6月5日

03:15

swyx@swyx

Cognition发布企业级AI代码评估（eval），支持长达100小时深度测试（METR仅约16小时），并附带财务担保：若Devin产出价值低于费用，Cognition将补贴至达标，最高1000万美元。METR数据集覆盖ML工程、GPU内核、网络安全，使用GPT-4o和GPT-5从Claude Code转录估算人类时间，rlog=0.83。Cognition数据集来自126位Devin用户的258个真实会话（Java/TS/Python/C#功能开发、bug修复、迁移），保留集rlog=0.74。

Cognition: AI should earn its keep. Introducing the AI Productivity Guarantee. If Devin delivers less engineering value than you're...

产品更新编码评测/基准

03:03

Greg Brockman@gdb

更好的 ChatGPT 记忆： OpenAI 一直在研究让 ChatGPT 记忆跨对话携带上下文并长期保持有用的新方法。今天，这项成果以更强大的记忆系统在 ChatGPT 中推出。

OpenAI: We've been researching new ways for ChatGPT memory to carry context across conversations and keep it useful over time. T...

OpenAI 产品更新

关联讨论 5 条

02:35

jason@jxnlco

Poke 成为首个经苹果批准可在 Apple Messages 上发短信的 AI 智能体。Jason Liu 表示这是他自上线以来唯一每天都在使用的 AI 智能体。

Poke: Say hi to the new Poke! 🌴 Now officially approved by Apple to text on Apple Messages. As the first and only AI agent. C...

智能体产品更新

02:30

OpenAI Developers@OpenAIDevs

精选68

OpenAI 产品更新编码

推荐理由：对 iOS 开发者很实用，热重载和预览直接嵌进 Codex，减少工具间反复横跳，不过暂时还撼动不了 Xcode 的地位。

02:05

Replit ⠕@Replit

精选78

我们与 Shopify 合作，让你从想法到上线商店只需几分钟只需告诉 Replit Agent 你想卖什么。它会： - 构建自定义店铺页面 - 创建你的 Shopify 商店 - 帮你添加商品在 Shopify 中认领店铺，设置支付，即可开业。

智能体产品更新

关联讨论 1 条

推荐理由：Replit 把 Agent 从代码生成延伸到了实时开店，一句话建个定制店面上线卖货，这个集成对电商创业者来说是真正的零门槛。

01:45

swyx@swyx

Flow v3 发布：物理工程 Agentic 平台

Flow 发布 Flow v3，定位为物理工程的 Agentic 平台。智能体可执行真实工程工作：修改需求、将更新推送到 CAD 和仿真工具、标记需重跑的测试，将原本数月的迭代周期缩短至数天。核心创新是 Systems Graph，实时记录需求、设计模型、测试、分析及其连接，为智能体提供系统完整上下文。工程师与智能体在同一系统协同，工程师聚焦架构决策，智能体负责重写报告、重跑分析与仿真、触发测试。客户包括 Rivian、Joby、Astranis、Skydio、Radiant 等硬件公司。

Pari Singh: Agents have reached hardware. We are launching Flow v3, the Agentic Platform for Physical Engineering. We've spent over ...

智能体产品更新

01:34

eric zakariasson@ericzakariasson

推出Cursor Profiles！前往 http://cursor.com/profile 认领你的用户名。

产品更新编码

01:30

NotebookLM@NotebookLM

专业技巧：将笔记本游戏化不要只是阅读笔记--去调查它们。我们全新的福尔摩斯笔记本将学习变成一款互动侦探游戏。推理事实，发现线索，证明即使是最复杂的问题也能迎刃而解。 ➡️ https://goo.gle/Sherlock

Google 产品更新推理

01:29

🚨 AI News | TestingCatalog@testingcatalog

OpenAI正为美国Plus和Pro用户推送一种新的"更强大、可扩展的记忆合成系统"，基于"dreaming"架构构建。该系统通过记忆摘要让用户快速了解ChatGPT记住的关于自己的关键信息。OpenAI表示，这项研究旨在让ChatGPT记忆能跨对话携带上下文并长期保持有用。未来几周将扩展至其他国家以及Free和Go用户。

OpenAI: We've been researching new ways for ChatGPT memory to carry context across conversations and keep it useful over time. T...

OpenAI 产品更新

01:28

Artificial Intelligence News（RSS）

Meta Business Agent 驱动 AI 赋能的对话式商务

Meta 推出 Business Agent，在 Instagram、Messenger 以及即将上线的 WhatsApp 中原生集成对话式商务工作流。该软件使全球零售品牌能直接在消息应用中自动执行交易和处理客服工单，无需人工干预，将智能体 AI 置于社交商务核心。

智能体 Meta 产品更新

01:05

Google Gemini@GeminiApp

看看用 Gemini Omni 将最疯狂的创想变为现实有多简单。只需在 Gemini 中选择"Create videos"，添加文字、视频或多达五张图片，然后尽情释放你的想象力。

Google 产品更新多模态视频

01:03

歸藏(guizang.ai)@op7418

CodePilot v0.55.0 正式版更新

CodePilot v0.55.0 正式版发布，核心新增三大功能：多执行引擎支持 Anthropic Claude Code、CodePilot 自建 Native、OpenAI Codex 三种引擎，可设全局默认或按会话临时切换；上下文用量可视化，实时显示占用与剩余，并按系统提示/工作区规则/技能/记忆/工具/MCP 分解；OpenAI Codex 账号原生能力打通，助理记忆、Widget、定时任务、Dashboard、CLI 等可用，不支持的功能如实标注。同时修复 macOS 视觉与托盘、Windows 安装与交互、服务商型号映射等问题。

产品更新编码