07:08

Ethan Mollick：One Useful Thing（RSS）

前沿AI模型能力加速提升，美国实验室发布速度加快，但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程，token成本$251。中国开源模型落后前沿6-12个月，但性能也快速提升，在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体，OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示，领域经验比职业属性更决定使用效果，专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体 Anthropic OpenAI 大佬观点

关联讨论 25 条

07:01

宝玉@dotey

Anthropic 发布科研AI工作台 Claude Science

Anthropic 推出 Claude Science，一个面向生命科学等领域的 AI 工作台，将文献检索、代码运行、数据库查询等科研流程整合到统一界面。它基于现有 Claude 模型（含 Opus 4.8），未专门训练生物学能力，通过主 Agent 连接 60+ 科学数据库（基因组学、蛋白质组学等），并可生成子 Agent 执行任务。特性包括可复现性（图表附带生成代码与环境）和本地运算（macOS/Linux 或 SSH 连接集群，敏感数据本地保留）。早期用户案例：Gladstone 研究所几天内搭建基因组浏览器；UCSF 团队用其发现卡了一年的 RNA-seq 病毒污染物；Allen 研究所将两年综述缩短至数周。与 OpenAI 的 GPT-Rosalind 不同，Claude Science 侧重工作流集成。即日起公测，需 Pro（$20/月）及以上订阅。Anthropic 将资助最多 50 个项目，每个最高 $30,000，申请截止 7 月 15 日。

Claude: Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...

智能体 Anthropic 产品更新

06:31

MarkTechPost（RSS）

Linq 推出 iMessage Apps，对话内嵌入交互式迷你应用

Linq 推出 iMessage Apps，允许开发者在 iMessage 对话中构建交互式迷你应用。用户无需离开聊天即可购物、玩游戏、订机票或支付，不再依赖外部链接跳转。技术实现基于新的 type: "imessage_app" 消息组件，通过 app 对象的 team_id 和 bundle_id 标识渲染扩展，layout 控制静态文本，interactive 标志决定是否显示实时交互卡片。已发送的卡片可通过 /messages/{id}/update 原地更新（仅支持 url、fallback_text、interactive、layout 等参数）。该功能仅限 iMessage 通道，无 SMS/RCS 回退，富交互渲染需接收方安装对应扩展。

智能体产品更新部署/工程

06:01

MarkTechPost（RSS）

Anthropic 发布 Claude Sonnet 5：中端智能体模型，基准与定价详解

Anthropic 发布 Claude Sonnet 5，定位为最具智能体能力的中端模型，即日起成为 Free 和 Pro 计划的默认模型。在 SWE-bench Pro 上得分 63.2%（前代 58.1%），OSWorld-Verified 达 81.2%（前代 78.5%），HLE（带工具）57.4%。输入/输出定价 2026 年 8 月 31 日前 $2/$10 每百万 token，之后 $3/$15。支持低/中/高/超高四档 effort 级别，低中 effort 下性价比最优。上下文窗口 1M token，采用新 tokenizer，相同文本 token 数增长约 1.0–1.35 倍。幻觉与谄媚率低于前代。开发者仅需更换模型字符串为 claude-sonnet-5 即可调用 API。

智能体 Anthropic 推理模型发布

关联讨论 5 条

05:59

TechCrunch：AI（RSS）

OpenClaw 正式登陆 Android 和 iOS

免费开源 AI 智能体 OpenClaw 现已推出 iOS 和 Android 应用。用户通过 OpenClaw Gateway 将手机与智能体及所需工具、技能连接，可在移动端运行智能体完成编程、餐食规划等任务。OpenClaw 今年早些时候因 MoltBook（号称完全由智能体运营的社交媒体站）走红，其创建者 Peter Steinberger 随后加入 OpenAI。尽管 MoltBook 后被证实部分由人类伪装智能体运行，但此事件推动了智能体生态扩张，如今 AI 智能体已嵌入更多场景，包括手机端。

智能体产品更新开源生态

05:31

Rohan Paul@rohanpaul_ai

Anthropic 发布专为科研设计的 Claude Science beta 版

Anthropic 推出 Claude Science beta 版，整合 60 个科学数据库，支持代码追踪的 artifact（含环境、方法及完整消息历史），可渲染 3D 蛋白质、基因组轨迹、化学结构等。协调 agent 可调用专业 agent、实验室技能和计算资源（HPC 或 Modal），分析从 1 GPU 扩展至数百，数据保持本地。内置审稿 agent 自动检查计算、引用和图表与源代码一致性。早期用户报告：生成 10 份超 100 页的审稿草稿，种系分析时间降至十分之一。该工具属于 Anthropic 自 2025 年 10 月启动的生命科学与医疗健康计划。

智能体 Anthropic 产品更新

05:28

Artificial Analysis@ArtificialAnlys

Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得 53 分，标准定价下每任务成本高于 Opus 4.8

Claude Sonnet 5 以 max effort 在 Artificial Analysis Intelligence Index 上得分 53（第 5 名），比 Sonnet 4.6 提高 6 分，与 GPT-5.5 (xhigh) 持平，落后 Opus 4.7/4.8 约 2-3 分。标准定价下每任务成本 $2.29，比 Sonnet 4.6 贵约 2 倍、比 Opus 4.8 贵 15%，主要因输出 token 增加 40%、agentic 任务调用次数增加约 3 倍。定价 $3/$15 每百万 token（促销至 9 月 1 日降至 $2/$10），上下文窗口 1M tokens，新增 xhigh 力度设置。在 agentic 知识工作基准 AA-Briefcase 和 GDPval-AA 上匹配或超越 Opus 4.8，推理基准仍落后。Terminal-Bench v2.1（+9）、HLE（+10）、SciCode（+7）显著提升。

智能体 Anthropic 推理评测/基准