AIHOT

5月8日

08:30

Claude Code：GitHub Releases（RSS）

精选69

Claude 发布 v2.1.133 版本，新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础，引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径，并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上，钩子现在可接收活动努力级别信息，Bash 工具命令可读取相应环境变量。此外，改进了焦点模式行为，并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题，包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。`claude --help` 现已列出远程控制选项，VSCode 扩展也修复了相关错误。

智能体AnthropicMCP/工具产品更新

推荐理由：Claude Code 这个版本修了一堆让人抓狂的 bug，并行会话掉认证、网络驱动器权限、子代理找不到 skill 都解决了，重度用户应该尽快升级。

08:16

IT之家（RSS）

iOS 27 版苹果备忘录 App 前瞻：接入 AI 版 Siri 简化内容收集、高效梳理信息

据报道，iOS 27系统将对Siri进行彻底重构，其底层将基于谷歌Gemini构建，交互模式将从指令式转变为类似ChatGPT的对话模式。新版Siri将与备忘录应用深度整合，用户可通过“把这个加到新备忘录”等语音指令，直接将AI生成的内容自动、完整地保存至备忘录，解决手动复制粘贴导致的流程繁琐和格式错乱问题。此外，Siri还能利用大语言模型能力，高效梳理信息并创建特定主题的备忘录。

产品更新语音

07:16

IT之家（RSS）

OpenAI 为 ChatGPT 推出"可信联系人"，应对 AI 对话中的自残风险

OpenAI为ChatGPT推出“可信联系人”功能，以应对对话中的自残风险。当系统检测到成年用户对话涉及相关内容时，会鼓励用户联系他人，并自动向其预设的联系人发送简短的电子邮件、短信或推送通知提醒，以促进沟通。通知不包含具体对话细节以保护隐私。该功能采用自动审核与人工复核结合，触发提醒的对话会交由人工安全团队处理，官方承诺对此类通知进行人工审核并力求在一小时内完成。此前，OpenAI曾因被指控鼓励用户自杀而面临诉讼。

OpenAI产品更新安全/对齐

05:43

OpenRouter：Announcements（RSS）

精选73

为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择，实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型（如GPT、Claude、LLaMA等）集成实时、可靠的网络信息获取能力，无需为每个模型单独适配。

智能体MCP/工具产品更新

推荐理由：让任何模型都能用统一接口做联网搜索和抓取，做 agent 的同学不用再为每个模型单独配工具了，在 OpenRouter 上搭产品的实用性直接拉高。

05:29

Anthropic：Research（发表成果 · 网页）

精选73

捐赠开源对齐工具 Petri

2025年10月，Anthropic公司开源了AI模型对齐测试工具箱Petri，用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分，并被英国AI安全研究所等外部机构采用。近日，Petri升级至3.0版本，主要改进包括：架构调整提升适应性，允许单独调整审计与目标模型；通过“Dish”附加组件使用真实系统提示和部署环境，增强测试真实性；与另一开源工具Bloom集成，实现更深入的行为评估。为确保独立性与公信力，Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由：Petri 从 Anthropic 内部工具箱变成行业公共品，捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司，做安全测试的团队又多了一个可参考的标尺。

04:30

Simon Willison 博客

llm-gemini 0.31

llm-gemini 0.31 版本发布，其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态，转为正式可用。该模型自三月份预览以来，其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。

Google产品更新开源生态

03:06

Hacker News 热门（buzzing.cc 中文翻译）

精选74

DeepSeek 4：适用于 Metal 的 Flash 本地推理引擎

DeepSeek 4 Flash 本地推理引擎正式发布，这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型，实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能，降低了延迟与内存占用。该项目已在 GitHub 开源，并在 Hacker News 上获得了关注。

DeepSeek开源/仓库推理端侧

推荐理由：antirez 写的引擎让 DeepSeek 4 在 Mac 本地跑出近乎 Flash 的速度，而且代码极其精简，做本地推理的开发者应该立刻克隆下来跑一下。

03:04

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选71

在ChatGPT中测试广告

OpenAI开始在ChatGPT中测试广告功能，旨在支持其免费服务的持续运营。测试强调广告会带有明确标识，且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施，并确保用户对广告体验拥有控制权。

OpenAI产品更新

推荐理由：ChatGPT免费版要开始看广告了，虽然官方承诺回答不受影响且隐私保护，但这是AI商业化的大实验，所有免费用户都会盯着会不会掺水。

02:41

Claude：Blog（网页）

精选85

在Excel、PowerPoint、Word和Outlook中与Claude协同工作

Claude for Excel、PowerPoint和Word现已全面上市，Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文，实现跨文件智能协作。例如，在Outlook中分类邮件并起草回复，在Excel中调整数据后，PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署，并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问，Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。

Anthropic产品更新

关联讨论 2 条

推荐理由：Claude 这次 Office 集成不是普通插件，它让 Excel、PPT、Word、Outlook 共享同一对话上下文，改一个数其余自动更新，生产力提升是实打实的，企业用户值得立即部署。

02:06

Hacker News 热门（buzzing.cc 中文翻译）

Chrome 撤回了关于"设备端 AI 不会将数据发送至 Google 服务器"的声明

Chrome浏览器近日从其帮助文档中撤回了关于“设备端AI不会将数据发送至Google服务器”的声明。这一修改表明，谷歌可能调整了其设备端AI功能的隐私数据处理政策，相关AI功能在本地处理数据时，或许仍存在将某些数据发送至服务器的可能性。该变动引发了技术社区的关注，在Hacker News上获得了超过100的讨论热度。

Google产品更新端侧

02:03

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

Introducing Trusted Contact in ChatGPT

ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时，该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预，为面临心理健康危机的用户提供额外安全保障。

OpenAI产品更新安全/对齐

推荐理由：ChatGPT 这次更新的不是模型能力，而是安全机制，引入可信联系人针对严重自残风险，对部分用户是真正的底线保障。

01:06

Hacker News 热门（buzzing.cc 中文翻译）

AlphaEvolve：由Gemini驱动的编程代理，在各领域产生广泛影响

DeepMind发布了由Gemini驱动的编程代理AlphaEvolve。该代理能自动生成、测试和优化代码，显著提升了软件开发效率与质量。其影响已扩展至多个领域，包括科学研究和工业应用，在特定基准测试中展示了卓越的代码生成能力。该技术旨在通过自动化复杂编程任务，降低开发门槛并加速各行业的创新进程。

智能体DeepMind产品更新编码

5月7日

22:59

Google DeepMind：Blog（RSS）

精选66

AlphaEvolve：我们由Gemini驱动的编程智能体如何跨领域扩展影响力

AlphaEvolve推出了基于Gemini大模型的编程智能体，其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用，通过自动化代码生成与问题解决提升效率。具体实践表明，它能显著加速开发周期并处理复杂任务，标志着AI编程助手从辅助工具向核心生产力引擎的演进。

智能体DeepMindGoogle产品更新

推荐理由：DeepMind这次不只是秀参数，AlphaEvolve用Gemini驱动编码代理，已经开始在工业设计和科学发现里产生真实影响了，做自动化的可以盯着看。