5月8日
06:21
Berryxia.AI@berryxia
精选76
Codex原生支持Chrome扩展,成为浏览器"原住民"智能体

OpenAI宣布Codex现已原生支持Chrome浏览器扩展,可在macOS和Windows上直接运行。此次升级使其能更高效地操作网页和应用,并能在后台并行处理多个标签页,无需占用浏览器窗口。这意味着Codex可自主编写并执行代码,自动化处理浏览器内的重复性任务,如页面导航、数据录入、仪表盘检查和CRM更新等。这标志着Codex从“聊天助手”转变为深度集成于浏览器的“原住民”智能体。用户可通过Codex应用安装Chrome插件,但目前欧盟和英国地区暂不支持。

OpenAI: Codex now works directly in Chrome on macOS and Windows. It's even better at working with apps and sites in Chrome, and ...

智能体OpenAI产品更新
关联讨论 7X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:邵猛 (@shao__meng)IT之家(RSS)X:Vista (@vista8)X:歸藏 (@op7418)X:小互 (@xiaohu)
推荐理由:Codex这波更新让它从「借道浏览器的访客」变成了后台多线程原住民,所有依赖浏览器重复操作的场景都会重构,值得立刻装插件试试。
06:21
Berryxia.AI@berryxia
66
Chrome版Codex结合子代理,可测试多人游戏功能

Chrome版Codex的一个关键实用功能在于其能与子代理结合使用。这一特性使得开发者能够利用该工具来测试像多人游戏之类的复杂功能。该工具兼容macOS和Windows系统,提升了跨平台开发的便利性。

智能体OpenAI产品更新编码
06:21
Berryxia.AI@berryxia
63
Claude全面集成微软Office套件,支持跨应用上下文保留

Anthropic的AI助手Claude现已全面集成微软Office生产力套件。Claude for Excel、PowerPoint和Word已正式上线,而Claude for Outlook也开启了公测。该集成的一个核心功能是,当用户在Microsoft的不同应用程序之间切换时,Claude能够完整保留并理解整个对话的所有上下文信息,实现了跨应用的无缝协作体验。

智能体Anthropic产品更新
05:43
OpenRouter:Announcements(RSS)
精选73
为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。

智能体MCP/工具产品更新

推荐理由:让任何模型都能用统一接口做联网搜索和抓取,做 agent 的同学不用再为每个模型单独配工具了,在 OpenRouter 上搭产品的实用性直接拉高。
05:35
Orange AI@oran_ge
74
开源AI Agent网盘NeuDrive,支持主流工具与自动同步

开发者开源了一款专为AI Agent设计的网盘NeuDrive,能够自动同步Agent的记忆、技能和文件。该工具支持Claude Code、Codex、Cursor等主流开发工具以及多种网页应用。项目已在GitHub开源,同时提供了可直接使用的部署版本。免费版已能满足绝大多数使用场景,付费版在付款时输入优惠码“vivo50”可兑换三个月免费使用权。

智能体GitHubMCP/工具产品更新
05:29
Anthropic:Research(发表成果 · 网页)
精选73
捐赠开源对齐工具 Petri

2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由:Petri 从 Anthropic 内部工具箱变成行业公共品,捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司,做安全测试的团队又多了一个可参考的标尺。
05:09
宝玉@dotey
74
OpenAI 为 Codex 发布 Chrome 扩展,使其能直接在浏览器中执行任务

OpenAI 为其编程助手 Codex 推出了 Chrome 浏览器扩展。该扩展现可供 macOS 和 Windows 用户在 Codex 应用中安装,使 Codex 能直接在浏览器后台并行处理多标签页任务,且不干扰用户当前界面。此举将 Codex 的能力从终端、IDE 和云端延伸至浏览器环境,使其能够处理需要登录的网页操作,例如访问内部后台、更新 CRM 记录或完成多步骤表单流程。它通过编写并运行代码来操作页面,并自动组合使用现有插件或通过 Chrome 处理登录任务。典型应用场景包括调试业务流程、进行调研和处理重复性数据录入。目前该功能已在 Codex 应用中提供,但欧盟和英国地区暂未开放。

OpenAI: Codex now works directly in Chrome on macOS and Windows. It's even better at working with apps and sites in Chrome, and ...

智能体MCP/工具OpenAI产品更新
关联讨论 7X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:邵猛 (@shao__meng)IT之家(RSS)X:Vista (@vista8)X:歸藏 (@op7418)X:小互 (@xiaohu)
04:42
TestingCatalog News 🗞@testingcatalog
71
OpenAI的Codex现已正式推出适用于macOS和Windows的Chrome浏览器扩展,用户需安装插件以开始测试。该扩展旨在提升Codex与浏览器内应用及网站的协作能力,能够在后台并行处理多个标签页任务而不占用浏览器控制权。用户可自主管理Codex可访问的网站权限。此前测试消息显示,此专用扩展将显著优化浏览器环境中的AI辅助工作流程。

TestingCatalog News 🗞: OPENAI 🔥: Codex is getting a dedicated Chrome extension soon! > With the new extension for Chrome, Codex is even better...

智能体OpenAI产品更新
关联讨论 7X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:邵猛 (@shao__meng)IT之家(RSS)X:Vista (@vista8)X:歸藏 (@op7418)X:小互 (@xiaohu)
04:42
04:39
宝玉@dotey
精选80
Anthropic将Claude全面集成至Microsoft 365,多款插件结束测试

Anthropic宣布,Claude for Excel、PowerPoint和Word三款插件已结束测试转为正式版,Outlook插件同步进入公测。所有付费Claude用户均可免费使用。此次集成的核心突破在于Claude能在Microsoft 365套件中跨应用保持连续的对话上下文。例如,用户可在Outlook中处理邮件,随后在Word中编辑附件,再于Excel构建财务模型并最终生成PowerPoint演示文稿,全程无需重复提供材料。具体功能包括:在Excel中修改单元格而不破坏公式;按模板生成原生PowerPoint图表;在Word中以修订模式编辑文档;在Outlook中生成待发送的邮件草稿。

Claude: Claude for Excel, PowerPoint, and Word are now generally available, and Claude for Outlook is in public beta. As Claude ...

Anthropic产品更新

推荐理由:Claude不再只是个聊天框,Excel里改模型、PPT里出图表还能跨应用带上下文,对天天做表写PPT的人,这比新模型发布更实在,而且不额外收费。
04:36
OpenAI Developers@OpenAIDevs
精选72
Codex 现在能承担更多浏览器开发工作。 通过 Codex 应用中的新 Chrome 插件,它可以测试网络应用、跨标签页收集上下文、并行高效使用网页开发者工具,并保持结果井井有条而不占用你的浏览器。
OpenAI产品更新编码
关联讨论 7X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:邵猛 (@shao__meng)IT之家(RSS)X:Vista (@vista8)X:歸藏 (@op7418)X:小互 (@xiaohu)
推荐理由:Codex 从写代码扩展到了浏览器自动化测试,这个 Chrome 插件让它在 DevTools 并行操作上有了自己的想法,做前端自动化的可以试试。
04:36
04:35
Greg Brockman@gdb
精选76
自OpenAI创立以来,我一直对实时语音翻译这一AI应用感到兴奋。 现在看到它通过API向所有开发者开放,真是太酷了:

jason liu: 新しいリアルタイム翻訳モデルを発表できることをうれしく思います。ぜひ本日よりAPIでお試しください。

OpenAI产品更新语音
关联讨论 14OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:OpenAI 把实时语音翻译做成了 API,从 demo 到可开发只差一个调用,语音类产品这下有真正的实时翻译基建了。
04:30
Simon Willison 博客
28
llm-gemini 0.31

llm-gemini 0.31 版本发布,其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态,转为正式可用。该模型自三月份预览以来,其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。

Google产品更新开源生态
04:10
OpenAI@OpenAI
精选75
Codex现可直接在macOS和Windows的Chrome中运行。 它在处理Chrome中的应用和网站时表现更佳,并能在后台跨标签页并行工作,而不会占用浏览器控制权。 要开始使用,请在Codex应用中安装Chrome插件。
智能体OpenAI产品更新编码
关联讨论 7X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:邵猛 (@shao__meng)IT之家(RSS)X:Vista (@vista8)X:歸藏 (@op7418)X:小互 (@xiaohu)
推荐理由:Codex 从终端跑进 Chrome,最大的变化不是平台迁移,而是能跨标签并行在后台干活不接管浏览器,这对前端开发和依赖网页工具的流程是实打实的效率提升。
03:06
Hacker News 热门(buzzing.cc 中文翻译)
精选74
DeepSeek 4:适用于 Metal 的 Flash 本地推理引擎

DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型,实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能,降低了延迟与内存占用。该项目已在 GitHub 开源,并在 Hacker News 上获得了关注。

DeepSeek开源/仓库推理端侧

推荐理由:antirez 写的引擎让 DeepSeek 4 在 Mac 本地跑出近乎 Flash 的速度,而且代码极其精简,做本地推理的开发者应该立刻克隆下来跑一下。
03:04
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选71
在ChatGPT中测试广告

OpenAI开始在ChatGPT中测试广告功能,旨在支持其免费服务的持续运营。测试强调广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施,并确保用户对广告体验拥有控制权。

OpenAI产品更新

推荐理由:ChatGPT免费版要开始看广告了,虽然官方承诺回答不受影响且隐私保护,但这是AI商业化的大实验,所有免费用户都会盯着会不会掺水。
02:41
Claude:Blog(网页)
精选85
在Excel、PowerPoint、Word和Outlook中与Claude协同工作

Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文,实现跨文件智能协作。例如,在Outlook中分类邮件并起草回复,在Excel中调整数据后,PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署,并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问,Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。

Anthropic产品更新

推荐理由:Claude 这次 Office 集成不是普通插件,它让 Excel、PPT、Word、Outlook 共享同一对话上下文,改一个数其余自动更新,生产力提升是实打实的,企业用户值得立即部署。
02:11
Perplexity@perplexity_ai
精选68
Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。 它可在任何Mac设备上运行,能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。
智能体产品更新

推荐理由:Perplexity 把计算机使用能力做进了 Mac 原生应用,能跨本地文件、桌面程序和网络运行任务,对 Mac 用户而言 AI 助手真正开始接管操作系统层级的工作。
02:11
02:06
Hacker News 热门(buzzing.cc 中文翻译)
57
Chrome 撤回了关于"设备端 AI 不会将数据发送至 Google 服务器"的声明

Chrome浏览器近日从其帮助文档中撤回了关于“设备端AI不会将数据发送至Google服务器”的声明。这一修改表明,谷歌可能调整了其设备端AI功能的隐私数据处理政策,相关AI功能在本地处理数据时,或许仍存在将某些数据发送至服务器的可能性。该变动引发了技术社区的关注,在Hacker News上获得了超过100的讨论热度。

Google产品更新端侧
02:05
OpenRouter@OpenRouter
精选68
Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!
Google产品更新多模态

推荐理由:OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token,这个定价让 Flash 系列不再是试验品,轻量级应用可以认真考虑它了。
02:03
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选56
Introducing Trusted Contact in ChatGPT

ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时,该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预,为面临心理健康危机的用户提供额外安全保障。

OpenAI产品更新安全/对齐

推荐理由:ChatGPT 这次更新的不是模型能力,而是安全机制,引入可信联系人针对严重自残风险,对部分用户是真正的底线保障。
01:38
宝玉@dotey
精选81
OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型:GPT-Realtime-2用于对话,GPT-Realtime-Translate用于翻译,GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力,在音频测试中性能显著提升,改进了交互体验,如任务前语音提示、工具调用透明化和128K上下文窗口,并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译,GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线,并公布了API价格。

OpenAI: Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice age...

OpenAI产品更新语音
关联讨论 14OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:GPT-5 级推理终于进了语音 API,Big Bench Audio 从 81 跳到 97,多工具调用还能念出来,做语音 agent 的可以直接上手试了。
01:06
Hacker News 热门(buzzing.cc 中文翻译)
58
AlphaEvolve:由Gemini驱动的编程代理,在各领域产生广泛影响

DeepMind发布了由Gemini驱动的编程代理AlphaEvolve。该代理能自动生成、测试和优化代码,显著提升了软件开发效率与质量。其影响已扩展至多个领域,包括科学研究和工业应用,在特定基准测试中展示了卓越的代码生成能力。该技术旨在通过自动化复杂编程任务,降低开发门槛并加速各行业的创新进程。

智能体DeepMind产品更新编码
5月7日
23:21
Berryxia.AI@berryxia
65
Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧
23:06
meng shao@shao__meng
70
Apify mcpc 与 x402:给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc,集成了x402支付协议,旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批,而x402协议将支付压缩为一次HTTP往返加签名,使程序能自主交易。mcpc为Agent提供加密钱包,当调用付费服务遭遇HTTP 402状态码时,可自动签名完成支付,无需人工干预。该工具支持Claude Code等MCP兼容的Agent,用户可使用USDC为钱包充值并连接x402兼容服务。

Sumanth: Give your AI agents a wallet! Apify just released mcpc with support for autonomous agentic payments. The problem: Your a...

智能体MCP/工具产品更新
23:04
OpenRouter@OpenRouter
精选72
1/ 音频现已成为OpenRouter的一等公民。 今日上线两个新端点: 📢 /api/v1/audio/speech - 文本转语音(TTS) 🎤 /api/v1/audio/transcriptions - 语音转文本(SST) 沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。
产品更新语音部署/工程

推荐理由:OpenRouter 突然把 TTS 和 STT 拉进了统一路由,用同一把 Key 和账单,做多模态 App 的人可以少调一个 API。更新不大,但省事。
23:01
Chubby♨️@kimmonismus
53
谷歌推出AI健康教练,整合多维度健康数据

谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

Google产品更新
22:59
Google DeepMind:Blog(RSS)
精选66
AlphaEvolve:我们由Gemini驱动的编程智能体如何跨领域扩展影响力

AlphaEvolve推出了基于Gemini大模型的编程智能体,其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用,通过自动化代码生成与问题解决提升效率。具体实践表明,它能显著加速开发周期并处理复杂任务,标志着AI编程助手从辅助工具向核心生产力引擎的演进。

智能体DeepMindGoogle产品更新

推荐理由:DeepMind这次不只是秀参数,AlphaEvolve用Gemini驱动编码代理,已经开始在工业设计和科学发现里产生真实影响了,做自动化的可以盯着看。