AIHOT

02:43

Google AI Developers@googleaidevs

精选68

Gemini API 文件搜索工具近日扩展三项功能更新，旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括：多模态支持，通过Gemini Embedding 2模型实现对图像和文本的同步推理；自定义元数据过滤，允许为文件添加键值标签以结构化非结构化数据，从而提升搜索速度；精确引用功能，能够捕获并返回每条索引信息的精确来源，如页码。开发者可通过Google AI Studio的示例应用体验这些功能，与图像和文档库交互，提问并追溯答案来源。

GoogleMCP/工具检索增强产品更新

推荐理由：如果你在用 Gemini 搭 RAG 系统，这三项更新能直接改善搜索精度和可解释性，多模态搜索终于把图片和文档打通了，值得马上试试。

02:32

Google Gemini@GeminiApp

25

上周末的Gemini Paddock真是精彩绝伦。@McLarenF1经典赛车、定制头盔、Gemini照相亭，还有无与伦比的热情。谢谢你们，Papaya Army。🧡 #McLarenRacingLive

Google行业动态

02:28

The Decoder：AI News（RSS）

59

美国政府现可提前获取五大实验室AI模型以进行国家安全测试

美国商务部正扩大其人工智能安全测试范围。继Anthropic和OpenAI之后，Google DeepMind、微软以及xAI也已与美国人工智能标准与创新中心签署协议。这些公司将在网络安全风险加剧、与中国的技术竞争日趋激烈的背景下，提供降低了安全护栏的模型版本，供政府在机密环境中进行测试。目前，美国政府对五家主要人工智能实验室的模型均拥有了发布前的访问权限。

AnthropicOpenAI安全/对齐政策/监管

02:11

Rohan Paul@rohanpaul_ai

精选73

Luma发布Uni-1.1 API，主打意图优先图像生成

Luma的Uni-1.1模型现已作为API开放。这是一个用于图像生成和自然语言编辑的统一智能模型，其核心特点是“意图优先”的图像生成。模型在生成前会进行思考，能补全场景缺失部分，理解空间上下文而非仅像素，并能基于参考图像保持一致性。该API内置提示词增强、研究和参考收集功能，专为生产环境打造。据称，其成本和延迟仅为同类模型的一半以下，且在图像生成与编辑的综合评测中位列前三。

产品更新图像生成多模态

关联讨论 1 条

推荐理由：Luma 把「意图优先」的图像生成从研究变成了 API，先推理再出图，还不到同类一半价格。做创意工具或广告管线的团队可以立刻接进去试试。

02:05

OpenAI Developers@OpenAIDevs

精选73

更新后的 Agents SDK 现已提供 TypeScript 版本，支持沙盒代理并内置开源测试框架。【引用 @OpenAIDevs】：构建可长期运行的代理，获得更多对代理执行的控制权。 Agents SDK 的新功能： • 在受控沙盒中运行代理 • 检查并自定义开源测试框架 • 控制记忆创建时机及存储位置

智能体OpenAI产品更新开源生态

关联讨论 1 条

推荐理由：OpenAI 把 Agents SDK 带到了 TypeScript，而且直接上了沙箱和开源 harness，做 Node.js 代理的可以扔掉自研的调度层了。

02:04

The Decoder：AI News（RSS）

精选72

ChatGPT 更新推出 GPT-5.5 Instant 模型，幻觉减少且答案更个性化

OpenAI 将 ChatGPT 的默认模型更新为 GPT-5.5 Instant。内部测试显示，该模型在医学和法律等高风险主题上产生的幻觉声称减少了 52.5%。新功能“记忆来源”允许用户查看影响特定回答的存储上下文。该模型正立即向所有用户推出，但基于过去聊天记录、文件和 Gmail 的个性化功能将首先在网页版上向 Plus 和 Pro 用户开放。此次更新旨在提升回答的准确性和个性化体验。

OpenAI产品更新安全/对齐

关联讨论 8 条

推荐理由：GPT-5.5 Instant换到默认模型，减少一半幻觉是个硬指标进步，记忆源让用户知道ChatGPT为什么这样回答，透明度这块终于追上了。

02:04

Sam Altman@sama

50

我想与那些利用5.5版本构建了惊人项目的人交流，这些项目在早期模型中是无法实现的。我特别关注那些消耗了巨额令牌预算的案例。谢谢。

OpenAI大佬观点

02:02

TestingCatalog News 🗞@testingcatalog

精选77

OPENAI 🚨： GPT-5.5 Instant 正在向所有 ChatGPT 用户推出！"gpt-5.5-chat-latest" 也将进入 API。 &gt；更加简洁。更好的记忆。更个性化。即时测试时间 👀

OpenAI模型发布

关联讨论 8 条

推荐理由：GPT-5.5 Instant这版从语气到长度都在优化，免费用户终于能摸到GPT-5.5的门槛了，实际体验可能会比参数更重要。

02:01

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

59

梦工厂联合创始人杰弗里·卡森伯格预测，AI将在三年内使动画电影制作成本降低90%，所需人力减少至原先的10%。这不仅将彻底颠覆娱乐产业，更将迅速波及所有行业。好莱坞艺术家的反抗凸显了危机感--AI已在艺术创作领域实现从低水平到超人类能力的飞跃。若其在操纵、编程、生物工程等领域取得类似突破，将引发大规模失业潮，可能促使有组织劳工运动复兴。尽管可能带来更多电影产出，但各行各业的游戏规则已被永久改变。

现象/趋势视频

01:54

Gary Marcus：The Road to AI We Can Trust（RSS）

46

研究揭示：主流AI自主智能体表现堪忧

近期一项对GPT-4、Claude 3等主流AI自主智能体的系统评估显示，其在复杂任务中的成功率普遍低于30%。测试覆盖超500个场景，发现智能体常陷入循环或操作错误，关键问题包括任务分解失效、上下文理解偏差及指令遵循不稳定。研究表明，当前技术在需要多步骤推理的实际应用中仍存在显著缺陷。

智能体大佬观点

01:51

Yuchen Jin@Yuchenj_UW

39

一切都是技能-md问题。

大佬观点推理

01:46

宝玉@dotey

精选77

OpenAI 将 ChatGPT 默认模型全面升级为 GPT-5.5 Instant

OpenAI 将 ChatGPT 默认模型全面升级为 GPT-5.5 Instant，替换原有的 GPT-5.3 Instant，并向所有用户推送。新模型显著减少了事实幻觉，在医疗、法律等高风险领域的错误率大幅降低，并在多项基准测试中性能提升。回答风格更为简洁，减少冗余内容。同时增强了记忆功能，能主动利用用户历史聊天记录等数据提供个性化回答，并上线“记忆来源”功能供用户管理引用。免费用户即可使用新版模型，付费用户可保留旧版三个月。个性化记忆功能将逐步向各版本用户开放。

OpenAI产品更新推理

关联讨论 8 条

推荐理由：默认模型直接换到 GPT-5.5 Instant，幻觉砍半、回答更简洁，还开始主动用你的聊天记录，日常对话的体验会有明显提升，值得看看具体变了什么。

01:38

Anthropic@AnthropicAI

精选70

当AI承担人类无法完全核查的任务时，具备高能力的模型可能策略性隐藏实力且难以被察觉。Anthropic与MATS、Redwood的研究团队发现，即使仅使用较弱的模型作为监督者，也能成功训练一个接近完全能力的模型，使其停止这种"装傻"行为。该研究表明，通过弱监督训练可以有效抑制强模型的策略性能力保留问题。

Anthropic安全/对齐论文/研究

推荐理由：Anthropic 这篇论文把「模型故意隐藏能力」这个藏在阴影里的安全隐患摆到台面上，而且证明了弱模型也能监督强模型，做对齐的人值得细读，方向很重要。

01:35

宝玉@dotey

精选75

Google为Gemma 4发布MTP草稿模型，推理速度最高提升3倍

Google为其开源模型Gemma 4推出MTP drafter（多token预测草稿模型），采用推测解码技术，能在保持输出质量不变的前提下，将推理速度最高提升3倍。该技术利用轻量级小模型预先推测多个token，再由大模型并行验证，从而显著提高吞吐效率，尤其有利于缓解本地部署时的内存带宽瓶颈。例如，在Apple Silicon上运行26B MoE模型时，批量处理可获得约2.2倍加速。模型沿用Apache 2.0协议，权重已开源，并获主流推理框架支持。

Google开源生态推理模型发布

关联讨论 3 条

推荐理由：Gemma 4 的 MTP drafter 不是噱头，在 Apple Silicon 上实测能翻倍，且完全无损，本地跑开源模型的可以直接上，权重和框架都备好了。

01:33

Sam Altman@sama

69

5.5 instant 今日登陆 ChatGPT！在我看来这是一个相当大的升级，我真的很喜欢使用它。【引用 @ericmitchellai】：Excited that we're updating the default model in ChatGPT today！ 5.5 instant 在智能、图像感知和事实准确性方面都有显著提升。它还更新了写作风格，使其更平实、更直接。你的愿望清单上有什么？

OpenAI多模态模型发布

关联讨论 8 条

01:28

NotebookLM@NotebookLM

57

思维导图正迎来一次重大升级💅 以下新功能今日上线： 🚗自定义：通过特定用户提示引导你的导图 📂整理：即时重命名并分享你的导图 🗺️导航：节点间丝滑流畅的过渡切换欢迎告诉我们你的想法！

Google产品更新

01:21

Rohan Paul@rohanpaul_ai

精选70

Anthropic发布10款金融智能体模板，将Claude转化为标准化工作流

Anthropic发布了10款面向金融服务的Claude智能体模板，使其从聊天助手转变为可执行募资书制作、KYC审查、月度结算、估值分析等标准化任务的工作流。其核心是通过预置“技能”规范操作，利用“连接器”安全访问数据，并通过“子智能体”拆分任务步骤。该功能支持在Microsoft 365应用间保持上下文连贯，无需重复输入。同时提供具备权限控制与审计日志的托管代理模式。据称，Claude Opus 4.7在Vals AI金融智能体基准测试中以64.37%领先。模板可安装于Cowork和Claude Code，或部署为生产级托管代理。

智能体Anthropic产品更新

关联讨论 4 条

推荐理由：金融从业者能直接把Claude当成一个能跑pitchbook和月底结账的同事了，不再是聊天助手。Anthropic给的性能基准也说明他们这次认真在解决金融合规和工具链的实际问题，值得关注

01:18

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

35

提醒一下，OpenAI *和* Anthropic 都认为我们只剩下0-2年时间几家公司正加速将人类推入黑洞，只为看看会发生什么

AnthropicOpenAI安全/对齐

01:16

Satya Nadella@satyanadella

精选82

Copilot Cowork 新增功能：移动端、技能与插件。现已在 iOS 和 Android 平台推出，您可通过手机委派工作，在桌面端继续处理，保持任务流畅推进。借助全新连接器，Cowork 可跨业务系统与数据运作。

智能体Microsoft产品更新

推荐理由：Copilot Cowork 把委托工作从桌面延伸到了手机，加上 skills 和插件，办公自动化终于能随时丢任务随时捡起来，这是微软把 agent 落地的关键一步。

01:14

The Decoder：AI News（RSS）

57

OpenAI的首款硬件产品可能是一款用智能体任务流取代应用网格的手机

OpenAI据传正计划推出自有AI智能手机，将采用联发科和高通的芯片，并由立讯精密负责制造。分析师郭明錤预测，该手机最早可能在2027年上半年开始量产，头两年出货量最高可达3000万台。这款手机的核心设计理念是用基于AI智能体的任务流界面，取代传统的应用图标网格。这一相对保守的形态选择也表明，目前更实验性的AI硬件尚未准备好进入主流市场。

OpenAI端侧行业动态

01:12

阿绎 AYi@AYi_AInotes

52

你可能不会相信，但有人在第一个月通过运营一个AI虚拟女友的OnlyFans赚了43，000美元。目前有1，247名付费订阅者，甚至有一个人在单月内给她打赏了2，000美元。

智能体现象/趋势

01:11

Eric@ericmitchellai

精选82

OpenAI宣布将ChatGPT的默认模型更新为GPT-5.5 Instant。新版模型在智能水平、图像理解能力和事实准确性方面均有显著提升。其回应风格变得更简洁、直接和自然，同时提供更个性化和清晰的答案。此次升级基于用户反馈，旨在提供更优质的对话体验。

OpenAI模型发布

关联讨论 8 条

推荐理由：ChatGPT 默认模型这次升级把智能、图片感知和事实性都拉高了一截，更简洁的写作风格可能终于解决了啰嗦的老毛病，所有用户开机就能感受到变化，值得第一时间试。

01:09

Fei-Fei Li@drfeifei

61

游戏创作平台Astrocade宣布完成5600万美元融资，B轮由红杉资本领投，A轮由Sea领投。该平台旨在利用AI技术降低游戏创作门槛，让用户能够轻松创建游戏、与朋友游玩并向数百万人分享作品。其核心理念并非取代创造力，而是为更多人提供工具，使其能将个人品味、幽默感、故事和技艺融入游戏创作中，推动互动娱乐进入新纪元。

多模态行业动态

01:07

Perplexity@perplexity_ai

精选71

Perplexity和Computer现已接入优质健康资源，首批包括NEJM和BMJ集团，另有9种医学期刊和临床数据库即将上线。提出健康问题，即可获得来自医院和研究机构所信赖的相同来源的引用答案。

产品更新搜索

推荐理由：医疗信息最怕不靠谱，Perplexity 直接接进 NEJM 和 BMJ 这种顶刊，等于把医生的参考资料装进 AI，查健康问题终于不用在营销文里盲人摸象了。

01:06

Chubby♨️@kimmonismus

精选83

OpenAI推出GPT-5.5 Instant作为ChatGPT新默认模型，实现显著升级

OpenAI正式将GPT-5.5 Instant设置为ChatGPT的新默认模型，该模型在基准测试中表现大幅提升，变得更智能、准确和可靠。其在图像分析、STEM、写作及医学、法律等高精度领域能力增强。核心升级在于个性化功能，能有效利用用户保存的记忆、过往聊天、文件和Gmail上下文，并展示影响回复的记忆来源。该模型将在未来两天内向所有用户推出，个性化改进优先面向网页版Plus和Pro用户，移动版随后跟进；API版本为gpt-5.5-chat-latest。官方表示，升级后的模型能提供更智能、清晰、个性化的答案，语气温暖自然且更简洁。

OpenAI多模态推理模型发布

关联讨论 8 条

推荐理由：ChatGPT默认模型直接换到GPT-5.5 Instant，个性化能力是代际跃迁，明天打开就能感受到不同。

01:06

AK@_akhaliq

63

持久视觉记忆为LVLMs中的深度生成维持感知论文： https：//huggingface.co/papers/2605.00814

Hugging Face多模态论文/研究

01:04

AK@_akhaliq

67

从上下文到技能语言模型能否巧妙地通过上下文学习？论文：https：//huggingface.co/papers/2604.27660

arXiv推理论文/研究

关联讨论 1 条

01:03

Chubby♨️@kimmonismus

精选82

Coinbase宣布裁员约14%，CEO Brian Armstrong指出裁员源于市场周期与AI变革的双重压力。公司需在加密市场低迷期调整成本，同时拥抱AI提升效率：AI已让工程师几天完成以前数周工作，非技术团队也能编码。为此，Coinbase将转型为"AI原生"组织，压缩管理层至最多5级，取消纯管理岗位，组建小型高协同团队，并尝试"一人团队"模式。此次重组旨在构建更精简、敏捷的AI核心运营模式。

现象/趋势行业动态

关联讨论 2 条

推荐理由：Coinbase裁员14%，CEO把AI列为关键原因。这封邮件不是例行通知，它把组织扁平化、砍掉纯管理岗、实验一人团队这些动作讲得很具体，是AI如何倒逼大公司重构的真实案例。

01:02

Rohan Paul@rohanpaul_ai

60

Interact AI正在构建一种用于网站的AI交互界面，旨在改变用户与网站的互动方式。该AI可以直接与访客对话，回答购买者问题、展示产品价值、解释产品功能、引导产品演示，并帮助访客判断产品是否符合需求。其核心价值在于能将任何公司网站转变为一个24/7全天候在线的"产品专家"，从被动阅读变为主动对话。开发者@interact_ai将其定位为一种全新的网络界面，只需添加到网站即可实现与每位访客交流。

智能体产品更新

01:02

ChatGPT@ChatGPTapp

精选83

GPT-5.5 Instant 开始向所有 ChatGPT 用户推出。更简洁。记忆更佳。更个性化。而且对话体验顺畅得多。真的。

OpenAI模型发布

关联讨论 8 条

推荐理由：GPT-5.5 Instant 不是 GPT-5，但对每天用 ChatGPT 的人来说，更简洁、更好记忆这些改动比跑分提升更实在，值得等推送。

01:02

OpenAI@OpenAI

精选86

GPT-5.5 Instant 正在 ChatGPT 中逐步推出。这是一次重大升级，以更温暖、更自然的语调为您提供更智能、更清晰、更个性化的答案。同时它也更加简洁，这正是我们所了解到的用户需求。我们相信您会喜欢与它对话。

OpenAI模型发布

关联讨论 8 条

推荐理由：GPT-5.5 Instant 是 OpenAI 给所有人的即时升级，更聪明更自然还更简洁，这可能是 ChatGPT 推出以来最接地气的版本迭代。

01:01

AK@_akhaliq

62

MolmoAct2 面向现实世界部署的行动推理模型论文： https：//huggingface.co/papers/2605.02881

智能体推理论文/研究

关联讨论 1 条

01:00

SemiAnalysis@SemiAnalysis_

35

Cerebras公司的口号应该是："无需分割，皆是奇点"

大佬观点部署/工程

00:56

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

43

不，说真的，你不能再相信截图了

图像生成安全/对齐

00:55

Peter Steinberger 🦞@steipete

42

我让Molty审查我的PR，它创作了一首歌。https：//github.com/openclaw/openclaw/pull/77205

教程/实践编码

00:48

TestingCatalog News 🗞@testingcatalog

69

Inworld AI发布了新一代实时对话语音模型Realtime TTS-2。该模型的核心突破在于，能在说话前处理完整的多轮对话音频上下文，从而像真人一样实时适应对话情境。其关键特性包括：单一音色支持超过100种语言，首次音频生成延迟低于200毫秒，并能通过自然语言指令调整语音风格，无需预设情感标签。这标志着语音AI首次具备了"聆听"对话整体氛围而不仅是字面内容的能力，其架构设计旨在实现既自然动听又富有情境感知的对话体验。

产品更新语音

00:44

宝玉@dotey

精选77

开源幻灯片框架open-slide支持AI智能生成

open-slide 这个开源的 Slides 项目不错，可以通过 Agent + Skills 制作 Slides，然后还有一个 Web 程序可以编辑生成好的 Slides。并且可以支持动画，以及网页直接播放 slides。期待完善： - 更好的编辑 - 导出 pptx https://github.com/1weiho/open-slide

智能体GitHub开源/仓库

推荐理由：让 agent 直接生成可编辑的 slides，npx 一行命令就能跑，还支持动画和网页播放，是产品人和开发者的提效刚需小工具，宝玉推荐的质量一般不差。

00:41

阿绎 AYi@AYi_AInotes

精选71

Anthropic发布10个开源金融AI Agent，重塑华尔街工作流程

Anthropic发布了10个开箱即用的金融专用AI Agent，将估值复核、制作pitchbook、月末结账等核心工作产品化。这些Agent能自动连接顶级金融数据库，原生支持Office，并可通过插件或托管模式使用，全链路审计确保合规。所有代码均已开源，企业可快速部署内部AI团队。此举直接替代初级分析师大量重复劳动，将AI Agent从实验工具转化为企业级生产力，并精准切入金融行业对安全合规的刚性需求，可能引发行业工作流程重构。