Anthropic基础设施负责人Boris Cherny透露,公司并无秘密模型Mythos,主要使用与公众相同的Claude Opus 4.7。其高速迭代的核心并非技术优势,而是组织结构变革:公司由数百个AI Agent在Slack上协同工作,自动拆分任务、编写代码并解决问题,形成24小时运作的AI军队。工程师团队规模仅增4倍,但人均产出提升200%,Boris本人自2025年11月起未手动写代码。这揭示了AI时代真正的代差在于流程与组织形态。
关联讨论 2 条X:Kim (@kimmonismus)X:阿易 AI Notes (@AYi_AInotes)核心观点在于Anthropic正将公司改造为由AI Agent持续运行的系统。具体表现为,数百个Claude实例在循环中自动执行任务,并通过Slack等工具相互通信,使代码提交、持续集成、SQL查询、数据整理及反馈聚类等工作在后台自动流动。这种将AI Agent深度整合进核心业务流程的模式,被视为推动生产力大爆发的关键,其意义超越了单纯讨论AI编程能力或商业收入的层面。
Anthropic正式发布面向金融服务的Claude Agent模板,将AI在金融领域的角色从“辅助”升级为“直接执行”。该模板针对融资演示、估值审查、月末结账等高频率、耗时的核心流程,提供开箱即用的解决方案。它集成了完整的连接器、技能和子代理,可直接适配公司内部标准,并支持在Claude协作与开发环境中安装插件,或通过官方指南一键部署为生产级托管Agent。此举意味着AI开始直接接管以往需金融人员耗费数十小时完成的任务,标志着金融行业Agent时代的实质性开启。
OpenAI对其Agents SDK进行重大升级,旨在为构建长时运行Agent提供更强的执行控制能力。核心在于将控制权交给开发者,打破黑盒状态。新功能包括:在受控沙箱环境中运行Agent,支持多家云服务商;允许完全检查和自定义开源harness;以及精准控制记忆的创建时机与存储位置。所有文件、凭证和执行状态均保留在开发者自有环境中,模型仅能访问经批准的上下文。此举解决了Agent易“失控”或“失忆”的问题,显著降低了工程化门槛,推动其从演示原型迈向生产级基础设施。
关联讨论 1 条X:OpenAI Developers (@OpenAIDevs)用户在使用微信读书的AI听书功能时,发现其语音合成音色已非常逼真,但核心问题在于多音字识别准确率低,导致频繁读错字音,严重影响听书体验。相比之下,喜马拉雅的真人朗读版本效果更佳。用户认为,以当前大语言模型的技术水平,理应能更好地解决多音字歧义问题,并期待相关功能得到改进。
Google发布Gemma 4模型,采用创新的MTP drafters技术,实现最高3倍解码速度提升且质量无损。该技术让模型一次预测多个token,突破传统自回归生成的串行瓶颈,极大提升GPU利用率。vLLM项目在官方宣布后立即提供Day-0支持,用户可通过一条Docker命令快速部署。这一进步显著增强本地部署的实时性,使Agent、代码生成等场景受益,进一步放大开源模型在性价比和本地化运行方面的优势。
Gemma 4 现在最高能跑到 3倍速度,而且质量完全不变。 他们没有增加参数、没有换新架构,只是推出了一套 MTP drafters(多 token 预测草…
关联讨论 3 条X:宝玉 (@dotey)X:Testing Catalog (@testingcatalog)X:karminski (@karminski3)Inworld AI 发布了新一代实时对话语音模型 Realtime TTS-2,突破了传统TTS仅追求拟人化的竞争框架。该模型能够实时倾听完整对话,捕捉情绪、语气与节奏,动态决定回应方式,成为一个“会倾听、会共情、会适配”的对话伙伴。其关键创新包括:支持用自然语言语音指令像指挥大语言模型一样调整声音;同一声音身份可跨100多种语言保持一致性;还能通过文字描述生成全新声音并保存复用。这标志着语音AI从机械的“语音输出”迈向更贴近真人互动的“实时对话”时代。
小说写到将近一半,各方势力都已露面,情节推进大方向已定,但是细节开始变得错综复杂。于是我让 AI 给每个主要角色都建立了一个认知智能体。在写每一章之前,让它安排…
Google通过为Gemma 4引入MTP drafters(多token预测草稿机),在不增加参数、不改变架构和模型质量的前提下,实现了最高3倍的推理速度提升。该技术让模型能一次预测多个token,突破了传统自回归解码的串行瓶颈,极大提升了GPU利用率。这显著增强了本地部署的实时性,并使Agent、代码生成等场景受益,进一步放大了开源模型在性价比和本地运行方面的优势。
Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。
加密货币交易所Coinbase宣布裁员约14%,影响700名员工。CEO解释原因为加密货币市场下行导致营收下滑,以及AI技术显著提升工作效率,公司目标将AI生成代码比例从40%提至50%以上。同时,公司进行组织扁平化改革,管理层级压缩至最多5层,并要求管理者兼任一线贡献者,还将实验包括“单人团队”在内的AI原生小组。此次裁员与Block、Crypto.com等行业公司举措类似,均提及市场不佳与AI提效。有分析师认为,加密寒冬可能是主因,AI或是借口。
据报道,OpenAI正加速其首款AI智能体手机的开发,目标在2027年上半年量产。此举可能旨在强化其年底IPO的叙事,并将自身定位拓展至消费硬件平台。联发科有望成为独家处理器供应商,提供基于台积电N2P制程定制的天玑9600。关键硬件规格包括增强HDR管线的图像信号处理器,以提升AI视觉感知能力,以及双NPU架构、LPDDR6与UFS 5.0等。若按计划推进,2027至2028年总出货量可能达到约3000万台。
加密货币交易所 Coinbase 宣布裁员约 14%,涉及 700 名员工。CEO Brian Armstrong 解释原因包括加密货币市场下行及 AI 技术深刻改变公司运营。AI 已提升工程师效率,并使非技术团队能编写生产代码,公司目标是将 AI 生成代码比例从 40% 提至 50% 以上。同时,公司进行组织重构,管理层级压缩至最多 5 层,并试验“AI 原生小组”等新模式。尽管同行也出现类似裁员,但有分析师认为加密市场寒冬才是主因。消息公布后,公司股价盘前上涨 4%。
关联讨论 2 条X:Kim (@kimmonismus)X:Rohan Paul (@rohanpaul_ai)人工智能公司Anthropic与谷歌云达成一项价值约2000亿美元的多年期承诺,用于购买云计算服务和TPU芯片。此举不仅是购买服务器,更是对未来训练和部署前沿模型所必需的稀缺计算资源(包括芯片、电力、网络和数据中心空间)的长期储备。据报道,此项承诺可能占谷歌云近期披露收入积压的40%以上,意味着单一AI实验室已成为其未来合同销售的重要部分。其深层战略在于分散依赖,Anthropic将Claude的算力分布在谷歌TPU、亚马逊Trainium和英伟达GPU上,以避免受限于单一供应商。
关联讨论 2 条The Decoder:AI News(RSS)X:Yuchen Jin (@Yuchenj_UW)OpenAI已将GPT-5.5 Instant设置为ChatGPT的默认模型。该模型在医学、法律和金融等关键提示上的虚假陈述比前代减少52.5%,在用户标记过事实错误的困难对话中不准确陈述降低37.3%。回答更简洁,用词和行数减少约30%。同时,模型增强了图像和STEM处理能力,并能从记忆、过往对话、文件及连接的Gmail中提取上下文以实现深度个性化。OpenAI表示,此次升级旨在提供更智能、清晰、个性化且语气自然温暖的回答。
关联讨论 13 条X:Greg Brockman (@gdb)X:Testing Catalog (@testingcatalog)The Decoder:AI News(RSS)X:宝玉 (@dotey)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)OpenAI:官网动态(RSS · 排除企业/客户案例)X:歸藏 (@op7418)X:OpenAI Developers (@OpenAIDevs)IT之家(RSS)X:OpenAI (@OpenAI)本文针对AI开发者提出关键观点,主张智能体技能应被视为默认不受信任的代码,而非仅凭签名或来源就推断其可信。当前运行时环境默认信任已签名技能的做法存在安全风险。论文强调,技能必须经过独立的门控验证流程才能被信任,否则,每次不可逆调用都需要人工介入,这在大规模应用中会退化为无效的“橡皮图章”式批准。将技能作为一等部署工件并引入验证流程,是借鉴软件供应链安全经验、避免技能库成为下一个攻击面的关键。论文呼吁在技能库普及前,通过严格验证建立安全基准。
AI工作正从聊天交互转向能直接操作计算机的智能体。Sai推出的新产品提供了一个由AI代理控制的远程计算机(通常是虚拟机),用户可通过手机或电脑与之交互。AI在私有远程桌面中自主操作真实应用程序,执行完整工作流。其核心突破在于手机成为真实软件工作的“遥控器”,繁重任务由后台持续运行的计算机完成。实际用例中,团队成员通过iMessage报告问题,Sai能在其虚拟机中复现问题、截图并交由Claude Code修改代码和提交PR,全程无需打开笔记本电脑,实现了在移动端发起并完成复杂工作。