谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元,生成式AI产品收入年增近800%,大额合同储备翻倍。关键转折在于搜索业务:搜索广告收入增长19%,查询量创历史新高。这表明AI非但没有取代传统搜索,反而成为其业务的增长加速器,成功将生存威胁转化为发展动力。
模型能力的提升遵循扩展定律,但其在生产环境中的可靠性取决于如何应对“规模化阵痛”。博客通过GLM-5大规模服务的调试实例,分享了处理罕见乱码输出、重复及生僻字符生成等问题的经验。关键工作包括追踪并消除KV Cache的竞态条件、修复HiCache同步问题,以及引入LayerSplit技术以实现最高132%的吞吐量提升。这些实践旨在帮助社区避免类似陷阱,构建更健壮的推理基础设施。
关联讨论 1 条智谱:研究(网页内嵌数据)哈佛、斯坦福、UC伯克利等顶尖实验室联合提出,深度学习正从经验优化转向可解释的科学理论。尽管神经网络架构、数据等完全公开,但其复杂互动使得预测训练过程仍依赖大量实验。作者倡导建立“学习力学”,类似物理学关注宏观规律,通过可解玩具模型、无限宽度极限、缩放定律等五种路径,揭示训练动态与性能演化的整体性法则。这一理论与专注于局部电路的机制可解释性研究形成互补,共同探索学习的全局定律。
《哈佛商业评论》文章指出,AI的首要经济影响并非自动化,而是制造了巨大的不确定性“迷雾”,导致“预见能力的崩溃”。这动摇了现代资本主义依赖未来“可读性”的根基,使得个人对教育投资、企业对长期雇佣与资本开支、金融市场对终值的评估均陷入犹豫。其结果是行为模式迅速转向短期视野:更倾向于模块化、可调整的投入,而非长期、不可逆的重大承诺。
Mistral Medium 3.5是MistralAI的新旗舰模型,以公共预览版发布。它整合指令遵循、推理和编码能力,采用128B密集参数和256k上下文窗口,支持可配置推理努力。模型定位比基准测试更关键,比较对象包括Kimi、Qwen、GLM和Claude Sonnet,而非GPT或Gemini。随着Aleph Alpha被Cohere收购,Mistral成为唯一非美国、非中国的尖端实验室,以开源权重和修改的MIT许可证发布。模型在推理效率与一致性间权衡,Collie分数达95.8领先,目标不是原始推理,而是成为生产中可靠遵循指令的模型,体现欧洲企业定位。它是Mistral Vibe和Le Chat的新默认模型。
马斯克作为首名证人出庭,指控OpenAI从非营利开源转向营利闭源,违背创立初衷。他警告AI垄断可能带来人类灭绝风险。这场诉讼已超越私人恩怨,成为首次在法庭上争夺AI控制权的标志性事件,核心争议聚焦于AI发展的速度与安全、开源与闭源以及控制权归属等终极问题。无论结果如何,此案都将把AI治理议题置于全球视野,成为科技史的重要转折点。
马斯克真的和OpenAI在法庭上开战了,这条77万浏览的帖子把这场审判包装成了人类存亡之战🫠🤣😆 我先拆穿一个最容易被忽略的细节, 视频里只有他过安检的…
关联讨论 3 条IT之家(RSS)X:Kim (@kimmonismus)The Decoder:AI News(RSS)Hermes Agent采用四层记忆架构,核心是保持提示词稳定以优化缓存。第一层是固化在提示词中的MEMORY.md和USER.md文件,容量小以确保缓存友好性;第二层是通过session_search调用的SQLite历史会话存档,实现按需检索;第三层是压缩对话时的记忆冲刷机制,优先保存关键信息;第四层是作为程序记忆的技能管理系统。可选的Honcho层用于深层用户建模。与OpenClaw的流水账存储不同,Hermes严格区分记忆层级,强调缓存效率,旨在以正确成本记住正确信息。
研究人员通过询问不同难度知识问题,估计大型语言模型参数大小。结果显示,GPT 5.5约10T参数,Claude Opus 4.x约4-5T,Grok 4约3T。事实性知识容量与模型规模呈对数线性关系。论文提出7个知识层级,最高层级T7对所有模型接近零,表明预训练仍有显著提升空间。Gemini 3.1 Pro可能超过10T参数。此方法有助于推断模型训练成本及后训练在非事实性任务上的性能。
当前AI智能体缺乏感知层,只能被动响应提示。World2Agent (W2A) 通过构建开放协议解决了这一问题,它将现实世界事件(如GitHub动态、股价变动或社交媒体帖子)通过传感器转化为结构化信号。智能体可订阅这些信号,从而能自主决策和行动,无需人工持续输入。这消除了开发者需手动集成轮询、Webhook等复杂逻辑的负担。本质上,W2A为构建主动型智能体提供了缺失的基础设施层,类似于MCP协议为工具调用所做的标准化工作。例如,当特定人物发帖时,传感器捕捉信号后,智能体可自动触发代码库审查任务,实现了“知道何时行动”的关键能力。
作者强调自己并非AI原生博主,而是关注效率,将AI视为提升效率的工具。其核心关切点在于如何赚钱、制作内容并获取流量,同时利用AI加速这些过程以促进线下活动。他认为学习AI有必要,但必须基于某种核心业务,这才是关键所在。
团队开发了Symphony平台,旨在解决产品与技术因工具链割裂导致的协作效率低下问题。该平台将AI Coding能力收敛至统一环境,推动开发模式从人驱动工具转变为Agent任务驱动。其核心是让AI自动处理需求拆解、构建与交付初版,团队仅需负责提出需求、验证结果与提供兜底。尽管类似实践已在行业中出现,但对团队而言当前正是推行时机。未来计划进一步整合产品与测试流程,以探索自动化开发的极限。
五一期间好好干,GPT生图了。 这几天实在是忙的没时间更新和创作。 看来这一波GPT生图,把原来玩过的还可以再来一次啊。
一段演示视频显示,GPT-5.5通过Codex接管浏览器,自动与亚马逊真人客服谈判,成功取消Prime会员并获得全额退款,耗时仅约50秒且成本极低。AI在谈判中目标明确、逻辑清晰,确认退款后直接结束对话,毫无社交冗余。这标志着普通人能以低成本雇佣高效、不知疲倦的“数字谈判专家”,极大增强消费者对抗繁琐流程和隐形收费的能力。AI正成为替人类处理繁琐事务的“打手”,并可能重塑依赖用户惰性的商业盈利模式。
Browserbase推出的/browser-trace工具,解决了Agent网页自动化调试的核心痛点。它能无感地完整记录Agent(如Claude)操作网页的全过程,涵盖数千个CDP事件、DOM快照、网络请求及JS异常,并自动生成交互式HTML报告。这相当于为浏览器Agent创建了“黑匣子”和可观测性系统,将浏览器从黑箱执行器转变为透明、可查询、可复现的系统,为Agent的工程化可靠性奠定了坚实基础。