llm 发布了 0.32a1 版本,修复了 0.32a0 版本中存在的一个关键缺陷。该缺陷会导致从 SQLite 数据库重新加载时,工具调用对话无法正确恢复。此次更新解决了 GitHub 上的 issue #1426。
Google Gemini迎来重磅更新,用户现可在聊天中通过一句话指令,直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件,无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表,且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”,迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成,实现了降维打击,对依赖AI生成文档的初创公司构成巨大压力,并推动行业竞争焦点转向直接产出可用成果。
关联讨论 4 条X:Gemini (@GeminiApp)X:Testing Catalog (@testingcatalog)X:Josh Woodward (@joshwoodward, Google Labs VP)X:Sundar Pichai (@sundarpichai)苹果公司与加州大学圣迭戈分校团队联合发布名为LaDiR的AI推理框架。该框架并非新模型,而是一个可叠加于现有大语言模型之上的通用架构,其核心创新在于结合扩散模型与自回归模型。在推理阶段,LaDiR利用扩散过程并行探索多条独立路径,并通过多样性鼓励机制防止思维过早收敛,最后以自回归方式输出最终答案。测试显示,该框架在LLaMA 3.1 8B等模型上,于数学推理、代码生成及谜题规划任务中,其准确率和可靠性均优于现有通用方法。
Moonlake发布3D Agent,这是一个AI驱动的工具,能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景(包含数百物体)。它支持从零建模,自动处理独立部件和关节绑定,无需预设规则,并能重建完整可编辑的室内或室外场景。通过原生集成Blender,该工具实现了真实工作流的自动化,简化3D创作过程。
微信朋友圈正进行灰度改版,将文字描述移至配图上方,并新增“时间轴相册”入口。追觅正式回应造车质疑,宣布其高端新能源品牌“星空计划”首款概念车零百加速0.9秒,采用“华为模式”合作造车,量产车计划于2027年上市。小米下一代自研芯片“玄戒O3”信息曝光,主频突破4GHz。DeepSeek大模型正灰度测试具备多模态识别能力的“识图模式”。此外,比亚迪方程豹钛7 EV闪充版上市,福特改装版Mustang创下全美400米加速最快电车纪录。
据报道,苹果公司已内部搁置新款Vision Pro头显的研发,原团队重心转向Siri和AI智能眼镜项目。Vision Pro自发布以来市场反应冷淡,总销量约60万台且退货比例异常偏高。尽管在2025年10月其升级至M5芯片并改进了头带,但3499美元的高价和超过1.3磅的机身重量仍影响佩戴体验,未能扭转需求。苹果已停止新款硬件开发工作,但会继续维护和更新visionOS系统。
据报道,苹果正加速研发其首款智能眼镜,预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备,核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头:高分辨率主摄用于拍照录像,低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄,眼镜不内置显示屏及LiDAR等模块,并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri,支持拍照、通话及环境交互。产品可能于2026年晚些时候预览,2027年正式上市。
OpenAI在发布GPT-5.5后推出官方提示词指南,核心主张是摒弃冗长指令。指南指出,新模型具备更强推理能力,用户只需清晰描述期望结果、成功标准和限制条件,过细的步骤规划反而会限制模型搜索空间,导致输出僵化。关键建议包括采用简短的角色、目标等模块化提示;为搜索设定“检索预算”以控制成本;在创意写作中严格区分事实与虚构。这标志着提示词范式从“详细过程控制”转向“结果导向”。
关联讨论 1 条X:邵猛 (@shao__meng)NVIDIA在季度财报电话会议中宣布,其AI业务年化收入已突破370亿美元,同比增长123%。公司指出,当前正处于一个关键的平台转型期,技术栈正从由终端用户驱动的工作负载,转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革,扩大市场总规模,并重塑全球经济的价值创造模式。为把握此机遇,NVIDIA正专注于两大核心任务:提供强大的AI基础设施和解决方案,以赋能所有企业在这一智能体计算时代实现成果最大化。
谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元,生成式AI产品收入年增近800%,大额合同储备翻倍。关键转折在于搜索业务:搜索广告收入增长19%,查询量创历史新高。这表明AI非但没有取代传统搜索,反而成为其业务的增长加速器,成功将生存威胁转化为发展动力。
模型能力的提升遵循扩展定律,但其在生产环境中的可靠性取决于如何应对“规模化阵痛”。博客通过GLM-5大规模服务的调试实例,分享了处理罕见乱码输出、重复及生僻字符生成等问题的经验。关键工作包括追踪并消除KV Cache的竞态条件、修复HiCache同步问题,以及引入LayerSplit技术以实现最高132%的吞吐量提升。这些实践旨在帮助社区避免类似陷阱,构建更健壮的推理基础设施。
关联讨论 1 条智谱:研究(网页内嵌数据)一篇题为“不使用人工智能的人将会被时代淘汰”的文章在Hacker News上获得110点高关注。文章指出,随着AI技术在各行各业加速渗透,个人和企业若不积极采用AI工具,将在效率、创新和竞争力上落后,面临被时代边缘化的风险。它强调AI已成为职场、教育和社会发展的核心驱动力,忽视其应用将导致技能过时和市场淘汰,并警示公众需主动拥抱AI以应对快速变化的数字环境。
哈佛、斯坦福、UC伯克利等顶尖实验室联合提出,深度学习正从经验优化转向可解释的科学理论。尽管神经网络架构、数据等完全公开,但其复杂互动使得预测训练过程仍依赖大量实验。作者倡导建立“学习力学”,类似物理学关注宏观规律,通过可解玩具模型、无限宽度极限、缩放定律等五种路径,揭示训练动态与性能演化的整体性法则。这一理论与专注于局部电路的机制可解释性研究形成互补,共同探索学习的全局定律。
Meta发布2026财年第一季度财报,营收达563.11亿美元,同比增长33%;净利润为267.73亿美元,同比大幅增长61%。业绩增长主要得益于广告业务表现强劲,广告投放量及平均价格均实现增长。同时,公司旗下应用家族日活跃用户数持续上升。尽管Reality Labs业务仍处于亏损状态,但亏损额有所收窄。公司对下一季度营收给出了乐观预期。
谷歌2026年第一季度业绩表现强劲,AI投资与全栈策略正全面推动业务增长。公司搜索查询量因AI驱动创下历史新高,Google Cloud收入同比增长63%。Gemini模型发展势头迅猛,以GeminiApp为代表的消费者AI订阅业务也创下季度最佳纪录。公司即将举行财报电话会议,并将在20天后的Google I/O大会上分享更多进展。
关联讨论 1 条Tomer Tunguz 博客(VC 分析)研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为,源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源,并正在部署修复方案,通过调整训练数据和微调模型来消除此类非预期的个性特征,以提升模型行为的稳定性和可预测性。