4月30日
07:52
Simon Willison 博客
30
llm 0.32a1 发布

llm 发布了 0.32a1 版本,修复了 0.32a0 版本中存在的一个关键缺陷。该缺陷会导致从 SQLite 数据库重新加载时,工具调用对话无法正确恢复。此次更新解决了 GitHub 上的 issue #1426。

GitHub产品更新
07:47
阿绎 AYi@AYi_AInotes
精选70
Google Gemini实现AI"交付时代"跨越,直接生成可下载办公文件

Google Gemini迎来重磅更新,用户现可在聊天中通过一句话指令,直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件,无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表,且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”,迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成,实现了降维打击,对依赖AI生成文档的初创公司构成巨大压力,并推动行业竞争焦点转向直接产出可用成果。

Google产品更新
关联讨论 4X:Gemini (@GeminiApp)X:Testing Catalog (@testingcatalog)X:Josh Woodward (@joshwoodward, Google Labs VP)X:Sundar Pichai (@sundarpichai)
推荐理由:Gemini原生生成文档这功能,不是简单的“能出Word”,而是把二十年Workspace生态变成AI的输出管道,那些靠格式转换吃饭的中间商要慌了。
07:41
IT之家(RSS)
60
苹果发布 AI 框架 LaDiR:突破单一思维,并行探索多条推理路径

苹果公司与加州大学圣迭戈分校团队联合发布名为LaDiR的AI推理框架。该框架并非新模型,而是一个可叠加于现有大语言模型之上的通用架构,其核心创新在于结合扩散模型与自回归模型。在推理阶段,LaDiR利用扩散过程并行探索多条独立路径,并通过多样性鼓励机制防止思维过早收敛,最后以自回归方式输出最终答案。测试显示,该框架在LLaMA 3.1 8B等模型上,于数学推理、代码生成及谜题规划任务中,其准确率和可靠性均优于现有通用方法。

Meta推理论文/研究
07:39
Berryxia.AI@berryxia
52
Moonlake推出3D Agent:AI自动化生成可编辑3D资产

Moonlake发布3D Agent,这是一个AI驱动的工具,能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景(包含数百物体)。它支持从零建模,自动处理独立部件和关节绑定,无需预设规则,并能重建完整可编辑的室内或室外场景。通过原生集成Blender,该工具实现了真实工作流的自动化,简化3D创作过程。

智能体产品更新多模态
07:26
IT之家(RSS)
21
IT早报 0430:微信朋友圈灰度改版;追觅回应造车质疑;小米自研芯片玄戒 O3 曝光;DeepSeek 灰度"识图模式"

微信朋友圈正进行灰度改版,将文字描述移至配图上方,并新增“时间轴相册”入口。追觅正式回应造车质疑,宣布其高端新能源品牌“星空计划”首款概念车零百加速0.9秒,采用“华为模式”合作造车,量产车计划于2027年上市。小米下一代自研芯片“玄戒O3”信息曝光,主频突破4GHz。DeepSeek大模型正灰度测试具备多模态识别能力的“识图模式”。此外,比亚迪方程豹钛7 EV闪充版上市,福特改装版Mustang创下全美400米加速最快电车纪录。

多模态开源生态行业动态
07:23
IT之家(RSS)
50
消息称苹果已搁置研发 Vision Pro 头显,重心转向 Siri 和 AI 眼镜

据报道,苹果公司已内部搁置新款Vision Pro头显的研发,原团队重心转向Siri和AI智能眼镜项目。Vision Pro自发布以来市场反应冷淡,总销量约60万台且退货比例异常偏高。尽管在2025年10月其升级至M5芯片并改进了头带,但3499美元的高价和超过1.3磅的机身重量仍影响佩戴体验,未能扭转需求。苹果已停止新款硬件开发工作,但会继续维护和更新visionOS系统。

行业动态语音
07:10
IT之家(RSS)
45
苹果 AI 眼镜曝光:内置 2 颗摄像头、支持 Siri 智能交互、可手势控制

据报道,苹果正加速研发其首款智能眼镜,预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备,核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头:高分辨率主摄用于拍照录像,低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄,眼镜不内置显示屏及LiDAR等模块,并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri,支持拍照、通话及环境交互。产品可能于2026年晚些时候预览,2027年正式上市。

多模态端侧行业动态
07:09
OpenAI Developers@OpenAIDevs
精选63
你完全可以构建网络应用
OpenAI教程/实践编码部署/工程

推荐理由:OpenAI开发者官方转发了这篇‘直接构建web应用’的文章,说明这可能是他们认可的实践路径,对想用AI快速搭应用的开发者算是个值得收藏的参考。
07:00
宝玉@dotey
69
OpenAI发布GPT-5.5官方提示词指南:主张简短指令,转向结果导向

OpenAI在发布GPT-5.5后推出官方提示词指南,核心主张是摒弃冗长指令。指南指出,新模型具备更强推理能力,用户只需清晰描述期望结果、成功标准和限制条件,过细的步骤规划反而会限制模型搜索空间,导致输出僵化。关键建议包括采用简短的角色、目标等模块化提示;为搜索设定“检索预算”以控制成本;在创意写作中严格区分事实与虚构。这标志着提示词范式从“详细过程控制”转向“结果导向”。

OpenAI推理教程/实践
关联讨论 1X:邵猛 (@shao__meng)
06:52
Satya Nadella@satyanadella
67
NVIDIA公布季度财报,AI业务年化收入突破370亿美元

NVIDIA在季度财报电话会议中宣布,其AI业务年化收入已突破370亿美元,同比增长123%。公司指出,当前正处于一个关键的平台转型期,技术栈正从由终端用户驱动的工作负载,转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革,扩大市场总规模,并重塑全球经济的价值创造模式。为把握此机遇,NVIDIA正专注于两大核心任务:提供强大的AI基础设施和解决方案,以赋能所有企业在这一智能体计算时代实现成果最大化。

Microsoft现象/趋势行业动态
05:49
Chubby♨️@kimmonismus
64
AI成增长引擎,谷歌搜索营收创新高

谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元,生成式AI产品收入年增近800%,大额合同储备翻倍。关键转折在于搜索业务:搜索广告收入增长19%,查询量创历史新高。这表明AI非但没有取代传统搜索,反而成为其业务的增长加速器,成功将生存威胁转化为发展动力。

Google搜索现象/趋势
05:44
05:25
Z.ai@Zai_org
59
模型规模化部署的挑战与GLM-5服务调试经验

模型能力的提升遵循扩展定律,但其在生产环境中的可靠性取决于如何应对“规模化阵痛”。博客通过GLM-5大规模服务的调试实例,分享了处理罕见乱码输出、重复及生僻字符生成等问题的经验。关键工作包括追踪并消除KV Cache的竞态条件、修复HiCache同步问题,以及引入LayerSplit技术以实现最高132%的吞吐量提升。这些实践旨在帮助社区避免类似陷阱,构建更健壮的推理基础设施。

教程/实践部署/工程
关联讨论 1智谱:研究(网页内嵌数据)
05:05
OpenAI Developers@OpenAIDevs
精选62
⚙️ 我们通过 Responses API 中的 WebSockets 让代理循环运行得更快 随着 Codex 速度提升,瓶颈从推理转移到了低效的 API 调用 WebSockets 在工具调用之间保持响应状态活跃,帮助工作流程端到端运行速度提升高达 40% https://openai.com/index/speeding-up-agentic-workflows-with-websockets
智能体OpenAI产品更新

推荐理由:这不是颠覆性更新,但对依赖 Responses API 搭 agent 的开发者是个实打实的好消息,loop 加速 40% 意味着延迟和成本双降,官方推荐的最佳实践值得直接套用。
04:46
Hacker News 热门(buzzing.cc 中文翻译)
46
不使用人工智能的人将会被时代淘汰

一篇题为“不使用人工智能的人将会被时代淘汰”的文章在Hacker News上获得110点高关注。文章指出,随着AI技术在各行各业加速渗透,个人和企业若不积极采用AI工具,将在效率、创新和竞争力上落后,面临被时代边缘化的风险。它强调AI已成为职场、教育和社会发展的核心驱动力,忽视其应用将导致技能过时和市场淘汰,并警示公众需主动拥抱AI以应对快速变化的数字环境。

现象/趋势
04:31
Rohan Paul@rohanpaul_ai
51
深度学习迈向科学理论:顶尖实验室提出"学习力学"新范式

哈佛、斯坦福、UC伯克利等顶尖实验室联合提出,深度学习正从经验优化转向可解释的科学理论。尽管神经网络架构、数据等完全公开,但其复杂互动使得预测训练过程仍依赖大量实验。作者倡导建立“学习力学”,类似物理学关注宏观规律,通过可解玩具模型、无限宽度极限、缩放定律等五种路径,揭示训练动态与性能演化的整体性法则。这一理论与专注于局部电路的机制可解释性研究形成互补,共同探索学习的全局定律。

推理数据/训练论文/研究
04:10
IT之家(RSS)
36
Meta 2026 财年第一财季净利润 267.73 亿美元,同比增长 61%

Meta发布2026财年第一季度财报,营收达563.11亿美元,同比增长33%;净利润为267.73亿美元,同比大幅增长61%。业绩增长主要得益于广告业务表现强劲,广告投放量及平均价格均实现增长。同时,公司旗下应用家族日活跃用户数持续上升。尽管Reality Labs业务仍处于亏损状态,但亏损额有所收窄。公司对下一季度营收给出了乐观预期。

行业动态
04:09
Sundar Pichai@sundarpichai
63
谷歌Q1财报亮眼,AI投资驱动全线业务增长

谷歌2026年第一季度业绩表现强劲,AI投资与全栈策略正全面推动业务增长。公司搜索查询量因AI驱动创下历史新高,Google Cloud收入同比增长63%。Gemini模型发展势头迅猛,以GeminiApp为代表的消费者AI订阅业务也创下季度最佳纪录。公司即将举行财报电话会议,并将在20天后的Google I/O大会上分享更多进展。

Google搜索行业动态
关联讨论 1Tomer Tunguz 博客(VC 分析)
04:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选57
Where the goblins came from:GPT-5 行为中"妖精"输出的起源

研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为,源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源,并正在部署修复方案,通过调整训练数据和微调模型来消除此类非预期的个性特征,以提升模型行为的稳定性和可预测性。

OpenAI数据/训练论文/研究

推荐理由:GPT-5的“地精”现象不是偶然,OpenAI这篇复盘把它追溯到训练数据的最早期阶段,解释了模型为什么会有自己的“脾气”,做模型训练的值得细读。
03:45
ClaudeDevs@ClaudeDevs
精选62
Claude Code 内置一项用于操作 Claude Platform 的技能。 适用于模型迁移、使用 API 功能(例如提示缓存),或接入较新的 API 如 Claude Managed Agents。
AnthropicMCP/工具产品更新
关联讨论 3Anthropic:Engineering(事故复盘 + 工程实践 · 网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)
推荐理由:Claude Code 终于把平台操作集成进命令行,模型迁移和 prompt caching 现在一条命令搞定,做 agent 开发的省了大把配配置文件的时间。