AIHOT

4月30日

07:52

Simon Willison 博客

30

llm 0.32a1 发布

llm 发布了 0.32a1 版本，修复了 0.32a0 版本中存在的一个关键缺陷。该缺陷会导致从 SQLite 数据库重新加载时，工具调用对话无法正确恢复。此次更新解决了 GitHub 上的 issue #1426。

GitHub产品更新

07:47

阿绎 AYi@AYi_AInotes

精选70

Google Gemini实现AI"交付时代"跨越，直接生成可下载办公文件

Google Gemini迎来重磅更新，用户现可在聊天中通过一句话指令，直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件，无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表，且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”，迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成，实现了降维打击，对依赖AI生成文档的初创公司构成巨大压力，并推动行业竞争焦点转向直接产出可用成果。

Google产品更新

关联讨论 4 条

推荐理由：Gemini原生生成文档这功能，不是简单的“能出Word”，而是把二十年Workspace生态变成AI的输出管道，那些靠格式转换吃饭的中间商要慌了。

07:41

OpenClaw🦞@openclaw

58

OpenClaw 2026.4.27 🦞 🧠 DeepInfra 提供商 📎 更好的文件附件功能 🛡️ 运营商管理的代理路由 🧭 更严格的模型选择 + 本地模型修复 🔧 网关、通道和会话可靠性实干多于自夸。 https：//github.com/openclaw/openclaw/releases/tag/v2026.4.27

智能体产品更新

07:41

IT之家（RSS）

60

苹果发布 AI 框架 LaDiR：突破单一思维，并行探索多条推理路径

苹果公司与加州大学圣迭戈分校团队联合发布名为LaDiR的AI推理框架。该框架并非新模型，而是一个可叠加于现有大语言模型之上的通用架构，其核心创新在于结合扩散模型与自回归模型。在推理阶段，LaDiR利用扩散过程并行探索多条独立路径，并通过多样性鼓励机制防止思维过早收敛，最后以自回归方式输出最终答案。测试显示，该框架在LLaMA 3.1 8B等模型上，于数学推理、代码生成及谜题规划任务中，其准确率和可靠性均优于现有通用方法。

Meta推理论文/研究

07:40

Berryxia.AI@berryxia

55

越来越方便了，Agent来帮你完成Cloud Flare 中的创建账号，启动付费订阅，注册域名… 任务。

智能体产品更新部署/工程

07:39

Berryxia.AI@berryxia

52

Moonlake推出3D Agent：AI自动化生成可编辑3D资产

Moonlake发布3D Agent，这是一个AI驱动的工具，能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景（包含数百物体）。它支持从零建模，自动处理独立部件和关节绑定，无需预设规则，并能重建完整可编辑的室内或室外场景。通过原生集成Blender，该工具实现了真实工作流的自动化，简化3D创作过程。

智能体产品更新多模态

07:26

IT之家（RSS）

21

IT早报 0430：微信朋友圈灰度改版；追觅回应造车质疑；小米自研芯片玄戒 O3 曝光；DeepSeek 灰度"识图模式"

微信朋友圈正进行灰度改版，将文字描述移至配图上方，并新增“时间轴相册”入口。追觅正式回应造车质疑，宣布其高端新能源品牌“星空计划”首款概念车零百加速0.9秒，采用“华为模式”合作造车，量产车计划于2027年上市。小米下一代自研芯片“玄戒O3”信息曝光，主频突破4GHz。DeepSeek大模型正灰度测试具备多模态识别能力的“识图模式”。此外，比亚迪方程豹钛7 EV闪充版上市，福特改装版Mustang创下全美400米加速最快电车纪录。

多模态开源生态行业动态

07:23

IT之家（RSS）

50

消息称苹果已搁置研发 Vision Pro 头显，重心转向 Siri 和 AI 眼镜

据报道，苹果公司已内部搁置新款Vision Pro头显的研发，原团队重心转向Siri和AI智能眼镜项目。Vision Pro自发布以来市场反应冷淡，总销量约60万台且退货比例异常偏高。尽管在2025年10月其升级至M5芯片并改进了头带，但3499美元的高价和超过1.3磅的机身重量仍影响佩戴体验，未能扭转需求。苹果已停止新款硬件开发工作，但会继续维护和更新visionOS系统。

行业动态语音

07:11

dax@thdxr

35

我们开发了opentui，这样高管们就能在终端应用中输入指令，让他们感觉自己像黑客，并回忆起年轻时还能派上用场的日子。

产品更新编码

07:10

IT之家（RSS）

45

苹果 AI 眼镜曝光：内置 2 颗摄像头、支持 Siri 智能交互、可手势控制

据报道，苹果正加速研发其首款智能眼镜，预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备，核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头：高分辨率主摄用于拍照录像，低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄，眼镜不内置显示屏及LiDAR等模块，并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri，支持拍照、通话及环境交互。产品可能于2026年晚些时候预览，2027年正式上市。

多模态端侧行业动态

07:09

OpenAI Developers@OpenAIDevs

精选63

你完全可以构建网络应用

OpenAI教程/实践编码部署/工程

推荐理由：OpenAI开发者官方转发了这篇‘直接构建web应用’的文章，说明这可能是他们认可的实践路径，对想用AI快速搭应用的开发者算是个值得收藏的参考。

07:00

宝玉@dotey

69

OpenAI发布GPT-5.5官方提示词指南：主张简短指令，转向结果导向

OpenAI在发布GPT-5.5后推出官方提示词指南，核心主张是摒弃冗长指令。指南指出，新模型具备更强推理能力，用户只需清晰描述期望结果、成功标准和限制条件，过细的步骤规划反而会限制模型搜索空间，导致输出僵化。关键建议包括采用简短的角色、目标等模块化提示；为搜索设定“检索预算”以控制成本；在创意写作中严格区分事实与虚构。这标志着提示词范式从“详细过程控制”转向“结果导向”。

OpenAI推理教程/实践

关联讨论 1 条

06:59

Anthropic@AnthropicAI

59

科学博客上新：我们给Claude出了99个分析真实生物学数据的难题，并将其表现与专家小组进行了比较。在23个问题上，专家们被难住了。我们最新的模型解决了其中大约30%--以及其余的大部分问题。

Anthropic推理论文/研究

06:52

Satya Nadella@satyanadella

67

NVIDIA公布季度财报，AI业务年化收入突破370亿美元

NVIDIA在季度财报电话会议中宣布，其AI业务年化收入已突破370亿美元，同比增长123%。公司指出，当前正处于一个关键的平台转型期，技术栈正从由终端用户驱动的工作负载，转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革，扩大市场总规模，并重塑全球经济的价值创造模式。为把握此机遇，NVIDIA正专注于两大核心任务：提供强大的AI基础设施和解决方案，以赋能所有企业在这一智能体计算时代实现成果最大化。

Microsoft现象/趋势行业动态

06:32

宝玉@dotey

62

我测试了 GPT-4o 和 Claude 3.5 Sonnet 在多种任务上的表现。 Claude 在需要深度思考的任务中表现更好，而 GPT-4o 在需要快速响应的任务中更出色。两者都是优秀的模型，但各有侧重。

智能体教程/实践

06:18

Rohan Paul@rohanpaul_ai

55

Replit 首席执行官 Amjad Masad：我们正进入后提示时代：AI 将从优化提示转向开发新界面和能在后台运行的自主智能体。 "完全自主的智能体将能够主动推送而非被动拉取，并在后台运行"

智能体大佬观点

06:09

Luma@LumaLabsAI

58

优质内容值得拥有全球观众。上传你的视频。设置语言。Luma Agents 会处理翻译、唇形同步和针对每个市场的本地化工作。无需重新拍摄。无需单独制作流程。只需你的内容，触达所有需要的地方。走向全球 → http：//lumalabs.ai/app

智能体产品更新多模态视频

06:04

Marc Andreessen 🇺🇸@pmarca

25

但后来… 【引用 @feelsdesperate】：我注意到AI让行政人员能够发送冗长复杂的邮件，这些邮件需要大量时间来回复。这是一种巨大的不对称，迟早必须得到解决。

其他现象/趋势

05:59

Greg Brockman@gdb

40

我对GPT Image 2在应用构建中的实用性感到非常惊喜：【引用 @romainhuet】：GPT-5.5 + GPT-Image-2 is becoming one of the best combos for building apps！ @dkundel 分析了它为何如此有效。我们将这些见解融入了Build Web Apps插件中，因此Codex可以为您处理从设计到应用的循环。👌

OpenAI图像生成多模态大佬观点

05:57

Greg Brockman@gdb

61

使用codex app-server构建你自己的智能体【引用 @arrakis_ai】：Codex应用服务器被严重低估了。你可以通过ChatGPT账户将Codex级别的智能注入任何平台。我把它嵌入到Chrome里…运行完美无瑕。是的…它100%开源。 https：//github.com/GENEXIS-AI/chromex

OpenAI开源/仓库

05:49

Chubby♨️@kimmonismus

64

AI成增长引擎，谷歌搜索营收创新高

谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元，生成式AI产品收入年增近800%，大额合同储备翻倍。关键转折在于搜索业务：搜索广告收入增长19%，查询量创历史新高。这表明AI非但没有取代传统搜索，反而成为其业务的增长加速器，成功将生存威胁转化为发展动力。

Google搜索现象/趋势

05:44

OpenAI Developers@OpenAIDevs

精选64

通过Figma插件，Codex现在可以将实施计划转化为可视化的FigJam白板。

MCP/工具OpenAI产品更新编码

推荐理由：Codex 这次更新不是小功能补丁，它把 Figma 从设计师专属变成了开发者的白板，generate_diagram 直接画架构图，做系统设计的可以扔了 Lucidchart 了。

05:43

Ethan Mollick@emollick

56

Gemini现在可以创建文档了，这是个不错的开始，但尚未达到前沿水平，正如你从我"霍格沃茨杠杆收购"测试中看到的那样。 PowerPoint比NotebookLM差得多，电子表格功能简陋，仍然没有思考轨迹，它的思考也不够深入。

Google评测/基准

05:25

Z.ai@Zai_org

59

模型规模化部署的挑战与GLM-5服务调试经验

模型能力的提升遵循扩展定律，但其在生产环境中的可靠性取决于如何应对“规模化阵痛”。博客通过GLM-5大规模服务的调试实例，分享了处理罕见乱码输出、重复及生僻字符生成等问题的经验。关键工作包括追踪并消除KV Cache的竞态条件、修复HiCache同步问题，以及引入LayerSplit技术以实现最高132%的吞吐量提升。这些实践旨在帮助社区避免类似陷阱，构建更健壮的推理基础设施。

教程/实践部署/工程

关联讨论 1 条

05:05

OpenAI Developers@OpenAIDevs

精选62

⚙️ 我们通过 Responses API 中的 WebSockets 让代理循环运行得更快随着 Codex 速度提升，瓶颈从推理转移到了低效的 API 调用 WebSockets 在工具调用之间保持响应状态活跃，帮助工作流程端到端运行速度提升高达 40% https：//openai.com/index/speeding-up-agentic-workflows-with-websockets

智能体OpenAI产品更新

推荐理由：这不是颠覆性更新，但对依赖 Responses API 搭 agent 的开发者是个实打实的好消息，loop 加速 40% 意味着延迟和成本双降，官方推荐的最佳实践值得直接套用。

05:01

Replit ⠕@Replit

41

提示词时代正在终结。接下来是：新的界面和全自主代理，它们将推送而非拉取。 Amjad 谈后提示时代，与 @southpkcommons 直播中 ⠕ 完整对话如下。

智能体大佬观点现象/趋势编码

04:46

Hacker News 热门（buzzing.cc 中文翻译）

46

不使用人工智能的人将会被时代淘汰

一篇题为“不使用人工智能的人将会被时代淘汰”的文章在Hacker News上获得110点高关注。文章指出，随着AI技术在各行各业加速渗透，个人和企业若不积极采用AI工具，将在效率、创新和竞争力上落后，面临被时代边缘化的风险。它强调AI已成为职场、教育和社会发展的核心驱动力，忽视其应用将导致技能过时和市场淘汰，并警示公众需主动拥抱AI以应对快速变化的数字环境。

现象/趋势

04:31

Rohan Paul@rohanpaul_ai

51

深度学习迈向科学理论：顶尖实验室提出"学习力学"新范式

哈佛、斯坦福、UC伯克利等顶尖实验室联合提出，深度学习正从经验优化转向可解释的科学理论。尽管神经网络架构、数据等完全公开，但其复杂互动使得预测训练过程仍依赖大量实验。作者倡导建立“学习力学”，类似物理学关注宏观规律，通过可解玩具模型、无限宽度极限、缩放定律等五种路径，揭示训练动态与性能演化的整体性法则。这一理论与专注于局部电路的机制可解释性研究形成互补，共同探索学习的全局定律。

推理数据/训练论文/研究

04:26

宝玉@dotey

60

我就说你们咋逆向 Claude Design 的 System Prompt 的，原来都在请求的 Payload 里面，包括调用啥工具都有。可惜额度太少了，用几次就没了

AnthropicMCP/工具教程/实践

04:26

Chubby♨️@kimmonismus

33

说真的，这是最能引起共鸣的感觉了。开源，本地化 = &lt；3

其他开源生态

04:20

Rohan Paul@rohanpaul_ai

57

Abacus 刚刚推出了 Abacus AI Studio。将 100 多种 AI 模型，以及图像、视频和语音功能，整合进一个仪表板。

产品更新多模态

04:14

OpenAI@OpenAI

26

还在思考如何将Codex用于（几乎）所有事情吗？ Codex能协助更多支持性工作，从整理研究到制作电子表格、演示文稿和摘要。

OpenAI其他编码

04:10

IT之家（RSS）

36

Meta 2026 财年第一财季净利润 267.73 亿美元，同比增长 61%

Meta发布2026财年第一季度财报，营收达563.11亿美元，同比增长33%；净利润为267.73亿美元，同比大幅增长61%。业绩增长主要得益于广告业务表现强劲，广告投放量及平均价格均实现增长。同时，公司旗下应用家族日活跃用户数持续上升。尽管Reality Labs业务仍处于亏损状态，但亏损额有所收窄。公司对下一季度营收给出了乐观预期。

行业动态

04:10

Luma@LumaLabsAI

56

你的主体拍得很棒。背景却不尽人意。几秒钟内搞定它。上传你的参考图，设定场景，让Luma Agents将你的主体无缝融入任何环境，光照一致。结果看起来就像它本就该在那里。更换场景 → http：//lumalabs.ai/app

产品更新图像生成视频

04:09

Sundar Pichai@sundarpichai

63

谷歌Q1财报亮眼，AI投资驱动全线业务增长

谷歌2026年第一季度业绩表现强劲，AI投资与全栈策略正全面推动业务增长。公司搜索查询量因AI驱动创下历史新高，Google Cloud收入同比增长63%。Gemini模型发展势头迅猛，以GeminiApp为代表的消费者AI订阅业务也创下季度最佳纪录。公司即将举行财报电话会议，并将在20天后的Google I/O大会上分享更多进展。

Google搜索行业动态

关联讨论 1 条

04:00

Google AI Developers@googleaidevs

55

观看 @thorwebdev 的这个演示，看看 Gemini 3.1 Flash 如何作为实时 DJ 实际运作。该模型使用函数调用（调用 Gemini API），通过 Lyria 3️⃣ 生成定制的 30 秒片段。在 @GoogleAIStudio 中开启你自己的工作室会话：http：//goo.gle/3PbcCXJ

Google多模态教程/实践

04:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选57

Where the goblins came from：GPT-5 行为中"妖精"输出的起源

研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为，源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源，并正在部署修复方案，通过调整训练数据和微调模型来消除此类非预期的个性特征，以提升模型行为的稳定性和可预测性。

OpenAI数据/训练论文/研究

推荐理由：GPT-5的“地精”现象不是偶然，OpenAI这篇复盘把它追溯到训练数据的最早期阶段，解释了模型为什么会有自己的“脾气”，做模型训练的值得细读。

03:55

SemiAnalysis@SemiAnalysis_

46

德黑兰，2026年4月29日--在@deepseek_ai DeepSeek v4 Pro发布不到一周后，@vllm_project和@inferact的破解团队在GB200（Dynamo+vLLM）上取得了显著改进。这主要得益于vLLM 0.20.0版本的发布，该版本为DEP部署启用了MegaMoE内核！出色的工作--我们期待在未来几天重点介绍更多改进。

DeepSeek产品更新开源生态推理

03:46

Anthropic@AnthropicAI

精选64

在新的Anthropic Fellows研究中，我们探讨了"内省适配器"：这种工具能让语言模型自我报告在训练过程中习得的行为--包括潜在的错位。【引用 @kshenoy_】：大型语言模型能否直接告诉我们它们在训练中习得的不良行为？我们训练了一个单一的内省适配器（IA），使微调后的模型能够描述自身行为。该方法可推广至检测隐藏的错位、后门和安全措施移除。

Anthropic数据/训练论文/研究

推荐理由：让模型自己说出训练时偷偷学会了什么，还泛化到检测后门和隐藏不对齐，可能是对齐工具箱里一种很实用的新方法，做安全的值得细看。

03:45

ClaudeDevs@ClaudeDevs

精选62

Claude Code 内置一项用于操作 Claude Platform 的技能。适用于模型迁移、使用 API 功能（例如提示缓存），或接入较新的 API 如 Claude Managed Agents。

AnthropicMCP/工具产品更新

关联讨论 3 条

推荐理由：Claude Code 终于把平台操作集成进命令行，模型迁移和 prompt caching 现在一条命令搞定，做 agent 开发的省了大把配配置文件的时间。