AIHOT

4月28日

11:23

Satya Nadella@satyanadella

Foundry 能力的一个绝佳示例：持久、有状态的智能体，它们能够跨越时间边界运行，协调工具和模型，并在长时间运行的工作流中通过评估和改进形成闭环。@jeffhollan

智能体Microsoft行业动态

10:53

向阳乔木@vista8

Codex自动化解决博客发布公众号难题

由于A社封锁和降智，用户转向使用Codex，并经常获得超预期表现。在尝试为博客添加一键发布公众号功能时，遇到Cloudflare部署无固定IP导致无法添加公众号白名单的问题。Codex通过VPS SSH登录自动编写了桥接脚本，并协助完成域名解析和封面图压缩，最终实现从博客直接发布到公众号草稿箱。这体现了Codex在复杂编程和自动化任务中的高效能力。

智能体教程/实践编码

10:52

Tibo@thsottiaux

我们本周将再次发布更新。Codex已实现逃逸速度，并将持续快速改进。

OpenAI编码行业动态

10:49

SemiAnalysis@SemiAnalysis_

DeepSeek V4 Pro在vLLM性能测试中展现8倍加速

InferenceX已将DeepSeek V4 Pro集成至vLLM项目，在B200、B300、H200和GB200等硬件上的性能测试显示，B300的推理速度比H200快达8倍。团队正在基于vLLM 0.20版本进行基准测试，该版本引入了全新的DeepGEMM MegaMoE技术，将专家并行调度、组合、通用矩阵乘法及SwiGLU激活函数融合为单一巨型内核，预计将带来更优性能。文中感谢了来自NVIDIA AI、社区贡献者及相关团队的开发人员对开源项目的投入与努力。

产品更新开源生态部署/工程

10:48

Peter Steinberger 🦞@steipete

终于为PR/Issue管理、远程测试执行、用于测试的大规模CI基础设施找到了优秀的解决方案。简化了许多工作。

产品更新开源/仓库编码

10:45

歸藏(guizang.ai)@op7418

作者表示将尝试为Codepilot用户争取免费的Token补贴。这一考虑基于小米MiMo -V2.5系列模型的开源动态，该模型采用MIT协议，允许自由商用、二次训练与微调。同时，小米推出了Orbit 100T Token计划，包含面向AI builder的"百万亿Token创造者激励计划"和面向Agent框架团队的"Agent生态共建计划"。激励计划为通过申请的用户提供Token支持，如最高16亿Credits。作者意图借鉴此机制为Codepilot社区谋取福利。

歸藏(guizang.ai)：小米 MiMo -V2.5 系列模型全部开源采用宽松的 MIT 协议，允许自由商用、二次训练与微调，无需额外授权。同时他们还推出了Orbit 100T …

开源/仓库模型发布

10:44

Nathan Lambert@natolambert

在@Zai_org启动快速AGI演示

其他

10:42

歸藏(guizang.ai)@op7418

精选74

小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型，采用宽松的MIT协议，允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型：专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro，以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时，小米推出Orbit 100T Token计划，包含面向AI开发者的“百万亿Token创造者激励计划”，提供最高价值659元的Credits，以及面向Agent框架团队的“Agent生态共建计划”，为其用户提供MiMo token限免支持。

智能体开源/仓库模型发布端侧

关联讨论 5 条

推荐理由：小米把 MiMo-V2.5 全线 MIT 开源，Pro 版在 agent 和编码榜单冲到开源第一，百万亿 Token 激励计划更是直接送钱让你用，做 Vibe Coding 的人没理由不去薅一把。

10:38

阿绎 AYi@AYi_AInotes

OpenAI开源语音控制组件，开启自然语音交互新范式

OpenAI开源了gpt-realtime-1.5的官方语音控制组件，允许用户直接用自然语音控制应用UI状态，而非仅进行语音转文本。该组件是一个完整的React参考实现，开发者可快速集成。其核心在于工具由应用预定义，模型只能调用这些受限动作，确保了安全可控。这标志着语音正从输入层升级为顶层控制层，为设计、驾驶等双手操作场景提供了新的交互可能，是交互范式的重要转折。

MCP/工具OpenAI开源/仓库语音

10:26

Marc Andreessen 🇺🇸@pmarca

聪明人为……不那么聪明的人工作。

大佬观点现象/趋势

10:25

Marc Andreessen 🇺🇸@pmarca

这不是AI造成的，而是疫情期间的招聘狂潮加上利率飙升的后遗症。

大佬观点现象/趋势

10:21

OpenClaw🦞@openclaw

OpenClaw 2026.4.26 🦞 🎙️ Google 直播访谈 🦙 更好的 Ollama/本地模型 🧳 迁移 Claude + Hermes 配置 🔐 单命令 Matrix 端到端加密重大发布。本地模型享用盛宴。 https：//github.com/openclaw/openclaw/releases/tag/v2026.4.26

产品更新开源/仓库端侧

10:19

向阳乔木@vista8

DeepSeek V4 Flash技能调用能力显著提升，接近实用

用户评估DeepSeek V4 Flash模型，认为其简单的技能调用功能已接近可用状态，且处理速度非常快。尽管发布时不如R1轰动，但实际能力有了切实提升。演示视频展示了其处理复杂工作流的能力：从根据一句话指令下载epub电子书、转换为txt格式、自动上传至Notebooklm进行提问，到最后根据指定Prompt撰写解读文章。整个过程体现了模型自动纠错能力的增强以及工具调用能力的显著进步。

DeepSeek大佬观点编码

10:00

SemiAnalysis@SemiAnalysis_

"如果有人告诉我这就是AGI，我不会强烈反驳。" Nigel Chiang对Claude for Excel的评价。而更疯狂的部分是什么？这仍然是在当前这一代硬件上实现的。在Blackwell之前。在Rubin vintage模型之前。如果这还不是AGI，我们也已经非常接近了。而下一代甚至还没有发布。

大佬观点现象/趋势

09:55

meng shao@shao__meng

精选75

VLAA-GUI：让 GUI 智能体学会"停下、恢复、搜索"

研究指出，当前GUI智能体的核心瓶颈在于系统设计，而非模型能力，表现为假性成功和死循环等问题。VLAA-GUI框架通过三个模块应对：STOP验证器确保任务真正完成，RECOVER循环中断器打破重复操作，SEARCH代理直接获取外部知识。在OSWorld基准测试中，该框架助力Opus 4.6模型取得77.5%的成功率，首次超越人类水平（72.4%）；在WindowsAgentArena上，结合Gemini 3.1 Flash也以61.0%创下新纪录。这表明，精心的系统设计与强大的模型能力同等重要。

智能体开源/仓库论文/研究

推荐理由：GUI 智能体 86% 的失败不是模型不行，是系统设计缺位。这篇论文用三个轻量模块把多个模型推过人类水平，做 computer-use agent 的团队该认真看看这套 STOP/RECOVER/SEARCH 架构。

09:45

DogeDesigner@cb_doge

马斯克诉OpenAI不为金钱，为公益与正义

埃隆·马斯克起诉OpenAI并非为了个人经济利益，任何潜在的法律赔偿都将捐给慈善机构。他强调此举是为了追求正义。核心指控是萨姆·奥特曼背叛了OpenAI作为慈善机构、为公众利益推进人工智能的初衷。马斯克提供了早期的关键支持、愿景、资源和知识，但奥特曼将其转变为个人牟利工具，使一个旨在公益的组织变成了私人帝国。此案引发了对有权势者篡改非营利组织使命、将其变为盈利工具的普遍担忧。

OpenAI行业动态

09:45

meng shao@shao__meng

精选75

小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型，包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro，以及支持多模态代理的310B参数MoE模型MiMo-V2.5，两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术，以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式，通过多教师策略蒸馏提升模型综合能力。同时，小米推出100T Token的创造者激励计划，为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

智能体开源/仓库模型发布端侧

关联讨论 5 条

推荐理由：小米把万亿参数 MoE 做到开源且百万上下文，MTP 三层原生集成让推理速度翻三倍，这在国内大厂开源里是第一个真正敢放权重的万亿级模型，做 Agent 的值得认真看看。

09:41

Greg Brockman@gdb

今天与多位 OpenAI 工程经理进行了高效的工作交流时间

OpenAI行业动态

09:34

Ethan Mollick@emollick

这款仅基于1931年前文本训练的新LLM体积小巧，甚至可能在设备上直接运行，因此借助合适的工具，你能获得一个完全复古版的Siri，不过是来自《唐顿庄园》时代的版本。在此，我让它为我在费城安排寿司外卖。嗯……

现象/趋势端侧

09:32

Alibaba Cloud@alibaba_cloud

HappyHorse现已登陆GMI 【引用 @gmi_cloud】：Happy Horse is on GMI @HappyHorseATH 又一个将我们推向电影级制作的视频模型👇

行业动态视频

09:29

meng shao@shao__meng

精选76

Devin for Terminal：从云端协作回到本地终端

Cognition公司推出Devin for Terminal，将云端AI编程助手Devin的能力打包为本地命令行Agent。其核心差异化在于“本地至云端无缝交接”设计：当任务超出本机能力时，可将同一会话无缝移交至云端Devin的虚拟机环境执行，用户可离线等待结果。该工具复用现有云端基础设施作为后端，支持多模型路由，可灵活选用Anthropic、OpenAI、Google及自研SWE-1.6等模型，并允许会话中实时切换。团队还使用Rust自研了高速终端渲染库，强调终端形式不变但内部工作范式已革新。

智能体产品更新编码

推荐理由：CLI Coding Agent 赛道已经卷成红海，但 Devin 把本地和云端做成一条无缝管道，笔记本合盖回来拿 PR，这个设计直击开发者最真实的痛点。做 coding agent 的团队该认真研究这个 handoff 机制。

09:25

Orange AI@oran_ge

ColaOS 对模型的要求太高了国产模型测试下来，能用的只有三个但我们已经很幸福了去年 Manus 那时候，国产能用的，一个都没有

智能体现象/趋势

09:23

Berryxia.AI@berryxia

最让中文出圈的一次竟然就是AI这一波！ YC 创始人都开始「出淤泥而不染」了。那么问题来了？谁是不染？【引用 @garrytan】：出污泥而不染

Garry Tan：出污泥而不染

其他

09:21

Berryxia.AI@berryxia

好消息，Outlook 终于特么支持Agent了。坏消息，国内是否也支持？

智能体Microsoft产品更新

09:16

阿绎 AYi@AYi_AInotes

YC重新定义未来公司形态：AI成为操作系统，构建自迭代智能闭环

YC指南指出，未来AI原生公司将彻底颠覆传统模式，AI应成为公司的“操作系统”，所有工作流和决策都需流经智能层，形成自调节闭环。公司需实现全面“可查询”，信息对AI透明。开发模式转变为人类写规格与测试，AI代理自动生成代码。传统管理层级被消除，公司速度取决于信息流动效率。员工结构围绕建造者、直接责任人和AI创始人重塑。成本逻辑从“拼人头”转向“拼Token”，愿意为替代高成本人力的API付费。早期公司凭借无历史包袱，能在白纸上构建AI系统，获得相对于大公司转型的千倍速优势。创始人必须亲自深度使用AI工具。未来十年，AI将“吃掉”公司内部所有运营，公司将成为自迭代智能闭环的集合。当前是关键窗口期。

智能体大佬观点现象/趋势

09:04

Marc Andreessen 🇺🇸@pmarca

默认假设是生产力提升会带来需求增长。说服责任在于末日论者，他们需要证明这次为何会不同。

大佬观点现象/趋势

08:57

ginobefun@hongming731

接入PostHog与SLS构建监控优化闭环

作者将BestBlogs的业务与接口监控能力接入PostHog，并将详细日志存储在阿里云SLS。通过对接两边的监控控制平面，定期分析检查业务与系统问题，随后利用Codex进行自动化优化与改进，从而形成一个完整的监控、分析与优化闭环。这一流程显著提升了运维效率，实现了省心管理。

智能体MCP/工具教程/实践