4月28日

08:14

ginobefun@hongming731

BestBlogs 每日早报 EP41 · Symphony 编排 / gpt-realtime-1.5 / AI 原生工程团队 · 04.28

OpenAI近期发布Symphony与gpt-realtime-1.5，分别从工程师工作流与用户交互层面重塑软件控制平面。Symphony实现工单驱动的自动化编码，而gpt-realtime-1.5旨在提供产品级语音控制体验。吴恩达据此提出，AI原生工程团队应由小型通才团队构成，效率瓶颈将转移至产品与市场等领域。同时，微软专家警告此类工具可能导致初级开发者人才萎缩，引发行业对工程师核心判断力应沉淀于何处的深度思考。

智能体大佬观点现象/趋势编码

07:55

Sam Altman@sama

每月20美元计划的Codex真是非常划算

OpenAI 编码行业动态

07:47

Berryxia.AI@berryxia

🚀 Claude Code 终于可以和浏览器并排实时控制了！ YC 大佬推出 GStack Browser + /open-gstack-browser skill，调试体验直接起飞！ 1. 在 Claude Code 中输入 Install GStack 快速安装 2. 输入 /open-gstack-browser 即可打开浏览器窗口 3. 实现 Claude Code 和浏览器完全 side-by-side 操作 4. 完美解决 Agent 调试时"看不见浏览器在干什么"的痛点 Claude Code 重度用户和 AI Agent 开发者必装神器！项目地址： https://github.com/garrytan/gstack

Garry Tan: Did you ever want to control your browser side-by-side with Claude Code? Now, with /open-gstack-browser skill and GStack...

智能体 MCP/工具教程/实践编码

07:23

Berryxia.AI@berryxia

小米开源MiMo-V2.5系列模型，支持百万token上下文

小米正式开源MiMo-V2.5系列模型，采用MIT许可证，允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口：MiMo-V2.5-Pro专为复杂Agent和编码任务设计，在开源模型的GDPVal-AA和ClawEval基准测试中排名第一；MiMo-V2.5是原生多模态模型，具备强大的Agent能力。小米强调，模型的价值不应仅由排行榜衡量，而应取决于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

04:43

宝玉@dotey

西方制造与编程能力流失的危机重演

作者以国防工业为镜，揭示西方因长期“优化”导致关键能力流失的深层危机。雷神公司重启“毒刺”导弹生产线需召回70多岁老工程师，依赖卡特时代的图纸，新订单交付需4年。欧盟承诺的百万发炮弹交付严重延期，暴露出整个国防工业供应链存在大量单点故障，且缺乏大规模生产与应急能力。这种模式源于冷战后的“和平红利”政策，导致企业合并、劳动力锐减。类似地，核材料Fogbank的制造工艺也曾因人员流失而几乎失传。作者指出，软件行业正重蹈覆辙：过度依赖AI编程工具可能导致初级工程师培养断层和“理解力危机”。重建能力需要数年甚至数十年，核心限制并非资金，而是知识与经验传承的断裂。当前市场已极度缺乏兼具技术能力与独立判断力的人才。

大佬观点现象/趋势编码

03:45

Fuli Luo@_LuoFuli

精选76

小米宣布开源两个大模型：专攻复杂智能体和编码任务的MiMo-V2.5-Pro，以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度，并采用允许商业部署和微调的MIT许可证。同时，小米为开发者和创作者提供了100万亿token的免费额度，鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名，更在于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

推荐理由：小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源，还送 100T 免费 token，诚意拉满。做 coding agent 的团队值得认真看看，这可能是目前开源阵营里最强的代码智能体基座。

03:39

宝玉@dotey

精选74

GitHub Copilot 将于6月1日起改为基于用量的计费模型

GitHub Copilot 将于6月1日起改用基于AI积分的用量计费模型，以支持更多Agent和高级工作流。各档订阅价格不变，每月赠送等额积分，代码补全等基础功能不消耗积分。新规则按Token消耗计费，积分用尽后无降级选项，代码审查会额外消耗Actions时长。企业用户有三个月过渡期及积分池福利。5月初将上线账单预览功能，年付和轻度用户受影响小，但重度用户需关注成本变化。

GitHub: Starting June 1st, GitHub Copilot will move to a usage-based billing model as GitHub Copilot supports more agentic and a...

编码行业动态部署/工程

推荐理由：Copilot 从固定订阅转向按量计费，本质是 GitHub 扛不住 Agent 模式的推理成本了。重度用户得重新算账，轻度用户反而没影响，6 月前值得先跑一下预览账单。

03:01

宝玉@dotey

Cursor 3用户反馈：追求稳定可控的AI开发操作系统

用户对Cursor 3的反馈显示，核心诉求已超越“AI辅助编码”，转向构建一个可靠、可控的AI开发工作流。主要需求包括：Agent功能需与IDE无缝融合，保留完整的开发工具链；支持多Agent协作与可视化进度管理；深度集成并产品化Git、Worktree和PR工作流；解决信息架构与导航痛点，升级为任务记忆系统；确保键盘优先操作与高度自定义；提升基础稳定性和性能以建立信任；增加模型选择与成本透明度；加强扩展、MCP及外部工具集成，成为开发自动化中枢；提供移动端以远程监管Agent；以及强化前端与设计工作流的集成能力。用户期望Cursor 3能演变为管理AI工程团队的稳定主界面。

eric zakariasson: how can we make cursor 3 better? send us any bugs, feature requests, or feedback you have!

智能体现象/趋势编码

02:02

OpenAI Developers@OpenAIDevs

精选66

📣 如果每个未解决的问题都有一个 Codex 智能体呢？这就是 Symphony 背后的理念--一个为 Codex 设计的开源智能体编排器，它将任务追踪器转变为持续运行的系统，用于智能体工作，让人类专注于审查和方向指导。

智能体 OpenAI 产品更新编码

推荐理由：OpenAI 把 Codex 从单次对话变成了任务队列的常驻工人，Symphony 这个开源编排层让 issue 自动派发 agent，做工程管理的人可以认真看看这个范式。

01:48

Xiaomi MiMo@XiaomiMiMo

精选71

小米开源MiMo-V2.5双模型，支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型，采用MIT许可，支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型：MiMo-V2.5-Pro专为复杂智能体和编码任务设计，在GDPVal-AA和ClawEval基准测试中位列开源模型第一；MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调，模型的价值不仅在于排名，更在于其解决实际问题的能力，并已公开模型权重与技术博客。

智能体开源生态模型发布编码

推荐理由：小米把 MiMo-V2.5 直接 MIT 开源且支持商用，1M 上下文 + Agent 能力在开源阵营里确实能打，做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。

00:32

凡人小北@frxiaobei

OpenClaw 4.1x增强GPT支持，soul文件修改致AI口癖异常

OpenClaw 4.1x版本在GPT支持方面实现重大改进，基本解决了以往只说不干的缺陷。但用户修改soul文件内容后，AI在对话中频繁使用“卧槽”等口语化词汇，导致言语风格变得粗俗和不成熟。这种行为被比喻为刚走向社会的二愣子，反映出AI在个性化调整后可能出现意料之外的言行表现。

智能体教程/实践编码

4月27日

23:20

Z.ai@Zai_org

GLM-5.1和GLM-5-Turbo的"三倍用量"使用期现已延长至6月30日。可用时间：除东部时间凌晨2点至6点外，全天可用。

Z.ai: Usage limits tripled for GLM-5-Turbo in GLM Coding Plan! Enjoy the same high-volume capacity as GLM-4.7 during non-peak ...

产品更新编码

22:56

Greg Brockman@gdb

gpt-5.5 非常适合编写 GPU 内核等高难度任务

Elliot Arledge: KernelBench-Hard coming soon.

OpenAI 大佬观点编码

20:28

meng shao@shao__meng

用 Gemma 4 + Pi Agent 搭建本地编程助手

开发者@patloeber分享了一套完全本地的Coding Agent方案，核心是Pi Agent框架与Gemma 4 26B A4B模型。Gemma 4因原生支持function calling和thinking mode，首次真正适合作为Agent；其MoE架构在质量与速度间取得平衡。Pi框架设计极简，仅提供read、write等四个核心工具以节省宝贵的上下文窗口。文中强调了上下文长度与显存的权衡，并给出安全警告：本地模型可能产生危险命令幻觉，建议至少安装permission-gate等扩展进行防护。

Patrick Loeber: Lately I've been having fun with running coding agents fully locally. The setup I landed on is: - Pi agent - Gemma 4 26B...

智能体教程/实践端侧编码

14:21

karminski-牙医@karminski3

DeepSeek-V4测试进度同步及新增大模型工程能力测试

作者同步了DeepSeek-V4的测试进度，并重点介绍了一项新设计的“大模型工程能力测试”。该测试以约20万行代码的SillyTavern项目为基础，要求大模型通过tool_call创建新的数值系统（如属性、状态），并能注入JS代码与现有系统交互。测试使用魔改的kimi-cli来监督实现过程、统计token与工具使用情况，并运行定制黑盒测试。此外，通过为酒馆增加CLI模式，测试还评估了大模型的Agent能力，使其能自行测试并迭代代码。目前测试仍在进行中。

智能体 DeepSeek 编码评测/基准

11:19

歸藏(guizang.ai)@op7418

最近正在重构 CodePilot，把 AI 能做的事情变得简单点，AI 不能做的东西变得详细点。

大佬观点编码

10:59

小互@xiaohu

这个提示词牛逼啊

小小东: http://x.com/i/article/2048438511788007424

教程/实践编码

10:00

meng shao@shao__meng

真正的「个人 Agent」应该是什么样？

作者提出了个人Agent应满足的七条标准：能力层需能跨工具处理任务并具备主动性与可靠性；认知层需拥有长期记忆；接入层需在Web与移动端原生可用、支持多模态无缝切换且能从第三方IM触达；人格层需具备个性。依据此标准，当前OpenClaw、Claude Code和Codex均未完全达标。Claude Code在接入便捷性和人格化上不足；Codex主要缺乏移动端入口；OpenClaw则在能力层的可靠性上有明显缺陷，导致重度用户仍需借助其他工具来修正其错误。

Peter Yang: A great personal agent should: 1. Get work done across email, calendar, Google Workspace, or any API/MCP it's hooked up ...

智能体 Anthropic OpenAI 大佬观点

09:18

阿绎 AYi@AYi_AInotes

说个扎心的真相，90%的AI工程师，其实什么都没做出来

Cluely的CEO Roy Lee在NYU活动中，以500美元现金询问在场AI学生和工程师是否上线过公开项目，几乎无人举手。这揭示了AI圈的普遍现象：工程师们热衷讨论大模型、Agent等理论，却缺乏将知识转化为公开产品的执行力。LLM虽能解决大部分技术问题，但部署、用户体验和成本控制等实际工作才是关键。知识在AI时代已泛滥，真正稀缺的是执行力。呼吁工程师立即实践，做出哪怕不完美的公开产品。

现象/趋势编码部署/工程

06:29

Orange AI@oran_ge

AI大V自嘲与BuilderPulse项目宣传

刘小排（@bourneliu66）在开放麦中表达对AI大V的厌倦，但被指出自己也是AI大V。他批评labnana项目基于vibe coding开发。作者以幽默态度回应，强调格局开放，并承诺帮助推广刘小排的BuilderPulse项目，凸显AI社区内自我反思与项目互助的互动。

大佬观点编码