AIHOT

4月28日

07:47

Berryxia.AI@berryxia

🚀 Claude Code 终于可以和浏览器并排实时控制了！ YC 大佬推出 GStack Browser + /open-gstack-browser skill，调试体验直接起飞！ 1. 在 Claude Code 中输入 Install GStack 快速安装 2. 输入 /open-gstack-browser 即可打开浏览器窗口 3. 实现 Claude Code 和浏览器完全 side-by-side 操作 4. 完美解决 Agent 调试时"看不见浏览器在干什么"的痛点 Claude Code 重度用户和 AI Agent 开发者必装神器！项目地址： https：//github.com/garrytan/gstack

智能体MCP/工具教程/实践编码

07:42

Sam Altman@sama

我们爱我们的用户

其他

07:34

Berryxia.AI@berryxia

Minmax 的 Music-2.6 本周在 Cloudflare 上免费使用！从文本提示生成完整长度的歌曲或器乐作品，并可选自动生成歌词。直接开整吧！！！

产品更新多模态部署/工程

07:29

Berryxia.AI@berryxia

马斯克自述创立OpenAI初衷：为制衡谷歌，坚持非营利

埃隆·马斯克阐述其创立OpenAI的动机源于与拉里·佩奇在人工智能安全风险上的分歧。佩奇对AI潜在危险不够重视，甚至称更关注人类利益的马斯克为“物种主义者”。这促使马斯克决心建立一股制衡Google的力量，其核心形式是一个开源、非营利的组织，这也是“Open”一词的初衷。马斯克投入个人资金、招募团队、传授知识并促成微软合作，但拒绝接受任何股份或财务回报，坚信非营利组织不应成为个人致富的工具。

大佬观点行业动态

07:28

TestingCatalog News 🗞@testingcatalog

Meta与Overview Energy合作，将高达1吉瓦的空间太阳能输送至地球！ Meta还与Noon Energy合作，部署高达1吉瓦/100吉瓦时的储能系统。现在是Meta对阵SpacexAI了 👀 【引用 @Meta_Engineers】：这些与Overview和Noon的合作延续了我们的一贯策略，即通过多元可靠的解决方案助力电网强化，并为我们的AI基础设施供电。了解更多：https：//go.meta.me/635755

行业动态部署/工程

07:24

Marc Andreessen 🇺🇸@pmarca

😍 【引用 @DavidDuvenaud】：宣布 Talkie：一个全新的开放权重历史 LLM！我们在一个仅包含 1930 年前数据的新整理数据集上训练并微调了一个 13B 模型。欢迎在下方尝试！与 @AlecRad 和 @status_effects 合作 🧵

开源/仓库数据/训练模型发布

07:23

Berryxia.AI@berryxia

小米开源MiMo-V2.5系列模型，支持百万token上下文

小米正式开源MiMo-V2.5系列模型，采用MIT许可证，允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口：MiMo-V2.5-Pro专为复杂Agent和编码任务设计，在开源模型的GDPVal-AA和ClawEval基准测试中排名第一；MiMo-V2.5是原生多模态模型，具备强大的Agent能力。小米强调，模型的价值不应仅由排行榜衡量，而应取决于其解决实际问题的能力。

智能体开源/仓库模型发布编码

07:21

TestingCatalog News 🗞@testingcatalog

Microsoft 向 Frontier 早期体验用户推出了 Outlook 的智能体模式。 &gt； Outlook 中的 Copilot 现已具备智能体功能，可持续处理收件箱和日历的运营工作。它能分类邮件、重新安排冲突日程，并在你询问前就突出显示最重要事项。

智能体Microsoft产品更新

07:13

TestingCatalog News 🗞@testingcatalog

你可能错过了：Gemini 现在可以在网页和移动端生成 Docs 和 Sheets。不过不确定这个功能是何时添加的。目前 Slides 还不能用，但考虑到 Gemini for Business，我们很可能也会获得该功能，或许还会有一个内联编辑器。

Google产品更新多模态

07:04

DogeDesigner@cb_doge

Sam Altman 如果诈骗是奥运项目的话：

其他

06:57

Berryxia.AI@berryxia

浏览器本地智能体Gemma 4 E2B发布

一个完全本地的 Agent，就生活在你的浏览器里。由 Gemma 4 E2B 和 WebGPU 驱动，它使用原生工具调用来实现： 🔍 搜索浏览历史 📄 阅读并总结页面内容 🔗 管理标签页 100% 本地运行！无需任何服务器！

智能体Google产品更新端侧

06:46

TestingCatalog News 🗞@testingcatalog

Anthropic 正在为移动端的 Claude 开发侧边栏自定义功能，以及为 Claude Dispatch 和 Claude Code 设计通用任务列表。 Conway 也在进行中 🚧

智能体Anthropic产品更新

06:20

Microsoft Research@MSFTResearch

微软研究论坛将于5月14日发布：来自MSR AI Frontiers的新版本和演示。此外，还有关于Agentic GitHub工作流程、实时智能体验证、基于能量的微调以及引导AI转型的新工作。立即注册：

智能体Microsoft行业动态

05:51

Luma@LumaLabsAI

不确定该选择哪个方向？探索所有可能。设定你的参考标准，让 Luma Agents 探索你心中的每一种视觉风格。从暗黑电影感到明亮编辑风，每一种美学方向都能被渲染呈现，随时可供比较。立即构建 → https：//app.lumalabs.ai/？seed=922de654-a944-4679-adbf-d23cbfb48307

智能体产品更新图像生成

05:49

Satya Nadella@satyanadella

Outlook中的代理模式现已上线！ Copilot现在可以帮助管理您的收件箱和日历，分类邮件、重新安排会议，并助您掌控最重要的事务。

智能体Microsoft产品更新

05:45

Google Gemini@GeminiApp

准备好通过Gemini Canvas释放你的创造力了吗？🪄 别错过我们下一次Discord活动，届时Gemini创意技术专家@DavidMaliglowka将现场演示他最新的Canvas和Nano Banana工作流程，帮助你提升创意提示技巧。 🗓️ 4月29日星期三 ⏰ 太平洋时间上午11：30 📍 http：//discord.gg/gemini

Google产品更新多模态

05:22

Suno@suno

截图它。歌曲它。#SunoTextSong

产品更新多模态

05:05

OpenAI Developers@OpenAIDevs

你可以用gpt-realtime-1.5构建交互式应用，让用户通过语音更自然地控制应用状态。嗨，Chappy 👋

OpenAI产品更新语音

05:02

Chubby♨️@kimmonismus

出于某种原因，微软是唯一一家没有从AI中受益的公司。

MicrosoftOpenAI行业动态

05:01

宝玉@dotey

精选79

OpenAI与微软重塑合作关系，解除Azure绑定

OpenAI与微软重新谈判合作协议，核心变化在于解除了对Azure云的独家依赖。根据新协议，微软仍是OpenAI的主要云合作伙伴，产品优先在Azure上线，但若微软无法支持特定能力，OpenAI可将服务部署到任何云平台。IP授权延续至2032年，但由独家转为非独家，OpenAI可向其他公司授权技术。财务安排上，微软不再向OpenAI支付分成，而OpenAI向微软的分成持续至2030年并设有上限。此举为OpenAI的IPO铺平道路，企业客户未来可通过AWS或Google Cloud等平台使用其服务，微软则以股东身份继续受益。

MicrosoftOpenAI行业动态

关联讨论 3 条

推荐理由：OpenAI 从 Azure 独占松绑成多云自由身，这是 IPO 前最关键的一次架构手术。做企业级 AI 产品的团队要重新评估云选型了，AWS 和 GCP 上跑 OpenAI API 的路终于打通。

05:00

SemiAnalysis@SemiAnalysis_

Intel弃用EMIB转向UCIe，外部客户仍受益

Intel的EMIB封装技术被外部客户如Google的TPU采用，但Intel自身产品正转向UCIe技术。Diamond Rapids预计使用UCIe over substrate实现长距离die-to-die互连。在ISSCC上，Intel展示了UCIe-S D2D链接，在22nm工艺下达到48 Gb/s/lane，距离达30mm，数据率和带宽密度优于3nm设计。substrate配置为5-2-5，而EMIB为11-2-11。由于substrate短缺，Intel的“最佳”封装技术对除Intel外的客户更具优势。

行业动态部署/工程

04:43

宝玉@dotey

西方制造与编程能力流失的危机重演

作者以国防工业为镜，揭示西方因长期“优化”导致关键能力流失的深层危机。雷神公司重启“毒刺”导弹生产线需召回70多岁老工程师，依赖卡特时代的图纸，新订单交付需4年。欧盟承诺的百万发炮弹交付严重延期，暴露出整个国防工业供应链存在大量单点故障，且缺乏大规模生产与应急能力。这种模式源于冷战后的“和平红利”政策，导致企业合并、劳动力锐减。类似地，核材料Fogbank的制造工艺也曾因人员流失而几乎失传。作者指出，软件行业正重蹈覆辙：过度依赖AI编程工具可能导致初级工程师培养断层和“理解力危机”。重建能力需要数年甚至数十年，核心限制并非资金，而是知识与经验传承的断裂。当前市场已极度缺乏兼具技术能力与独立判断力的人才。

大佬观点现象/趋势编码

04:30

Rohan Paul@rohanpaul_ai

为精确性优化RAG可能悄然损害检索效果，危及智能体流程

最新研究发现，企业为提升精确性而微调RAG嵌入模型，可能导致检索质量下降高达40%。其核心矛盾在于，单个密集嵌入向量被同时要求承担广泛主题召回和精确语义判别的双重任务。当强制模型区分细微结构差异（如否定、语序颠倒）时，会损害其跨领域聚合相关材料的能力。解决方案是采用两阶段检索：先用嵌入模型快速召回，再通过能感知结构的词元级比对来验证候选结果。这揭示了“几乎相同的句子”与“相同含义”本质不同，在合同、合规等高精度领域混淆二者将导致系统关键失效。

检索增强论文/研究部署/工程

04:26

AK@_akhaliq

小米 MiMo-V2.5 已在 Hugging Face 发布 https：//huggingface.co/collections/XiaomiMiMo/mimo-v25

多模态开源/仓库模型发布

04:25

DogeDesigner@cb_doge

Elon Musk 曾向 Sam Altman 提出一个交易。将 OpenAI 改名为 ClosedAI，他就会撤销诉讼。

OpenAI行业动态

03:45

Fuli Luo@_LuoFuli

精选76

小米宣布开源两个大模型：专攻复杂智能体和编码任务的MiMo-V2.5-Pro，以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度，并采用允许商业部署和微调的MIT许可证。同时，小米为开发者和创作者提供了100万亿token的免费额度，鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名，更在于其解决实际问题的能力。

智能体开源/仓库模型发布编码

关联讨论 6 条

推荐理由：小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源，还送 100T 免费 token，诚意拉满。做 coding agent 的团队值得认真看看，这可能是目前开源阵营里最强的代码智能体基座。

03:39

宝玉@dotey

精选74

GitHub Copilot 将于6月1日起改为基于用量的计费模型

GitHub Copilot 将于6月1日起改用基于AI积分的用量计费模型，以支持更多Agent和高级工作流。各档订阅价格不变，每月赠送等额积分，代码补全等基础功能不消耗积分。新规则按Token消耗计费，积分用尽后无降级选项，代码审查会额外消耗Actions时长。企业用户有三个月过渡期及积分池福利。5月初将上线账单预览功能，年付和轻度用户受影响小，但重度用户需关注成本变化。

编码行业动态部署/工程

关联讨论 1 条

推荐理由：Copilot 从固定订阅转向按量计费，本质是 GitHub 扛不住 Agent 模式的推理成本了。重度用户得重新算账，轻度用户反而没影响，6 月前值得先跑一下预览账单。

03:29

François Chollet@fchollet

Keras Kinetic 发布了新的 alpha 版本：v0.0.2！包括新的文档网站：http：//kinetic.readthedocs.io Kinetic 是我最喜欢的 Keras 团队新发布：一个超级简单的类 Modal API，用于在 TPU 上运行训练任务。

产品更新开源生态部署/工程

03:22

elvis@omarsar0

构建个人AI代理工具以提升思维辅助能力

AI应提升人类思维，而非取代。当前LLMs默认不支持此功能，需用户构建agent harness（包括检索、验证、记忆等架构）来增强辅助能力。agent harness至关重要，即使简单技能也能显著提升LLMs的"human-centered augmenting"能力。持续学习前景广阔但尚处早期，上下文学习更为有效。用户需主动优化工作流程以引导LLMs，而自我改进代理因激励不足效果有限。最佳实践是重用LLM输出，让AI持续为用户服务，并通过每次交互提升双方能力。最终，用户需亲自构建定制化AI工具，而非等待他人开发。

智能体大佬观点教程/实践

03:01

宝玉@dotey

Cursor 3用户反馈：追求稳定可控的AI开发操作系统

用户对Cursor 3的反馈显示，核心诉求已超越“AI辅助编码”，转向构建一个可靠、可控的AI开发工作流。主要需求包括：Agent功能需与IDE无缝融合，保留完整的开发工具链；支持多Agent协作与可视化进度管理；深度集成并产品化Git、Worktree和PR工作流；解决信息架构与导航痛点，升级为任务记忆系统；确保键盘优先操作与高度自定义；提升基础稳定性和性能以建立信任；增加模型选择与成本透明度；加强扩展、MCP及外部工具集成，成为开发自动化中枢；提供移动端以远程监管Agent；以及强化前端与设计工作流的集成能力。用户期望Cursor 3能演变为管理AI工程团队的稳定主界面。

智能体现象/趋势编码

03:01

Replit ⠕@Replit

Replit联合创始人Amjad和Haya认为过度反思无益，倡导"每日执行、季度预测、交付产品"的务实方法论。他们指出，Replit正赋能新一代AI原生创业者创造百万美元企业，并讨论了AI模型能力的快速演进以及许多创业者过早放弃的原因。Replit奉行"寻求痛苦"的反直觉文化价值观，在招聘中看重饥饿感而非资历。面对AI的飞速变化，他们建议创始人必须做出微预测并及时调整，否则将面临被淘汰的风险。

智能体大佬观点行业动态

02:53

DogeDesigner@cb_doge

我问ChatGPT谁更值得信任--Sam Altman还是Elon Musk……它回答是"Elon Musk"。

现象/趋势

02:41

Chubby♨️@kimmonismus

OpenAI已从其与微软的协议中移除了AGI条款。考虑到即将进行的IPO，如果很快正式宣布AGI，我也不会感到惊讶。

MicrosoftOpenAI行业动态

02:40

DogeDesigner@cb_doge

塔克·卡尔森：我认为OpenAI举报人绝对是被谋杀的 "你们的程序员曾投诉说你们在窃取他人成果且不支付报酬，然后他就被谋杀了。我不明白旧金山市为何拒绝调查此事" OpenAI举报人苏希尔·巴拉吉的母亲也补充道："我儿子掌握着对OpenAI不利的文件。他们袭击了他并杀害了他。" 必须进行彻底调查，正义必须得到伸张。

安全/对齐行业动态

02:24

DogeDesigner@cb_doge

OpenAI前董事会成员称Sam Altman是骗子。他多年来对董事会撒谎，隐瞒ChatGPT的发布，在拥有创业基金一事上说谎，伪造安全信息，并在她的论文发表后撒谎以驱逐她。董事会失去所有信任 → 解雇了他。 Sam Altman是个骗子。

OpenAI安全/对齐行业动态

02:21

Satya Nadella@satyanadella

很高兴看到埃森哲推出超过74万个M365 Copilot席位--这是我们迄今为止最大规模的部署！ https：//news.microsoft.com/source/features/digital-transformation/accenture-is-rolling-out-copilot-to-a-workforce-the-size-of-denver

Microsoft产品更新行业动态

02:19

Rohan Paul@rohanpaul_ai

OpenAI据传正研发以AI代理为核心操作系统的智能手机

OpenAI据传正探索开发一款以AI代理为核心操作模式的智能手机，旨在取代传统应用模型。公司计划与联发科、高通及立讯精密合作设计定制移动芯片，以优化能效与云端协同，并已吸纳Jony Ive的设计团队。该设备计划于2026年下半年发布，其核心逻辑是通过软硬件垂直整合，让AI代理跨消息、位置、日历等多维度上下文直接执行任务，突破苹果与谷歌对应用权限的限制。技术架构预计采用本地轻量模型实现低延迟响应，结合云端模型处理复杂推理，以打造能深度感知与推断的个人智能助手。

OpenAI现象/趋势行业动态

02:13

Rohan Paul@rohanpaul_ai

精选79

OpenAI结束与微软独家云合作，转向多云战略

OpenAI修订与微软的合作协议，结束独家云合作关系，未来可将其服务部署于亚马逊云等平台。微软保留至2032年的非独家模型许可以及至2030年的有上限收入分成。此举削弱了微软的稀缺性优势，引发其股价下跌，但有助于微软释放资本投入Copilot并缓解反垄断压力。亚马逊成为明确赢家，其AWS从备用基础设施转为OpenAI的前线平台；谷歌云也获得了竞争OpenAI工作负载的机会。OpenAI创始人确认微软仍是其主要云合作伙伴，但产品将扩展至所有云平台。