AIHOT

4月30日

02:31

The Decoder：AI News（RSS）

NewsGuard的审计发现，Mistral的AI聊天机器人Le Chat在回应关于伊朗战争的提问时，平均约半数情况会重复国家支持的虚假信息。具体错误率从针对中性提问的10%到针对恶意引导提问的80%不等。该审计揭示了特定AI模型在涉及地缘政治敏感话题时，存在传播不实信息的高风险。

安全/对齐行业动态

02:13

Suno@suno

@sofiadangelo27 使用 Voices 探索沙漠摇滚、嘻哈和舞曲，全部用她自己的声音演绎。你想听到自己演绎哪些音乐类型？用 Voices 发现可能，无需录音室。

产品更新语音

02:11

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

我经常听到这种说法--人们忽视灭绝风险，因为概率"只有"10-20%或类似数字 "只有"？！？！？【引用 @tombibbys】："但只有10-20%" 伯尼这话说得太好了

安全/对齐现象/趋势

02:03

Google Gemini@GeminiApp

这场活动即将开始！在此处加入Gemini Discord：http：//discord.gg/gemini 【引用 @GeminiApp】：准备好用Gemini Canvas释放你的创造力了吗？🪄 不要错过我们下一次的Discord活动，届时Gemini创意技术专家@DavidMaliglowka将现场演示他最新的Canvas和Nano Banana工作流程，帮助你提升自己的创意提示技巧。 🗓️ 4月29日，星期三 ⏰ 太平洋时间上午11：30 📍 http：//discord.gg/gemini

Google多模态教程/实践

01:50

Google AI@GoogleAI

智能体时代启幕：谷歌发布第八代TPU，专为AI训练与服务打造

在Google Cloud Next '26大会上，谷歌正式推出专为智能体时代设计的第八代TPU芯片，分别针对AI训练与服务两大核心挑战。TPU 8t专注于训练，其性能约为前代的3倍，并通过加速数据移动和优化硬件容错，将原本需数月的训练时间缩短至数周。TPU 8i则专为执行复杂任务的AI智能体服务，内存扩大三倍以支持多步推理，每美元性能提升80%，延迟降低5倍，助力企业以更低成本扩展服务规模。这些芯片将为医疗研究、客户支持等广泛场景提供核心算力，推动AI应用创新。

Google产品更新推理部署/工程

关联讨论 1 条

01:50

NVIDIA AI Developer@NVIDIAAIDev

如果你看到这条消息，你应该关注 @NVIDIAAI。我们的开发团队已搬迁至 @NVIDIAAI 隔壁。加入我们以获取最新产品、模型、深度解析等资讯。感谢所有在这里陪伴我们的人。期待很快与你们相见 💚

行业动态

01:48

阿绎 AYi@AYi_AInotes

Cursor发布SDK：将生产级编程Agent能力嵌入基础设施

Cursor正式发布SDK，将生产级编程Agent能力转化为可嵌入基础设施。此前Agent仅限于编辑器内使用，现可通过SDK集成到CI/CD流水线、自动化脚本或自有产品中，且采用与桌面端相同的runtime、harness和模型，确保智能程度一致。用户无需自行处理沙箱、上下文管理或工具调用，即可免费利用Cursor积累的经验。这使编程Agent能突破编辑器限制，在后台自动修bug、提PR、实时生成功能，甚至修复CI构建错误。开发者角色从直接编码转变为指挥Agent，Cursor正演变为AI编程时代的操作系统。

智能体产品更新编码

关联讨论 1 条

01:45

Tibo@thsottiaux

👁️codex👁️ 【引用 @OpenAI】：想提前获得OpenAI DevDay入场券吗？用GPT-5.5和Image Gen构建作品。每周我们将选出2-3个优秀作品，赠送OpenAI DevDay 2026免费门票。Codex将协助筛选最佳提交，最终获奖者由团队选定。回复需包含#OpenAIDevDay2026标签、可访问链接及简短制作说明。

OpenAI行业动态

01:43

Chubby♨️@kimmonismus

Mistral Medium 3.5：定位胜于基准测试

Mistral Medium 3.5是MistralAI的新旗舰模型，以公共预览版发布。它整合指令遵循、推理和编码能力，采用128B密集参数和256k上下文窗口，支持可配置推理努力。模型定位比基准测试更关键，比较对象包括Kimi、Qwen、GLM和Claude Sonnet，而非GPT或Gemini。随着Aleph Alpha被Cohere收购，Mistral成为唯一非美国、非中国的尖端实验室，以开源权重和修改的MIT许可证发布。模型在推理效率与一致性间权衡，Collie分数达95.8领先，目标不是原始推理，而是成为生产中可靠遵循指令的模型，体现欧洲企业定位。它是Mistral Vibe和Le Chat的新默认模型。

大佬观点开源生态

01:35

Luma@LumaLabsAI

刀锋背后。一览狐狸武士如何通过Luma获得生命。角色。动作。电影风格。从最初构想到最终画面，每个元素如何融合的过程在此呈现。开始创作 → http：//lumalabs.ai/app

教程/实践视频

01:31

阿绎 AYi@AYi_AInotes

马斯克出庭指控OpenAI违背初心，AI控制权之争成科技史转折点

马斯克作为首名证人出庭，指控OpenAI从非营利开源转向营利闭源，违背创立初衷。他警告AI垄断可能带来人类灭绝风险。这场诉讼已超越私人恩怨，成为首次在法庭上争夺AI控制权的标志性事件，核心争议聚焦于AI发展的速度与安全、开源与闭源以及控制权归属等终极问题。无论结果如何，此案都将把AI治理议题置于全球视野，成为科技史的重要转折点。

阿绎 AYi：马斯克真的和OpenAI在法庭上开战了，这条77万浏览的帖子把这场审判包装成了人类存亡之战🫠🤣😆 我先拆穿一个最容易被忽略的细节，视频里只有他过安检的…

OpenAIxAI安全/对齐现象/趋势

关联讨论 3 条

01:30

Ant Ling@AntLingAGI

精选61

AntLingAGI 开源了 Ling-2.6-1T 模型，这是一个面向现实世界智能体工作流程的新旗舰模型。作为 1T 参数规模模型的先驱，团队强调了硬件、软件与 LLM 协同设计的重要性。vLLM 项目从发布首日（Day-0）起即提供支持，体现了顶尖工程生态系统的协作。这种合作旨在实现最佳的优化效果与用户体验，共同推动技术进步。

智能体开源生态模型发布

关联讨论 3 条

推荐理由：vLLM 对 1T 模型的 Day-0 适配，说明开源推理栈对大尺寸模型的跟进速度越来越快，做私有化部署的可以直接参考官配 recipe 跑起来。

01:29

TestingCatalog News 🗞@testingcatalog

Mistral AI宣布其Le Chat平台现已直接集成Mistral Vide功能。同时，平台推出了处于预览阶段的Work Mode，这是一个能够处理复杂、长期任务的智能体。该模式专为研究、分析和跨连接工具执行操作等场景设计，默认开启连接器，可自动从文档、电子邮件和日历中获取上下文信息。任务会话会持续进行，直至任务完成。

智能体产品更新视频

01:28

宝玉@dotey

Cursor开放TypeScript SDK公测，提供智能体框架

Cursor开放官方TypeScript SDK公测，允许开发者使用其智能体（agent）框架，该框架驱动Cursor编辑器、CLI和网页版。智能体可在本机或云端独立虚拟机中运行，云端提供沙箱、代码仓库和完整开发环境，支持任务持续执行并自动提交PR。模型层面不绑定，可一键切换OpenAI、Anthropic、Google等前沿模型，或使用Cursor专为编码训练的Composer 2。SDK开放了代码库索引、语义搜索、MCP工具接入、技能加载和任务拆分等核心能力。应用场景包括CI/CD流水线自动化、内部工具开发以及嵌入客户产品，使最终用户获得智能体体验。计费按token用量计算，SDK基于Cursor自身的运行时、harness和模型，让开发者能构建与Cursor相同能力的智能体。

智能体MCP/工具大佬观点

关联讨论 1 条

01:24

Ant Ling@AntLingAGI

精选72

SGLang团队（隶属于LMSYS Org）揭示了其旗舰指令模型实现快速、高效、大规模执行的关键在于可靠的基础设施与针对性优化。团队宣布对AntLingAGI发布的Ling-2.6-1T万亿参数模型提供Day-0支持。该模型采用快速思考方法，在保持质量的同时，成本可比同类模型降低约4倍，并在AIME26和SWE-bench基准测试中达到SOTA水平。它专为高级编码、复杂推理和大规模智能体工作流设计，具备万亿参数能力与即时模型延迟。团队正持续进行优化，以进一步提升性能。

智能体推理模型发布编码

推荐理由：万亿参数做到即时延迟和4倍成本优势，还有SWE-bench SOTA，这份承诺如果兑现，会改变大规模Agent部署的性价比计算。值得去cookbook跑一下验证。