5月29日

00:00

LMSYS：Blog（Chatbot Arena 团队）

精选61

LMSYS与Intel合作通过异构CPU+GPU EPD架构提升视觉语言模型服务性能

LMSYS团队（Intel与SGLang）通过Dynamo和SGLang框架，为视觉语言模型（VLM）启用了异构编码-预填充-解耦（EPD）架构。该方案将视觉编码任务从GPU卸载至CPU（如Intel Xeon 6747P），与GPU协同工作。在Qwen3-VL-8B-Instruct模型的测试中，采用4 CPU + 1 GPU作为编码器、4 GPU作为预填充解码器（能力比R=12）的配置，在ISL/OSL 128/256、1080p 8张图像的负载下，实现了P99 TTFT和请求吞吐量约1.2倍至1.3倍的提升，并将P99 TPOT降低了约1.3倍至30倍。

多模态推理教程/实践部署/工程

推荐理由：做VLM服务部署的可以认真看一下，用CPU头节点做异构EPD分离，几乎零成本换来了TTFT和TPOT的显著提升，有完整脚本和benchmark，能直接上手试。

5月28日

23:43

AK@_akhaliq

多模态智能体推理的探索性策略优化

智能体 arXiv 多模态推理

23:38

Xiaomi MiMo@XiaomiMiMo

同事件精选69

MiMo-V2.5现已在OpenCode上线--限时免费。🎉 【引用 @opencode】：OpenCode x MiMo V2.5 - 限时免费 1M上下文 • 推理 • 文本 • 图像

OpenCode: OpenCode x MiMo V2.5 - Free for a limited time 1M context • reasoning • text • image

多模态推理模型发布

同一事件，精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s》

推荐理由：MiMo-V2.5在OpenCode免费开放，1M上下文加多模态推理，小米的模型迭代不算大新闻，但趁免费白嫖一下国产模型的机会别错过。如果你正在选型，跑个分试试。

23:19

IT之家（RSS）

消息称微软下周将推全新编程模型，以争取开发者群体认可

微软计划在下周Build大会发布多款自研AI模型，旨在争取开发者认可。其中将包含一款编程专用模型，以提升GitHub Copilot的竞争力，应对Cursor与Claude Code等对手的挑战。同时，微软还将推出多款不同规格的新模型，具备语音转写、逻辑推理、语音处理及图像生成等技能。

Microsoft 多模态模型发布编码

23:12

Rohan Paul@rohanpaul_ai

Reactor推出实时世界模型基础设施

Reactor公司宣布推出实时世界模型（World Models）基础设施层，并完成了由Lightspeed领投的5900万美元种子轮与A轮融资。其核心突破是将视频生成从被动预渲染转变为根据用户行动和语音实时生成的像素流。开发者只需使用几行ReactSDK代码，即可将前沿世界模型的实时像素流集成到产品中，应用于游戏、创意工具、模拟、机器人及叙事等领域。公司核心团队成员来自Apple、Meta、Google等多家公司，目前已有众多合作伙伴与开发者在使用其平台。

reactor: Today, we're coming out of stealth with $59M in seed and Series A funding, led by Lightspeed, with Amplify Partners, Wnd...

智能体产品更新多模态行业动态

23:12

TechCrunch：AI（RSS）

Siri新应用预览揭示苹果挑战ChatGPT等计划

新渲染图展示了苹果计划在 iOS 27 中对 AI 进行重大改造的细节，包括重新设计的 Siri 体验以及一款独立的 Siri 应用。

多模态行业动态

21:42

Chubby♨️@kimmonismus

一夜之间构建的AI Twitch主播：功能、情绪与潜在影响

一个团队在一夜之间打造了一款AI Twitch主播。该AI能玩游戏、进行解说、与直播聊天互动，并在做出高风险决策时感到紧张，在获胜后表现出喜悦。文中探讨了其深远影响：当AI能实现24/7不间断直播、永不倦怠时会怎样；当观众与能比人类创作者更“了解”他们的AI建立情感联结时意味着什么；以及当娱乐的创作门槛降至零时，对创作者经济将产生何种冲击。该AI主播被其开发者@karthik_ragu_06等人定义为“具有情感智能的数字人类”。

Tavus: @Twitch the first ever human-like AI streamer is here. This AI streamer plays, narrates, reacts to chat, gets nervous on...

智能体多模态现象/趋势视频