Serving LLM well is a challenging task and it requires engineering acumen and good taste. Thanks to @Modular team's high caliber engineers for making the collaboration a reality. Ecosystem FTW! 🤠👏

译服务好LLM是一项具有挑战性的任务，它需要工程智慧和良好的品味。感谢@Modular团队高水平的工程师们让这次合作成为现实。生态系统必胜！🤠👏

ginobefun@hongming731 · 4月29日41

联想与连接是知识管理的本质，这个数据也增长得太快了 😱

译个人知识管理工具GBrain的数据量在短时间内快速增长，页面数从14,000激增至74,114。其核心价值在于117,855个关联链接，将人物、会议、公司、邮件等元素相互连接，使之成为一个基于联想运作的Memex系统，而非简单的文件柜。这种关联网络使用户能在短时间内追溯复杂的信息脉络，体现了万尼瓦尔·布什提出的“人类思维通过联想运作”的理念。该工具正被用于书籍研究，并将开源共享。

歸藏(guizang.ai)@op7418 · 4月29日46

Ghostty 的负责人今天说他会离开 GitHub。这哥们在 GitHub 有 5 万多的粉丝，每天都有提交，是重度的 GitHub 使用者。他的意思是，GitHub 现在频繁的故障和不稳定的服务已经严重影响了开发工作，导致他觉得这里不再适合进行严肃工作。因此，他会把所有的重度开发工作都迁移到自建的服务上，GitHub 之后只保留代码库。目前主要影响的内容是： Actions、PR、Issues 等配套服务经常挂掉，导致他没办法进行代码评审和跑 CI 合并。我感觉这是一个非常大的机会。在 AI 时代，GitHub 事实上已经变成了所有 Vibe Coding 最重要的基建之一，但现在微软显然没有办法应付这套东西。所以，如果哪个平台能够提供一个更适合 AI、更适合 AI Agent 的 Git 服务，可能会有很大的机会。

译Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务，仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户，他指出 GitHub 频繁的故障已严重影响开发，特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为，在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施，但微软难以维持其可靠性。这揭示了一个市场机会：若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务，将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。

SiliconFlow@SiliconFlowAI · 4月29日63

👀 🚀 🙌

译👀 🚀 🙌 [引用 @SiliconFlowAI]：开发者们正在用他们的 token 投票 🔥 SiliconFlow 现已成为日 token 使用量排名第一的第三方模型提供商在 @OpenRouter 上， • 每日约 280B token • 每月约 1.9T token • 33 个前沿模型：DeepSeek V4 系列、GLM 5.1、Kimi K2.6 等衷心感谢每一位与我们共同构建的开发者更多精彩即将到来🚀

Chubby♨️@kimmonismus · 4月29日40

Mistral Medium incoming. The only relevant european AI company is going to release another model.

译Mistral Medium 即将到来。唯一相关的欧洲AI公司将发布另一个模型。

阿绎 AYi@AYi_AInotes · 4月29日47

holy shit，Warp这次真的是把整个行业的桌子给掀了。发布一天多，GitHub直接冲到31.9k星，速度快到系统都卡了。兄弟们，这可不是简单把代码扔到GitHub，相当于带来了人类历史上第一个AI原生的开源协作范式🤯🤯🤯 以前开源是靠热情开发者周末肝代码，现在Oz代理会自动写代码，跑测试，做code review，甚至生成完整的技术文档。未来人类只需要做最值钱的三件事，提想法，把关品味，拍板最终方向。更有意思的是，前几天http://Cal.com刚因为AI风险宣布闭源，Warp反其道而行之，用AI把开源的优势放大到了极致👍👍👍 而且你现在甚至能去http://build.warp.dev，实时围观几百个AI代理同时在写代码，改bug，处理issue。我感觉这可能是未来十年软件开发方式的一次预演。

译Warp宣布开源后，其GitHub仓库在一天内获得超过3万星标，热度极高。此举被视为开创了“AI原生的开源协作范式”，其核心在于引入AI代理（如Oz代理）自动执行编码、测试、代码审查和技术文档生成等任务。这预示着未来开发者的角色将转向提出创意、把控质量和决策方向。此举与Cal.com因AI风险而闭源的做法形成鲜明对比，Warp通过AI技术将开源协作的优势极大化。用户现可在线实时观察数百个AI代理协同处理代码、修复漏洞的进程，这可能是未来十年软件开发模式的一次重要预演。

meng shao@shao__meng · 4月29日60

Warp 开源啦？！ @warpdotdev 👍🏻 Warp cline 正式宣布开源，AGPL License： https://github.com/warpdotdev/warp 和开源发布同步的是一套以 Agent 为中心的协作方式：用云端编排平台 Oz 让 Agent 承担大部分编码、规划、测试等重活，人类侧重方向、审阅与验证。 OpenAI 是新开源仓库的创始赞助方，Oz 工作流里用的是 GPT-5.5 模型。

译Warp 开源啦？！ @warpdotdev 👍🏻 Warp cline 正式宣布开源，AGPL License： https://github.com/warpdotdev/warp 和开源发布同步的是一套以 Agent 为中心的协作方式：用云端编排平台 Oz 让 Agent 承担大部分编码、规划、测试等重活，人类侧重方向、审阅与验证。 OpenAI 是新开源仓库的创始赞助方，Oz 工作流里用的是 GPT-5.5 模型。 [引用 @zachlloydtweets]：http://x.com/i/article/2049151514380267520

Berryxia.AI@berryxia · 4月29日65

🚀 OpenBMB 重磅发布！MiniCPM-o 4.5 技术报告来了！ 9B 参数多模态模型实现突破性实时交互： • Omni-Flow 框架：原生全双工流式交互（视频+音频+文本毫秒级同步） • Native Full-Duplex + Proactive Interaction（无需VAD，可主动提醒） • 多模态基准接近 Gemini 2.5 Flash（MMBench 87.6 / MathVista 80.1） • 极致 Edge AI：完全离线运行，一键安装 Windows / macOS（12G VRAM 即可） • 100% 本地隐私 + 免费社区 API 真正的实时、自然人机交互时代来了！🔥 技术报告、GitHub、HuggingFace、Web Demo 已开放。

译OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型，实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流，无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash，并专为边缘AI设计，支持完全离线运行，提供Windows/macOS一键安装（仅需12G显存），保障100%数据隐私，同时开源权重并提供免费社区API。

宝玉@dotey · 4月29日62

微软 1 月开源的 VibeVoice-ASR 语音识别模型（https://github.com/microsoft/VibeVoice），Simon Willison 在 Mac 上测试后给出了一份具体的实测报告。 VibeVoice-ASR 是微软研究院今年 1 月 21 日开源的 9B 参数语音转文字模型，MIT 协议。最大卖点是单次能处理 60 分钟连续音频，而且把"谁在说、什么时候说、说了什么"做成结构化输出。传统方案要拿 Whisper（OpenAI 开源的语音识别模型）配上 pyannote 这种说话人分离工具拼起来，这次一个模型直接搞定，原生支持 50 多种语言和中英混说。 Simon 跑的是社区做的 4-bit 量化版（5.71GB，原模型 17.3GB），机器是 128GB 内存的 M5 Max MacBook Pro，转写一小时播客花了 8 分 45 秒。调用时要手动把 max-tokens 调到 32768，否则默认 8192 只够大约 25 分钟的音频。Activity Monitor 监控显示，prefill（预填充）阶段内存峰值飙到 61.5GB，生成阶段稳定在 18GB 上下，普通 32GB 笔电基本跑不动这个量化版。一个有趣的细节：模型把这场播客识别成了三个说话人。实际上只有 Simon 和主持人 Lenny 两人对谈，但 Lenny 的开场白和广告口播用了不同的录音环境，模型干脆把这部分切成了第三人。硬限制有两个：单次最多 60 分钟，超过要自己切片处理，还得手动对齐切片间的说话人 ID；想本地跑量化版至少要 64GB 以上内存的机器。对做播客转写、会议纪要、采访整理的人来说，原来拼接的多步流程现在能压缩成一次推理。

译微软开源的VibeVoice-ASR是一个9B参数语音转文字模型，采用MIT协议。其核心优势在于单次可处理长达60分钟的连续音频，并直接输出带说话人、时间戳的结构化文本，原生支持50多种语言及中英混说。实测在128GB内存的MacBook Pro上，其4-bit量化版转录一小时音频约需9分钟，但预填充阶段内存峰值达61.5GB，要求设备内存至少64GB。模型存在单次60分钟时长限制，且对录音环境变化敏感，但为播客、会议等长音频转录提供了简化流程。

小互@xiaohu · 4月29日53

智能终端工具Warp 宣布开源并引入"AI 智能体驱动"的全新协作开发模式开源后启用新协作方式：Warp 的云端 AI（叫 Oz）负责写代码、测试、规划等繁重工作，你只需要 review即可 OpenAI 是首位赞助商，开源仓库的 agent 工作流由 GPT 模型驱动（含 GPT-5.5）同步推出三大产品改进“ 1、支持更多开源 AI 模型，包括 Kimi、MiniMax、通义千问（Qwen），还有"自动选最优开源模型"功能 2、界面和功能高度可定制：可以只用纯终端，也可以开启完整的 AI 开发环境 3、终于推出了配置文件（Settings File），方便跨设备迁移和程序化控制

译智能终端工具Warp宣布开源，并引入由云端AI（Oz）驱动的协作开发模式，该AI可负责代码编写、测试等任务，开发者主要进行审核。OpenAI成为首位赞助商，其GPT模型驱动开源仓库的智能体工作流。产品改进包括支持Kimi、MiniMax、通义千问等多款开源AI模型，具备自动选择最优模型功能；提供高度可定制的界面，支持从纯终端到完整AI开发环境；新增配置文件，便于跨设备迁移和程序化控制。

Berryxia.AI@berryxia · 4月29日67

前Github CTO team带着新模型来了！他们的Poolside AI 团队刚刚开源了他们的首个权重模型！模型名称 Laguna XS.2 • 33B total / 3B active MoE • Apache 2.0 完全开源 • 专为 Agentic Coding + 长时序任务设计 • 单张 GPU 即可流畅运行同时发布 Laguna M.1（当前最强版）和 Agent Harness。由前 GitHub CTO Jason Warner 创立的团队，coding agent 赛道新力量！ ```

译由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构，专为Agentic Coding和长时序任务设计，可在单张GPU上运行，并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness，标志着其在智能编码代理赛道成为新的竞争者。

Berryxia.AI@berryxia · 4月29日60

NVIDIA 重磅发布！🚀 Nemotron 3 Nano Omni 多模态开源模型来了！ 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型（语言+视觉+语音+视频+音频一体化） 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源（权重 + 数据 + 配方），领跑多项榜单可通过 NVIDIA NIM API 免费试用！完美 powering 多代理工作流。

译NVIDIA 重磅发布！🚀 Nemotron 3 Nano Omni 多模态开源模型来了！ 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型（语言+视觉+语音+视频+音频一体化） 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源（权重 + 数据 + 配方），领跑多项榜单可通过 NVIDIA NIM API 免费试用！完美驱动多代理工作流。

Chubby♨️@kimmonismus · 4月29日46

My current daily driver is Brave Browser. A fully private AI browser that runs agents locally on your machine, no cloud, no data leaving your device sounds freaking awesome. Qwen, Gemma, Nemotron - all running directly in the browser, open source. This is the direction browser AI should go! Ngl, love to work with them.

译作者推崇将AI智能体完全本地化运行的浏览器模式，认为这是浏览器AI应有的发展方向。这种模式的核心在于隐私保护与开源，所有数据处理均在用户设备本地完成，无需依赖云端，确保数据不外泄。当前，已有如Sigma Browser等产品实现了这一理念，支持在浏览器内直接运行Qwen、Gemma、Nemotron等开源模型。作者对此表示高度赞赏，并表达了强烈的合作意愿。

Rohan Paul@rohanpaul_ai · 4月29日59

Sigma (@Sigma_Browser) just announced an open-source private AI browser that runs the OpenClaw agent and local models like Qwen, Gemma, and Nemotron on your device. Most AI browsers send page context and task steps to remote servers, which adds delay and creates a privacy gap. Sigma’s proposal is to place a local LLM inside a Chromium browser, then let it read pages, understand intent, and act on the web directly. That changes the browser from a passive viewer into a working surface where AI can click, type, summarize, and automate routine online tasks. Because the browser already holds your real working context: tabs, forms, searches, accounts, and all the messy state of a task in progress. Once an agent lives there, the interface shifts from asking for information to delegating action.

译Sigma发布了一款开源私有AI浏览器，其核心是将本地大语言模型（如Qwen、Gemma、Nemotron）与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体，能直接读取页面内容、理解用户意图，并执行点击、输入、总结等自动化操作，从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险，所有计算均在用户本地设备完成，确保了隐私安全和响应速度。

TestingCatalog News 🗞@testingcatalog · 4月29日55

Now you can run a private OpenClaw Agent powered by local models directly inside a Sigma browser. > Gemma 4, Qwen, 3.5, or Nemotron 3 models are available. All your browser data stays on your machine. > Private AI Agent can manage tabs, navigate to pages, and more!

译现在你可以在Sigma浏览器内直接运行由本地模型驱动的私有OpenClaw智能体。 > 可选Gemma 4、Qwen、3.5或Nemotron 3模型。所有浏览器数据均保留在本地设备。 > 私有AI智能体可管理标签页、跳转页面，功能丰富！

Chubby♨️@kimmonismus · 4月29日54

NVIDIA just launched Nemotron 3 Nano Omni. Not the first omni-model, but built for a different job. And that makes it really interesting: Models like ChatGPT and Gemini already handle vision, audio, and text. What they're not optimized for is running as a lightweight perception sub-agent inside agentic systems, where the model gets called hundreds of times in a loop. That's the gap Nemotron 3 Nano Omni fills. A 30B-A3B mixture-of-experts architecture that delivers up to 9x higher throughput than comparable open omni models. Not smarter but faster and cheaper at scale. The design logic: It acts as the "eyes and ears" in a multi-agent stack, paired with Nemotron Super for execution and Ultra for planning. One model sees screens, reads documents, hears audio. Then hands structured context to the reasoning layer. Fully open weights, datasets, and training recipes. Runs from workstation to cloud. Available today on Hugging Face. NVIDIA isn't trying to build the best chatbot. They're building the infrastructure layer for agentic AI, and this is the perception module. Btw. the blogpost was written by Kari Briski. I already talked to her about NVIDIA Nemotron at the GTC :) Check it out in the comments.

译NVIDIA推出Nemotron 3 Nano Omni模型，其定位并非通用聊天机器人，而是作为智能体系统中的轻量级感知模块。该模型采用30B-3B混合专家架构，在处理视觉、音频和文本多模态输入时，吞吐量可比同类开源全模态模型提升高达9倍。它旨在充当多智能体栈中的“眼睛和耳朵”，负责感知屏幕、文档和音频等信息，并将结构化上下文传递给如Nemotron Super（执行）和Ultra（规划）等推理层，从而优化大规模、高频率调用的智能体工作流。模型完全开源，现已登陆Hugging Face。

Ant Ling@AntLingAGI · 4月29日57

Thanks to @huggingface for offering the place where open models can keep thriving! 🤗🤗 Token efficiency is the key to practical and sustainable co-work systems, let elephant-alpha / Ling-2.6-flash to be your best companion 😎

译推文感谢Hugging Face为开源模型的持续发展提供了重要平台。文中强调，token效率是构建实用、可持续协作系统的关键。AntLingAGI最新发布的Ling-2.6-flash模型已加入这场效率竞争，该模型采用MIT许可，具备104B/7.4B激活参数，并创新性地结合了1:7 MLA与Lightning Linear混合注意力机制。其性能表现突出：推理速度高达340 tok/s，并且仅需约1500万tokens即可完成完整的Artificial Analysis评测套件。这一效率显著高于通常需要5000万至1亿tokens的前沿模型，展现出其作为高效协作伙伴的潜力。

OpenRouter@OpenRouter · 4月29日33

Welcome @KenTheRogers to the team! Expect to see some technical guides, cookbooks, and more coming from him. He's the author of our first X article 👇

译欢迎 @KenTheRogers 加入团队！期待看到他带来一些技术指南、cookbooks 等。他是我们第一篇 X 文章的作者👇

AK@_akhaliq · 4月29日44

SenseNova U1 is out on Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1

译SenseNova U1 已在 Hugging Face 发布 https://huggingface.co/collections/sensenova/sensenova-u1

Ant Ling@AntLingAGI · 4月29日59

Thanks to the @vllm_project team for the Day0 support of Ling-2.6-flash! The true system experts and open ecosystem builders always find synergies working with each other~ 🥳🥳 Stay tuned for more!

译vLLM项目团队宣布对Ling-2.6-flash模型提供Day-0首发支持，体现了开源生态系统构建者之间的高效协同。Ling-2.6-flash是一个专为需要快速响应和强大执行力的现实世界智能体设计的即时指令MoE模型。其核心特点包括：1040亿总参数与74亿激活参数的高度稀疏混合专家架构，结合了1:7 MLA与Lightning Linear注意力机制，支持262K上下文长度，并具备原生工具调用能力，可无缝接入Claude Code、Kilo Code、Qwen Code、Hermes、OpenClaw等主流框架。

凡人小北@frxiaobei · 4月29日20

雷老板是懂营销的，本着拿人 token，替人带货的原则，替 Xiaomi MiMo 喊个话。

Chubby♨️@kimmonismus · 4月28日59

Microsoft Presents "TRELLIS.2": An Open-Source, 4B-Parameter, Image-to-3D Model producing up to 1536³ PBR textured assets. Built On Native 3D VAES With 16× Spatial compression, delivering efficient, scalable, high-fidelity asset generation. Ngl, pretty cool!

译Microsoft 推出 "TRELLIS.2"：一个开源的、40亿参数的图像转3D模型，可生成高达1536³的PBR纹理资产。基于原生3D VAES，具有16倍空间压缩能力，提供高效、可扩展、高保真的资产生成。说实话，相当酷！

Alibaba Cloud@alibaba_cloud · 4月28日39

🚀 Alibaba Cloud AI Gateway now supports DeepSeek V4! ☁️ Plug-and-play via OpenAI/Anthropic-compatible APIs ☁️ Smart routing + automatic fallback (e.g., Qwen) ☁️ Full support for 1M-context, Tool Calls, and thinking mode ☁️ Unified management for security, quotas, and observability 🧠 Deploy DeepSeek V4 in production—securely, reliably, and at scale! 🔗 Learn more: https://int.alibabacloud.com/m/1000412507/

译🚀 阿里云AI网关现已支持DeepSeek V4！ ☁️ 通过OpenAI/Anthropic兼容API即插即用 ☁️ 智能路由 + 自动回退（例如，Qwen） ☁️ 全面支持100万上下文、工具调用及思考模式 ☁️ 统一管理安全性、配额与可观测性 🧠 安全、可靠、大规模地部署DeepSeek V4至生产环境！ 🔗 了解更多：https://int.alibabacloud.com/m/1000412507/

Berryxia.AI@berryxia · 4月28日56

🔥兄弟们，最近多模态图像模型真是神仙打架啊！看来又要来一波，实测对比了啊！前几天才发完测试，又有新的模型，真心吃不消啊！又发现一个全网开源、即刻可用的重磅神器 —— 商汤 OpenSenseNova 刚刚发布 SenseNova-U1！原生统一多模态大模型，NEO-Unify架构，视觉+语言从第一性原理彻底打通，无独立VE/VAE！核心技术亮点： • 文本与图像深度交错生成（教程、海报、漫画一气呵成） • 推理驱动的智能图像编辑（懂物理逻辑） • 高密度信息图表渲染超强模型大小高度本地化： • 8B 密集模型 • A3B-MoT（活性参数仅约3B，个人显卡就能本地部署跑起来！）全网开源部署，Apache 2.0 可商用： GitHub: https://github.com/OpenSenseNova/SenseNova-U1 立刻登录领取限时免费Token Plan额度，每天5小时 + 1500次无门槛调用，零成本解锁极速体验！即将上线「办公小浣熊」，这个结合办公看看能不能搞点东西出来！本地多模态时代，冲就对了！

译商汤发布开源可商用的多模态大模型SenseNova-U1，采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版，适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度，并即将推出办公场景应用功能。

歸藏(guizang.ai)@op7418 · 4月28日65

小米牛皮！早上申请的中午就到了直接给了 329 的赠金，相当于一个月的 Codeplan Pro 会员

译小米宣布将其MiMo-V2.5系列模型全部开源，采用宽松的MIT协议，允许自由商用、二次训练与微调。同时，公司推出了Orbit 100T Token计划，旨在激励开发者和构建者。该计划包含两部分：面向AI builder的“百万亿Token创造者激励计划”，成功申请者最高可获得价值659元的16亿Credits；以及面向Agent框架团队的“Agent生态共建计划”，将为框架提供MiMo token限免支持，让终端用户免费体验模型。

Alibaba Cloud@alibaba_cloud · 4月28日28

Alibaba Cloud is proud to support the TNG Digital FINHACK 2026, where 300+ Malaysian innovators tackled real fintech challenges from fraud prevention to financial inclusion, powered by AI. As a strategic partner, Alibaba Cloud provided cloud infrastructure, AI tools including Qwen, our #1 open-source model, Qoder, our next generation AI powered coding platform and on ground Solutions Architect support to help the future talents build scalable and real world solutions. Congratulations to all participants and winners! Together, we are accelerating Malaysia's fintech future: inclusive, secure and intelligent. #AlibabaCloud #TNGDigital #Fintech #AI #MalaysiaTech #AInnovation #Qwen #Qoder

译阿里云作为战略合作伙伴，支持了TNG Digital FINHACK 2026活动。该活动汇聚了300多名马来西亚创新者，利用人工智能应对从欺诈预防到金融普惠等现实金融科技挑战。阿里云提供了云基础设施、AI工具（包括排名第一的开源模型Qwen和下一代AI驱动编码平台Qoder）以及现场解决方案架构师支持，旨在帮助未来人才构建可扩展的、面向真实世界的解决方案。活动致力于共同加速马来西亚金融科技的未来，使其更具包容性、安全性和智能化。

SiliconFlow@SiliconFlowAI · 4月28日43

Builders are voting with their tokens 🔥 SiliconFlow is now the #1 third-party model provider by daily token usage On @OpenRouter , • ~280B tokens/day • ~1.9T tokens/month • 33 frontier models: DeepSeek V4 series, GLM 5.1, Kimi K2.6 etc. Big thanks to every dev building with us And more is coming🚀

译开发者们正在用他们的代币投票 🔥 SiliconFlow 现已成为日使用代币量排名第一的第三方模型提供商在 @OpenRouter 上， • 每日约 2800 亿代币 • 每月约 1.9 万亿代币 • 33 个前沿模型：DeepSeek V4 系列、GLM 5.1、Kimi K2.6 等衷心感谢每一位与我们共同构建的开发者更多精彩即将到来 🚀

SemiAnalysis@SemiAnalysis_ · 4月28日57

8x VLLM CUDA MOAT ALERT: InferenceX has added @deepseek_ai V4 Pro for @vllm_project for day 3 performance across B200, B300, H200, GB200 disagg. We are seeing that B300 is up to 8x faster than H200. The team is working on benchmarking vLLM 0.20 which has the new DeepGEMM MegaMoE which fuses EP dispatch/EP combine/GEMMs & SwiGLU activations into a single mega-kernel, we believe that the perf will be even better. Thank you to vLLM maintainers from @NVIDIAAI & @rogerw0108 & team from @interact for their passion for open source & burning the midnight oil over the weekend!

译InferenceX已将DeepSeek V4 Pro集成至vLLM项目，在B200、B300、H200和GB200等硬件上的性能测试显示，B300的推理速度比H200快达8倍。团队正在基于vLLM 0.20版本进行基准测试，该版本引入了全新的DeepGEMM MegaMoE技术，将专家并行调度、组合、通用矩阵乘法及SwiGLU激活函数融合为单一巨型内核，预计将带来更优性能。文中感谢了来自NVIDIA AI、社区贡献者及相关团队的开发人员对开源项目的投入与努力。

François Chollet@fchollet · 4月28日60

Keras Kinetic has a new alpha release: v0.0.2! Including a new docs website: http://kinetic.readthedocs.io Kinetic is my favorite new release from the Keras team: a super simple Modal-like API to run training jobs on TPU.

译Keras Kinetic 发布了新的 alpha 版本：v0.0.2！包括新的文档网站：http://kinetic.readthedocs.io Kinetic 是我最喜欢的 Keras 团队新发布：一个超级简单的类 Modal API，用于在 TPU 上运行训练任务。

Google AI Developers@googleaidevs · 4月28日52

Zoom in on how @GoogleGemma 4 is optimized to handle high-concurrency serving for complex tasks (such as generating SVGs) — on a single GPU. ✓ 10+ sessions are sent to the 26B A4B model ✓ The system routes, accelerates, and processes those workloads — without bottlenecking ✓ A live dashboard visually tracks the load balancing in real time, displaying active slots, context sizes, and token generation speeds Watch the demo to see it in action ⬇️

译深入了解 @GoogleGemma 4 如何优化以在单个 GPU 上处理高并发复杂任务（例如生成 SVG）。 ✓ 10 多个会话被发送到 26B A4B 模型 ✓ 系统路由、加速并处理这些工作负载——没有瓶颈 ✓ 实时仪表板可视化跟踪负载均衡，显示活动槽位、上下文大小和令牌生成速度观看演示视频以了解实际运行情况 ⬇️

Xiaomi MiMo@XiaomiMiMo · 4月28日53

We believe open source is more than releasing weights — it’s about building ecosystems. Today, we’re introducing MiMo Orbit. A program to support builders, frameworks, and the next wave of AI applications. MiMo Orbit includes: 1️⃣ 100T Token Grant for Builders We’re making 100 trillion (100T) tokens available to AI builders worldwide. • Free access, while supplies last • Application-based • Up to a 1-month Max Plan (1.6B credits) 📅 Apr 27, 2026, 9:00 AM – May 27, 2026, 9:00 AM (PDT) Apply here: http://100t.xiaomimimo.com 2️⃣ Agent Ecosystem Program We support Agent frameworks globally with free integration access and zero-friction onboarding for your users. If you’re building an Agent framework, let’s collaborate: 📩 business-mimo@xiaomi.com

译小米推出MiMo Orbit计划，旨在超越单纯开源模型权重，构建开放的AI生态系统。该计划包含两大核心举措：一是向全球AI开发者提供100万亿（100T）令牌的免费资源资助，申请者有机会获得最高1.6B积分的月度计划，申请窗口为2026年4月27日至5月27日；二是启动Agent生态系统项目，为全球Agent框架提供免费的集成接入和无摩擦的用户入驻支持，以促进下一代AI应用的发展。

Xiaomi MiMo@XiaomiMiMo · 4月28日71

Xiaomi MiMo-V2.5 is now officially open-sourced！ MIT License, supporting commercial deployment, continued training, and fine-tuning - no additional authorization required. Two models, both supporting a 1M-token context window : • MiMo-V2.5-Pro: built for complex agent and coding tasks, ranking No.1 among open-source models on GDPVal-AA and ClawEval • MiMo-V2.5: a native omni-modal model with strong agent capabilities A model's value isn't measured by rankings alone — it's measured by the problems it solves. Let's build with MiMo now! 🤗 Weights: https://huggingface.co/collections/XiaomiMiMo/mimo-v25 📄 Blog: https://mimo.xiaomi.com/index#blog

译小米正式开源MiMo-V2.5系列模型，采用MIT许可，支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型：MiMo-V2.5-Pro专为复杂智能体和编码任务设计，在GDPVal-AA和ClawEval基准测试中位列开源模型第一；MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调，模型的价值不仅在于排名，更在于其解决实际问题的能力，并已公开模型权重与技术博客。

小互@xiaohu · 4月27日29

阿里的 HappyHorse 上线了字节的回应🤣

elvis@omarsar0 · 4月27日59

Don't try to build a self-improving AI agent without evals. You are just wasting time and compute. An agent can't improve from traces it can't evaluate. This is why it's exciting to see @FutureAGI_ going fully open source with their platform. It combines the best of all the eval tools and methods in one stack. They've shipped a set of tools to make it easier for AI devs to reliably ship self-improving agents. There is a lot to like here: - Evals for hallucination, groundedness, PII, toxicity, tool-use correctness, bias, and any custom metric. Every evaluator is readable and modifiable, not a black-box score. No vendor lock-in to worry about. - Six prompt optimization algorithms (GEPA, PromptWizard, ProTeGi, and others) that take production traces and feed them back as training signals. - Multi-turn simulation before launch, including voice agents through LiveKit, VAPI, Retell, and Pipecat. You stress test edge cases before users ever hit them. - Real-time guardrails for jailbreaks, prompt injection, and PII leaks. - OpenTelemetry-native tracing with 4+ languages (Python, TypeScript, Java, and C#), 50+ framework instrumentors (LangChain, LlamaIndex, CrewAI, AutoGen, DSPy, Haystack). - An OpenAI-compatible gateway with 100+ providers, routing strategies, and caching. If self-improving agents are the direction the field is moving, we need eval infrastructures we can actually trust and build on top of. This is that infrastructure, and now it's open. Check it out here: http://github.com/future-agi/future-agi Generous free tier cloud-based offer here: https://shorturl.at/cxYOd

译构建自进化AI代理必须依赖可靠的评估体系，否则将浪费资源。@FutureAGI_ 开源其平台，整合了领先的评估工具与方法，为开发者提供完整基础设施。该平台涵盖幻觉、毒性、偏见等多维度可修改评估器，集成六种提示优化算法，支持多轮模拟测试与实时安全防护，并提供多语言追踪及兼容OpenAI的网关。其开源特性旨在建立可信任的评估基础，推动自进化AI代理领域发展。

向阳乔木@vista8 · 4月27日33

DeepSeek 牛逼！不过得吐槽下Grok的翻译，这个语境下的GOAT翻译成山羊... 不翻译就好啊这是应该是没用大模型翻译能力吧，再弱的模型都不应该犯这样的错误。

译DeepSeek 牛逼！不过得吐槽下Grok的翻译，这个语境下的GOAT翻译成山羊... 不翻译就好啊这应该是没用大模型翻译能力吧，再弱的模型都不应该犯这样的错误。

Kimi.ai@Kimi_Moonshot · 4月27日50

Kimi K2.6 is now #1 on OpenRouter's weekly LLM Leaderboard 🏆 A huge thank you to every developer building with Kimi. We'll keep our heads down and keep shipping.

译Kimi K2.6 现已登上 OpenRouter 每周 LLM 排行榜首位 🏆 衷心感谢每一位使用 Kimi 进行开发的开发者。我们将继续埋头苦干，持续交付。

meng shao@shao__meng · 4月27日67

Browser Use 团队推出「Browser Use Box (bux)」：一台属于你自己的盒子，一个 7×24 小时在线、自带真实浏览器的 Claude Code Agent @browser_use bux 要解决的问题 · 会话不持久：关电脑 = Agent 断电；登录态、Cookie、记忆不沉淀 · 浏览器很脆弱：本地 Playwright 装一坨依赖，2FA / CAPTCHA / Cloudflare 一来就废 · 没有可达性：人在地铁里，没法让 Agent "顺手帮我处理一下" bux 的做法：把 Agent 跑在自己拥有的盒子上（VPS、Mac mini、树莓派都行），把浏览器外移到 Browser Use Cloud，并通过 Telegram 让你随时随地一句话调用它。整体架构 Telegram Web Browser │ │ ▼ ▼ telegram_bot.py ttyd │ │ └───┬───┘ │ ▼ claude -p │ ├──► /home/bux │ (持久化状态) ▼ browser-harness │ │ CDP over WSS ▼ BU Cloud 1. 入口层：Telegram 消息 / 浏览器访问 ttyd web 终端，是用户的两条触达通道。 2. 调度层：两条入口最终都汇入 claude -p，由它驱动整轮 Agent 逻辑。 3. 状态层：每一轮对话和产出都落到 /home/bux/，重启不丢。 4. 执行层：claude 通过 browser-harness 走 CDP-over-WSS 协议，远程驱动跑在 Browser Use Cloud 上的真实 Chromium。三个 systemd 服务，互相独立： · bux-browser-keeper：维持一个长期存活的云端浏览器会话，解决冷启动 20–30s 的痛点 · bux-tg：Telegram 长轮询机器人，用户的"遥控器" · bux-ttyd：绑定 127.0.0.1 的 web 终端，当 SSH 嫌麻烦时直接进 Claude 开源地址 https://github.com/browser-use/bux

译Browser Use团队发布Browser Use Box（bux），一个可部署在自有设备（如VPS、树莓派）的24/7在线个人代理盒子。它通过将Claude Code Agent部署于本地，并将浏览器外移至Browser Use Cloud，解决了传统智能体会话不持久、本地浏览器环境脆弱（受2FA/CAPTCHA等限制）以及无法随时随地调用的问题。用户可通过Telegram或Web终端远程触发，Agent通过CDP-over-WSS协议驱动云端真实Chromium执行自动化任务（如预订航班、回复消息）。该项目已开源。

ginobefun@hongming731 · 4月27日49

#BestBlogs 早报 2026-04-27 今日主题：软件功能不再是护城河，真正稀缺的是分发、组织方式和协作机制。Snapchat 的 Evan Spiegel 用十五年的复盘说明，新社交产品要么靠资本补贴要么靠平台规模，单点产品已经很难破局。Replit 的 Amjad Masad 把公司未来收敛为 Builders 和 Sales 两类角色，赌的是十亿开发者。GitHub Next 的 Maggie Appleton 则提醒我们，AI 让实现窗口塌陷之后，团队对齐才是真正的瓶颈。

译软件功能已非核心壁垒，稀缺资源转向分发能力、组织模式与协作机制。Snapchat创始人指出，新社交产品需依赖资本或平台规模破局；Replit将未来押注于Builders与Sales两类角色，瞄准十亿开发者市场；GitHub Next强调，AI大幅缩短产品实现周期后，团队目标对齐与协作效率已成为关键瓶颈。

Orange AI@oran_ge · 4月27日48

昨天参加开放麦，听到最好笑的分享： GitHub 正在成为 AI 界的小红书。三个维度论证： 1. Star 从"我用了好使"退化成"这个故事让我兴奋"， 2. README 从技术文档变成营销 Landing Page， 3. Star 数还能花钱买，20块钱就能买100个。笑完之后发现，好像真的是这样。

译推文以开放麦分享为引，尖锐指出GitHub在AI浪潮中正演变为类似“小红书”的社区。核心论证围绕“星标”功能异化展开：其一，Star从实用价值认可退化为对项目叙事的情感共鸣；其二，项目README从技术文档转变为营销导向的落地页；其三，Star数量出现可购买现象，市场价约20元人民币可购100个。这一观察揭示了开源平台在热度驱动下，其核心评价体系与内容生态正在发生显著偏移。

Berryxia.AI@berryxia · 4月26日36

花生的女娲skills的确不错！我自己参加腾讯的比赛也是受花生女娲的启发做了悟空skills，之前有人问是不是和女娲一样？或者抄袭？其实，我一开始就说了。我自己的迭代和完善的内容是不同的，根据我的需求进行了迭代。过几天开源后大家自己可以看看。有什么区别哈～

译作者回应外界对其开发的“悟空skills”是否抄袭“女娲skills”的质疑，澄清其项目是在“女娲skills”启发下，根据自身需求进行独立迭代和完善的产物，并预告即将开源以供公众自行比较差异。背景信息显示，“女娲.skill”已取得显著关注，并被多家主流公司的Agent产品采用。