5月15日

09:00

公众号：蚂蚁百灵（Ling）

Ring-2.6-1T 正式开源：为真实复杂任务打造的万亿级思考模型

Ring-2.6-1T 正式开源，这是为真实复杂任务打造的万亿级思考模型，Agent 执行能力全面增强，采用双档推理配置，兼顾效率、成本与能力上限。

开源生态推理模型发布

08:51

Berryxia.AI@berryxia

AI自主研究实现突破：智能体在nanoGPT优化赛道上超越人类基准

Prime Intellect 近期在AI研究自动化领域取得重要进展。他们让Claude Code与Codex智能体完全自主运行于nanoGPT速度挑战的优化器赛道，利用闲置算力完成了近万次实验，消耗约1.4万H200小时。最终，Claude Code将记录提升至2930步，超越了2990步的人类基准。实验显示，智能体在系统整合社区主流优化方法、进行超参数扫描和策略组合方面效率极高，但在要求真正创新的“新颖性检查”环节未能突破基线。该项目将所有实验记录、日志和代码开源，使得AI自主研究从概念转化为可复现的现实。

Prime Intellect: Automating AI research is the next major step in AI We let Claude Code (Opus 4.7) and Codex (GPT 5.5) run autonomously o...

智能体开源生态论文/研究

08:51

Berryxia.AI@berryxia

开源3D生成工具包：单张图片快速构建可交互3D世界

开发者@neilsonks开源了一套专为Claude Code设计的完整3D生成工具包。该工具能将输入的单张图片自动拆解，生成包含环境、网格、物理、灯光和音频的全套可交互3D场景。其流程首先利用图像与3D生成技术提取物体并生成高质量网格，随后移除物体以得到静态背景，最后为整个场景添加物理模拟、实时灯光和环境音效。配套查看器支持对生成物体的点击编辑与一键导出。此工具将以往需数天的2D转3D工作流程缩短至几分钟，适用于游戏开发、世界构建和产品可视化等项目。项目已在GitHub开源。

neilson: open-sourcing a 3D gen toolkit for Claude Code input image → environment, meshes, physics, lighting, & audio

Anthropic GitHub 产品更新多模态

06:56

Simon Willison 博客

引用 Mitchell Hashimoto

Mitchell Hashimoto 针对 Bun 从 Zig 移植到 Rust 一事发表评论，指出编程语言正变得越来越可替代。他认为，过去编程语言常形成技术锁定，但现在情况已大不相同。Bun 团队展示出他们可以在大约一两周内用任何他们想要的语言重写项目，Rust 也不例外。语言变得可消耗，有用时则用，不再适用时便可弃用，这一现象值得关注。

大佬观点开源生态编码

06:03

François Chollet@fchollet

Keras包近期在PyPI上月下载量突破2100万次，创历史新高（日下载量峰值约90万次）。我仍记得约5年前首次突破1000万月下载量时，曾以为这已是极限……

开源生态行业动态

03:45

Hugging Face：Blog（RSS）

精选60

IBM 发布 Granite Embedding Multilingual R2 开源多语言嵌入模型

IBM 发布两个 Apache 2.0 开源多语言嵌入模型：97M 参数的紧凑型（granite-embedding-97m-multilingual-r2）在 MTEB Multilingual Retrieval 上得 60.3 分，超越所有开放子 1 亿参数模型；311M 全尺寸模型（granite-embedding-311m-multilingual-r2）得 65.2 分，在 500M 以下开放模型中排第二，并支持 Matryoshka 维度。两者均基于 ModernBERT 架构，支持 200+ 种语言，针对 52 种语言和 9 种编程代码检索训练，上下文窗口达 32,768 tokens。可直接替换 sentence-transformers、LangChain、LlamaIndex 等框架中的默认模型，预置 ONNX 和 OpenVINO 权重以优化 CPU 推理。

检索增强开源生态搜索模型发布

推荐理由：97M小模型在跨语言检索上打败很多300M级选手，32K上下文让长文档处理不再鸡肋，Apache 2.0开源意味着做多语言RAG的可以直接拿来当默认嵌入模型了。

5月14日

23:51

Berryxia.AI@berryxia

MLX CUDA后端测试全通过，跨平台本地AI时代来临

MLX框架的CUDA后端已实现所有测试通过，标志着其从苹果芯片专属工具正式进军NVIDIA GPU领域。这意味着开发者能用同一套代码，在Mac和NVIDIA显卡上获得高性能运行体验，有望打破PyTorch等框架的兼容性壁垒。此举可能强力推动本地AI应用的跨平台发展进程。

Cheng: We have achieved a milestone in MLX that all tests are passing in CUDA backend now.

产品更新开源/仓库开源生态

23:45

Ant Ling@AntLingAGI

Ring-2.6-1T开源：万亿级思考模型支持复杂任务执行

Ring-2.6-1T 正式开源，这是一个专为现实世界复杂任务构建的万亿规模旗舰思考模型。其设计目标超越单纯的“回答”，转向任务执行，能够理解上下文、规划步骤、调用工具，并在长任务链中保持稳定。模型重点支持高级智能体工作流，提供不同级别的推理努力配置：常规任务采用高级别，复杂推理则启用更高强度。通过 IcePop 算法实现了可扩展的异步强化学习，从而支撑了面向长周期智能体任务的稳定万亿规模训练。

智能体开源生态推理模型发布

19:15

SenseTime@SenseTime_AI

精选77

由联合创始人兼首席科学家李沐博士领导的团队发布了SenseNova U1技术报告，详细阐述了其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型（MoE）的新权重，旨在推动AI领域的透明度、可复现性与进一步创新。团队希望通过开放共享促进整个社区的技术发展。

Dahua Lin: Proud to announce the release of the SenseNova U1 Tech Report - together with the a new set of model weights based on Mo...

开源/仓库开源生态数据/训练模型发布

推荐理由：商汤这次把SenseNova U1的MoE权重和完整技术报告一起开源，比常规PR多了些诚意，做模型选型和微调的值得翻翻。

13:58

Xiaomi MiMo@XiaomiMiMo

精选69

MiMo V2.5 Pro 在 @DesignArena 上刚刚获得第三名！🎉 MiMo V2.5 Pro （Thinking）在总排行榜上比 MiMo-V2.5 提升了 8 个名次，在前端编码任务中达到与 Claude Sonnet 4.6 相同的性能水平。衷心祝贺 @XiaomiMiMo 团队取得这些进步！

Design Arena: BREAKING: MiMo V2.5 Pro (Thinking) takes 3rd overall out of open weights models on Design Arena. MiMo V2.5 Pro (Thinking...

开源生态编码评测/基准

推荐理由：小米MiMo在Design Arena前端编码评测里直接杀进前三，跟Claude Sonnet 4.6平起平坐，这是国产开源模型在代码能力上第一次给我真正的压迫感，搞前端的可以盯一下。