AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 470 条
全部一手资讯X论文
标签「开源/仓库」清除
6月20日周六
15:59IT之家(RSS)66开源工具 Headroom 爆火:Netflix 工程师打造,声称可节省 60%-95% Token 消耗量
06:54MarkTechPost(RSS)77精选NVIDIA Research 发布 SpatialClaw:免训练空间推理框架
6月19日周五
18:01公众号:卡尔的AI沃茨77精选Humanize PPT v0.9:为演讲而生的开源PPT Skill
6月18日周四
21:47Hugging Face:Blog(RSS)74精选AI 智能体够格吗?在自有工具上评测开源模型
18:14IT之家(RSS)67小米发布并开源全屋智能 AI 方案 Xiaomi Miloco 2.0
11:14Hacker News 热门(buzzing.cc 中文翻译)70精选cuTile Rust:安全无数据竞争的 GPU 内核系统
04:12GitHub Blog61精选GitHub 发布 CC0-1.0 开源多语言仓库级数据集,覆盖 README、Issue 和 PR
03:47Ars Technica:AI(RSS)55AI编码智能体教会机器人安装GPU和剪扎带--NVIDIA GEAR等团队开发ENPIRE框架
00:32Hacker News 热门(buzzing.cc 中文翻译)61GLM-5.2 (max) 性能、价格与开源发布
6月17日周三
15:36蚂蚁 inclusionAI:GitHub 新仓库7蚂蚁集团 GitHub 新建仓库 inclusionAI/asystem,内容暂未公开
00:53MarkTechPost(RSS)76同事件精选Qwen团队发布三个具身AI模型套件 Qwen-RobotSuite同一事件,精选展示《Qwen-RobotWorld:具身智能体的无界世界》
00:01IT之家(RSS)54开发者绕过苹果软件限制,成功解锁 M4 芯片 15.8TFLOPS 的 AI 算力
6月16日周二
10:40公众号:蚂蚁百灵(Ling)79同事件精选蚂蚁百灵发布 Ling & Ring 2.6 技术报告同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
03:59GitHub Blog54GitHub 发布新开源数据集,加速多语言 AI 研究与开发
6月15日周一
17:41MarkTechPost(RSS)73精选Flash-KMeans:IO感知的精确K-Means,在GPU上比FAISS快200倍以上
08:00HuggingFace Daily Papers(社区热门论文)55LOGOS:面向自然科学的通用科学生成语言模型
02:29Hacker News 热门(buzzing.cc 中文翻译)62里约热内卢的"本土化"LLM 似乎是现有模型的融合体
01:59Hacker News 热门(buzzing.cc 中文翻译)72精选里约热内卢市政府 AI 模型 Rio3.5 在基准测试中击败 Qwen3.7
6月14日周日
13:05MarkTechPost(RSS)68Databricks 开源 Omnigent:跨 Claude Code、Codex 和 Pi 的 AI 智能体元编排框架
08:00HuggingFace Daily Papers(社区热门论文)42SSync:面向视频目标中心学习的选择性协同学习方法
00:52Hacker News 热门(buzzing.cc 中文翻译)58/architect:减少80%的Fable token,Fable负责协调/审核,Codex负责构建
6月13日周六
23:21Hacker News 热门(buzzing.cc 中文翻译)52AI开源工具仓库在完成730万美元种子轮融资后,一夜之间被归档
17:36IT之家(RSS)31鸿蒙 PC 包管理器 HarmonyBrew 已支持 2763 条常用命令安装/卸载
17:02The Decoder:AI News(RSS)61月之暗面开源模型Kimi K2.7 Code每个token价格比GPT-5.5和Claude低12倍
15:36IT之家(RSS)69微软开源 iOS 流式 Markdown 渲染库 SwiftStreamingMarkdown
6月12日周五
18:00HuggingFace Daily Papers(社区热门论文)60ArogyaSutra:面向印度语言多模态医疗推理的多智能体框架
14:00HuggingFace Daily Papers(社区热门论文)77同事件精选MiniMax Sparse Attention(MSA)块状稀疏注意力同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
02:26Simon Willison 博客37asyncinject 0.7 发布
01:17Hacker News 热门(buzzing.cc 中文翻译)72精选DeepSeek-R1 的开源实现
00:17Hacker News 热门(buzzing.cc 中文翻译)75同事件精选MiMo Code 现已发布并开源同一事件,精选展示《小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议》
6月11日周四
18:50公众号:卡尔的AI沃茨77开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流
17:31IT之家(RSS)71精选阿里云发布 Meoo CLI:本地 AI 编程项目可一键部署上线
16:50公众号:腾讯混元78精选腾讯混元 AI Infra 新开源:HPC-Ops 推理核心算子全面升级
12:58HuggingFace Daily Papers(社区热门论文)68Claw-SWE-Bench:评估OpenClaw风格智能体框架编程能力的多语言基准
08:00HuggingFace Daily Papers(社区热门论文)40自我进化的视觉提问者(Self-Evolving Visual Questioner)
02:47Hacker News 热门(buzzing.cc 中文翻译)64Apache Burr:构建可靠的人工智能代理和应用程序
02:16Hacker News 热门(buzzing.cc 中文翻译)65DiffusionGemma:文本生成速度提升4倍
00:56HuggingFace Daily Papers(社区热门论文)73精选DeLM:去中心化多智能体系统框架
6月10日周三
09:41Hacker News 热门(buzzing.cc 中文翻译)55大型语言模型能否超越经典的超参数优化算法?
09:20Simon Willison 博客31llm 0.32a3 发布,代码几乎全部由 Claude Fable 5 编写
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月20日
15:59
IT之家(RSS)
66
开源工具 Headroom 爆火:Netflix 工程师打造,声称可节省 60%-95% Token 消耗量

Netflix 高级工程师 Tejas Chopra 开发的开源工具 Headroom(v0.26.0)在 AI 应用与 LLM 间建立本地透明压缩层,通过压缩 JSON、代码、RAG 片段和对话历史等冗余数据减少 Token 消耗,支持可逆压缩与 CCR 缓存机制。实测代码搜索场景 Token 从 17765 降至 1408(节省 92%),SRE 事故调试场景从 65694 降至 5118(同样节省 92%)。累计帮助用户节省约 70 万美元成本、释放超 2000 亿 Token。提供 Python/TypeScript 库、智能体代理模式、直接包装现有 AI 编程智能体以及 MCP 服务器模式,并可精简 AI 回复中客套话进一步降低成本。

GitHubMCP/工具开源/仓库部署/工程
06:54
MarkTechPost(RSS)
精选77
NVIDIA Research 发布 SpatialClaw:免训练空间推理框架

NVIDIA Research 发布 SpatialClaw,一个免训练的空间推理框架。它通过将代码作为动作接口,让智能体调用感知工具(Depth Anything 3、SAM 3)并自由组合输出,解决视觉语言模型在 3D 空间判断上的弱点。在 20 项基准测试中平均准确率达 59.9%,比近期智能体 SpaceTools 高 11.2 个百分点,比无工具基线高 6.5 点,比结构化工具调用高 3.2 点。框架无需重新训练,同一提示词和工具集可跨所有基准和骨干网络运行,支持 Qwen3.5/3.6 及 Gemma4 等 26B 至 397B 参数的模型。

智能体具身智能开源/仓库推理

推荐理由:NVIDIA 把空间推理的动作接口从工具调用换成代码,这个思路很巧,20 个基准平均拉升到 59.9%,无训练即插即用,做机器人和视频理解的人该直接跑一下 repo。
6月19日
18:01
公众号:卡尔的AI沃茨
精选77
Humanize PPT v0.9:为演讲而生的开源PPT Skill

Humanize PPT v0.9 是一款专为演讲场景设计的PPT Skill,核心通过AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游Skill。渲染前先输出4张真实预览页,并将图片、视频素材的占位与生成prompt写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按S键在独立窗口显示演讲稿备注,按ESC键打开全局索引快速跳页。项目已开源至github.com/LearnPrompt/humanize-ppt,由卡尔 & yc星辰开发。

GitHubMCP/工具开源/仓库

推荐理由:卡尔把 AI 做 PPT 的坑全趟了一遍,这套工具体系让页面从‘好看’变成‘能讲’,做演讲的人可以抄作业了。
6月18日
21:47
Hugging Face:Blog(RSS)
精选74
AI 智能体够格吗?在自有工具上评测开源模型

Hugging Face 发布面向 AI 智能体使用场景的基准测试框架,以 transformers 库为案例评估库的智能体友好度。框架使用 pi coding agent 与开源模型驱动,通过 Hugging Face Jobs 分散任务确保硬件一致。评估关注 agent 完成任务的成本、延迟、token 使用量和失败率,而非仅最终结果。此前 hf CLI 经优化后 agent token 使用量减少 1.3-1.8 倍(最高 6 倍),该框架旨在验证类似优化对 transformers 的效果。

智能体Hugging Face开源/仓库教程/实践

推荐理由:Hugging Face 这波实验打破了我的直觉——为大型模型优化的 CLI+Skill 方案反而让小模型正确率暴跌,做 agent 工具链的人应该马上看这个标杆。
18:14
IT之家(RSS)
67
小米发布并开源全屋智能 AI 方案 Xiaomi Miloco 2.0

小米开源全屋智能 AI 方案 Xiaomi Miloco 2.0,基于自研 MiMo 大模型,以 Agent 形式接入 OpenClaw。具备六大核心特性:通用常识(自动识别危险并预警)、身份识别(人脸+体态)、家庭记忆(沉淀习惯供主动决策)、家庭任务(条件自动化、定时提醒等)、主动智能、家庭面板。前置条件:内存≥4GB、存储≥256GB、7×24运行(推荐 Mac mini),macOS/Linux,需小米账号及米家设备,以及多模态大模型 API Key(感知用 MiMo-v2.5,Agent 用 MiMo-v2.5-pro)。

智能体产品更新开源/仓库端侧
11:14
Hacker News 热门(buzzing.cc 中文翻译)
精选70
cuTile Rust:安全无数据竞争的 GPU 内核系统

cuTile Rust 是一个基于 tile 的 GPU 编程系统,允许用 Rust 编写内存安全、无数据竞争的内核。它通过 #[cutile::module] 宏将内核 AST 嵌入主机二进制,在运行时经 CUDA Tile IR JIT 编译为 GPU cubin。可变张量在启动前分割,不可变张量共享,启动器在 GPU 工作期间保持所有权。在 NVIDIA B200 上,逐元素操作达 7 TB/s(约 91% 峰值带宽),GEMM 达 2 PFlop/s(约 92% 密集 f16 峰值)。基于 cuTile Rust 构建的 Grout 推理引擎在 RTX 5090 上解码 Qwen3-4B 达 171 tokens/s,在 B200 上解码 Qwen3-32B 达 82 tokens/s。项目处于早期研究阶段。

arXivHugging Face开源/仓库开源生态

推荐理由:用Rust的所有权模型保证GPU内核无数据竞争,性能还能达到峰值的92%,这个方向可能是安全GPU编程的未来,系统编程和推理引擎开发者值得一试。
04:12
GitHub Blog
精选61
GitHub 发布 CC0-1.0 开源多语言仓库级数据集,覆盖 README、Issue 和 PR

GitHub 推出一个新的仓库级数据集,采用 CC0-1.0 许可证,旨在帮助研究人员和开发者发现跨 README、Issue 和 Pull Request 的多语言开发者内容,加速多语言 AI 开发。

GitHub开源/仓库数据/训练

推荐理由:GitHub 发布了一个多语言开发者内容数据集,CC0 许可,对于训练跨语言代码模型和辅助翻译有直接价值,做多语言 Copilot 的团队应该会关注。
03:47
Ars Technica:AI(RSS)
55
AI编码智能体教会机器人安装GPU和剪扎带--NVIDIA GEAR等团队开发ENPIRE框架

NVIDIA GEAR实验室联合卡内基梅隆大学和UC Berkeley开发了ENPIRE框架,让AI编码智能体自主训练机器人。测试了OpenAI Codex(GPT-5.5)、Anthropic Claude Code(Opus 4.7)和月之暗面Kimi Code(Kimi K2.6)。在Push-T、插针盒、剪扎带和GPU安装等任务中,智能体达到99%成功率;插针任务中AI智能体比人类参与方法更快接近100%。8个智能体协作2小时完成Push-T(4个需3小时,单个近5小时)。局限包括机器人闲置、智能体耗时总结彼此想法和token消耗高。团队将开源全部内容。

智能体具身智能开源/仓库
00:32
Hacker News 热门(buzzing.cc 中文翻译)
61
GLM-5.2 (max) 性能、价格与开源发布

智谱AI于2026年6月发布开源推理模型GLM-5.2 (max),总参数753B,活跃参数40B,支持文本输入输出,上下文窗口1M tokens。在Artificial Analysis Intelligence Index上以51分位居同类92款模型第一。输出速度111 tokens/s(第15/92)。价格输入$1.40/百万tokens、输出$4.40/百万tokens,属较贵一档;缓存命中$0.26/百万tokens(便宜81%)。模型权重以MIT协议开源发布于HuggingFace。

开源/仓库推理评测/基准
6月17日
15:36
蚂蚁 inclusionAI:GitHub 新仓库
7
蚂蚁集团 GitHub 新建仓库 inclusionAI/asystem,内容暂未公开

蚂蚁集团在 GitHub 上新建仓库 inclusionAI/asystem。目前仓库仅包含 docs、.nojekyll 和 CNAME 等基础文件,尚无代码或详细说明,具体功能与项目目标尚未披露。

开源/仓库开源生态
00:53
MarkTechPost(RSS)
同事件精选76
Qwen团队发布三个具身AI模型套件 Qwen-RobotSuite

Qwen团队发布三个具身AI模型组成的套件Qwen-RobotSuite:Qwen-RobotManip(基于Qwen3.5-4B的VLA模型,通过统一对齐框架和3800小时开源数据(含24708小时合成)实现跨本体操作,在LIBERO-Plus OOD基准上达91.4%,跨本体迁移性能为π0.5的3.2倍)、Qwen-RobotWorld(60层MMDiT+冻结Qwen2.5-VL编码器的语言条件视频世界模型,以自然语言为统一动作接口预测未来视频)和Qwen-RobotNav(基于Qwen3-VL的导航模型,2B/4B/8B,输出航点轨迹)。RobotManip与RobotNav已开源GitHub。

具身智能多模态开源/仓库模型发布
同一事件,精选展示《Qwen-RobotWorld:具身智能体的无界世界》
推荐理由:Qwen-RobotSuite 一次性放出三个具身模型,用统一对齐策略解决了机器人数据碎片化问题,多个 SOTA 结果加上两个开源仓库,做具身智能的值得认真看一下。
00:01
IT之家(RSS)
54
开发者绕过苹果软件限制,成功解锁 M4 芯片 15.8TFLOPS 的 AI 算力

苹果 M4 神经网络引擎原仅开放推理,X 用户 @0x0SojalSec 通过逆向工程,从零开发自定义 MIL 直接与芯片通信,绕开了软件限制。训练全程将数据放在 RAM 中运行,不写入 NAND 闪存以维持高速。解锁后 M4 可达 15.8TFLOPS AI 性能,足以承担模型训练。目前不确定该 MIL 能否用于更新的 Apple Silicon,exec() 命令在新平台上的兼容性也未知。

开源/仓库端侧部署/工程
6月16日
10:40
公众号:蚂蚁百灵(Ling)
同事件精选79
蚂蚁百灵发布 Ling & Ring 2.6 技术报告

蚂蚁百灵发布 Ling & Ring 2.6 技术报告,系统公开 Ling-2.6-flash、Ling-2.6-1T 和 Ring-2.6-1T 的架构、预训练、后训练及 Agent 强化学习细节。三款模型采用 Hybrid Linear Attention 架构,将 Lightning Attention 与 MLA 以 7:1 比例结合。Ling-2.6-flash 在 4×H20 硬件上解码速度达 340 tokens/s,Ling-2.6-1T 在 Artificial Analysis Intelligence Index 上 token efficiency 较前代提升约 4 倍。Ring-2.6-1T high 在 PinchBench 得 87.60,ClawEval 得 63.82。三款模型均已开源。

智能体开源/仓库推理模型发布
同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
推荐理由:蚂蚁百灵2.6技术报告首次公开Hybrid Linear Attention与KPop Agent RL细节,开源模型在OpenClaw登顶,把万亿模型从聊天拉到真实工作流,做Agent应用的值得细读。
03:59
GitHub Blog
54
GitHub 发布新开源数据集,加速多语言 AI 研究与开发

GitHub 在 CC0-1.0 许可下发布了一个仓库级数据集,涵盖多语言开发者内容,包括 README、issue 和 pull request。该数据集旨在帮助研究者和开发者发现并利用跨语言的技术文档与社区讨论,以推动多语言 AI 的构建与优化。

GitHub开源/仓库数据/训练
6月15日
17:41
MarkTechPost(RSS)
精选73
Flash-KMeans:IO感知的精确K-Means,在GPU上比FAISS快200倍以上

UC Berkeley与UT Austin团队开源Flash-KMeans(Apache 2.0,pip install flash-kmeans),精确实现标准Lloyd's k-Means,通过重构GPU数据流而非改变数学或近似来提速。在NVIDIA H200上,端到端速度比最佳基线快17.9×,比cuML快33×,比FAISS快200×以上。其FlashAssign核避免物化完整N×K距离矩阵,将IO复杂度从O(NK)降至O(Nd+Kd),单核加速最高21.2×;Sort-Inverse Update核通过排序聚类ID减少原子争用,单核加速最高6.3×。支持out-of-core处理,在1B数据点、K=32768时单次迭代仅41.4s。适用于向量搜索索引、稀疏注意力路由、KV缓存压缩等在线场景。

开源/仓库数据/训练部署/工程

推荐理由:Flash-KMeans 把 k-means 从离线预处理拉进了在线循环,200 倍加速不是纸面数字,而是让向量索引重建、稀疏注意力路由这些场景突然可行了。做大规模聚类的可以立刻换掉 FAISS。
08:00
HuggingFace Daily Papers(社区热门论文)
55
LOGOS:面向自然科学的通用科学生成语言模型

LOGOS 是一个科学生成语言模型,将自然科学的异构任务统一到同一自回归框架和共享科学语法中。它把科学对象及其空间交互编码成 token 序列,无需依赖坐标或几何神经网络,即可用纯序列方式捕获复杂结构相互作用。该统一表示使得多领域持续预训练与下游任务高度对齐。在多个任务上,LOGOS 匹配或超越领域专用基线,且 1B、3B、8B 三种参数规模与性能呈正相关。模型权重已开源以促进后续研究。

arXiv开源/仓库数据/训练论文/研究
02:29
Hacker News 热门(buzzing.cc 中文翻译)
62
里约热内卢的"本土化"LLM 似乎是现有模型的融合体

里约热内卢声称自主研发的大语言模型(LLM)被指实为现有模型的融合体,相关代码托管于 GitHub。

开源/仓库数据/训练行业动态
01:59
Hacker News 热门(buzzing.cc 中文翻译)
精选72
里约热内卢市政府 AI 模型 Rio3.5 在基准测试中击败 Qwen3.7

里约热内卢市政府开发的 AI 模型 Rio3.5,在近期基准测试中超越了 Qwen3.7。该消息源自 Hacker News 上的一篇帖子,指出 Rio3.5 在多项评测中表现优于 Qwen3.7。目前尚未公开具体的测试细节或基准名称。

Hugging Face开源/仓库模型发布评测/基准

推荐理由:一个市政府 IT 部门训练的模型在基准测试中击败了 Qwen3.7,这让人重新审视谁在参与前沿模型竞争。如果结果可复现,可能是今年最意外的黑马。
6月14日
13:05
MarkTechPost(RSS)
68
Databricks 开源 Omnigent:跨 Claude Code、Codex 和 Pi 的 AI 智能体元编排框架

Databricks 开源了 Omnigent,一个位于 Claude Code、Codex 和 Pi 等编码智能体之上的元编排框架(meta-harness),支持组合、上下文策略和实时会话共享,可在终端、网页、桌面和移动端使用。该项目采用 Apache 2.0 许可,目前处于 alpha 阶段。

智能体开源/仓库
08:00
HuggingFace Daily Papers(社区热门论文)
42
SSync:面向视频目标中心学习的选择性协同学习方法

针对视频目标中心学习中密集对齐策略传播各模块弱点且计算代价二次增长的缺陷,提出 Selectice Synergistic Learning (SSync)。该方法避免穷举对齐,而是选择性蒸馏最可靠线索:编码器用于边界细化,解码器用于内部去噪。通过线性复杂度的伪标记实现,并引入传递式伪标记合并以消除重叠 slot 冗余。实验表明 SSync 显著提升分解质量,作为即插即用模块对 slot 配置具有强鲁棒性。代码已开源。

arXivGitHub开源/仓库数据/训练
00:52
Hacker News 热门(buzzing.cc 中文翻译)
58
/architect:减少80%的Fable token,Fable负责协调/审核,Codex负责构建

/architect项目将Fable token减少80%,由Fable进行协调和审核,Codex负责构建任务。

智能体AnthropicOpenAI开源/仓库
6月13日
23:21
Hacker News 热门(buzzing.cc 中文翻译)
52
AI开源工具仓库在完成730万美元种子轮融资后,一夜之间被归档

一个未公开名称的AI开源工具仓库在获得730万美元种子轮融资后,一夜之间被归档。该仓库托管于GitHub,目前处于只读状态,具体归档原因及后续计划尚未披露。

开源/仓库行业动态
17:36
IT之家(RSS)
31
鸿蒙 PC 包管理器 HarmonyBrew 已支持 2763 条常用命令安装/卸载

华为开发者大会 HDC 2026 上,鸿蒙 PC 包管理器 HarmonyBrew 已支持 2763 条常用命令的安装和卸载。HarmonyBrew 是知名包管理器 Homebrew 的鸿蒙移植版本,支持鸿蒙 PC、OpenHarmony 开发板和鸿蒙容器环境,与 Homebrew 高度兼容,开发者几乎无需学习新命令。此外,开发者可通过翻译文档、软件包适配、兼容性测试等方式将上游 Formula 移植到鸿蒙平台,也可使用 Rust 实现的 AI 开发 CLI atomcode 一句话适配命令。

产品更新其他开源/仓库
17:02
The Decoder:AI News(RSS)
61
月之暗面开源模型Kimi K2.7 Code每个token价格比GPT-5.5和Claude低12倍

Moonshot AI发布Kimi K2.7 Code,一款拥有1万亿参数的开源权重编程模型。在编程基准测试上仍落后于GPT-5.5和Claude Opus 4.8,但每个token的价格比竞争对手低最多12倍。核心问题在于:同等预算下额外获得的运行次数能否弥补质量差距。

开源/仓库模型发布编码
15:36
IT之家(RSS)
69
微软开源 iOS 流式 Markdown 渲染库 SwiftStreamingMarkdown

微软本周三在 GitHub 开源 SwiftStreamingMarkdown,面向 iOS 平台,专为大语言模型聊天场景的逐字流式渲染优化。采用 MIT 许可证,通过 Swift Package Manager 集成约增加 3 MB 体积,可避免主线程过载。支持 CommonMark 与 GFM 核心子集(标题、段落、粗斜体、删除线、行内代码、链接、代码块、引用块、列表、表格、LaTeX 公式及 LLM 溯源标记),图片仅显示替代文本,未实现语法降级为可读文本。内置过渡动画、数学公式渲染、可配置主题、上下文菜单及交互追踪钩子。在 iPhone XS 高负载测试中,主线程控制优于同类库。

Microsoft开源/仓库部署/工程
6月12日
18:00
HuggingFace Daily Papers(社区热门论文)
60
ArogyaSutra:面向印度语言多模态医疗推理的多智能体框架

为应对印度农村患者用本土语言和医学影像表达复杂病情,研究团队构建了ArogyaBodha数据集,包含8个异构来源、31个身体系统、6种成像模态、21个临床领域,覆盖英语和7种主要印度语言。同时提出ArogyaSutra,一个基于Actor-Critic的多智能体框架,集成工具接地与双记忆机制,实现逐步推理感知决策,并利用存储的Actor-Critic仿真轨迹进行知识蒸馏。实验表明,该数据集与框架在所有印度语言上均提升了多语言医疗推理准确性。源代码与数据集已开源。

智能体多模态开源/仓库论文/研究
14:00
HuggingFace Daily Papers(社区热门论文)
同事件精选77
MiniMax Sparse Attention(MSA)块状稀疏注意力

MiniMax 提出块状稀疏注意力 MSA,基于 GQA 构建。轻量级 Index Branch 为每个 GQA 组独立选择 Top‑k KV 块,Main Branch 仅对选中块执行精确块稀疏注意力。在 109B 参数多模态模型上,MSA 与 GQA 性能持平,1M 上下文下每 token 注意力计算减少 28.4 倍。配合协同设计的 GPU 内核,H800 上实现 14.2 倍 prefill 和 7.6 倍 decoding 端到端加速。推理内核与基于 MSA 的多模态模型已公开发布。

GitHubHugging Face开源/仓库推理
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
推荐理由:MiniMax这个稀疏注意力把长上下文推理计算砍掉28倍,而且直接开源了高效CUDA kernel和模型,做agent和代码仓库级推理的团队可以赶紧试试。
02:26
Simon Willison 博客
37
asyncinject 0.7 发布

asyncinject 0.7 发布,这是一个作者数年前为支持 asyncio 依赖注入模式而构建的 Python 工具库,曾与 Datasette 搭配使用。Claude Fable 5 发现了库中的若干 bug 并自动修复——Claude Fable 5 是一个非常主动的模型。

开源/仓库部署/工程
01:17
Hacker News 热门(buzzing.cc 中文翻译)
精选72
DeepSeek-R1 的开源实现

DeepSeek-R1 的开源复现项目已在 GitHub 发布,在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。

Hugging Face开源/仓库推理模型发布

推荐理由:Hugging Face 把 DeepSeek-R1 的完整训练管线拆解得清清楚楚,从数据蒸馏到 GRPO 强化学习都开源了,还放出了复现的模型和数据集。想理解或自己训练推理模型的开发者,这大概是目前最实用的路线图。
00:17
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选75
MiMo Code 现已发布并开源

2026年6月11日,小米旗下 MiMo Code 项目正式发布并开源,相关代码已托管于 mimo.xiaomi.com 供社区访问。

产品更新开源/仓库编码
同一事件,精选展示《小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议》
推荐理由:小米下场做 AI 编程工具,直接开源,121 个 HN 点赞说明社区有期待,对标 Cursor 还是自成一路,得看实际体验。
6月11日
18:50
公众号:卡尔的AI沃茨
77
开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流

Claude Fable 5(Mythos 安全公开版)6月22日前对 Pro/Max/Team 订阅用户开放,之后转 API。作者用 100 美元/月的 Max 会员,让 Fable 5 开发了开源“鲁班 Skill”,专用于打磨其他 AI Skill。该 Skill 通过前提验证(真实问题、安装理由、唯一性)、并行搜索同类(GitHub/ClawHub/skills.sh 等)、横纵分析、Darwin 式 9 维度评分(权重最高的实测表现)、SkillOpt 式单方向改写等步骤,将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑,追加了热点模式和时间轴模式,改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill,强调 Skill 本质是清晰提示语而非复杂脚本。

智能体AnthropicGitHub开源/仓库
关联讨论 31 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
17:31
IT之家(RSS)
精选71
阿里云发布 Meoo CLI:本地 AI 编程项目可一键部署上线

阿里云今日推出 Meoo(秒悟)开源命令行工具 Meoo CLI,面向开发者,支持 Claude Code、Codex、Cursor 等本地 AI 编程助手。通过调用阿里云云端能力,可自动完成数据库接入、用户登录、文件存储及项目发布,将本地项目一键部署上线并生成可分享的访问链接。该工具定位为本地 Agent 与秒悟云端能力的连接入口,已开放下载,支持主流 Linux、macOS 及 Windows 平台。

智能体产品更新开源/仓库部署/工程

推荐理由:本地AI编程工具产出的项目终于有了一条直通云端的管道,Meoo CLI 把数据库、鉴权、部署这些脏活全包了,非前端也可以把原型直接变成产品。
16:50
公众号:腾讯混元
精选78
腾讯混元 AI Infra 新开源:HPC-Ops 推理核心算子全面升级

腾讯混元 AI Infra 团队开源升级 HPC-Ops 推理算子库,推出五大核心算子。Attention 采用运行时动态负载调度,长文本最高加速 2.95x,端到端 QPM 提升 17%;Router GEMM 以双 BF16 组合实现 FP32 精度,对比 CuBLAS FP32 最高提速 3.22x;FusedMoE 相对 vLLM、SGLang 性能提升 1.2x~1.6x;Fused AllReduce+Norm 对比主流方案最高提速 1.68x;Sampler 将解码采样融合为 2 个 CUDA Kernel,相对 vLLM 提速 4.0x~7.5x。所有能力均来自生产实践并完全开源。

产品更新开源/仓库推理部署/工程

推荐理由:腾讯混元把推理全链路的瓶颈都加速了一遍,Sampler 算子比 vLLM 快 4-7 倍,Attention 动态调度根治长尾延迟,这套开源算子库可以直接用,做推理部署的可以抄作业。
12:58
HuggingFace Daily Papers(社区热门论文)
68
Claw-SWE-Bench:评估OpenClaw风格智能体框架编程能力的多语言基准

Claw-SWE-Bench是一个多语言SWE-bench风格基准和适配器协议,用于在公平设置下比较通用智能体框架(claws)的编程能力。完整基准包含350个GitHub issue解决实例,覆盖8种语言和43个仓库,来源于SWE-bench-Multilingual和SWE-bench-Verified-Mini。同时发布80实例的Lite子集用于快速验证。在完整基准上,OpenClaw搭配最小适配器仅得19.1% Pass@1,而完整适配器使用相同GLM 5.1骨干达到73.4%,表明适配器设计至关重要。模型选择改变Pass@1达29.4个百分点,框架选择改变27.4个百分点;相似精度的系统总API成本差异巨大。Claw-SWE-Bench将框架和成本核算作为SWE风格编码智能体评估的第一类维度。

智能体开源/仓库编码评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
40
自我进化的视觉提问者(Self-Evolving Visual Questioner)

视觉语言模型通常训练为被动回答者,主动提出多样化、视觉中心问题的能力未被充分探索。本文提出无需外部监督的自我进化框架:VLM自身作为提议者和过滤器,生成更难、信息更丰富、更视觉中心的问题,同时维持探索多样性防止训练崩溃。自产问题用于同时训练VLM的提问者与回答者模式。引入智能体评估协议,从感知、推理与多样性三维度衡量提问质量。实验表明该方法显著提升自主问题生成的质量与难度边界,且自我进化的提问者仍保持甚至增强回答性能。

多模态开源/仓库论文/研究
02:47
Hacker News 热门(buzzing.cc 中文翻译)
64
Apache Burr:构建可靠的人工智能代理和应用程序

Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。

智能体开源/仓库部署/工程
02:16
Hacker News 热门(buzzing.cc 中文翻译)
65
DiffusionGemma:文本生成速度提升4倍

DiffusionGemma 是 Google 推出的文本生成模型,其文本生成速度相比前代提升 4 倍。该模型详情已发布在 Google 官方博客。

Google开源/仓库推理模型发布
00:56
HuggingFace Daily Papers(社区热门论文)
精选73
DeLM:去中心化多智能体系统框架

DeLM是一种去中心化多智能体系统框架,通过并行智能体、共享已验证上下文和任务队列避免中央控制器瓶颈。智能体异步认领子任务、读取累计进展、执行局部推理并写回紧凑的已验证更新。在SWE-bench Verified上,DeLM在Avg.@1、Pass@2和Pass@4指标中均取得最佳性能,相比最强基线提升最多10.5个百分点,每任务成本降低约50%。在LongBench-v2多文档问答上,DeLM在四个前沿模型家族中取得最高平均准确率,提升最多5.7个百分点。代码已开源。

智能体开源/仓库推理论文/研究

推荐理由:去中心化MAS把中心调度换成共享黑板,SWE-bench一口气提10.5个点还省一半成本,这个思路值得所有搞agent的团队认真看。
6月10日
09:41
Hacker News 热门(buzzing.cc 中文翻译)
55
大型语言模型能否超越经典的超参数优化算法?

一项研究将大型语言模型(LLM)应用于超参数优化任务,并与经典算法进行对比实验,检验 LLM 在该场景下是否具备超越传统方法的表现。

开源/仓库数据/训练论文/研究
09:20
Simon Willison 博客
31
llm 0.32a3 发布,代码几乎全部由 Claude Fable 5 编写

Simon Willison 的 llm 工具发布 0.32a3 版本,该版本的代码几乎全部由新的 Claude Fable 5 模型编写。

产品更新开源/仓库编码
‹ 上一页
1234…12
下一页 ›