全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 641 条

全部一手资讯 X 论文

标签「开源生态」清除

6月27日周六

09:02Hacker News 热门（buzzing.cc 中文翻译）58开源LLM与闭源LLM之间的差距

01:32Hacker News 热门（buzzing.cc 中文翻译）55脑部超声成像

6月26日周五

23:02Hacker News 热门（buzzing.cc 中文翻译）56安全事件 CVE-2026-LGTM

18:09The Decoder：AI News（RSS）65Linux Foundation联合20家科技企业发起Akrites倡议，修补开源软件漏洞以抵御AI攻击

15:59IT之家（RSS）48高通与 Hugging Face 扩大合作，构建端到云 AI 开发生态

12:00公众号：龙猫LongCat（美团）69精选美团 LongCat 开源 VitaBench 2.0：长期动态智能体基准新标杆

09:59IT之家（RSS）56Linux 基金会联合多方推出 Akrites 项目，抵御 AI 驱动开源软件漏洞攻击

09:01Hacker News 热门（buzzing.cc 中文翻译）65Un-0：利用耦合振荡器生成图像

06:01Hacker News 热门（buzzing.cc 中文翻译）61Show HN： OpenKnowledge--Obsidian/Notion 的开源替代方案

02:31Hacker News 热门（buzzing.cc 中文翻译）79精选赫库兰尼姆古卷首次被完整虚拟解读

01:01Hacker News 热门（buzzing.cc 中文翻译）42开放权重模型的难以忍受的廉价感

00:16Hugging Face：Blog（RSS）65精选OLMo Hybrid vs Transformer：混合模型在实义词上优势明显，但重复短语上几无优势

6月25日周四

15:58IT之家（RSS）69百度开源 Unlimited OCR 模型，基于 DeepSeek OCR 架构，30亿参数仅激活5亿

15:58IT之家（RSS）50谷歌前 CEO 施密特批中国 AI 开源：不受控制，我很不喜欢

14:04MarkTechPost（RSS）73同事件精选百度发布Unlimited OCR：3B参数MoE模型，KV缓存恒定实现长文档高效解析同一事件，精选展示《无限制OCR：单次长时域解析》

11:12HuggingFace Daily Papers（社区热门论文）67iLLaDA：改进的大型语言扩散模型

09:58IT之家（RSS）542025 中国开源年度报告：OpenHarmony 登顶全球，7 年后中国开发者贡献度有望超过美国

08:00HuggingFace Daily Papers（社区热门论文）54JetSpec：基于因果并行草稿头的推测解码框架

04:29Hacker News 热门（buzzing.cc 中文翻译）61AI编码智能体导致OpenClaw项目PR泛滥：合并率从48%暴跌至9.3%

02:29Hacker News 热门（buzzing.cc 中文翻译）63对世界上大多数地区而言，开源人工智能是唯一的前进之路

6月24日周三

23:29Hacker News 热门（buzzing.cc 中文翻译）78Krea 2 技术报告

21:29MarkTechPost（RSS）68Nous Research为Hermes Agent技能系统新增/learn命令，无需手写SKILL.md即可将工作流捕获为斜杠命令

16:57Hacker News 热门（buzzing.cc 中文翻译）60YOLO26 简介

16:30公众号：面壁智能（MiniCPM）28面壁智能曾国洋出席APEC中小企业工商论坛，以"高效+开源"加速大模型普惠

11:55HuggingFace Daily Papers（社区热门论文）70精选NatureBench：AI编码智能体能否匹配Nature系列论文已发表SOTA？

10:49HuggingFace Daily Papers（社区热门论文）61OpenThoughts-Agent：开源数据流水线训练智能体模型

10:49HuggingFace Daily Papers（社区热门论文）76Qwen-AgentWorld：用于通用智能体的语言世界模型

03:43GitHub Blog56精选GitHub联合开源联盟呼吁修改加州AI透明度法案以保护开源

03:37MarkTechPost（RSS）68Datalab 发布 lift：9B 开放权重视觉模型，依据 Schema 从 PDF 提取结构化 JSON

02:26Hugging Face：Blog（RSS）64精选在 Transformers.js 中实验提议的跨源存储 API

00:00Berkeley RDI：Blog（AI 安全与评测）82精选恶意CDN仍潜伏GitHub Pages，AI让情况恶化

6月23日周二

21:20Hugging Face：Blog（RSS）73精选IBM 开源 CUGA：轻量级智能体框架，提供二十余个单文件示例应用

20:24The Decoder：AI News（RSS）39Cursor 发布自有 AI 模型、新 Git 平台和移动应用

20:11IT之家（RSS）40《历史模拟器：崇祯》6月25日起本体免费，创意工坊及MOD《罗马：塞维鲁》同步测试

19:10IT之家（RSS）59英国政府拨款6000万英镑建两所AI实验室，开发低硬件需求开源模型

18:07IT之家（RSS）51QQ邮箱推出Agently Mail，为AI智能体提供专属邮箱服务

16:12Hugging Face：Blog（RSS）59精选我们用免费本地模型对 OpenClaw 仓库进行实时分类

16:07IT之家（RSS）48欧洲自由软件基金会建议欧盟施压谷歌，阻止安卓静默重装AI行为

14:13HuggingFace Daily Papers（社区热门论文）55Tmax：终端智能体的简单配方

14:10公众号：京东JoyAI73精选京东全栈开源JoyAI-VL-Interaction，从"一问一答"走向"边看边说"

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月27日

09:02

Hacker News 热门（buzzing.cc 中文翻译）

58

开源LLM与闭源LLM之间的差距

在Artificial Analysis Intelligence Index上，开源LLM与闭源LLM的性能差距自2024年夏季开始持续缩小，线性外推预测到2026年12月3日差距降为零。但在全部18个不同基准上的平均差距几乎恒定，保持在不到5个月。编码基准的差距从15个月缩小至1-2个月，多数其他基准差距反而略有扩大。这一分析表明，LLM质量评测的单一基准可能误导结论，整体差距并未显著缩小。

开源生态推理现象/趋势

01:32

Hacker News 热门（buzzing.cc 中文翻译）

55

脑部超声成像

一支研究团队通过完整颅骨对活人脑部进行超分辨率超声成像，获得了迄今最详细的脑血管三维图像。该技术利用FDA批准的微泡造影剂实现超衍射极限定位，体积分辨率比CT高100倍。团队已开源完整处理流程和数据集。下一步目标是无需造影剂的神经血管成像，依靠硬件小型化和端到端机器学习从每小时TB级原始数据中提取更多信号。

开源/仓库开源生态端侧

6月26日

23:02

Hacker News 热门（buzzing.cc 中文翻译）

56

安全事件 CVE-2026-LGTM

恶意包 foxhole-lz4（伪装成 vulpine-lz4 的社区维护分支）发布到 creats.io 注册表后，连续通过 OpenClaw-4.2、ThreatNuzzle、SentinelMind 等七道 AI 安全门，每道门均因不同原因未能阻止。SentinelMind 正确识别 build.rs 中的凭证窃取代码，但仓库 AI 分类助手（同样基于 OpenClaw-4.2）将其误判为误报并关闭。该包作为传递依赖进入 snekpack 4.x，凭证窃取大规模展开。事件持续 96 小时（计费 2.1 万亿 token），最终因攻击者的自主 agent 读取不应读取的文件而解决。CVE-2026-54321 被发布后又被撤回。

智能体安全/对齐开源生态

18:09

The Decoder：AI News（RSS）

65

Linux Foundation联合20家科技企业发起Akrites倡议，修补开源软件漏洞以抵御AI攻击

Linux Foundation与约20家科技企业、AI实验室和银行共同发起Akrites倡议，旨在AI工具利用漏洞前修补关键开源软件的安全缺陷。创始成员包括Amazon Web Services、Anthropic、Cisco、Google、Microsoft、NVIDIA、OpenAI等。当前开源安全响应模式碎片化，过去数月经验证的漏洞中仅不到5%被打补丁。Akrites设立共享安全事件响应团队，通过CVE、CVSS、TLP等标准保密处理报告、去重并协调修复。对于无活跃维护者的项目，将作为“最后维护者”自行发布补丁。种子资金来自Linux Foundation下的Alpha-Omega专项基金。

安全/对齐开源生态行业动态

15:59

IT之家（RSS）

48

高通与 Hugging Face 扩大合作，构建端到云 AI 开发生态

高通与 Hugging Face 宣布扩大合作，携手构建从端到云无缝衔接的 AI 开发生态。Hugging Face 的 AI 存储和推理服务将适配高通 Dragonfly“飞龙”数据中心解决方案。其生态中百万量级 AI 模型将通过智能体接入高通平台，加速在芯片终端与数据中心机架上的部署。Hugging Face 还向使用高通芯片的客户提供 PRO 专业版访问权限。双方计划共同支持分布式 AI 框架，使智能体在端、云平台之间灵活流转。

Hugging Face 开源生态端侧行业动态

12:00

公众号：龙猫LongCat（美团）

精选69

美团 LongCat 开源 VitaBench 2.0：长期动态智能体基准新标杆

美团 LongCat 团队推出 VitaBench 2.0，首个真实生活场景下针对长期动态用户建模的智能体评测基准。包含56名拟真用户、819个复杂任务、超2000个动态偏好及66个可执行工具，每位用户平均2093个交互事件，时间跨度平均1580天。同时支持长文本上下文学习和智能体记忆策略评测。测试显示，最强模型 Claude-Opus-4.6 在“开卷”模式下平均分刚过0.5；开启思考模式并不总能提升个性化任务表现；所有模型在需要主动提问的任务上得分断崖式下跌。VitaBench 2.0 已开源。

智能体开源生态评测/基准

推荐理由：美团LongCat开源的VitaBench 2.0是首个评测AI长期理解用户偏好的基准，实验发现最强模型得分也刚过0.5，做Agent和推荐系统的值得跑一遍。

09:59

IT之家（RSS）

56

Linux 基金会联合多方推出 Akrites 项目，抵御 AI 驱动开源软件漏洞攻击

Linux 基金会联合亚马逊、Anthropic、OpenAI、英伟达、红帽等推出 Akrites 项目，旨在保护开源软件，防范基于 AI 与大语言模型的漏洞攻击。项目采用统一 CVD 披露流程，保密优先，漏洞由原维护团队按自身节奏修复；无活跃维护者的项目由最后维护者接手并尽快分发。合作伙伴还包括思科、花旗集团、谷歌、IBM、摩根大通、微软、GitHub、Rust 基金会、沃达丰等。

Anthropic OpenAI 安全/对齐开源生态

09:01

Hacker News 热门（buzzing.cc 中文翻译）

65

Un-0：利用耦合振荡器生成图像

Unconventional AI 发布首个图像生成模型 Un-0，其核心是一个模拟的耦合振荡器系统——一种物理计算基板。在 class-conditional ImageNet 64×64 上，Un-0 达到 FID 6.74，匹配此前领先常规图像生成方法的首次发布质量。模型将耦合强度矩阵 K 和频率 ω 作为可学习参数，通过库拉莫托振荡器方程演化。权重、训练与消融代码均已开源。Un-0 旨在验证物理动态系统能以约 1000 倍更高能效运行现代 AI 工作负载。

图像生成开源生态模型发布

06:01

Hacker News 热门（buzzing.cc 中文翻译）

61

Show HN： OpenKnowledge--Obsidian/Notion 的开源替代方案

OpenKnowledge 是一款开源、AI 优先的笔记与知识管理工具，可作为 Obsidian 和 Notion 的替代方案。项目代码托管在 GitHub 上。

GitHub 开源/仓库开源生态

02:31

Hacker News 热门（buzzing.cc 中文翻译）

精选79

赫库兰尼姆古卷首次被完整虚拟解读

研究人员利用高分辨率X射线显微断层扫描和机器学习，在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷PHerc.1667（Scroll4）。这是首卷被从头到尾连续读取的纸莎草卷，内容为斯多葛哲学论著，提及克里西普斯的侄子Aristocreon。第二卷PHerc.Paris4通过更高分辨率成像使墨水在三维数据中直接可见，独立确认了2023年大奖赛的解读。第三卷PHerc.139确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。

GitHub 开源生态论文/研究

关联讨论 1 条X：Ethan Mollick (@emollick)

推荐理由：两千年来首次完整读取密封的古卷，用 X 射线和机器学习做到了，还把数据和代码全开放了，我觉得这是 AI 应用在人文领域最优雅的示范之一。

01:01

Hacker News 热门（buzzing.cc 中文翻译）

42

开放权重模型的难以忍受的廉价感

DeepSeek V4 定价极低，仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍，未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境，难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流，尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4，Meta Llama 无新版本，OpenAI 最后开放权重停留在 2025 年 GTP，Anthropic 从未发布。真正开源（含训练数据管道）模型正流行，但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。

Anthropic DeepSeek OpenAI 开源生态

00:16

Hugging Face：Blog（RSS）

精选65

OLMo Hybrid vs Transformer：混合模型在实义词上优势明显，但重复短语上几无优势

通过对比7B参数的OLMo 3（Transformer）与OLMo Hybrid（混合架构），实验发现混合模型在大多数token上预测损失更低：对名词、动词、形容词等实义词优势明显（loss gap约0.04），功能词上gap约0.02，且在需上下文推理的代词指代上更好。但在重复出现的n-gram和闭合括号（如}）上，混合模型的优势几乎消失，Transformer凭借注意力机制更擅长从输入中直接检索精确信息。

Hugging Face 开源生态推理论文/研究

推荐理由：OLMo 团队的 token 级别分析让人看清混合模型到底强在哪里，优势在名词动词等意义词，但在重复 token 上接近消失，这份洞察对做模型架构的人很有启发性。

6月25日

15:58

IT之家（RSS）

69

百度开源 Unlimited OCR 模型，基于 DeepSeek OCR 架构，30亿参数仅激活5亿

百度于6月22日开源 Unlimited OCR 模型，总参数量30亿，推理时仅激活5亿。模型延续 DeepSeek OCR 架构，编码端采用两级视觉编码并执行16倍 token 压缩，将1024×1024 PDF 图像压缩为256个视觉 token，缓解长文档解析越生成越慢问题。训练基于 DeepSeek OCR 检查点，冻结 DeepEncoder 后继续4000步，使用约200万份文档在8×16 A800 GPU上完成，单页与多页数据配比约9:1。在 OmniDocBench v1.5 上整体得分93.23（DeepSeek OCR 87.01，DeepSeek OCR 2 89.17），文本编辑距离0.038，公式 CDM 92.61，表格 TEDS 90.93，读序编辑距离0.045；v1.6 得分93.92。GitHub 已获 6.8K Star。

DeepSeek 多模态开源生态模型发布

15:58

IT之家（RSS）

50

谷歌前 CEO 施密特批中国 AI 开源：不受控制，我很不喜欢

谷歌前 CEO 埃里克·施密特在今年 5 月 SCSP 国家竞争力 AI 博览会的炉边谈话中表示，限制 AI 芯片进入中国的政策已开始失效，中国已通过较弱的 AI 硬件（如华为昇腾芯片）和软件方法造出顶级 AI 模型。施密特称不喜欢中国大力推广开源 AI 技术，认为这些技术不受美国或任何方控制。他援引最新分析称，中美 AI 差距已从一年前的 1~2 年缩短至不到 6 个月。

大佬观点开源生态

14:04

MarkTechPost（RSS）

同事件精选73

百度发布Unlimited OCR：3B参数MoE模型，KV缓存恒定实现长文档高效解析

百度推出Unlimited OCR，一个3B参数的MoE模型，推理时仅激活500M参数。其核心创新Reference Sliding Window Attention（R-SWA）将KV缓存大小固定为Lm + n（n默认128），内存和延迟不随输出长度增长。模型基于DeepSeek OCR继续训练4000步，支持32K最大长度，通过DeepEncoder实现16倍token压缩。在OmniDocBench v1.5上整体得分93.23，超出DeepSeek OCR基线6.22分；v1.6得分93.92为最高。Base模式下吞吐达5580 TPS，比DeepSeek OCR提升12.7%，6000 token输出时延迟低35%。适用于整本书转录等场景，代码与权重已在HuggingFace开源。

多模态开源生态模型发布

同一事件，精选展示《无限制OCR：单次长时域解析》

推荐理由：Baidu这个OCR模型用R-SWA把KV缓存压成常量，长文档解析终于不用越跑越慢了。MIT开源，3B总参但推理只消500M，做文档管线的可以直接接。

11:12

HuggingFace Daily Papers（社区热门论文）

67

iLLaDA：改进的大型语言扩散模型

iLLaDA是一个8B参数的掩码扩散语言模型，采用完全双向注意力机制训练，预训练数据量达12T tokens，并在25B tokens的指令数据集上微调12个epoch。模型引入变长生成与置信度评分方法以提升效率和多选评测效果。相比LLaDA，iLLaDA-Base在BBH和ARC-Challenge上分别提升21.6和14.9个点，iLLaDA-Instruct在MATH和HumanEval上分别提升14.5和16.5个点。尽管是非自回归训练，iLLaDA仍在多个基准上与Qwen2.5 7B保持竞争力。模型权重和代码已开源。

开源生态推理模型发布

09:58

IT之家（RSS）

54

2025 中国开源年度报告：OpenHarmony 登顶全球，7 年后中国开发者贡献度有望超过美国

开源社发布《2025中国开源年度报告》。GitHub平台中国活跃开发者超210万，全球第三。OpenHarmony以60089 OpenRank值登顶全球开源项目影响力榜首。中美贡献度增速差超10%，按当前态势7年后中国开发者贡献度有望超过美国。中国OpenRank贡献度254963，全球第二。AI大模型相关仓库年均增长率超210%，vLLM进入全球项目Top15。10亿以上参数模型中Meta下载量占23.2%，阿里Qwen系列占20%，DeepSeek占3.8%，其R1训练成本仅550万美元。开源企业影响力微软居首，华为第二。

DeepSeek GitHub 开源生态行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

54

JetSpec：基于因果并行草稿头的推测解码框架

JetSpec 是一种头部驱动推测解码框架，通过在冻结目标模型的融合隐藏状态上训练因果并行草稿头，生成与自回归因子分解对齐的候选树，从而将更大草稿预算转化为更长接受前缀和更高端到端加速。在密集和 MoE Qwen3 模型的数学、编码及聊天基准测试中，JetSpec 一致优于双向头和树形基线。在 H100 GPU 上，MATH-500 达 9.64 倍加速，开放对话达 4.58 倍；经 vLLM 集成在现实服务负载下进一步降低延迟。

arXiv GitHub 开源生态推理

04:29

Hacker News 热门（buzzing.cc 中文翻译）

61

AI编码智能体导致OpenClaw项目PR泛滥：合并率从48%暴跌至9.3%

Greptile观察OpenClaw项目发现，AI编码智能体正大量生成低质量PR。提交量从去年12月每周2个飙升至今年2月每周3400个，合并率从约48%降至9.3%以下。一名贡献者一天内提交106个PR，中位间隔仅3秒。项目开始依据贡献者信誉过滤：首次贡献者合并率8.2%，5次以上为18.6%。Ghostty作者Mitchell Hashimoto因此限制AI贡献并发布信誉管理工具Vouch。此外，多个贡献者使用相同AI工具（Claude/Codex/Cursor/Devin）独立提交相同功能PR，导致思路同质化。数据显示重构类PR合并率35%，远高于新功能类的9%，表明对代码库深度理解更重要。

开源/仓库开源生态现象/趋势

02:29

Hacker News 热门（buzzing.cc 中文翻译）

63

对世界上大多数地区而言，开源人工智能是唯一的前进之路

Yann LeCun 在联合国开源周演讲中主张，开源 AI 是全球数字主权和文化多样性的唯一可行路径。他指出专有 AI 系统被美中少数大公司控制，对民主和人权构成威胁。LeCun 推出 Project Tapestry，一个基于 GitHub 的开源联邦协作项目，各参与方保留数据主权，仅交换参数向量来训练全球模型。已有欧洲、印度、日本、韩国及 IBM、NVIDIA、AMD、Intel 等参与，目标 2027 年初投入生产。

大佬观点安全/对齐开源生态政策/监管

6月24日

23:29

Hacker News 热门（buzzing.cc 中文翻译）

78

Krea 2 技术报告

Krea 2 是一系列基础模型，兼顾审美多样性与创意控制。采用扩散 Transformer（DiT）架构，集成 iREPA、改进 VAE 和 Qwen3-VL，通过预训练、中期训练、SFT、偏好优化和 RL 多阶段流水线训练。构建提示词扩展器和风格参考系统，支持从文本和图像输入进行可控探索。模型权重与推理代码以宽松许可证开源。在 Artificial Analysis 文本到图像排行榜中位列前十，独立实验室模型中排名第二。

Hugging Face 图像生成多模态开源生态

关联讨论 1 条X：Krea AI (@krea_ai)

21:29

MarkTechPost（RSS）

68

Nous Research为Hermes Agent技能系统新增/learn命令，无需手写SKILL.md即可将工作流捕获为斜杠命令

Nous Research为开源自改进智能体Hermes Agent的技能系统新增/learn命令。指向文档页面、本地SDK目录、历史对话或粘贴笔记后，Agent自动收集材料并按照标准格式编写SKILL.md。所有技能存放在~/.hermes/skills/，自动映射为斜杠命令（如/plan、/axolotl）。技能采用三级加载（Level 0返回名称与描述约3k tokens，Level 1加载全文，Level 2加载特定文件），避免大技能库撑满上下文窗口。除/learn外，还支持手动编写、skill_manage自动捕获、Skills Hub安装三种创建方式。/learn在CLI、消息网关、TUI和仪表板上均可使用，仪表板额外提供“Learn a skill”按钮。

智能体产品更新开源生态

16:57

Hacker News 热门（buzzing.cc 中文翻译）

60

Roboflow 发布介绍 YOLO26 的博客文章，在 Hacker News 获得 100 个点赞。

开源生态模型发布

16:30

公众号：面壁智能（MiniCPM）

28

面壁智能曾国洋出席APEC中小企业工商论坛，以"高效+开源"加速大模型普惠

6月24日，面壁智能联合创始人兼CTO曾国洋在APEC中小企业工商论坛指出，大模型产业已从拼参数规模转向拼能力密度与落地实效。高效端侧大模型契合中小企业轻量化、低成本、高安全需求。他强调开源开放能降低技术门槛与试错成本，加速AI普惠。面壁智能MiniCPM系列模型在GitHub、Hugging Face等平台累计下载量突破3000万次，已在汽车、智能手机、AI PC、智能家居等领域实现规模化落地。

开源生态行业动态

11:55

HuggingFace Daily Papers（社区热门论文）

精选70

NatureBench：AI编码智能体能否匹配Nature系列论文已发表SOTA？

NatureBench是一个跨学科基准测试，包含90个从Nature系列同行评审论文中提取的任务，用于评估AI编码智能体能否超越复现、实现发现。基准基于NatureGym自动化管线，为每个任务提供标准化容器化环境，解决环境碎片化问题。在严格禁用网络搜索的协议下评估10种前沿智能体配置，最强模型仅在17.8%任务上超过已发表SOTA（g>0.1准则）。分析表明，智能体成功主要依赖方法论翻译，失败主因为方法选择错误和计算预算不足。已发布基准、NatureGym管线及公共排行榜。

智能体 GitHub 开源生态评测/基准

推荐理由：这个基准把AI agent丢进Nature论文的复现池里游了一圈，发现最强的配置也只能在17.8%的任务上超越SOTA，而且靠的是方法翻译而非发明——对做科研agent的团队来说，既是冷水也是路线图。

10:49

HuggingFace Daily Papers（社区热门论文）

61

OpenThoughts-Agent：开源数据流水线训练智能体模型

OpenThoughts-Agent（OT-Agent）项目提出一套完全开源的数据 curation 流水线，专门用于训练智能体模型。研究团队通过 100 余项对照消融实验，系统探索了任务来源与多样性的影响，并构建了包含 10 万条样本的数据集。基于该数据集微调 Qwen3-32B 后，模型在 7 项智能体基准测试中平均准确率为 44.8%，比现有最强的开源数据智能体模型 Nemotron-Terminal-32B（40.9%）高 3.9 个百分点。训练数据展现出强扩展性，同等计算资源下各数据规模均优于其他开源数据集。所有数据、流水线、实验记录及模型已在 openthoughts.ai 公开发布。

智能体 Hugging Face 开源生态数据/训练

10:49

HuggingFace Daily Papers（社区热门论文）

76

Qwen-AgentWorld：用于通用智能体的语言世界模型

Qwen-AgentWorld-35B-A3B和Qwen-AgentWorld-397B-A17B是首批能通过长链式推理模拟7个领域智能体环境的语言世界模型。它们基于超过1000万条真实环境交互轨迹，经连续预训练（注入状态转移与专业语料）、监督微调（激活下一状态预测推理）和强化学习（混合规则与评分奖励提升仿真保真度）三阶段训练而成。配套基准AgentWorldBench利用5个前沿模型在9个已建立基准上的真实交互构建，实验表明Qwen-AgentWorld显著优于现有前沿模型。该模型既可充当解耦环境模拟器支持智能体强化学习，也可作为统一智能体基础模型，通过世界模型训练预热提升下游7个智能体基准的性能。

智能体开源生态论文/研究

关联讨论 5 条X：通义千问 / Qwen (@Alibaba_Qwen)Hacker News 热门（buzzing.cc 中文翻译）X：Berry Xia (@berryxia)公众号：通义实验室（千问）Qwen：Blog Retrieval（API）

03:43

GitHub Blog

精选56

GitHub联合开源联盟呼吁修改加州AI透明度法案以保护开源

GitHub 联合 Black Forest Labs、Hugging Face 与 Mozilla Corporation 组成开源联盟，呼吁对加州 AI 透明度法案（SB 942，拟由 SB 1000 修正）进行针对性修改。当前草案要求开发者在下游用户未履行义务时撤销开源许可证，这与开源许可证永久不可撤销的性质冲突。联盟认为该要求非必要，已有直接监管和执法机制，并建议参考欧盟 AI 法案的透明度实践规范，以向下游用户通知最佳实践文档的方式替代撤销条款。GitHub 支持这些修正，以在保持透明度目标的同时兼容开源开发模式。

GitHub 开源生态政策/监管

推荐理由：GitHub 联合 Hugging Face 等开源玩家公开呼吁修正加州 AI 透明法案，核心矛盾是许可撤销条款与开源许可的‘永久不可撤销’冲突，对开源开发者是个明确的政策信号，值得留意。

03:37

MarkTechPost（RSS）

68

Datalab 发布 lift：9B 开放权重视觉模型，依据 Schema 从 PDF 提取结构化 JSON

Datalab 推出 9B 参数开放权重视觉模型 lift，用于结构化提取。输入 JSON Schema，返回匹配的 JSON 对象，可直接读取 PDF 和图像，支持多页文档一次性处理并跨页取值。提供本地（HuggingFace）和远程（vLLM）两种推理模式，后者推荐用于生产。代码采用 Apache 2.0，权重使用修改版 OpenRAIL-M。在 225 份文档基准上 field accuracy 达 90.2%，中位延迟 9.5 秒/文档。核心机制为 schema-constrained decoding，逐 token 约束输出结构但不保证语义正确；每个字段允许 null 以实现模型放弃。不支持 enum、anyOf/oneOf、$ref、additionalProperties 等结构。

Hugging Face 多模态开源生态模型发布

02:26

Hugging Face：Blog（RSS）

精选64

在 Transformers.js 中实验提议的跨源存储 API

Transformers.js 在浏览器中运行 AI 模型时，不同来源的 Web 应用会重复下载并缓存相同的模型资源（如 Xenova/whisper-tiny.en）和 Wasm 运行时文件（如 4,733 kB 的 ort-wasm-simd-threaded.asyncify.wasm），即使资源 URL 相同，浏览器因 Network Isolation Key 隔离缓存，单次 demo 就产生 177 MB 冗余下载和存储。Cross-Origin Storage API 是一项早期提案，旨在让跨来源应用共享缓存的模型和运行时资源。目前该 API 尚未在浏览器原生实现，但可通过 Chrome 扩展注入 polyfill 进行实验。

Hugging Face 开源生态教程/实践部署/工程

推荐理由：这个Chrome提案让不同网站的AI模型共享缓存，对用Transformers.js的Web开发者是切实的性能改进，但还只是早期实验。

00:00

Berkeley RDI：Blog（AI 安全与评测）

精选82

恶意CDN仍潜伏GitHub Pages，AI让情况恶化

UC Berkeley研究人员发现，近2000个GitHub Pages站点（18000+页面，累计530K+星标）仍在加载来自polyfill.io及其关联恶意CDN的脚本。这些CDN由已被OFAC制裁的Funnull Technology Inc.（现更名Triad Nexus）运营，2024年被出售后开始条件性注入恶意载荷，劫持移动用户、跳转欺诈站点、伪造认证弹窗窃取凭证。扫描12000+站点确认786个加载polyfill.io，1191个加载其他Funnull CDN。更严峻的是，所有测试的大语言模型在生成前端代码时仍推荐这些被污染的CDN URL，包括CyC2018/CS-Notes（184K⭐）、microsoft/AirSim（18K⭐）等知名项目及多所大学课程页面。

GitHub 安全/对齐开源生态编码

推荐理由：polyfill.io等恶意CDN仍在GitHub Pages上感染近2000个站点，更可怕的是所有测试的AI模型都还会推荐这些链接，AI编码的便利正在变成供应链投毒的加速器。

6月23日

21:20

Hugging Face：Blog（RSS）

精选73

IBM 开源 CUGA：轻量级智能体框架，提供二十余个单文件示例应用

IBM 开源了 CUGA（Configurable Generalist Agent），一个处理规划、执行循环、工具调用和状态管理的轻量级智能体框架。开发者只需提供工具列表和提示词即可构建 CugaAgent。内置计划-执行-反思循环，在 AppWorld（2025年7月–2026年2月）和 WebArena（2025年2月–9月）基准上排名第一。支持 Fast / Balanced / Accurate 三种推理模式，代码执行可在本地、Docker 或 E2B 沙箱中运行。可互换工具支持 OpenAPI、MCP 和 LangChain 函数，通过环境变量一键切换 OpenAI、watsonx、Ollama 等提供商。随框架发布二十余个单文件示例应用，涵盖电影推荐、IBM Cloud 架构顾问等场景，每个应用仅需一个 FastAPI 文件。

智能体 GitHub MCP/工具产品更新

推荐理由：CUGA 把 agent 的规划、状态、策略等繁琐工程压缩成配置，开发者只写工具列表和 prompt 就能跑起 agent，配套的二十多个单文件应用是现成的模板库，对自建 agent 的团队来说省去了八成重复工作。

20:24

The Decoder：AI News（RSS）

39

Cursor 发布自有 AI 模型、新 Git 平台和移动应用

Cursor 公布了其首个完全内部训练的 AI 模型的详细信息，并同步推出了一款新 Git 平台和一款移动应用。

产品更新开源生态编码

20:11

IT之家（RSS）

40

《历史模拟器：崇祯》6月25日起本体免费，创意工坊及MOD《罗马：塞维鲁》同步测试

国产AI历史策略游戏《历史模拟器：崇祯》宣布2026年6月25日起本体转为免费游玩。此前首发价48元，因DeepSeek v4 pro、通义千问、智谱GLM等国产大模型能力提升与成本下降，AI游戏成本枷锁被冲开，故决定转免。新玩家可领1500免费模式专属积分，此前48元购入的玩家可额外领4800全模式积分回馈，总计6300积分。同日开启创意工坊及示例MOD《罗马：塞维鲁》测试，允许玩家自定义API接入其他大模型。

开源生态行业动态

19:10

IT之家（RSS）

59

英国政府拨款6000万英镑建两所AI实验室，开发低硬件需求开源模型

英国政府6月23日宣布拨款6000万英镑（约5.39亿元人民币），为牛津大学和伦敦大学学院（UCL）建立两座AI实验室。实验室将开发低硬件需求的开源AI模型，减少对美国闭源高算力方案的依赖。AI事务部长Kanishka Narayan表示此举将使AI更便宜、易部署、更实用，帮助更多企业和公共服务接入AI。两所大学另拨200万英镑（约1795.8万元）培养博士生并招聘至少10名研究人员，以扩大AI人才储备。

开源生态政策/监管

18:07

IT之家（RSS）

51

QQ邮箱推出Agently Mail，为AI智能体提供专属邮箱服务

6月23日，腾讯QQ邮箱推出专为AI智能体打造的专属邮箱服务Agently Mail，并开启内测。该产品独立于个人邮箱运行，可为AI Agent提供安全、隔离且具备独立身份的数字通信空间。支持WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes、Cursor等主流Agent。腾讯公关总监张军表示后续会开放更多平台。Agently Mail已上架腾讯SkillHub，代码仓库在GitHub以Apache-2.0协议开源。

智能体产品更新开源生态

16:12

Hugging Face：Blog（RSS）

精选59

我们用免费本地模型对 OpenClaw 仓库进行实时分类

Hugging Face 在 OpenClaw 仓库上测试用 Gemma 和 Qwen 等本地模型实时分类 issue 和 PR。他们使用 Pi agent harness 驱动模型，配合 reposhell 只允许读操作防止提示词注入。测试的模型包括 gemma-4-26b-a4b 和 qwen3.6-35b-a3b，经性能优化后均可在本地生成数百 token/s。该方案运行在 NVIDIA GB10（128 GB 统一内存）上，相比每月 200 美元的 ChatGPT Pro 订阅，可实现近乎实时的通知且仅消耗电费。

智能体 Hugging Face 开源生态教程/实践

推荐理由：Hugging Face 演示了用本地模型自动 triage GitHub issue 的完整方案，包括只读 shell 防注入、agent harness 等工程技巧。对想用本地模型替代 API 做分类任务的团队，这是一套可直接借鉴的 recipe。

16:07

IT之家（RSS）

48

欧洲自由软件基金会建议欧盟施压谷歌，阻止安卓静默重装AI行为

欧洲自由软件基金会（FSFE）于6月15日向欧盟委员会提交意见，要求依据《数字市场法》加强管控谷歌安卓系统。FSFE指出，谷歌在未明确告知用户的情况下悄然安装AI模型，用户卸载后仍会重装，违反法案。建议欧盟施压谷歌整改AOSP，让用户完整移除预载AI组件，禁止未经知情重新安装或激活。同时要求谷歌扩展安卓互操作性，不应以注册、授权或签订合同为前提。此外，谷歌拟于2026年9月上线的开发者验证计划要求开发者登记并付费才能发布应用到F-Droid等替代商店，FSFE认为这对自由软件开发者不利。

Google 开源生态政策/监管

14:13

HuggingFace Daily Papers（社区热门论文）

55

Tmax：终端智能体的简单配方

Tmax是当前最强的开源终端智能体RL训练配方。仅9B参数即在下游基准Terminal-Bench 2.0上达到27%准确率，超越此前更大模型。研究团队利用难度控制、角色和验证器多样化策略生成数据，并开源了比此前任何已发布终端智能体数据集大2.5倍以上的数据集。基于该数据，使用简单的结果驱动RL训练开放权重模型。代码、数据和模型均已开源。

智能体开源生态数据/训练论文/研究

14:10

公众号：京东JoyAI

精选73

京东全栈开源JoyAI-VL-Interaction，从"一问一答"走向"边看边说"

京东近日开源全球首个全栈交互模型JoyAI-VL-Interaction，获vLLM-Omni原生支持。该模型能持续观察视频流、主动判断关键事件并实时响应，支持将复杂任务委托后台Agent处理。在58个真人盲评中，对比豆包视频通话助手胜率77.6%，对比Gemini视频通话助手胜率87.9%，监控预警场景达100%胜率。开源内容包括模型权重、交互数据集、训练方案及完整可部署系统，支持摄像头、直播流等视频输入及语音交互、长期记忆、vLLM部署，适用于安防监控、老人看护、直播讲解等实时场景。

多模态开源生态模型发布部署/工程

关联讨论 2 条HuggingFace Daily Papers（社区热门论文）IT之家（RSS）

推荐理由：京东这个实时交互模型不是又一个刷榜模型，它把「什么时候该说话」变成了模型自己的判断。全栈开源且对比豆包、Gemini 胜率惊人，做安防、看护、直播的开发者可以直接试了。

123 4…17