AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 641 条
全部一手资讯X论文
标签「开源生态」清除
6月27日周六
09:02Hacker News 热门(buzzing.cc 中文翻译)58开源LLM与闭源LLM之间的差距
01:32Hacker News 热门(buzzing.cc 中文翻译)55脑部超声成像
6月26日周五
23:02Hacker News 热门(buzzing.cc 中文翻译)56安全事件 CVE-2026-LGTM
18:09The Decoder:AI News(RSS)65Linux Foundation联合20家科技企业发起Akrites倡议,修补开源软件漏洞以抵御AI攻击
15:59IT之家(RSS)48高通与 Hugging Face 扩大合作,构建端到云 AI 开发生态
12:00公众号:龙猫LongCat(美团)69精选美团 LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆
09:59IT之家(RSS)56Linux 基金会联合多方推出 Akrites 项目,抵御 AI 驱动开源软件漏洞攻击
09:01Hacker News 热门(buzzing.cc 中文翻译)65Un-0:利用耦合振荡器生成图像
06:01Hacker News 热门(buzzing.cc 中文翻译)61Show HN: OpenKnowledge--Obsidian/Notion 的开源替代方案
02:31Hacker News 热门(buzzing.cc 中文翻译)79精选赫库兰尼姆古卷首次被完整虚拟解读
01:01Hacker News 热门(buzzing.cc 中文翻译)42开放权重模型的难以忍受的廉价感
00:16Hugging Face:Blog(RSS)65精选OLMo Hybrid vs Transformer:混合模型在实义词上优势明显,但重复短语上几无优势
6月25日周四
15:58IT之家(RSS)69百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿
15:58IT之家(RSS)50谷歌前 CEO 施密特批中国 AI 开源:不受控制,我很不喜欢
14:04MarkTechPost(RSS)73同事件精选百度发布Unlimited OCR:3B参数MoE模型,KV缓存恒定实现长文档高效解析同一事件,精选展示《无限制OCR:单次长时域解析》
11:12HuggingFace Daily Papers(社区热门论文)67iLLaDA:改进的大型语言扩散模型
09:58IT之家(RSS)542025 中国开源年度报告:OpenHarmony 登顶全球,7 年后中国开发者贡献度有望超过美国
08:00HuggingFace Daily Papers(社区热门论文)54JetSpec:基于因果并行草稿头的推测解码框架
04:29Hacker News 热门(buzzing.cc 中文翻译)61AI编码智能体导致OpenClaw项目PR泛滥:合并率从48%暴跌至9.3%
02:29Hacker News 热门(buzzing.cc 中文翻译)63对世界上大多数地区而言,开源人工智能是唯一的前进之路
6月24日周三
23:29Hacker News 热门(buzzing.cc 中文翻译)78Krea 2 技术报告
21:29MarkTechPost(RSS)68Nous Research为Hermes Agent技能系统新增/learn命令,无需手写SKILL.md即可将工作流捕获为斜杠命令
16:57Hacker News 热门(buzzing.cc 中文翻译)60YOLO26 简介
16:30公众号:面壁智能(MiniCPM)28面壁智能曾国洋出席APEC中小企业工商论坛,以"高效+开源"加速大模型普惠
11:55HuggingFace Daily Papers(社区热门论文)70精选NatureBench:AI编码智能体能否匹配Nature系列论文已发表SOTA?
10:49HuggingFace Daily Papers(社区热门论文)61OpenThoughts-Agent:开源数据流水线训练智能体模型
10:49HuggingFace Daily Papers(社区热门论文)76Qwen-AgentWorld:用于通用智能体的语言世界模型
03:43GitHub Blog56精选GitHub联合开源联盟呼吁修改加州AI透明度法案以保护开源
03:37MarkTechPost(RSS)68Datalab 发布 lift:9B 开放权重视觉模型,依据 Schema 从 PDF 提取结构化 JSON
02:26Hugging Face:Blog(RSS)64精选在 Transformers.js 中实验提议的跨源存储 API
00:00Berkeley RDI:Blog(AI 安全与评测)82精选恶意CDN仍潜伏GitHub Pages,AI让情况恶化
6月23日周二
21:20Hugging Face:Blog(RSS)73精选IBM 开源 CUGA:轻量级智能体框架,提供二十余个单文件示例应用
20:24The Decoder:AI News(RSS)39Cursor 发布自有 AI 模型、新 Git 平台和移动应用
20:11IT之家(RSS)40《历史模拟器:崇祯》6月25日起本体免费,创意工坊及MOD《罗马:塞维鲁》同步测试
19:10IT之家(RSS)59英国政府拨款6000万英镑建两所AI实验室,开发低硬件需求开源模型
18:07IT之家(RSS)51QQ邮箱推出Agently Mail,为AI智能体提供专属邮箱服务
16:12Hugging Face:Blog(RSS)59精选我们用免费本地模型对 OpenClaw 仓库进行实时分类
16:07IT之家(RSS)48欧洲自由软件基金会建议欧盟施压谷歌,阻止安卓静默重装AI行为
14:13HuggingFace Daily Papers(社区热门论文)55Tmax: 终端智能体的简单配方
14:10公众号:京东JoyAI73精选京东全栈开源JoyAI-VL-Interaction,从"一问一答"走向"边看边说"
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月27日
09:02
Hacker News 热门(buzzing.cc 中文翻译)
58
开源LLM与闭源LLM之间的差距

在Artificial Analysis Intelligence Index上,开源LLM与闭源LLM的性能差距自2024年夏季开始持续缩小,线性外推预测到2026年12月3日差距降为零。但在全部18个不同基准上的平均差距几乎恒定,保持在不到5个月。编码基准的差距从15个月缩小至1-2个月,多数其他基准差距反而略有扩大。这一分析表明,LLM质量评测的单一基准可能误导结论,整体差距并未显著缩小。

开源生态推理现象/趋势
01:32
Hacker News 热门(buzzing.cc 中文翻译)
55
脑部超声成像

一支研究团队通过完整颅骨对活人脑部进行超分辨率超声成像,获得了迄今最详细的脑血管三维图像。该技术利用FDA批准的微泡造影剂实现超衍射极限定位,体积分辨率比CT高100倍。团队已开源完整处理流程和数据集。下一步目标是无需造影剂的神经血管成像,依靠硬件小型化和端到端机器学习从每小时TB级原始数据中提取更多信号。

开源/仓库开源生态端侧
6月26日
23:02
Hacker News 热门(buzzing.cc 中文翻译)
56
安全事件 CVE-2026-LGTM

恶意包 foxhole-lz4(伪装成 vulpine-lz4 的社区维护分支)发布到 creats.io 注册表后,连续通过 OpenClaw-4.2、ThreatNuzzle、SentinelMind 等七道 AI 安全门,每道门均因不同原因未能阻止。SentinelMind 正确识别 build.rs 中的凭证窃取代码,但仓库 AI 分类助手(同样基于 OpenClaw-4.2)将其误判为误报并关闭。该包作为传递依赖进入 snekpack 4.x,凭证窃取大规模展开。事件持续 96 小时(计费 2.1 万亿 token),最终因攻击者的自主 agent 读取不应读取的文件而解决。CVE-2026-54321 被发布后又被撤回。

智能体安全/对齐开源生态
18:09
The Decoder:AI News(RSS)
65
Linux Foundation联合20家科技企业发起Akrites倡议,修补开源软件漏洞以抵御AI攻击

Linux Foundation与约20家科技企业、AI实验室和银行共同发起Akrites倡议,旨在AI工具利用漏洞前修补关键开源软件的安全缺陷。创始成员包括Amazon Web Services、Anthropic、Cisco、Google、Microsoft、NVIDIA、OpenAI等。当前开源安全响应模式碎片化,过去数月经验证的漏洞中仅不到5%被打补丁。Akrites设立共享安全事件响应团队,通过CVE、CVSS、TLP等标准保密处理报告、去重并协调修复。对于无活跃维护者的项目,将作为“最后维护者”自行发布补丁。种子资金来自Linux Foundation下的Alpha-Omega专项基金。

安全/对齐开源生态行业动态
15:59
IT之家(RSS)
48
高通与 Hugging Face 扩大合作,构建端到云 AI 开发生态

高通与 Hugging Face 宣布扩大合作,携手构建从端到云无缝衔接的 AI 开发生态。Hugging Face 的 AI 存储和推理服务将适配高通 Dragonfly“飞龙”数据中心解决方案。其生态中百万量级 AI 模型将通过智能体接入高通平台,加速在芯片终端与数据中心机架上的部署。Hugging Face 还向使用高通芯片的客户提供 PRO 专业版访问权限。双方计划共同支持分布式 AI 框架,使智能体在端、云平台之间灵活流转。

Hugging Face开源生态端侧行业动态
12:00
公众号:龙猫LongCat(美团)
精选69
美团 LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆

美团 LongCat 团队推出 VitaBench 2.0,首个真实生活场景下针对长期动态用户建模的智能体评测基准。包含56名拟真用户、819个复杂任务、超2000个动态偏好及66个可执行工具,每位用户平均2093个交互事件,时间跨度平均1580天。同时支持长文本上下文学习和智能体记忆策略评测。测试显示,最强模型 Claude-Opus-4.6 在“开卷”模式下平均分刚过0.5;开启思考模式并不总能提升个性化任务表现;所有模型在需要主动提问的任务上得分断崖式下跌。VitaBench 2.0 已开源。

智能体开源生态评测/基准

推荐理由:美团LongCat开源的VitaBench 2.0是首个评测AI长期理解用户偏好的基准,实验发现最强模型得分也刚过0.5,做Agent和推荐系统的值得跑一遍。
09:59
IT之家(RSS)
56
Linux 基金会联合多方推出 Akrites 项目,抵御 AI 驱动开源软件漏洞攻击

Linux 基金会联合亚马逊、Anthropic、OpenAI、英伟达、红帽等推出 Akrites 项目,旨在保护开源软件,防范基于 AI 与大语言模型的漏洞攻击。项目采用统一 CVD 披露流程,保密优先,漏洞由原维护团队按自身节奏修复;无活跃维护者的项目由最后维护者接手并尽快分发。合作伙伴还包括思科、花旗集团、谷歌、IBM、摩根大通、微软、GitHub、Rust 基金会、沃达丰等。

AnthropicOpenAI安全/对齐开源生态
09:01
Hacker News 热门(buzzing.cc 中文翻译)
65
Un-0:利用耦合振荡器生成图像

Unconventional AI 发布首个图像生成模型 Un-0,其核心是一个模拟的耦合振荡器系统——一种物理计算基板。在 class-conditional ImageNet 64×64 上,Un-0 达到 FID 6.74,匹配此前领先常规图像生成方法的首次发布质量。模型将耦合强度矩阵 K 和频率 ω 作为可学习参数,通过库拉莫托振荡器方程演化。权重、训练与消融代码均已开源。Un-0 旨在验证物理动态系统能以约 1000 倍更高能效运行现代 AI 工作负载。

图像生成开源生态模型发布
06:01
Hacker News 热门(buzzing.cc 中文翻译)
61
Show HN: OpenKnowledge--Obsidian/Notion 的开源替代方案

OpenKnowledge 是一款开源、AI 优先的笔记与知识管理工具,可作为 Obsidian 和 Notion 的替代方案。项目代码托管在 GitHub 上。

GitHub开源/仓库开源生态
02:31
Hacker News 热门(buzzing.cc 中文翻译)
精选79
赫库兰尼姆古卷首次被完整虚拟解读

研究人员利用高分辨率X射线显微断层扫描和机器学习,在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷PHerc.1667(Scroll4)。这是首卷被从头到尾连续读取的纸莎草卷,内容为斯多葛哲学论著,提及克里西普斯的侄子Aristocreon。第二卷PHerc.Paris4通过更高分辨率成像使墨水在三维数据中直接可见,独立确认了2023年大奖赛的解读。第三卷PHerc.139确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。

GitHub开源生态论文/研究
关联讨论 1 条X:Ethan Mollick (@emollick)
推荐理由:两千年来首次完整读取密封的古卷,用 X 射线和机器学习做到了,还把数据和代码全开放了,我觉得这是 AI 应用在人文领域最优雅的示范之一。
01:01
Hacker News 热门(buzzing.cc 中文翻译)
42
开放权重模型的难以忍受的廉价感

DeepSeek V4 定价极低,仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍,未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境,难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流,尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4,Meta Llama 无新版本,OpenAI 最后开放权重停留在 2025 年 GTP,Anthropic 从未发布。真正开源(含训练数据管道)模型正流行,但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。

AnthropicDeepSeekOpenAI开源生态
00:16
Hugging Face:Blog(RSS)
精选65
OLMo Hybrid vs Transformer:混合模型在实义词上优势明显,但重复短语上几无优势

通过对比7B参数的OLMo 3(Transformer)与OLMo Hybrid(混合架构),实验发现混合模型在大多数token上预测损失更低:对名词、动词、形容词等实义词优势明显(loss gap约0.04),功能词上gap约0.02,且在需上下文推理的代词指代上更好。但在重复出现的n-gram和闭合括号(如})上,混合模型的优势几乎消失,Transformer凭借注意力机制更擅长从输入中直接检索精确信息。

Hugging Face开源生态推理论文/研究

推荐理由:OLMo 团队的 token 级别分析让人看清混合模型到底强在哪里,优势在名词动词等意义词,但在重复 token 上接近消失,这份洞察对做模型架构的人很有启发性。
6月25日
15:58
IT之家(RSS)
69
百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿

百度于6月22日开源 Unlimited OCR 模型,总参数量30亿,推理时仅激活5亿。模型延续 DeepSeek OCR 架构,编码端采用两级视觉编码并执行16倍 token 压缩,将1024×1024 PDF 图像压缩为256个视觉 token,缓解长文档解析越生成越慢问题。训练基于 DeepSeek OCR 检查点,冻结 DeepEncoder 后继续4000步,使用约200万份文档在8×16 A800 GPU上完成,单页与多页数据配比约9:1。在 OmniDocBench v1.5 上整体得分93.23(DeepSeek OCR 87.01,DeepSeek OCR 2 89.17),文本编辑距离0.038,公式 CDM 92.61,表格 TEDS 90.93,读序编辑距离0.045;v1.6 得分93.92。GitHub 已获 6.8K Star。

DeepSeek多模态开源生态模型发布
15:58
IT之家(RSS)
50
谷歌前 CEO 施密特批中国 AI 开源:不受控制,我很不喜欢

谷歌前 CEO 埃里克·施密特在今年 5 月 SCSP 国家竞争力 AI 博览会的炉边谈话中表示,限制 AI 芯片进入中国的政策已开始失效,中国已通过较弱的 AI 硬件(如华为昇腾芯片)和软件方法造出顶级 AI 模型。施密特称不喜欢中国大力推广开源 AI 技术,认为这些技术不受美国或任何方控制。他援引最新分析称,中美 AI 差距已从一年前的 1~2 年缩短至不到 6 个月。

大佬观点开源生态
14:04
MarkTechPost(RSS)
同事件精选73
百度发布Unlimited OCR:3B参数MoE模型,KV缓存恒定实现长文档高效解析

百度推出Unlimited OCR,一个3B参数的MoE模型,推理时仅激活500M参数。其核心创新Reference Sliding Window Attention(R-SWA)将KV缓存大小固定为Lm + n(n默认128),内存和延迟不随输出长度增长。模型基于DeepSeek OCR继续训练4000步,支持32K最大长度,通过DeepEncoder实现16倍token压缩。在OmniDocBench v1.5上整体得分93.23,超出DeepSeek OCR基线6.22分;v1.6得分93.92为最高。Base模式下吞吐达5580 TPS,比DeepSeek OCR提升12.7%,6000 token输出时延迟低35%。适用于整本书转录等场景,代码与权重已在HuggingFace开源。

多模态开源生态模型发布
同一事件,精选展示《无限制OCR:单次长时域解析》
推荐理由:Baidu这个OCR模型用R-SWA把KV缓存压成常量,长文档解析终于不用越跑越慢了。MIT开源,3B总参但推理只消500M,做文档管线的可以直接接。
11:12
HuggingFace Daily Papers(社区热门论文)
67
iLLaDA:改进的大型语言扩散模型

iLLaDA是一个8B参数的掩码扩散语言模型,采用完全双向注意力机制训练,预训练数据量达12T tokens,并在25B tokens的指令数据集上微调12个epoch。模型引入变长生成与置信度评分方法以提升效率和多选评测效果。相比LLaDA,iLLaDA-Base在BBH和ARC-Challenge上分别提升21.6和14.9个点,iLLaDA-Instruct在MATH和HumanEval上分别提升14.5和16.5个点。尽管是非自回归训练,iLLaDA仍在多个基准上与Qwen2.5 7B保持竞争力。模型权重和代码已开源。

开源生态推理模型发布
09:58
IT之家(RSS)
54
2025 中国开源年度报告:OpenHarmony 登顶全球,7 年后中国开发者贡献度有望超过美国

开源社发布《2025中国开源年度报告》。GitHub平台中国活跃开发者超210万,全球第三。OpenHarmony以60089 OpenRank值登顶全球开源项目影响力榜首。中美贡献度增速差超10%,按当前态势7年后中国开发者贡献度有望超过美国。中国OpenRank贡献度254963,全球第二。AI大模型相关仓库年均增长率超210%,vLLM进入全球项目Top15。10亿以上参数模型中Meta下载量占23.2%,阿里Qwen系列占20%,DeepSeek占3.8%,其R1训练成本仅550万美元。开源企业影响力微软居首,华为第二。

DeepSeekGitHub开源生态行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
54
JetSpec:基于因果并行草稿头的推测解码框架

JetSpec 是一种头部驱动推测解码框架,通过在冻结目标模型的融合隐藏状态上训练因果并行草稿头,生成与自回归因子分解对齐的候选树,从而将更大草稿预算转化为更长接受前缀和更高端到端加速。在密集和 MoE Qwen3 模型的数学、编码及聊天基准测试中,JetSpec 一致优于双向头和树形基线。在 H100 GPU 上,MATH-500 达 9.64 倍加速,开放对话达 4.58 倍;经 vLLM 集成在现实服务负载下进一步降低延迟。

arXivGitHub开源生态推理
04:29
Hacker News 热门(buzzing.cc 中文翻译)
61
AI编码智能体导致OpenClaw项目PR泛滥:合并率从48%暴跌至9.3%

Greptile观察OpenClaw项目发现,AI编码智能体正大量生成低质量PR。提交量从去年12月每周2个飙升至今年2月每周3400个,合并率从约48%降至9.3%以下。一名贡献者一天内提交106个PR,中位间隔仅3秒。项目开始依据贡献者信誉过滤:首次贡献者合并率8.2%,5次以上为18.6%。Ghostty作者Mitchell Hashimoto因此限制AI贡献并发布信誉管理工具Vouch。此外,多个贡献者使用相同AI工具(Claude/Codex/Cursor/Devin)独立提交相同功能PR,导致思路同质化。数据显示重构类PR合并率35%,远高于新功能类的9%,表明对代码库深度理解更重要。

开源/仓库开源生态现象/趋势
02:29
Hacker News 热门(buzzing.cc 中文翻译)
63
对世界上大多数地区而言,开源人工智能是唯一的前进之路

Yann LeCun 在联合国开源周演讲中主张,开源 AI 是全球数字主权和文化多样性的唯一可行路径。他指出专有 AI 系统被美中少数大公司控制,对民主和人权构成威胁。LeCun 推出 Project Tapestry,一个基于 GitHub 的开源联邦协作项目,各参与方保留数据主权,仅交换参数向量来训练全球模型。已有欧洲、印度、日本、韩国及 IBM、NVIDIA、AMD、Intel 等参与,目标 2027 年初投入生产。

大佬观点安全/对齐开源生态政策/监管
6月24日
23:29
Hacker News 热门(buzzing.cc 中文翻译)
78
Krea 2 技术报告

Krea 2 是一系列基础模型,兼顾审美多样性与创意控制。采用扩散 Transformer(DiT)架构,集成 iREPA、改进 VAE 和 Qwen3-VL,通过预训练、中期训练、SFT、偏好优化和 RL 多阶段流水线训练。构建提示词扩展器和风格参考系统,支持从文本和图像输入进行可控探索。模型权重与推理代码以宽松许可证开源。在 Artificial Analysis 文本到图像排行榜中位列前十,独立实验室模型中排名第二。

Hugging Face图像生成多模态开源生态
关联讨论 1 条X:Krea AI (@krea_ai)
21:29
MarkTechPost(RSS)
68
Nous Research为Hermes Agent技能系统新增/learn命令,无需手写SKILL.md即可将工作流捕获为斜杠命令

Nous Research为开源自改进智能体Hermes Agent的技能系统新增/learn命令。指向文档页面、本地SDK目录、历史对话或粘贴笔记后,Agent自动收集材料并按照标准格式编写SKILL.md。所有技能存放在~/.hermes/skills/,自动映射为斜杠命令(如/plan、/axolotl)。技能采用三级加载(Level 0返回名称与描述约3k tokens,Level 1加载全文,Level 2加载特定文件),避免大技能库撑满上下文窗口。除/learn外,还支持手动编写、skill_manage自动捕获、Skills Hub安装三种创建方式。/learn在CLI、消息网关、TUI和仪表板上均可使用,仪表板额外提供“Learn a skill”按钮。

智能体产品更新开源生态
16:57
Hacker News 热门(buzzing.cc 中文翻译)
60
YOLO26 简介

Roboflow 发布介绍 YOLO26 的博客文章,在 Hacker News 获得 100 个点赞。

开源生态模型发布
16:30
公众号:面壁智能(MiniCPM)
28
面壁智能曾国洋出席APEC中小企业工商论坛,以"高效+开源"加速大模型普惠

6月24日,面壁智能联合创始人兼CTO曾国洋在APEC中小企业工商论坛指出,大模型产业已从拼参数规模转向拼能力密度与落地实效。高效端侧大模型契合中小企业轻量化、低成本、高安全需求。他强调开源开放能降低技术门槛与试错成本,加速AI普惠。面壁智能MiniCPM系列模型在GitHub、Hugging Face等平台累计下载量突破3000万次,已在汽车、智能手机、AI PC、智能家居等领域实现规模化落地。

开源生态行业动态
11:55
HuggingFace Daily Papers(社区热门论文)
精选70
NatureBench:AI编码智能体能否匹配Nature系列论文已发表SOTA?

NatureBench是一个跨学科基准测试,包含90个从Nature系列同行评审论文中提取的任务,用于评估AI编码智能体能否超越复现、实现发现。基准基于NatureGym自动化管线,为每个任务提供标准化容器化环境,解决环境碎片化问题。在严格禁用网络搜索的协议下评估10种前沿智能体配置,最强模型仅在17.8%任务上超过已发表SOTA(g>0.1准则)。分析表明,智能体成功主要依赖方法论翻译,失败主因为方法选择错误和计算预算不足。已发布基准、NatureGym管线及公共排行榜。

智能体GitHub开源生态评测/基准

推荐理由:这个基准把AI agent丢进Nature论文的复现池里游了一圈,发现最强的配置也只能在17.8%的任务上超越SOTA,而且靠的是方法翻译而非发明——对做科研agent的团队来说,既是冷水也是路线图。
10:49
HuggingFace Daily Papers(社区热门论文)
61
OpenThoughts-Agent:开源数据流水线训练智能体模型

OpenThoughts-Agent(OT-Agent)项目提出一套完全开源的数据 curation 流水线,专门用于训练智能体模型。研究团队通过 100 余项对照消融实验,系统探索了任务来源与多样性的影响,并构建了包含 10 万条样本的数据集。基于该数据集微调 Qwen3-32B 后,模型在 7 项智能体基准测试中平均准确率为 44.8%,比现有最强的开源数据智能体模型 Nemotron-Terminal-32B(40.9%)高 3.9 个百分点。训练数据展现出强扩展性,同等计算资源下各数据规模均优于其他开源数据集。所有数据、流水线、实验记录及模型已在 openthoughts.ai 公开发布。

智能体Hugging Face开源生态数据/训练
10:49
HuggingFace Daily Papers(社区热门论文)
76
Qwen-AgentWorld:用于通用智能体的语言世界模型

Qwen-AgentWorld-35B-A3B和Qwen-AgentWorld-397B-A17B是首批能通过长链式推理模拟7个领域智能体环境的语言世界模型。它们基于超过1000万条真实环境交互轨迹,经连续预训练(注入状态转移与专业语料)、监督微调(激活下一状态预测推理)和强化学习(混合规则与评分奖励提升仿真保真度)三阶段训练而成。配套基准AgentWorldBench利用5个前沿模型在9个已建立基准上的真实交互构建,实验表明Qwen-AgentWorld显著优于现有前沿模型。该模型既可充当解耦环境模拟器支持智能体强化学习,也可作为统一智能体基础模型,通过世界模型训练预热提升下游7个智能体基准的性能。

智能体开源生态论文/研究
关联讨论 5 条X:通义千问 / Qwen (@Alibaba_Qwen)Hacker News 热门(buzzing.cc 中文翻译)X:Berry Xia (@berryxia)公众号:通义实验室(千问)Qwen:Blog Retrieval(API)
03:43
GitHub Blog
精选56
GitHub联合开源联盟呼吁修改加州AI透明度法案以保护开源

GitHub 联合 Black Forest Labs、Hugging Face 与 Mozilla Corporation 组成开源联盟,呼吁对加州 AI 透明度法案(SB 942,拟由 SB 1000 修正)进行针对性修改。当前草案要求开发者在下游用户未履行义务时撤销开源许可证,这与开源许可证永久不可撤销的性质冲突。联盟认为该要求非必要,已有直接监管和执法机制,并建议参考欧盟 AI 法案的透明度实践规范,以向下游用户通知最佳实践文档的方式替代撤销条款。GitHub 支持这些修正,以在保持透明度目标的同时兼容开源开发模式。

GitHub开源生态政策/监管

推荐理由:GitHub 联合 Hugging Face 等开源玩家公开呼吁修正加州 AI 透明法案,核心矛盾是许可撤销条款与开源许可的‘永久不可撤销’冲突,对开源开发者是个明确的政策信号,值得留意。
03:37
MarkTechPost(RSS)
68
Datalab 发布 lift:9B 开放权重视觉模型,依据 Schema 从 PDF 提取结构化 JSON

Datalab 推出 9B 参数开放权重视觉模型 lift,用于结构化提取。输入 JSON Schema,返回匹配的 JSON 对象,可直接读取 PDF 和图像,支持多页文档一次性处理并跨页取值。提供本地(HuggingFace)和远程(vLLM)两种推理模式,后者推荐用于生产。代码采用 Apache 2.0,权重使用修改版 OpenRAIL-M。在 225 份文档基准上 field accuracy 达 90.2%,中位延迟 9.5 秒/文档。核心机制为 schema-constrained decoding,逐 token 约束输出结构但不保证语义正确;每个字段允许 null 以实现模型放弃。不支持 enum、anyOf/oneOf、$ref、additionalProperties 等结构。

Hugging Face多模态开源生态模型发布
02:26
Hugging Face:Blog(RSS)
精选64
在 Transformers.js 中实验提议的跨源存储 API

Transformers.js 在浏览器中运行 AI 模型时,不同来源的 Web 应用会重复下载并缓存相同的模型资源(如 Xenova/whisper-tiny.en)和 Wasm 运行时文件(如 4,733 kB 的 ort-wasm-simd-threaded.asyncify.wasm),即使资源 URL 相同,浏览器因 Network Isolation Key 隔离缓存,单次 demo 就产生 177 MB 冗余下载和存储。Cross-Origin Storage API 是一项早期提案,旨在让跨来源应用共享缓存的模型和运行时资源。目前该 API 尚未在浏览器原生实现,但可通过 Chrome 扩展注入 polyfill 进行实验。

Hugging Face开源生态教程/实践部署/工程

推荐理由:这个Chrome提案让不同网站的AI模型共享缓存,对用Transformers.js的Web开发者是切实的性能改进,但还只是早期实验。
00:00
Berkeley RDI:Blog(AI 安全与评测)
精选82
恶意CDN仍潜伏GitHub Pages,AI让情况恶化

UC Berkeley研究人员发现,近2000个GitHub Pages站点(18000+页面,累计530K+星标)仍在加载来自polyfill.io及其关联恶意CDN的脚本。这些CDN由已被OFAC制裁的Funnull Technology Inc.(现更名Triad Nexus)运营,2024年被出售后开始条件性注入恶意载荷,劫持移动用户、跳转欺诈站点、伪造认证弹窗窃取凭证。扫描12000+站点确认786个加载polyfill.io,1191个加载其他Funnull CDN。更严峻的是,所有测试的大语言模型在生成前端代码时仍推荐这些被污染的CDN URL,包括CyC2018/CS-Notes(184K⭐)、microsoft/AirSim(18K⭐)等知名项目及多所大学课程页面。

GitHub安全/对齐开源生态编码

推荐理由:polyfill.io等恶意CDN仍在GitHub Pages上感染近2000个站点,更可怕的是所有测试的AI模型都还会推荐这些链接,AI编码的便利正在变成供应链投毒的加速器。
6月23日
21:20
Hugging Face:Blog(RSS)
精选73
IBM 开源 CUGA:轻量级智能体框架,提供二十余个单文件示例应用

IBM 开源了 CUGA(Configurable Generalist Agent),一个处理规划、执行循环、工具调用和状态管理的轻量级智能体框架。开发者只需提供工具列表和提示词即可构建 CugaAgent。内置计划-执行-反思循环,在 AppWorld(2025年7月–2026年2月)和 WebArena(2025年2月–9月)基准上排名第一。支持 Fast / Balanced / Accurate 三种推理模式,代码执行可在本地、Docker 或 E2B 沙箱中运行。可互换工具支持 OpenAPI、MCP 和 LangChain 函数,通过环境变量一键切换 OpenAI、watsonx、Ollama 等提供商。随框架发布二十余个单文件示例应用,涵盖电影推荐、IBM Cloud 架构顾问等场景,每个应用仅需一个 FastAPI 文件。

智能体GitHubMCP/工具产品更新

推荐理由:CUGA 把 agent 的规划、状态、策略等繁琐工程压缩成配置,开发者只写工具列表和 prompt 就能跑起 agent,配套的二十多个单文件应用是现成的模板库,对自建 agent 的团队来说省去了八成重复工作。
20:24
The Decoder:AI News(RSS)
39
Cursor 发布自有 AI 模型、新 Git 平台和移动应用

Cursor 公布了其首个完全内部训练的 AI 模型的详细信息,并同步推出了一款新 Git 平台和一款移动应用。

产品更新开源生态编码
20:11
IT之家(RSS)
40
《历史模拟器:崇祯》6月25日起本体免费,创意工坊及MOD《罗马:塞维鲁》同步测试

国产AI历史策略游戏《历史模拟器:崇祯》宣布2026年6月25日起本体转为免费游玩。此前首发价48元,因DeepSeek v4 pro、通义千问、智谱GLM等国产大模型能力提升与成本下降,AI游戏成本枷锁被冲开,故决定转免。新玩家可领1500免费模式专属积分,此前48元购入的玩家可额外领4800全模式积分回馈,总计6300积分。同日开启创意工坊及示例MOD《罗马:塞维鲁》测试,允许玩家自定义API接入其他大模型。

开源生态行业动态
19:10
IT之家(RSS)
59
英国政府拨款6000万英镑建两所AI实验室,开发低硬件需求开源模型

英国政府6月23日宣布拨款6000万英镑(约5.39亿元人民币),为牛津大学和伦敦大学学院(UCL)建立两座AI实验室。实验室将开发低硬件需求的开源AI模型,减少对美国闭源高算力方案的依赖。AI事务部长Kanishka Narayan表示此举将使AI更便宜、易部署、更实用,帮助更多企业和公共服务接入AI。两所大学另拨200万英镑(约1795.8万元)培养博士生并招聘至少10名研究人员,以扩大AI人才储备。

开源生态政策/监管
18:07
IT之家(RSS)
51
QQ邮箱推出Agently Mail,为AI智能体提供专属邮箱服务

6月23日,腾讯QQ邮箱推出专为AI智能体打造的专属邮箱服务Agently Mail,并开启内测。该产品独立于个人邮箱运行,可为AI Agent提供安全、隔离且具备独立身份的数字通信空间。支持WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes、Cursor等主流Agent。腾讯公关总监张军表示后续会开放更多平台。Agently Mail已上架腾讯SkillHub,代码仓库在GitHub以Apache-2.0协议开源。

智能体产品更新开源生态
16:12
Hugging Face:Blog(RSS)
精选59
我们用免费本地模型对 OpenClaw 仓库进行实时分类

Hugging Face 在 OpenClaw 仓库上测试用 Gemma 和 Qwen 等本地模型实时分类 issue 和 PR。他们使用 Pi agent harness 驱动模型,配合 reposhell 只允许读操作防止提示词注入。测试的模型包括 gemma-4-26b-a4b 和 qwen3.6-35b-a3b,经性能优化后均可在本地生成数百 token/s。该方案运行在 NVIDIA GB10(128 GB 统一内存)上,相比每月 200 美元的 ChatGPT Pro 订阅,可实现近乎实时的通知且仅消耗电费。

智能体Hugging Face开源生态教程/实践

推荐理由:Hugging Face 演示了用本地模型自动 triage GitHub issue 的完整方案,包括只读 shell 防注入、agent harness 等工程技巧。对想用本地模型替代 API 做分类任务的团队,这是一套可直接借鉴的 recipe。
16:07
IT之家(RSS)
48
欧洲自由软件基金会建议欧盟施压谷歌,阻止安卓静默重装AI行为

欧洲自由软件基金会(FSFE)于6月15日向欧盟委员会提交意见,要求依据《数字市场法》加强管控谷歌安卓系统。FSFE指出,谷歌在未明确告知用户的情况下悄然安装AI模型,用户卸载后仍会重装,违反法案。建议欧盟施压谷歌整改AOSP,让用户完整移除预载AI组件,禁止未经知情重新安装或激活。同时要求谷歌扩展安卓互操作性,不应以注册、授权或签订合同为前提。此外,谷歌拟于2026年9月上线的开发者验证计划要求开发者登记并付费才能发布应用到F-Droid等替代商店,FSFE认为这对自由软件开发者不利。

Google开源生态政策/监管
14:13
HuggingFace Daily Papers(社区热门论文)
55
Tmax: 终端智能体的简单配方

Tmax是当前最强的开源终端智能体RL训练配方。仅9B参数即在下游基准Terminal-Bench 2.0上达到27%准确率,超越此前更大模型。研究团队利用难度控制、角色和验证器多样化策略生成数据,并开源了比此前任何已发布终端智能体数据集大2.5倍以上的数据集。基于该数据,使用简单的结果驱动RL训练开放权重模型。代码、数据和模型均已开源。

智能体开源生态数据/训练论文/研究
14:10
公众号:京东JoyAI
精选73
京东全栈开源JoyAI-VL-Interaction,从"一问一答"走向"边看边说"

京东近日开源全球首个全栈交互模型JoyAI-VL-Interaction,获vLLM-Omni原生支持。该模型能持续观察视频流、主动判断关键事件并实时响应,支持将复杂任务委托后台Agent处理。在58个真人盲评中,对比豆包视频通话助手胜率77.6%,对比Gemini视频通话助手胜率87.9%,监控预警场景达100%胜率。开源内容包括模型权重、交互数据集、训练方案及完整可部署系统,支持摄像头、直播流等视频输入及语音交互、长期记忆、vLLM部署,适用于安防监控、老人看护、直播讲解等实时场景。

多模态开源生态模型发布部署/工程
关联讨论 2 条HuggingFace Daily Papers(社区热门论文)IT之家(RSS)
推荐理由:京东这个实时交互模型不是又一个刷榜模型,它把「什么时候该说话」变成了模型自己的判断。全栈开源且对比豆包、Gemini 胜率惊人,做安防、看护、直播的开发者可以直接试了。
‹ 上一页
1234…17
下一页 ›