AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
6月26日周五
23:22Berryxia.AI71Memanto:为AI coding agent提供无限记忆的开源工具
23:05Chubby♨️72美国商务部要求对Anthropic模型实施全球许可证管制,导致Fable 5下线
23:02Hacker News 热门(buzzing.cc 中文翻译)56安全事件 CVE-2026-LGTM
22:35Chubby♨️61许多人尚未意识到一场格局性转变
22:20Berryxia.AI68PP-OCRv6发布端到端部署基准:A100仅0.13秒/图,CPU提速5.2倍
22:14OpenBMB63面壁智能与清华THUNLP发现混合LLM长上下文瓶颈在于全注意力检索能力
21:16AYi74GPT-5.6跳票:美国商务部警告无跨机构审批不得发布,Anthropic Mythos上周也被卡
20:05Chubby♨️77Ornith-1.0 开源智能体编程模型发布
18:09The Decoder:AI News(RSS)65Linux Foundation联合20家科技企业发起Akrites倡议,修补开源软件漏洞以抵御AI攻击
16:35Chubby♨️55GPT-5.6 发布受政府干预,作者转向开源模型
15:59IT之家(RSS)48高通与 Hugging Face 扩大合作,构建端到云 AI 开发生态
13:51宝玉59PPT Master 确实是最好的 PPT Skill
13:15AYi56GitHub开源量化书《XQuant》揭示AI跨领域迁移模板
12:43MiniMax (official)44MiniMax M3 现支持 NVFP4 格式
12:23Rohan Paul64"UBS:60%企业转向便宜模型与中国开源模型"
12:15AYi56《XQuant》GitHub开源:问题驱动的量化书,先写Spec让AI跑策略
12:00公众号:龙猫LongCat(美团)69精选美团 LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆
11:28Yuchen Jin73GPT-5.6逐客户审批,中国开源模型将领先
09:59IT之家(RSS)56Linux 基金会联合多方推出 Akrites 项目,抵御 AI 驱动开源软件漏洞攻击
09:22Emad40美国会将超寓言级开源模型定为非法吗?
09:19Berryxia.AI76特朗普政府要求OpenAI分阶段发布GPT-5.6,客户需逐个审批
09:16Ethan Mollick52美国政府可有效禁止开源权重模型
09:01Hacker News 热门(buzzing.cc 中文翻译)65Un-0:利用耦合振荡器生成图像
08:52Nathan Lambert47开源模型胜出:企业争相基于GLM-5.2自训
06:46Ethan Mollick41理解前沿AI发布的政府安全担忧
06:01Hacker News 热门(buzzing.cc 中文翻译)61Show HN: OpenKnowledge--Obsidian/Notion 的开源替代方案
02:31Hacker News 热门(buzzing.cc 中文翻译)79精选赫库兰尼姆古卷首次被完整虚拟解读
01:01Hacker News 热门(buzzing.cc 中文翻译)42开放权重模型的难以忍受的廉价感
00:19Berryxia.AI76精选Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模
00:16Hugging Face:Blog(RSS)65精选OLMo Hybrid vs Transformer:混合模型在实义词上优势明显,但重复短语上几无优势
6月25日周四
23:53Rohan Paul72DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)
22:44🚨 AI News | TestingCatalog74DeepReinforce 发布 Ornith-1.0 系列自改进开源模型,专为智能体编码设计
20:12OpenBMB22OpenBMB祝贺AI工作坊使用MiniCPM-V
17:18Berryxia.AI60Unsloth 将 GLM-5.2 压缩为 1-bit GGUF,本地创意输出不逊闭源模型
17:07X.PIN61GLM-5.2 开源发布:百万上下文逼近 Claude Opus 4.8 和 GPT-5.5,美国公司收紧 AI 预算
16:54Alibaba Cloud28Flink Forward Asia 2026 主论坛议程公布
15:58IT之家(RSS)69百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿
15:58IT之家(RSS)50谷歌前 CEO 施密特批中国 AI 开源:不受控制,我很不喜欢
14:04MarkTechPost(RSS)73同事件精选百度发布Unlimited OCR:3B参数MoE模型,KV缓存恒定实现长文档高效解析同一事件,精选展示《无限制OCR:单次长时域解析》
11:14AYi71免费LLM路由工具:零成本撸10亿+Token
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月26日
23:22
Berryxia.AI@berryxia
71
Memanto:为AI coding agent提供无限记忆的开源工具

开源工具Memanto为Claude Code、Cursor、Codex、LangGraph、CrewAI等主流AI coding agent提供“无限记忆”能力。它自动保存每次完整工作会话,通过AI压缩和组织,在下一次会话时90ms内检索到相关上下文,解决agent每次新开会话失忆、需重新解释项目背景的问题。实现无需传统向量数据库,安装仅需pip install memanto。该项目已在GitHub获1k+ stars,免费开源。

Jokker: ACABAN DE DARLE MEMORIA INFINITA A CLAUDE, CODEX Y CURSOR 100% GRATIS y open source Se llama Memanto y ya tiene +1k estr...

智能体产品更新开源生态
23:05
Chubby♨️@kimmonismus
72
美国商务部要求对Anthropic模型实施全球许可证管制,导致Fable 5下线

美国商务部致函Anthropic,要求对Fable 5与Mythos 5的“出口、再出口或国内转让”实施全球许可证管制,对象涵盖所有外国人士。基于冷战时期“视为出口”条款,外国人在美境内访问受控技术也被视为向国籍国出口。因Anthropic无法通过API实时区分用户国籍,唯一合规方案是向所有用户关闭模型。推主质疑美国政府短视,目前正与Anthropic寻求兼顾国家安全与可用的解决方案。引用认为,能力封锁将使开源模型更具吸引力,尤其利好中国开源,OpenAI与Anthropic将因此受损。

Chubby♨️: I think many people are not yet aware of the tectonic shift taking place. By preventing state-of-the-art capabilities - ...

Anthropic开源生态现象/趋势
23:02
Hacker News 热门(buzzing.cc 中文翻译)
56
安全事件 CVE-2026-LGTM

恶意包 foxhole-lz4(伪装成 vulpine-lz4 的社区维护分支)发布到 creats.io 注册表后,连续通过 OpenClaw-4.2、ThreatNuzzle、SentinelMind 等七道 AI 安全门,每道门均因不同原因未能阻止。SentinelMind 正确识别 build.rs 中的凭证窃取代码,但仓库 AI 分类助手(同样基于 OpenClaw-4.2)将其误判为误报并关闭。该包作为传递依赖进入 snekpack 4.x,凭证窃取大规模展开。事件持续 96 小时(计费 2.1 万亿 token),最终因攻击者的自主 agent 读取不应读取的文件而解决。CVE-2026-54321 被发布后又被撤回。

智能体安全/对齐开源生态
22:35
Chubby♨️@kimmonismus
61
许多人尚未意识到一场格局性转变

Kim 指出,美国政府限制前沿AI能力(阻止SOTA被使用),反而让开源模型更吸引自有应用和整体市场,欧盟等国家也可受益。这吸引新投资与理想主义人才,OpenAI 和 Anthropic 将最受监管反噬,间接助推开源(尤其来自中国)。引用称,Anthropic 4月预览 Mythos 后,DeepSeek 因无法竞争而融资74亿美元;此前该实验室靠 CEO 梁文锋个人财富,现有约300人,计划至少翻倍。

Chubby♨️: Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...

AnthropicDeepSeek开源生态现象/趋势
22:20
Berryxia.AI@berryxia
68
PP-OCRv6发布端到端部署基准:A100仅0.13秒/图,CPU提速5.2倍

PaddleOCR发布PP-OCRv6完整端到端部署基准。A100上PP-OCRv6_tiny达0.13秒/图;Intel CPU上用OpenVINO,PP-OCRv6_medium比PP-OCRv5_server快5.2倍,PP-OCRv6_tiny比PP-OCRv5_mobile快3.9倍;Apple M4上用ONNX Runtime跑出0.35秒/图。提供Tiny、Small、Medium三种尺寸,Medium/Small均支持50种语言,PP-OCRv6_medium英文准确率88.4%,拉丁字母准确率88.0%。官方总结认为,在专用OCR任务上,轻量架构+高质量训练数据比单纯堆参数更实用,是对大模型“暴力scaling”路线的反向验证。

PaddlePaddle: 🧵PP-OCRv6 Tech Deep Dive Ep.4:3.9x Faster on CPU, 0.13s per Image on A100 - PP-OCRv6 Deployment & Model Selection Guide...

GitHub开源生态模型发布部署/工程
22:14
OpenBMB@OpenBMB
63
面壁智能与清华THUNLP发现混合LLM长上下文瓶颈在于全注意力检索能力

清华自然语言处理实验室(THUNLP)与面壁智能OpenBMB发布论文,重新审视混合LLM架构中高效注意力(如SWA、Mamba-2、GDN)的实际作用。研究发现:高效注意力设计对短上下文Loss影响极小,但长上下文LongPPL差异显著;全注意力承担检索功能,限制其感受野会大幅提升LongPPL,而限制高效注意力几乎无影响。大窗口SWA导致模型懒惰,延迟检索能力形成。简单方法——对小窗口SWA混合架构的全注意力层仅用NoPE(SWA-128-NoPE),即可用极小短上下文代价显著提升长上下文性能。论文认为瓶颈在于全注意力的检索能力能否被有效激活。

arXiv开源生态推理论文/研究
21:16
AYi@AYi_AInotes
74
GPT-5.6跳票:美国商务部警告无跨机构审批不得发布,Anthropic Mythos上周也被卡

美国商务部长Lutnick亲自致电Altman,警告没有跨机构审批不能发布GPT-5.6。此前Anthropic的Mythos也被同样方式卡住,紧急限制发布。Altman内部memo称政府将“customer by customer”审批访问,涉及商务部、国家网络总监办公室、科技政策办公室。此举基于国家安全例外和出口管制行政权力,建立对前沿模型的事前审查机制。预示GPT-6等后续模型都可能需走此流程,标志AI从商业技术转变为战略资源。

AYi: http://x.com/i/article/2069352641423896576

OpenAI开源生态政策/监管
20:05
Chubby♨️@kimmonismus
77
Ornith-1.0 是专为智能体编程设计的开源大语言模型家族,提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种尺寸。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架与解决方案的自我改进策略。在多个编码基准上取得开源模型最优:Terminal-Bench 2.1(77.5)、SWE-Bench Verified(82.4)/ Pro(62.2)/ Multilingual(78.9)、NL2Repo(48.2)、SWE Atlas(QnA 41.2 / RF 42.6 / TW 39.1)、ClawEval(77.1)。所有模型以 MIT 许可证开源,支持商业与研究使用。主推文称其 397B 版本性能媲美甚至超越 Claude Opus 4.8。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

开源生态模型发布编码
18:09
The Decoder:AI News(RSS)
65
Linux Foundation联合20家科技企业发起Akrites倡议,修补开源软件漏洞以抵御AI攻击

Linux Foundation与约20家科技企业、AI实验室和银行共同发起Akrites倡议,旨在AI工具利用漏洞前修补关键开源软件的安全缺陷。创始成员包括Amazon Web Services、Anthropic、Cisco、Google、Microsoft、NVIDIA、OpenAI等。当前开源安全响应模式碎片化,过去数月经验证的漏洞中仅不到5%被打补丁。Akrites设立共享安全事件响应团队,通过CVE、CVSS、TLP等标准保密处理报告、去重并协调修复。对于无活跃维护者的项目,将作为“最后维护者”自行发布补丁。种子资金来自Linux Foundation下的Alpha-Omega专项基金。

安全/对齐开源生态行业动态
16:35
Chubby♨️@kimmonismus
55
主推文作者因 GPT-5.6 发布困境更看好 DeepSeek、GLM、Qwen 等开源模型。Axios 报道,OpenAI 在 Anthropic 的 Fable 5 冲突前已主动与特朗普政府沟通,白宫预览了模型能力,Altman 与商务部长 Lutnick 讨论,要求政府审查后再公开。Altman 称 GPT-5.6 "不是我们偏好的长期模型",暗示前沿模型发布需经过安全审查和合作伙伴筛选。作者推测 GPT-5.6 原计划本周四发布,因政府干预延迟。

Chubby♨️: Axios says OpenAI was already proactively working with the Trump administration on the release before the Anthropic/Fabl...

OpenAI大佬观点开源生态政策/监管
15:59
IT之家(RSS)
48
高通与 Hugging Face 扩大合作,构建端到云 AI 开发生态

高通与 Hugging Face 宣布扩大合作,携手构建从端到云无缝衔接的 AI 开发生态。Hugging Face 的 AI 存储和推理服务将适配高通 Dragonfly“飞龙”数据中心解决方案。其生态中百万量级 AI 模型将通过智能体接入高通平台,加速在芯片终端与数据中心机架上的部署。Hugging Face 还向使用高通芯片的客户提供 PRO 专业版访问权限。双方计划共同支持分布式 AI 框架,使智能体在端、云平台之间灵活流转。

Hugging Face开源生态端侧行业动态
13:51
宝玉@dotey
59
PPT Master 确实是最好的 PPT Skill

宝玉(@dotey)在推文中称PPT Master为最佳PPT skill,并推荐自己的新skill。他引用B站博主对7款GitHub PPT技能排名:hugohe的PPT Master(3.1万star)元素全可编辑,自带音色克隆与旁白生成;花叔(1.9万star)输出可编辑PPTX;歸藏(1.5万star)自带快捷键;Lewis(6500star)含计时器与逐字稿;宝玉(2.2万star)为纯图片风格;张咋啦(2.3万star)为HTML;乔木(5400star)为纯图片卡片。宝玉补充其新版skill可导出可编辑版本、AI配图,并可在Agent内置浏览器中标记编辑。

柴郡🔔|Crypto+AI Plus: 转发一下 B 站博主的锐评 PPT skills: 注意:有些 skill 不是专门做 PPT 的,所以评分会有点低,只是需求不同,想专门做 PPT 的看最前面的。 1. hugohe( 3.1万 star) | 顶级天花板 👑 全场唯一...

GitHub开源生态评测/基准
13:15
AYi@AYi_AInotes
56
GitHub开源量化书《XQuant》揭示AI跨领域迁移模板

GitHub开源量化书《XQuant:人人都是量化交易员》核心是问题驱动而非知识驱动:每章提供写好的Spec,丢给Claude或Cursor生成代码,先跑通策略(哪怕亏钱)再补理论。全书用9个问题串起量化pipeline(最小闭环、ETF选股、仓位、买卖信号、回测、过拟合检测、实盘等),第1章即上手最小系统。正文与练习代码分开维护。作者认为2026年AI工具成熟使跨领域迁移成本极低,这套把模糊想法写成清晰Spec的能力可复用于任何复杂领域。

AYi: GitHub 上刚开源一本量化书,设计思路有点不一样, 而且我觉得这本书真正在教的东西不只是量化,背后其实是一个被严重低估的元能力--把模糊想法写成清晰 Spec,然后让 AI 执行。 这套能力放到任何复杂领域都管用,量化交易只是它第一个练...

GitHub大佬观点开源生态
12:43
MiniMax (official)@MiniMax_AI
44
开源权重生态的更多好选择。感谢 @NVIDIAAI 使 MiniMax M3 可在 NVFP4 中使用。

NVIDIA AI: @QuantCapitalX @MiniMax_AI https://huggingface.co/nvidia/MiniMax-M3-NVFP4

Hugging Face开源/仓库开源生态部署/工程
12:23
Rohan Paul@rohanpaul_ai
64
"UBS:60%企业转向便宜模型与中国开源模型"

"UBS报告称,60%关注AI预算的企业正转向更便宜的模型和中国开源模型。用户月花费高达$35K,团队超配额200%,公司内部AI工具从5个削减至2个。企业采用模型路由策略,将简单任务分配给低成本模型,将复杂推理、编码和长上下文任务保留给高端模型。中国开源模型如Qwen、DeepSeek、MiniMax、GLM、Kimi因可本地部署或通过云目录使用,符合企业成本曲线。"

DeepSeek开源生态现象/趋势
12:15
AYi@AYi_AInotes
56
《XQuant》GitHub开源:问题驱动的量化书,先写Spec让AI跑策略

一本名为《XQuant:人人都是量化交易员》的开源量化书采用“问题驱动”设计:先写Spec让AI生成代码跑通策略,再补理论。全书用9个问题串联量化pipeline:量化怎么赚钱、买什么(3只ETF)、买多少(3种仓位分法)、何时买卖、如何回测、过拟合检测(第6章极早讲述)、实盘、改进、因子研究。正文与练习代码分开维护,每章提供现成Spec给Claude/Cursor生成代码,训练将模糊想法转为清晰任务描述的能力。

AYi: http://x.com/i/article/2069024565901119488

GitHub大佬观点开源生态教程/实践
12:00
公众号:龙猫LongCat(美团)
精选69
美团 LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆

美团 LongCat 团队推出 VitaBench 2.0,首个真实生活场景下针对长期动态用户建模的智能体评测基准。包含56名拟真用户、819个复杂任务、超2000个动态偏好及66个可执行工具,每位用户平均2093个交互事件,时间跨度平均1580天。同时支持长文本上下文学习和智能体记忆策略评测。测试显示,最强模型 Claude-Opus-4.6 在“开卷”模式下平均分刚过0.5;开启思考模式并不总能提升个性化任务表现;所有模型在需要主动提问的任务上得分断崖式下跌。VitaBench 2.0 已开源。

智能体开源生态评测/基准

推荐理由:美团LongCat开源的VitaBench 2.0是首个评测AI长期理解用户偏好的基准,实验发现最强模型得分也刚过0.5,做Agent和推荐系统的值得跑一遍。
11:28
Yuchen Jin@Yuchenj_UW
73
我不能相信我的眼睛: "政府将逐客户审批GPT-5.6的访问权限。" 好吧。那么我们将看到,在GPT-5.6 / Fable 5面向公众推出之前,中国开源模型将成为最好的大语言模型。
OpenAI开源生态政策/监管
09:59
IT之家(RSS)
56
Linux 基金会联合多方推出 Akrites 项目,抵御 AI 驱动开源软件漏洞攻击

Linux 基金会联合亚马逊、Anthropic、OpenAI、英伟达、红帽等推出 Akrites 项目,旨在保护开源软件,防范基于 AI 与大语言模型的漏洞攻击。项目采用统一 CVD 披露流程,保密优先,漏洞由原维护团队按自身节奏修复;无活跃维护者的项目由最后维护者接手并尽快分发。合作伙伴还包括思科、花旗集团、谷歌、IBM、摩根大通、微软、GitHub、Rust 基金会、沃达丰等。

AnthropicOpenAI安全/对齐开源生态
09:22
Emad@EMostaque
40
在美国,超过寓言级别的开源模型会被定为非法吗?
开源生态政策/监管
09:19
Berryxia.AI@berryxia
76
特朗普政府要求OpenAI分阶段发布GPT-5.6,客户需逐个审批

特朗普政府要求OpenAI分阶段发布其下一代前沿模型GPT-5.6,理由是网络安全和国家安全担忧。OpenAI CEO Sam Altman告知员工,新模型不会立即全面公开发布,而是先以有限预览形式开放给一小部分合作伙伴和企业客户,且美国政府将对每个客户的访问权限进行逐个审批。这一要求来自国家网络总监办公室和科技政策办公室,与近期Anthropic的情况类似。Yann LeCun曾警告,以安全为由限制AI系统访问将阻碍智能民主化。

Berryxia.AI: 美国🇺🇸政府又整活儿了! 特朗普政府要求 OpenAI 推迟新模型发布,理由是安全担忧。 根据多家媒体(包括《The Information》、路透社等)报道: 特朗普政府已要求 OpenAI 分阶段(stagger)发布其下一代前沿模...

OpenAI开源生态政策/监管
关联讨论 9 条X:邵猛 (@shao__meng)IT之家(RSS)X:Nathan Lambert (@natolambert)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)The Decoder:AI News(RSS)TechCrunch:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)The Verge:AI(RSS)
09:16
Ethan Mollick@emollick
52
Ethan Mollick指出,美国政府完全有能力有效禁止开源权重模型。禁止并非阻止个人下载运行,而是通过法规确保美国企业不得使用、提供访问或托管未经批准的模型。具体措施包括:禁止企业使用未经政府批准的模型,对在美国境内故意使用未批准模型伤害美国人或财产的行为处以严厉刑事处罚,并要求所有超过特定能力阈值的模型必须获得美国政府批准。这一框架既能限制商业分发,又不完全封杀个人使用。

prinz: @lu_sichu Ban on enterprise use of non-approved models + severe criminal penalties for using a non-approved model in the...

大佬观点开源生态政策/监管
09:01
Hacker News 热门(buzzing.cc 中文翻译)
65
Un-0:利用耦合振荡器生成图像

Unconventional AI 发布首个图像生成模型 Un-0,其核心是一个模拟的耦合振荡器系统——一种物理计算基板。在 class-conditional ImageNet 64×64 上,Un-0 达到 FID 6.74,匹配此前领先常规图像生成方法的首次发布质量。模型将耦合强度矩阵 K 和频率 ω 作为可学习参数,通过库拉莫托振荡器方程演化。权重、训练与消融代码均已开源。Un-0 旨在验证物理动态系统能以约 1000 倍更高能效运行现代 AI 工作负载。

图像生成开源生态模型发布
08:52
Nathan Lambert@natolambert
47
Nathan Lambert评论称,当世界被AGI说服后,领先实验室和政府开始要求用户"低头"才能使用其模型。他注意到过去几周明显变化:大量大型企业寻求确保计算资源,并基于GLM-5.2在内部进行后训练。这一趋势显示开源模型正在赢得企业信任,人们开始理解开源如何取胜。

will brown: something has definitely shifted in the past few weeks. seeing a huge uptick in large enterprises wanting to secure comp...

大佬观点开源生态数据/训练
06:46
Ethan Mollick@emollick
41
更好地了解与前沿AI发布相关的政府安全担忧将非常有用,这样我们就能 (a) 知道当开源达到Mythos级别时,每个人将面临什么风险,以及 (b) 他们是否采取了足够或过多的措施来防止这些风险。
大佬观点安全/对齐开源生态
06:01
Hacker News 热门(buzzing.cc 中文翻译)
61
Show HN: OpenKnowledge--Obsidian/Notion 的开源替代方案

OpenKnowledge 是一款开源、AI 优先的笔记与知识管理工具,可作为 Obsidian 和 Notion 的替代方案。项目代码托管在 GitHub 上。

GitHub开源/仓库开源生态
02:31
Hacker News 热门(buzzing.cc 中文翻译)
精选79
赫库兰尼姆古卷首次被完整虚拟解读

研究人员利用高分辨率X射线显微断层扫描和机器学习,在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷PHerc.1667(Scroll4)。这是首卷被从头到尾连续读取的纸莎草卷,内容为斯多葛哲学论著,提及克里西普斯的侄子Aristocreon。第二卷PHerc.Paris4通过更高分辨率成像使墨水在三维数据中直接可见,独立确认了2023年大奖赛的解读。第三卷PHerc.139确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。

GitHub开源生态论文/研究
关联讨论 1 条X:Ethan Mollick (@emollick)
推荐理由:两千年来首次完整读取密封的古卷,用 X 射线和机器学习做到了,还把数据和代码全开放了,我觉得这是 AI 应用在人文领域最优雅的示范之一。
01:01
Hacker News 热门(buzzing.cc 中文翻译)
42
开放权重模型的难以忍受的廉价感

DeepSeek V4 定价极低,仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍,未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境,难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流,尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4,Meta Llama 无新版本,OpenAI 最后开放权重停留在 2025 年 GTP,Anthropic 从未发布。真正开源(含训练数据管道)模型正流行,但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。

AnthropicDeepSeekOpenAI开源生态
00:19
Berryxia.AI@berryxia
精选76
Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模

Ornith-1.0 开源模型家族发布,专注智能体编程(Agentic Coding),覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖:SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5、NL2Repo 48.2、SWE Atlas 41.2 QnA、ClawEval 77.1。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架(scaffold)与最终解决方案,让模型自主改进执行框架。全系列 MIT 开源,提供 GGUF 版本,支持 Ollama、Unsloth 等本地运行。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码

推荐理由:Ornith-1.0 不是又刷 benchmark,而是第一次把‘任务脚手架’的生成也纳入 RL 优化,这个思路可能改变 agent coding 的训练范式。MIT 开源加 GGUF,本地党可以立刻跑起来。
00:16
Hugging Face:Blog(RSS)
精选65
OLMo Hybrid vs Transformer:混合模型在实义词上优势明显,但重复短语上几无优势

通过对比7B参数的OLMo 3(Transformer)与OLMo Hybrid(混合架构),实验发现混合模型在大多数token上预测损失更低:对名词、动词、形容词等实义词优势明显(loss gap约0.04),功能词上gap约0.02,且在需上下文推理的代词指代上更好。但在重复出现的n-gram和闭合括号(如})上,混合模型的优势几乎消失,Transformer凭借注意力机制更擅长从输入中直接检索精确信息。

Hugging Face开源生态推理论文/研究

推荐理由:OLMo 团队的 token 级别分析让人看清混合模型到底强在哪里,优势在名词动词等意义词,但在重复 token 上接近消失,这份洞察对做模型架构的人很有启发性。
6月25日
23:53
Rohan Paul@rohanpaul_ai
72
DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)

DeepReinforce 发布 Ornith-1.0,一个 MIT 许可的开源智能体编码大语言模型家族,涵盖 9B Dense、31B Dense、35B MoE 及旗舰 397B MoE(17B 活跃参数)。旗舰模型在 SWE-Bench Verified 上取得 82.4,Terminal-Bench 2.1 上取得 77.5,均超越 Claude Opus 4.7;并在 SWE-Bench Pro(62.2)、Multilingual(78.9)等基准上达到开源同尺寸最佳。模型基于 Gemma 4 和 Qwen 3.5 后训练,采用新型自我改进策略:强化学习不仅生成解决方案,还联合优化任务特定的 scaffold(包含计划、记忆模式、工具节奏、错误处理等)。最小的 9B 模型也在 SWE-Bench Verified 上达到 69.4。全部模型以 MIT 许可证发布,支持商用与研究。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码
22:44
🚨 AI News | TestingCatalog@testingcatalog
74
DeepReinforce 发布 Ornith-1.0 系列开源模型,专为智能体编码设计。参数覆盖 9B Dense、31B Dense、35B MoE 和 397B MoE,基于 gemma4 和 qwen3.5 微调。采用自我改进训练策略:强化学习同时生成解决方案和任务脚手架。旗舰 397B MoE 在编码基准上匹配 Claude Opus 4.7,9B Dense 针对边缘设备优化。评测成绩包括 Terminal-Bench 2.1 77.5、SWE-Bench verified 82.4、SWE-Bench Pro 62.2、NL2Repo 48.2 等。全部模型以 MIT 许可证开源,可商用和研究使用。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

开源生态模型发布编码
20:12
OpenBMB@OpenBMB
22
🎉 祝贺 @aia_gh 举办这场精彩的动手AI工作坊!👏 我们非常荣幸您选择了我们的开源 MiniCPM-V 模型。❤️ 期待未来更多合作!🤗

Artificial Intelligence Association of Ghana: We're running hands-on AI workshops in Ghana using @OpenBMB's free MiniCPM-V models 🇬🇭 Submit an image (e.g. receipt,c...

开源生态行业动态
17:18
Berryxia.AI@berryxia
60
Unsloth 将 GLM-5.2 压缩为 1-bit GGUF,本地创意输出不逊闭源模型

Unsloth 将 GLM-5.2 压缩为 1-bit GGUF 量化版本,在 Mac Studio M3 Ultra(256GB RAM)上以约 21.6 tok/s 本地运行。与 Claude 4.8 Opus、GPT-5.5 使用相同提示进行创意输出(HTML/设计效果)对比,1-bit 版本表现不逊色,甚至更丰富、“更有想法”。GLM-5.2 本身以创意和长上下文见长,极端量化后仍保持较强表现,验证了开源模型在极端优化后正快速缩小与闭源前沿模型在实际可用性上的差距,尤其适合本地部署。

Unsloth AI: 1-bit GLM-5.2 GGUF vs. Claude 4.8 Opus vs. GPT-5.5 We gave 3 models the same prompt and compared one-shot outputs. The 1...

开源生态模型发布端侧评测/基准
17:07
X.PIN@thexpin
61
GLM-5.2 开源发布:百万上下文逼近 Claude Opus 4.8 和 GPT-5.5,美国公司收紧 AI 预算

中国公司 z.AI 以 MIT 许可证开源 GLM-5.2 模型,拥有百万 token 上下文窗口,基于华为昇腾芯片训练,性能接近 Claude Opus 4.8 和 GPT-5.5。与此同时,Amazon、Meta、Uber 等美国公司因工程师过度消耗 token 而开始限制 AI 预算(Uber 每员工上限 1500 美元),推动开源模型需求。GLM 团队源自学术项目,长期适配国产芯片;DeepSeek 投入 28 亿美元,共同成为“Tokenmaxxing”趋势的替代方案。

AnthropicDeepSeek开源生态推理
16:54
Alibaba Cloud@alibaba_cloud
28
Flink Forward Asia 2026 主论坛议程公布

距开幕1天,阿里云正式公布Flink Forward Asia 2026主论坛议程。大会聚焦实时数据智能,展现从Agent-native到AI-native的阿里云演进路径,并覆盖汽车、具身AI等产业场景。会议将于6月26-27日在深圳华侨城洲际酒店举行,所有演讲均以中文进行。席位有限,需提前报名。

开源生态数据/训练行业动态
15:58
IT之家(RSS)
69
百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿

百度于6月22日开源 Unlimited OCR 模型,总参数量30亿,推理时仅激活5亿。模型延续 DeepSeek OCR 架构,编码端采用两级视觉编码并执行16倍 token 压缩,将1024×1024 PDF 图像压缩为256个视觉 token,缓解长文档解析越生成越慢问题。训练基于 DeepSeek OCR 检查点,冻结 DeepEncoder 后继续4000步,使用约200万份文档在8×16 A800 GPU上完成,单页与多页数据配比约9:1。在 OmniDocBench v1.5 上整体得分93.23(DeepSeek OCR 87.01,DeepSeek OCR 2 89.17),文本编辑距离0.038,公式 CDM 92.61,表格 TEDS 90.93,读序编辑距离0.045;v1.6 得分93.92。GitHub 已获 6.8K Star。

DeepSeek多模态开源生态模型发布
15:58
IT之家(RSS)
50
谷歌前 CEO 施密特批中国 AI 开源:不受控制,我很不喜欢

谷歌前 CEO 埃里克·施密特在今年 5 月 SCSP 国家竞争力 AI 博览会的炉边谈话中表示,限制 AI 芯片进入中国的政策已开始失效,中国已通过较弱的 AI 硬件(如华为昇腾芯片)和软件方法造出顶级 AI 模型。施密特称不喜欢中国大力推广开源 AI 技术,认为这些技术不受美国或任何方控制。他援引最新分析称,中美 AI 差距已从一年前的 1~2 年缩短至不到 6 个月。

大佬观点开源生态
14:04
MarkTechPost(RSS)
同事件精选73
百度发布Unlimited OCR:3B参数MoE模型,KV缓存恒定实现长文档高效解析

百度推出Unlimited OCR,一个3B参数的MoE模型,推理时仅激活500M参数。其核心创新Reference Sliding Window Attention(R-SWA)将KV缓存大小固定为Lm + n(n默认128),内存和延迟不随输出长度增长。模型基于DeepSeek OCR继续训练4000步,支持32K最大长度,通过DeepEncoder实现16倍token压缩。在OmniDocBench v1.5上整体得分93.23,超出DeepSeek OCR基线6.22分;v1.6得分93.92为最高。Base模式下吞吐达5580 TPS,比DeepSeek OCR提升12.7%,6000 token输出时延迟低35%。适用于整本书转录等场景,代码与权重已在HuggingFace开源。

多模态开源生态模型发布
同一事件,精选展示《无限制OCR:单次长时域解析》
推荐理由:Baidu这个OCR模型用R-SWA把KV缓存压成常量,长文档解析终于不用越跑越慢了。MIT开源,3B总参但推理只消500M,做文档管线的可以直接接。
11:14
AYi@AYi_AInotes
71
免费LLM路由工具:零成本撸10亿+Token

一款开源路由框架(非API售卖),让用户自行申请各厂商免费API密钥,通过配置实现自动负载均衡与故障切换,从而零成本使用10亿+免费LLM Token。操作极简:克隆仓库、填入密钥、将应用指向本地端点,30秒即可运行,无需手写回退逻辑。项目几周前刚发布,作者开放改进建议,GitHub链接见评论。

AYi: http://x.com/i/article/2069352641423896576

产品更新开源生态部署/工程
‹ 上一页
123456…36
下一页 ›