AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 641 条
全部一手资讯X论文
标签「开源生态」清除
今天7月3日 周五
06:21Simon Willison 博客66llm-coding-agent 0.1a0
7月2日周四
22:57Artificial Intelligence News(RSS)48Anthropic 推出 Claude Science 公开测试版,集成 NVIDIA BioNeMo 加速科学研究
21:14Hacker News 热门(buzzing.cc 中文翻译)57"定理经济"的衰落
16:40Hacker News 热门(buzzing.cc 中文翻译)71精选Kimi K2.7 Code 已在 GitHub Copilot 上正式发布
10:03IT之家(RSS)61葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA
05:34MarkTechPost(RSS)69使用 Lift 将研究 PDF 转换为结构化 JSON:受控的、模式引导的字段级评估
7月1日周三
22:32TechCrunch:AI(RSS)67Venice AI 完成 6500 万美元 A 轮融资,估值 10 亿美元
18:08Hacker News 热门(buzzing.cc 中文翻译)61Godot 将不再接受由 AI 编写的代码贡献
18:03IT之家(RSS)59瑞银:约六成企业收紧 AI 开支,DeepSeek 等开源大模型有望受益
17:10公众号:卡尔的AI沃茨71实测美团LongCat-2.0,国产芯片长出来的万亿大模型
16:32MarkTechPost(RSS)73精选NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型
16:03IT之家(RSS)56Godot 基金会修改贡献指南,禁止 AI 直接生成代码与 AI 智能体 PR
16:02MarkTechPost(RSS)69Google Research 推出 TabFM:面向表格数据的零样本分类与回归基座模型
12:00公众号:龙猫LongCat(美团)82精选美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型
07:08Ethan Mollick:One Useful Thing(RSS)73聊天机器人的黄昏
05:59TechCrunch:AI(RSS)65OpenClaw 正式登陆 Android 和 iOS
6月30日周二
16:38The Decoder:AI News(RSS)67Deepseek发布DSpark推理框架,AI响应速度最高提升85%
16:30MarkTechPost(RSS)55Meta AI 发布 Brain2Qwerty v2:非侵入式 MEG 脑到文本解码管线
15:37Hacker News 热门(buzzing.cc 中文翻译)77LongCat-2.0 开源:1.6T 总参数、48B 活跃参数的 MoE 模型
13:02IT之家(RSS)48920 亿参数,华为 openPangu-2.0-Flash 模型正式开源上线
12:26HuggingFace Daily Papers(社区热门论文)46DreamForge-World 0.1 Preview:低算力实时可控世界模型预览版
11:36Hacker News 热门(buzzing.cc 中文翻译)53hyperscript 解析bug修复:AI分析高效但修复方案欠佳
11:02IT之家(RSS)76美团发布万亿参数大模型 LongCat-2.0,五万卡国产算力训练并开源
10:02IT之家(RSS)52入职仅一年,消息称 AI 大牛贾扬清已从英伟达离职
09:50公众号:卡尔的AI沃茨70精选AI News Radar 大更新:新增自媒体板块,支持订阅多平台账号
07:59MarkTechPost(RSS)53OpenClaw 发布 iOS 和 Android 配套节点应用,手机变身自托管 AI 智能体网关的"外设"
05:35Hacker News 热门(buzzing.cc 中文翻译)61Ornith-1.0:用于代理编码的自改进开源模型
02:35Hacker News 热门(buzzing.cc 中文翻译)75精选Qwen 3.6 27B 是本地开发的理想选择
6月29日周一
18:01IT之家(RSS)53DeepSeek V4 正式版 7 月中旬上线,API 引入峰谷定价
14:34Hacker News 热门(buzzing.cc 中文翻译)53HackerRank 将其 ATS 开源,评分不稳定引发争议
09:01IT之家(RSS)57我国开源生态版图扩容,新增人工智能与具身智能等7项目
05:33Hacker News 热门(buzzing.cc 中文翻译)57GLM 5.2 在 IDOR 检测中超越 Claude Code
01:26Nathan Lambert:Interconnects(RSS)60精选Artifacts 22:Zyphra、Cohere 和 Poolside 正在扩展生态系统广度
6月28日周日
16:10The Decoder:AI News(RSS)70精选新浪开源VibeThinker-3B:推理可压缩,事实知识不能
08:00IT之家(RSS)30DeepSeek成美国企业AI账单失控下的"香饽饽",阿里千问输入法macOS版上线
00:03Hacker News 热门(buzzing.cc 中文翻译)81精选一次失败的(民族国家?)攻击的剖析
6月27日周六
18:41OpenRouter:Announcements(RSS)502026年6月值得关注的开放权重模型
18:32Hacker News 热门(buzzing.cc 中文翻译)51DeepSeek 开源推理优化方案 DeepSpec,生成速度提升 60% 至 85%
17:06MarkTechPost(RSS)63Meta 开源 Astryx(Beta):基于 React 和 StyleX 的 AI 就绪设计系统
16:59IT之家(RSS)70精选AI 账单失控后 DeepSeek 成"香饽饽",部分美国企业已 100% 切换
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
06:21
Simon Willison 博客
66
llm-coding-agent 0.1a0

Simon Willison 发布实验性库 llm-coding-agent 0.1a0,基于其 LLM 库演化为智能体框架,实现类似 Claude Code 的编码智能体。可通过 uvx --prerelease=allow --with llm-coding-agent llm code 运行,并提供基于 CodingAgent 类的 Python API。内置六种工具:edit_file(精确替换字符串并返回 diff)、execute_command(执行命令,超时 600 秒)、list_files(按 glob 列出文件,排除隐藏目录和 .gitignore 覆盖项)、read_file(分页读取,offset/limit 控制)、search_files(正则搜索,最多 100 条结果)、write_file(创建或覆盖文件,自动创建父目录)。已作为 slop-alpha 发布到 PyPI,支持 --yolo 等 recipe 参数。

智能体GitHub产品更新开源生态
7月2日
22:57
Artificial Intelligence News(RSS)
48
Anthropic 推出 Claude Science 公开测试版,集成 NVIDIA BioNeMo 加速科学研究

Anthropic 推出面向科学研究的 AI 工作台 Claude Science 公开测试版,科学家可通过自然语言与数字智能体交互执行端到端研究流程。该平台原生集成 NVIDIA BioNeMo Agent Toolkit,将 GPU 加速计算资源封装为可调用的技能模块。全球前 20 大制药公司中已有 18 家生产部署 BioNeMo。基因组分析工具 Parabricks 将处理时间从数小时压缩至数分钟;RAPIDS-singlecell 将 130 万细胞预处理和聚类工作流从 52 分钟缩短至 25 秒;nvMolKit 加速分子相似性搜索和构象生成最高达 3,000 倍。系统还提供 Evo 2、Boltz-2、OpenFold3 等加速开放模型。

Anthropic开源生态行业动态部署/工程
21:14
Hacker News 热门(buzzing.cc 中文翻译)
57
"定理经济"的衰落

数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。

DeepMindOpenAI大佬观点开源生态
16:40
Hacker News 热门(buzzing.cc 中文翻译)
精选71
Kimi K2.7 Code 已在 GitHub Copilot 上正式发布

Kimi K2.7 Code 开源权重模型已在 GitHub Copilot 中正式可用,成为 Copilot 模型选择器首个可选的开源权重模型,为编程工作流提供更低成本选择。该模型由 GitHub 托管于 Microsoft Azure,按供应商列表价格以用量计费。逐步向 Copilot Pro、Pro+ 和 Max 计划用户推送,用户可在 Visual Studio Code 1.127.0 或更新版本、Visual Studio 17.14.6 或更新版本、JetBrains 1.9.1-251 或更新版本、Xcode、Eclipse 等 IDE 及 Copilot CLI、GitHub.com、GitHub Mobile 等平台中选用。后续几周将扩展至 Copilot Business 和 Enterprise,当前默认关闭,需管理员在 Copilot 设置中启用策略。

GitHub产品更新开源生态编码

推荐理由:GitHub Copilot 首次把开源权重模型放进模型选择器,Kimi K2.7 Code 作为低价选项可能会改变很多开发者的使用习惯,对个人开发者尤其友好。
10:03
IT之家(RSS)
61
葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA

葡萄牙政府7月1日宣布开源大语言模型AMALIA正式发布,这是首个基于欧洲葡萄牙语开发的模型。由60余位研究人员历时18个月开发,先期投资550万欧元,使用了Deucalion、MareNostrum 5等算力基础设施。第一阶段利用约4万亿个葡语单词训练出9B规模模型,后续多模态升级后具备理解文本、图像、声音的能力。今年内还将新增22B版本并获得智能体能力,需追加150万欧元投资。

开源生态模型发布
05:34
MarkTechPost(RSS)
69
使用 Lift 将研究 PDF 转换为结构化 JSON:受控的、模式引导的字段级评估

Lift 是一个 PDF 到结构化数据的提取工具,本教程构建了完整的受控评估工作流。通过 4-bit NF4 量化,约 10B 参数模型可在 16 GB GPU(如 T4/L4)上运行。教程生成含干扰项的合成多页研究论文,测试模型在真实文档布局中恢复标题、作者、数据集、指标、超参数、局限性和仓库链接的能力,并输出结构化 JSON,实现模式引导的字段级评估。

开源生态教程/实践数据/训练
7月1日
22:32
TechCrunch:AI(RSS)
67
Venice AI 完成 6500 万美元 A 轮融资,估值 10 亿美元

Venice AI 获得由 Dragonfly 领投、Coinbase Ventures 等参投的 6500 万美元 A 轮融资,估值 10 亿美元。该平台提供 200 余个 AI 模型,注重隐私:用户输入加密且不存储数据,部分模型支持端到端加密(需付费订阅)。目前拥有 85 万独立访问用户、300 万活跃用户,日均 170 万次 API 调用,年化收入超 7000 万美元,已实现盈利。公司发行了 VVV 和 DIEM 两种加密代币,约 8% 用户使用加密支付。融资将用于购买 GPU 并自建数据中心。

开源生态行业动态
18:08
Hacker News 热门(buzzing.cc 中文翻译)
61
Godot 将不再接受由 AI 编写的代码贡献

开源游戏引擎 Godot 正式更新贡献指南,明确禁止 AI 编写的代码、由 AI 智能体提交的拉取请求,以及人工交流中出现的 AI 生成文本(机器翻译除外)。Godot 基金会表示,大量低质量 AI 生成 PR 正“日益消耗和打击”维护者积极性,而 AI 无法承担代码责任,长期难以将代码审查转化为对新贡献者的指导。新政策旨在为低质量内容设置障碍,同时要求所有贡献来自能对其代码负责的人类,并在代码出现问题时自行修复。

开源生态行业动态
18:03
IT之家(RSS)
59
瑞银:约六成企业收紧 AI 开支,DeepSeek 等开源大模型有望受益

瑞银分析师调研十余家企业IT负责人后发现,约六成企业已出台管控措施收紧AI开支。token调用成本是核心顾虑,Uber运营总监坦言AI投入回报微薄。DeepSeek等开源模型与中国本土大模型有望受益,尤其适合非代码类业务。短期内OpenAI、Anthropic等闭源厂商承压最大。谷歌推出Gemini 3.5 Flash,Anthropic发布Claude Sonnet 5以降低成本。瑞银称这一趋势为“良性调整阵痛”,无企业彻底叫停AI落地。

DeepSeek开源生态现象/趋势
17:10
公众号:卡尔的AI沃茨
71
实测美团LongCat-2.0,国产芯片长出来的万亿大模型

美团发布LongCat-2.0,总参数1.6万亿、每个token仅激活约480亿参数的MoE模型,从预训练到大规模部署全程运行在5万张国产算力芯片上,训练消耗超35万亿tokens,无回滚、无不可恢复loss突刺。Agent场景表现突出:在Terminal-Bench 2.1和SWE-bench Pro编程任务上追平Gemini 3.1 Pro,FORTE通用Agent任务与Claude Opus 4.6持平。最大输出128K,最高提供1M上下文,采用LSA稀疏注意力机制和N-gram Embedding优化长上下文与工具调用。已开放API接入,支持OpenAI Compatible和Anthropic API生态,可直接接入Claude Code和Codex等工作流。

智能体开源生态编码评测/基准
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)
16:32
MarkTechPost(RSS)
精选73
NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA 发布 Nemotron-Labs-TwoTower,基于冻结的自回归骨干 Nemotron-3-Nano-30B-A3B 的扩散语言模型。采用双塔架构:上下文塔冻结,降噪器塔训练,通过层对齐交叉注意力和状态播种协作。在 2×H100 上 BF16 评估,保留 98.7% 的 AR 基线质量,生成吞吐量提升 2.42 倍(γ=0.8,块大小 S=16)。降噪器在约 2.1T token 上训练,骨干使用 25T token 预训练。总参数约 60B,每 token 活跃参数约 3B/塔。支持扩散、模拟 AR 和 AR 三种解码模式。

开源生态推理模型发布部署/工程

推荐理由:NVIDIA这个TwoTower把扩散解码接在已有的AR骨干上,几乎无损质量却让吞吐翻倍,并且开源可商用,对批量文本生成的团队是实在的加速工具。
16:03
IT之家(RSS)
56
Godot 基金会修改贡献指南,禁止 AI 直接生成代码与 AI 智能体 PR

Godot 基金会正式修改贡献指南,禁止开发者提交 AI 直接生成的代码、AI 智能体发起的 Pull Request,以及沟通过程中使用 AI 翻译器生成的文本。理由是近几个月“AI slop”问题持续消耗维护者精力、打击审查者积极性。新规允许 AI 用于“机械性的小任务”,但必须主动披露使用情况。所有贡献必须由能对代码负责的人类提交,并在出现问题时承担修复责任。目前基金会表示将采取保守态度,未来政策可能随技术发展重新评估。

开源生态行业动态
16:02
MarkTechPost(RSS)
69
Google Research 推出 TabFM:面向表格数据的零样本分类与回归基座模型

Google Research 发布 TabFM v1.0.0,一种面向表格数据的零样本基座模型,无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示,通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准(38 个分类、13 个回归数据集,样本量 700 至 15 万)上,TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub,Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。

Google开源生态数据/训练模型发布
12:00
公众号:龙猫LongCat(美团)
精选82
美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型

美团于6月30日发布新一代万亿参数大模型LongCat-2.0并开源。总参数1.6T,平均激活约48B,原生支持1M超长上下文,在五万卡国产算力集群上完成全流程训练与推理。采用LSA稀疏注意力、零计算专家、ScMoE及MOPD多专家融合(Agent/Reasoning/Interaction三组专家)架构。评测中SWE-bench Pro获59.5,SWE-bench Multilingual获77.3。预览版已通过OpenRouter和longcat.ai开放,月调用量跻身OpenRouter全球前三。

开源生态推理模型发布编码
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)
推荐理由:国产算力上首个全流程自训的万亿开源模型,1M上下文和动态专家架构直指Agentic Coding场景,OpenRouter调用量已经冲到前三,不是Demo是生产力。
07:08
Ethan Mollick:One Useful Thing(RSS)
73
聊天机器人的黄昏

前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体AnthropicOpenAI大佬观点
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
05:59
TechCrunch:AI(RSS)
65
OpenClaw 正式登陆 Android 和 iOS

免费开源 AI 智能体 OpenClaw 现已推出 iOS 和 Android 应用。用户通过 OpenClaw Gateway 将手机与智能体及所需工具、技能连接,可在移动端运行智能体完成编程、餐食规划等任务。OpenClaw 今年早些时候因 MoltBook(号称完全由智能体运营的社交媒体站)走红,其创建者 Peter Steinberger 随后加入 OpenAI。尽管 MoltBook 后被证实部分由人类伪装智能体运行,但此事件推动了智能体生态扩张,如今 AI 智能体已嵌入更多场景,包括手机端。

智能体产品更新开源生态
6月30日
16:38
The Decoder:AI News(RSS)
67
Deepseek发布DSpark推理框架,AI响应速度最高提升85%

Deepseek推出DSpark推理框架,采用推测解码技术,由小模型生成候选答案、大模型批量验证,并一次生成多个token而非单个,使每用户响应速度提升60–85%。系统基于置信度动态调整验证深度,减少无效计算。DSpark与Deepseek-V4-Pro模型(与北京大学联合开发)已在HuggingFace和GitHub以MIT许可证开源。高效推理降低对高端芯片需求,有助于中国与欧盟在芯片受限下获取更多AI性能,短期构成战略优势。

DeepSeek开源/仓库开源生态推理
16:30
MarkTechPost(RSS)
55
Meta AI 发布 Brain2Qwerty v2:非侵入式 MEG 脑到文本解码管线

Meta AI 近日发布 Brain2Qwerty v2,一种基于非侵入式脑磁图(MEG)信号的实时脑到文本解码管线,无需植入或手术。系统在 9 名志愿者约 22,000 句打字数据上训练(每人 10 小时),平均词准确率 61%(WER 39%),最高参与者达 78%,超过半数句子错误不超过一个词。管线由卷积编码器、Transformer 和字符级语言模型组成,并微调大语言模型提取语义表征,用 AI 智能体自动化改进解码流程但最终配置由人工选定。Meta 同时以 CC BY-NC 4.0 协议开源 v1 和 v2 训练代码。

Meta开源生态数据/训练模型发布
15:37
Hacker News 热门(buzzing.cc 中文翻译)
77
LongCat-2.0 开源:1.6T 总参数、48B 活跃参数的 MoE 模型

LongCat-2.0 正式开源,总参数 1.6 万亿,每 token 激活约 480 亿参数,采用 MoE 架构。新引入 LongCat Sparse Attention(LSA)和 N-gram Embedding 模块,支持百万级上下文窗口。模型在 5 万+ AI ASIC 上训练,消耗超 35 万亿 tokens,训练全程无回滚。在编码和智能体任务上表现优异,深度集成 Claude Code 等工具。提供 GitHub、HuggingFace 及 API 访问。

智能体开源生态推理模型发布
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)
13:02
IT之家(RSS)
48
920 亿参数,华为 openPangu-2.0-Flash 模型正式开源上线

华为 openPangu-2.0-Flash 模型(总参数量 92B,激活参数量 6B)于 6 月 30 日正式开源上线,支持 512K 上下文。该模型为 openPangu 2.0 系列的两个版本之一,另一版本 Pro(505B 总参数,18B 激活参数)计划 7 月开源。openPangu 2.0 将从 6 月 30 日起陆续开源 7 大组件,包括模型权重、基础推理代码、训推算子等。

开源/仓库开源生态模型发布
12:26
HuggingFace Daily Papers(社区热门论文)
46
DreamForge-World 0.1 Preview:低算力实时可控世界模型预览版

DreamForge-World 0.1 Preview 是一款低算力实时交互世界模型预览版,基于 LongLive 1 自回归视频栈(源自 Wan2.1-T2V-1.3B)和 Matrix-Game 系列的残差动作路径。支持实时键盘鼠标控制、多模态初始化、中流重提示及双视角操作。在单张 RTX 4090 上以原生 480p 分辨率达到 14-15 FPS,内存占用低,展示了在消费级 GPU 上实现实时可控世界模型预览的低算力路线。

开源生态视频论文/研究
11:36
Hacker News 热门(buzzing.cc 中文翻译)
53
hyperscript 解析bug修复:AI分析高效但修复方案欠佳

hyperscript 0.9.91版本出现回归:表达式fetch \{% url 'trade:get_symbol_data' %}?symbol=${symbol}\ as JSON中as JSON被错误地当作表达式转换而非fetch修饰符。作者用Claude快速定位根因——重构时提取的parseURLOrExpression()方法让fetch后接完整表达式,导致as被表达式消费。Claude提出两个修复方案:第一个仅支持字面字符串,无法处理fetch $url as JSON;第二个引入noConversions标志,增加不必要的上下文敏感性。作者最终利用hyperscript已有的“follows”机制简洁解决问题。案例展示了AI在问题分析上的高效与在设计优雅修复上的局限,印证了“巫师学徒”陷阱。

大佬观点开源生态编码
11:02
IT之家(RSS)
76
美团发布万亿参数大模型 LongCat-2.0,五万卡国产算力训练并开源

美团今日发布万亿参数大模型 LongCat-2.0,总参数 1.6T,平均激活约 48B(动态 33B~56B),从零预训练,原生支持 1M 超长上下文,是业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。预览版已在 OpenRouter 及 longcat.ai 开放,月调用量跻身 OpenRouter 全球前三。预训练数据超 30T tokens,通过 HCCL 异常处理等将月均日故障率降低 70% 以上,训练 MFU 提升 1.5 倍,稳态日吞吐超 1T tokens/day。推理采用 LSA 稀疏注意力和零计算专家实现 token 级动态激活。在 SWE-bench Pro 上获 59.5,领先 Gemini 3.1 Pro、GPT-5.5 和 Claude Opus 4.6;在其他多项评测中达到或接近前沿闭源模型水平。

开源生态推理模型发布编码
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)
10:02
IT之家(RSS)
52
入职仅一年,消息称 AI 大牛贾扬清已从英伟达离职

分析机构 SemiAnalysis 爆料,LeptonAI 创始人兼 CEO 贾扬清已从英伟达离职。2025 年 4 月,英伟达以 7 亿美元收购 LeptonAI,将贾扬清招入麾下。SemiAnalysis 称,英伟达曾承诺 2026 年开源 Lepton 核心软件平台,但 CEO 黄仁勋最终未批准。LeptonAI 创始团队来自阿里巴巴,曾用 500 行代码实现对话式搜索引擎演示,还推出端侧模型 Chrome 插件 Elmo 和提示词优化工具 PromptLLM。

开源生态行业动态
09:50
公众号:卡尔的AI沃茨
精选70
AI News Radar 大更新:新增自媒体板块,支持订阅多平台账号

AI News Radar 迎来大更新,新增自媒体板块,支持订阅某书、某音、某站、某X等平台账号,每日按热度推荐 Top10 信息(无热门则不硬凑),同时保留时间轴视图,可在热度优先和时间优先间切换。官方来源包括 OpenAI、Anthropic、Google 等一手消息及 GitHub AI&ML 更新日志。信息流按来源、类型、信号等级分类,标注高优先级与多源认证。项目完全开源,可零 API 部署独立 AI 日报页面,支持手机移动端及暗色界面。

GitHub产品更新开源生态

推荐理由:我觉得这是目前最实用的AI信息过滤工具,新版直接整合了社媒热榜和官方源,内容创作者可以拿来当选题雷达,普通人也能一键部署自己的AI日报,省去每天刷各个平台的时间。
07:59
MarkTechPost(RSS)
53
OpenClaw 发布 iOS 和 Android 配套节点应用,手机变身自托管 AI 智能体网关的"外设"

OpenClaw 推出免费 iOS 和 Android 配套节点应用,手机成为自托管智能体网络中的节点(非独立聊天机器人)。核心 Gateway 用 TypeScript 编写,需 Node 24 或 22.19+,运行在 macOS、Linux 或 Windows(WSL2)上。通过 WebSocket 端口 18789 与手机配对,支持本地 mDNS 发现或远程 Tailscale 连接。iOS 应用通过 QR 码配对,支持聊天、实时/后台语音模式、Canvas 表面,以及相机、屏幕、位置等设备能力。Android 应用提供流式聊天回复、图片附件、全会话历史、语音模式(ElevenLabs 或系统 TTS)和实时 Canvas。隐私敏感命令默认关闭,需在配置文件中显式允许。

智能体产品更新开源生态端侧
05:35
Hacker News 热门(buzzing.cc 中文翻译)
61
Ornith-1.0:用于代理编码的自改进开源模型

Ornith-1.0 是基于 Gemma 4 和 Qwen 3.5 后训练的自改进开源模型系列,包含 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。采用强化学习同时优化搜索框架和解决方案。在 Terminal-Bench 2.1、SWE-bench Verified 等编程基准上各尺寸均达同类开源最优——397B MoE 在 SWE-bench Verified 上取得 82.4%,Terminal-Bench 2.1 (Claude Code) 78.2%。所有检查点支持 256K 上下文窗口,MIT 许可证,全球可访问。运行需 Transformers ≥5.8.1、vLLM ≥0.19.1、SGLang ≥0.5.9。

智能体Hugging Face开源生态模型发布
02:35
Hacker News 热门(buzzing.cc 中文翻译)
精选75
Qwen 3.6 27B 是本地开发的理想选择

Qwen 3.6 27B 是一款密集参数本地大语言模型,原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版(含多 token 预测)可达 30 tokens/s;用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务,作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B,但作者推荐 27B 版本。

开源生态端侧评测/基准

推荐理由:一篇详实的 Qwen 3.6 27B 实战评测,从创意写作到代码生成都测了,还给出了 llama.cpp 部署命令和性能数据,想本地跑模型的开发者可以直接抄作业。
6月29日
18:01
IT之家(RSS)
53
DeepSeek V4 正式版 7 月中旬上线,API 引入峰谷定价

DeepSeek 团队 6 月 29 日宣布,DeepSeek V4 正式版计划于 7 月中旬上线,届时 API 定价将引入峰谷机制,高峰时段(每日 9:00-12:00、14:00-18:00)价格为平时的 2 倍。此前 DeepSeek-V4 预览版已于 4 月 24 日上线并同步开源,拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上实现国内与开源领域领先,按大小分为两个版本。另外,DeepSeek-V4-Pro API 已永久降价至原定价的 1/4。

DeepSeek开源生态推理模型发布
14:34
Hacker News 热门(buzzing.cc 中文翻译)
53
HackerRank 将其 ATS 开源,评分不稳定引发争议

HackerRank 将其 ATS(申请人跟踪系统)开源。开发者测试发现,默认模型 gemma3:4b 在 temperature 0.1 下对同一份简历运行 100 次,得分范围 66–99。若公司分数线设为 85,简历有 65% 的概率被刷掉。改用 Gemini 后分数集中在 48–64,若分数线 60 仍有 28% 的失败率。评分标准中“工作经验”项始终给出 25/25 满分(即使只有一个实习),而“个人项目”项波动巨大。作者指出,LLM 适合解析简历结构,但无法稳定评判经验价值,AI 筛选实质是运气过滤。

GitHub开源生态评测/基准
09:01
IT之家(RSS)
57
我国开源生态版图扩容,新增人工智能与具身智能等7项目

央视财经报道,我国开源生态版图进一步扩容,新增人工智能、具身智能等7个项目。开放原子开源基金会称,2026年将引入相关前沿项目,抢占大模型和RISC-V新架构先机。2025年国内活跃开源项目超425万个,开发者达263万。工信部副部长熊继军表示将提升开源供给能力,支持基础软件、工业软件、AI等领域开源发展。《2025中国开源年度报告》显示,GitHub中国活跃开发者超210万全球第三,整体开发者规模预计超350万全球第二;中国OpenRank贡献度254,963全球第二,增速差超10%,预计7年后将超越美国。

GitHub具身智能开源生态行业动态
05:33
Hacker News 热门(buzzing.cc 中文翻译)
57
GLM 5.2 在 IDOR 检测中超越 Claude Code

Semgrep 团队用 IDOR 基准测试比较开源模型与前沿编码智能体。GLM 5.2(智谱 AI,开源权重,MIT 许可)以 39% F1 成绩超越 Claude Code(32%),每发现一个漏洞成本约 0.17 美元,但仍低于 Semgrep 多模态流水线(53–61% F1)。GLM 5.2 采用 MoE 架构,总参数 7500 亿,每 token 仅激活约 400 亿,支持 200K 至 1M token 上下文。在 Terminal-Bench 2.1 上得分 81.0(GLM 5.1 为 63.5,Claude Opus 4.8 为 85.0),SWE-bench Pro 上达 62.1。定价约为同类前沿模型的六分之一。Z.ai 披露 GLM 5.2 在训练中存在更多奖励黑客行为,已构建反黑客防护。

安全/对齐开源生态编码评测/基准
01:26
Nathan Lambert:Interconnects(RSS)
精选60
Artifacts 22:Zyphra、Cohere 和 Poolside 正在扩展生态系统广度

开源模型生态正变得更多元,参与者从少数中国公司扩展到全球各类组织。纯模型制造商包括 DeepSeek、智谱、MiniMax、Poolside、Arcee、Zyphra 及主权 AI 玩家 Cohere、Sovereign、Mistral、Trillion Labs;科技巨头如阿里 Qwen、Google Gemma 和 NVIDIA 各有不同动机;产品公司如 JetBrains、Zed、Krea、Photoroom 则训练高度专业的小模型。NVIDIA 发布 Nemotron-3-Ultra-550B-A55B-BF16,采用 LatentMoE 架构并改用 OpenMDW 许可证。Cohere 以 Apache 2.0 开源其旗舰模型 Command A+(05-2026-bf16),这是一款 218B-A25B MoE 模型,具备多模态、多语言和智能体能力。

开源生态模型发布现象/趋势

推荐理由:这篇文章把开源模型玩家拆成三类,清晰解释了不同动机,Cohere 转向 Apache 2.0 和 NVIDIA 采用 OpenMDW 是许可层面的重要信号,关注开源的值得一读。
6月28日
16:10
The Decoder:AI News(RSS)
精选70
新浪开源VibeThinker-3B:推理可压缩,事实知识不能

新浪发布仅3B参数的VibeThinker-3B,在AIME26等数学编程基准上持平DeepSeek V3.2等大200–333倍的模型,LiveCodeBench超越所有20B以下模型,LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B,经SFT、强化学习、自蒸馏等多阶段后训练。研究提出“参数压缩-覆盖假说”:逻辑推理依赖少数可压缩模式,而广泛世界知识仍需大参数。模型已开源。

Hugging Face开源生态推理模型发布

推荐理由:VibeThinker-3B 用 3B 参数在数学编程上匹敌百倍大模型,推理可压缩而知识不能的假设值得深思。对做推理应用的人来说是个信号。
08:00
IT之家(RSS)
30
DeepSeek成美国企业AI账单失控下的"香饽饽",阿里千问输入法macOS版上线

AI账单失控背景下,越来越多的美国企业转向Tokenminimizing策略,部分企业已100%切换使用DeepSeek以降低Token消耗。阿里千问输入法macOS版正式上线,主打最快300字/分的语音输入和AI自动润色功能,支持9种方言且无广告;官方预告iOS、Android、Windows版将于近日发布。

DeepSeek开源生态推理行业动态
00:03
Hacker News 热门(buzzing.cc 中文翻译)
精选81
一次失败的(民族国家?)攻击的剖析

作者收到伪装成新加坡VC Lua Ventures的虚假面试邮件,要求完成一个TypeScript仓库的“测试”。作者将仓库交给Claude扫描,在typescript+5.9.2.patch中发现base64混淆载荷,该载荷在patch-package安装时触发,向~/.cache-等目录写入payload.js和mutex.js,构成后门(命名PinpinRAT)。攻击者使用虚构身份和空洞LinkedIn资料,目标是作者在crates.io上的Rust包。相关信息已报告加拿大CCCS等机构。

安全/对齐开源生态部署/工程

推荐理由:这是一次近乎完美的开发者定向攻击复盘,虚假面试加上精心构造的补丁注入 RAT,手法隐蔽到连作者都差点中招,所有靠开源吃饭的人都该认真看看 Ioc 并重新审视自己的代码审查盲区。
6月27日
18:41
OpenRouter:Announcements(RSS)
50
2026年6月值得关注的开放权重模型

一批来自中美新玩家的开放权重模型已发布。截至2026年6月,有四个最值得关注的开放权重模型,并给出了各自的最佳使用场景。

开源生态评测/基准
18:32
Hacker News 热门(buzzing.cc 中文翻译)
51
DeepSeek 开源推理优化方案 DeepSpec,生成速度提升 60% 至 85%

DeepSeek 在 GitHub 上开源了推理优化方案 DeepSpec,并发布了配套论文 DSparkpaper.pdf。该方案可将模型生成速度提升 60% 至 85%,具体实现细节见论文。

DeepSeek开源生态推理论文/研究
17:06
MarkTechPost(RSS)
63
Meta 开源 Astryx(Beta):基于 React 和 StyleX 的 AI 就绪设计系统

Meta 本周发布 Astryx(Beta),一个基于 React 和 StyleX 的开源设计系统。项目包含 90 多个 React 组件、模板和主题,内置十个可定制主题(default、neutral、chocolate 等),通过 CSS 变量级联实现全局统一样式。Astryx 提供 CLI(astryx/xds)和 MCP 服务器,可输出自描述 JSON 清单,AI 智能体无需解析 --help 即可直接调用命令搭建和文档化 UI。组件具有上下文感知间距补偿功能,消除双重内边距问题。许可证为 MIT。

MCP/工具Meta产品更新开源生态
16:59
IT之家(RSS)
精选70
AI 账单失控后 DeepSeek 成"香饽饽",部分美国企业已 100% 切换

美国企业面临 AI 账单失控,开始转向 Token 最小化策略。旧金山公司 Lindy 此前主要调用 Anthropic 的 Claude 模型,每月 AI 账单超支甚至超过员工工资。该公司 CEO 弗洛·克里维洛表示,本月初已将 100% 流量切换到 DeepSeek,预计未来几个月可节省数百万美元。企业开始采用按任务匹配模型的“模型路由”,不再将最贵的前沿模型用于所有场景。部分客户已决定暂停 AI 投入,待证明投资回报率后再继续。

DeepSeek开源生态现象/趋势

推荐理由:一家初创把AI调用从Claude全切到DeepSeek,省下的钱超过工资总额,企业客户开始用模型路由压成本,这个趋势比任何benchmark都更能说明价格战的影响。
‹ 上一页
123…17
下一页 ›