AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
今天7月3日 周五
05:08Rohan Paul48Palantir CEO:部分美国政府客户将敏感AI工作迁移至Nvidia Nemotron开源模型
01:22AYi60Firefox 内置免费 VPN,Claude Fable 5 在 ZenMux 上限时免费回归
7月2日周四
22:57Artificial Intelligence News(RSS)48Anthropic 推出 Claude Science 公开测试版,集成 NVIDIA BioNeMo 加速科学研究
22:39elvis61AI主权不可选择:Palantir CEO强调控制权与开源模型关键地位
21:14Hacker News 热门(buzzing.cc 中文翻译)57"定理经济"的衰落
16:40Hacker News 热门(buzzing.cc 中文翻译)71精选Kimi K2.7 Code 已在 GitHub Copilot 上正式发布
12:35Rohan Paul64Godot 开源游戏引擎禁止 AI 生成代码
10:03IT之家(RSS)61葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA
05:34MarkTechPost(RSS)69使用 Lift 将研究 PDF 转换为结构化 JSON:受控的、模式引导的字段级评估
03:33Rohan Paul62UBS:约60%大公司放缓AI支出,中国模型成本优势显著
00:31Berryxia.AI63Osaurus:Mac本地AI工作台,自动切换模型原生图像生成
7月1日周三
22:34Thariq18Claude 年度回顾炉边谈话预告
22:32TechCrunch:AI(RSS)67Venice AI 完成 6500 万美元 A 轮融资,估值 10 亿美元
22:31Berryxia.AI57Boogu-Image-0.1-Edit-Turbo 开源:4步蒸馏图像编辑模型
18:08Hacker News 热门(buzzing.cc 中文翻译)61Godot 将不再接受由 AI 编写的代码贡献
18:03IT之家(RSS)59瑞银:约六成企业收紧 AI 开支,DeepSeek 等开源大模型有望受益
17:10公众号:卡尔的AI沃茨71实测美团LongCat-2.0,国产芯片长出来的万亿大模型
16:32MarkTechPost(RSS)73精选NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型
16:03IT之家(RSS)56Godot 基金会修改贡献指南,禁止 AI 直接生成代码与 AI 智能体 PR
16:02MarkTechPost(RSS)69Google Research 推出 TabFM:面向表格数据的零样本分类与回归基座模型
15:32Rohan Paul68美芯片限制意外加速中国开源AI生态发展
14:56MiniMax (official)45MiniMax 研究员谈稀疏注意力与原生多模态训练
12:21向阳乔木61美团发布并开源LongCat-2.0万亿参数MoE大模型
12:06François Chollet60tufalabs开源第一名notebook 有望解锁新浪潮
12:00公众号:龙猫LongCat(美团)82精选美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型
09:02Rohan Paul63Agents-A1:35B参数Agent模型声称通过更长思考达到1T模型性能
07:31Rohan Paul33AI周报:央行担忧,中国模型成本低50倍,Meta脑机接口78%准确率
07:08Ethan Mollick:One Useful Thing(RSS)73聊天机器人的黄昏
05:59TechCrunch:AI(RSS)65OpenClaw 正式登陆 Android 和 iOS
02:28Artificial Analysis53GLM-5.2:开源权重智能最高但最啰嗦的领先模型
00:30Rohan Paul75美团发布开源编码模型LongCat-2.0,国产芯片从头训练
6月30日周二
23:23Peter Steinberger 🦞48Peter Steinberger澄清:OpenClaw未被OpenAI收购,希望获得建设性帮助
22:35elvis24开放模型扩展的推荐阅读
21:02StepFun50Step 3.7 Flash 本月OpenRouter前十
17:29Rohan Paul56Coinbase实验默认使用中国开源模型GLM 5.2与Kimi 2.7
16:48Chubby♨️50Anthropic 拟为 Fable 5 设独立信用系统需身份验证
16:38The Decoder:AI News(RSS)67Deepseek发布DSpark推理框架,AI响应速度最高提升85%
16:30MarkTechPost(RSS)55Meta AI 发布 Brain2Qwerty v2:非侵入式 MEG 脑到文本解码管线
16:29Rohan Paul59花旗研究:中国模型token价格低至18美分,企业转向成本控制引AI定价压力
15:37Hacker News 热门(buzzing.cc 中文翻译)77LongCat-2.0 开源:1.6T 总参数、48B 活跃参数的 MoE 模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
05:08
Rohan Paul@rohanpaul_ai
48
Palantir CEO:部分美国政府客户将敏感AI工作迁移至Nvidia Nemotron开源模型

Palantir CEO透露,部分美国政府客户正在将敏感AI工作迁移至Nvidia的Nemotron开源模型。Nemotron可在气隙环境运行,隔离于不安全的外部网络,适合对数据泄露敏感的国防任务。Karp称Nemotron在机密战场级任务上表现相当或更优。更深层变化在于,模型质量不再是唯一购买决策因素,机构现在综合权衡速度、价格、主权、审计追踪和运营控制。美国开源模型为华盛顿提供了介于闭源实验室和海外技术栈之间的第三条路径。

开源生态行业动态部署/工程
01:22
AYi@AYi_AInotes
60
Firefox 内置免费 VPN,Claude Fable 5 在 ZenMux 上限时免费回归

Firefox 推出官方原生 IP 保护功能,内置免费 VPN,每月赠送 50G 流量。开启方法:地址栏输入 about:config → 显示全部首选项 → 搜索 browser.ipProtection.enabled → 切换为 true。Claude Fable 5 回归上线,ZenMux 上限时免费使用。Fable 5 可输出高质量人像提示词,通过拆解塑料感根源、8 维度框架及自我检查环节,系统性避免塑料皮肤、畸形手等问题。ZenMux 提供无 RPM 限制、同屏 PK 功能,支持 Fable5、GPT-5.5、Opus4.8 等多模型对比,自动充值每笔返 20% 余额。

AYi: Claude Fable 5今天回归上线啦,ZenMux上限时免费使用真的太香了! 怎么用Fable 5输出高质量的「不会塑料 + 顶级人像提示词方法论以及户外美女人像prompt方法论大家收好! 说真的,我以为上次的Fable 5总结的A...

开源生态教程/实践
7月2日
22:57
Artificial Intelligence News(RSS)
48
Anthropic 推出 Claude Science 公开测试版,集成 NVIDIA BioNeMo 加速科学研究

Anthropic 推出面向科学研究的 AI 工作台 Claude Science 公开测试版,科学家可通过自然语言与数字智能体交互执行端到端研究流程。该平台原生集成 NVIDIA BioNeMo Agent Toolkit,将 GPU 加速计算资源封装为可调用的技能模块。全球前 20 大制药公司中已有 18 家生产部署 BioNeMo。基因组分析工具 Parabricks 将处理时间从数小时压缩至数分钟;RAPIDS-singlecell 将 130 万细胞预处理和聚类工作流从 52 分钟缩短至 25 秒;nvMolKit 加速分子相似性搜索和构象生成最高达 3,000 倍。系统还提供 Evo 2、Boltz-2、OpenFold3 等加速开放模型。

Anthropic开源生态行业动态部署/工程
22:39
elvis@omarsar0
61
DAIR.AI创始人Elvis Saravia指出,AI主权并非可选项,开源模型应成为个人、组织与国家AI战略的核心。他引用Palantir CEO Alex Karp观点:技术客户真正需要的是对计算、模型、数据栈及自身"alpha"(核心优势)的完全控制,即拥有生产资料而非转移给他人。Karp质疑:若模型如此有价值,前沿实验室为何只按token收费而不采取利润分成?这引出数据所有权、提示词安全等关键问题。

Palantir: Palantir CEO Alex Karp on what customers actually want, the real business of frontier labs, and the importance of open s...

大佬观点开源生态
21:14
Hacker News 热门(buzzing.cc 中文翻译)
57
"定理经济"的衰落

数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。

DeepMindOpenAI大佬观点开源生态
16:40
Hacker News 热门(buzzing.cc 中文翻译)
精选71
Kimi K2.7 Code 已在 GitHub Copilot 上正式发布

Kimi K2.7 Code 开源权重模型已在 GitHub Copilot 中正式可用,成为 Copilot 模型选择器首个可选的开源权重模型,为编程工作流提供更低成本选择。该模型由 GitHub 托管于 Microsoft Azure,按供应商列表价格以用量计费。逐步向 Copilot Pro、Pro+ 和 Max 计划用户推送,用户可在 Visual Studio Code 1.127.0 或更新版本、Visual Studio 17.14.6 或更新版本、JetBrains 1.9.1-251 或更新版本、Xcode、Eclipse 等 IDE 及 Copilot CLI、GitHub.com、GitHub Mobile 等平台中选用。后续几周将扩展至 Copilot Business 和 Enterprise,当前默认关闭,需管理员在 Copilot 设置中启用策略。

GitHub产品更新开源生态编码

推荐理由:GitHub Copilot 首次把开源权重模型放进模型选择器,Kimi K2.7 Code 作为低价选项可能会改变很多开发者的使用习惯,对个人开发者尤其友好。
12:35
Rohan Paul@rohanpaul_ai
64
Godot 开源游戏引擎禁止 AI 生成代码

Godot 开源游戏引擎发布新贡献政策,禁止“vibe coding”(AI 生成大量代码),因 AI 生成的 PR 使审阅时间成为瓶颈。大量 AI 生成代码将被禁止,仅允许代码补全等小型辅助工具。贡献者需披露是否使用 AI 辅助编写代码,同时禁止在 PR 讨论、议题、提案中使用 AI 生成文本。推文作者认为该规则执行不切实际,难以区分哪些代码是 AI 生成的。

开源生态编码行业动态
10:03
IT之家(RSS)
61
葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA

葡萄牙政府7月1日宣布开源大语言模型AMALIA正式发布,这是首个基于欧洲葡萄牙语开发的模型。由60余位研究人员历时18个月开发,先期投资550万欧元,使用了Deucalion、MareNostrum 5等算力基础设施。第一阶段利用约4万亿个葡语单词训练出9B规模模型,后续多模态升级后具备理解文本、图像、声音的能力。今年内还将新增22B版本并获得智能体能力,需追加150万欧元投资。

开源生态模型发布
05:34
MarkTechPost(RSS)
69
使用 Lift 将研究 PDF 转换为结构化 JSON:受控的、模式引导的字段级评估

Lift 是一个 PDF 到结构化数据的提取工具,本教程构建了完整的受控评估工作流。通过 4-bit NF4 量化,约 10B 参数模型可在 16 GB GPU(如 T4/L4)上运行。教程生成含干扰项的合成多页研究论文,测试模型在真实文档布局中恢复标题、作者、数据集、指标、超参数、局限性和仓库链接的能力,并输出结构化 JSON,实现模式引导的字段级评估。

开源生态教程/实践数据/训练
03:33
Rohan Paul@rohanpaul_ai
62
UBS:约60%大公司放缓AI支出,中国模型成本优势显著

UBS报告称约60%大公司正放缓AI支出,CFO和CTO聚焦账单上升与ROI不均,企业AI进入预算管控,任务被路由至更便宜模型。该趋势压力先给OpenAI和Anthropic。JP Morgan研究显示中国AI模型每token成本比美国低最多50倍,中国公司在OpenRouter平台流量从不足2%(2024年底)升至超45%(2026年4月)。arXiv研究证实美国芯片出口管制加速了中国开源AI生态发展。Google和Anthropic分别推出注重效率的Gemini 3.5 Flash和Claude Sonnet 5。

Rohan Paul: U.S. chip restrictions helped push China to build and spread open AI models. The authors tested this by looking at polic...

AnthropicOpenAI开源生态现象/趋势
00:31
Berryxia.AI@berryxia
63
Osaurus:Mac本地AI工作台,自动切换模型原生图像生成

Osaurus AI App 推出 Mac 原生 AI 工作台,不是浏览器套壳,而是用 Swift 在本地运行图像生成。用户生成图片时自动卸载当前聊天模型,加载本地图像模型(支持任意 MLX 模型),在 GPU 上生成并保存真实文件后再切回聊天模型,全程无需联网。目前 6k GitHub Stars、15.5 万次下载,MIT 开源,适合在 Mac 上本地跑多模型切换。

产品更新开源生态端侧
7月1日
22:34
Thariq@trq212
18
@_catwu @simonw 和我将在 AIE 的 Expo Stage 2 举办一场关于"今年 Claude 回顾"的炉边谈话,时间从下午 12:30 到 1:30。 我们将涵盖非常广泛的话题,我认为这会非常有趣,希望在那里见到你! https://www.ai.engineer/worldsfair/schedule?day=3&session=asn_slot_2026_06_30_main_stage_1230_2026_06_08t09_35_43_039z
Anthropic开源生态行业动态
22:32
TechCrunch:AI(RSS)
67
Venice AI 完成 6500 万美元 A 轮融资,估值 10 亿美元

Venice AI 获得由 Dragonfly 领投、Coinbase Ventures 等参投的 6500 万美元 A 轮融资,估值 10 亿美元。该平台提供 200 余个 AI 模型,注重隐私:用户输入加密且不存储数据,部分模型支持端到端加密(需付费订阅)。目前拥有 85 万独立访问用户、300 万活跃用户,日均 170 万次 API 调用,年化收入超 7000 万美元,已实现盈利。公司发行了 VVV 和 DIEM 两种加密代币,约 8% 用户使用加密支付。融资将用于购买 GPU 并自建数据中心。

开源生态行业动态
22:31
Berryxia.AI@berryxia
57
Boogu-Image-0.1-Edit-Turbo 开源:4步蒸馏图像编辑模型

ModelScope 上开源了 Boogu-Image-0.1-Edit-Turbo,一个 4 步蒸馏的 image-to-image 编辑模型,主打快速视觉编辑。支持物体替换、风格迁移、场景/背景修改,以及带文字感知的图像变换。

图像生成开源生态模型发布
18:08
Hacker News 热门(buzzing.cc 中文翻译)
61
Godot 将不再接受由 AI 编写的代码贡献

开源游戏引擎 Godot 正式更新贡献指南,明确禁止 AI 编写的代码、由 AI 智能体提交的拉取请求,以及人工交流中出现的 AI 生成文本(机器翻译除外)。Godot 基金会表示,大量低质量 AI 生成 PR 正“日益消耗和打击”维护者积极性,而 AI 无法承担代码责任,长期难以将代码审查转化为对新贡献者的指导。新政策旨在为低质量内容设置障碍,同时要求所有贡献来自能对其代码负责的人类,并在代码出现问题时自行修复。

开源生态行业动态
18:03
IT之家(RSS)
59
瑞银:约六成企业收紧 AI 开支,DeepSeek 等开源大模型有望受益

瑞银分析师调研十余家企业IT负责人后发现,约六成企业已出台管控措施收紧AI开支。token调用成本是核心顾虑,Uber运营总监坦言AI投入回报微薄。DeepSeek等开源模型与中国本土大模型有望受益,尤其适合非代码类业务。短期内OpenAI、Anthropic等闭源厂商承压最大。谷歌推出Gemini 3.5 Flash,Anthropic发布Claude Sonnet 5以降低成本。瑞银称这一趋势为“良性调整阵痛”,无企业彻底叫停AI落地。

DeepSeek开源生态现象/趋势
17:10
公众号:卡尔的AI沃茨
71
实测美团LongCat-2.0,国产芯片长出来的万亿大模型

美团发布LongCat-2.0,总参数1.6万亿、每个token仅激活约480亿参数的MoE模型,从预训练到大规模部署全程运行在5万张国产算力芯片上,训练消耗超35万亿tokens,无回滚、无不可恢复loss突刺。Agent场景表现突出:在Terminal-Bench 2.1和SWE-bench Pro编程任务上追平Gemini 3.1 Pro,FORTE通用Agent任务与Claude Opus 4.6持平。最大输出128K,最高提供1M上下文,采用LSA稀疏注意力机制和N-gram Embedding优化长上下文与工具调用。已开放API接入,支持OpenAI Compatible和Anthropic API生态,可直接接入Claude Code和Codex等工作流。

智能体开源生态编码评测/基准
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)
16:32
MarkTechPost(RSS)
精选73
NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA 发布 Nemotron-Labs-TwoTower,基于冻结的自回归骨干 Nemotron-3-Nano-30B-A3B 的扩散语言模型。采用双塔架构:上下文塔冻结,降噪器塔训练,通过层对齐交叉注意力和状态播种协作。在 2×H100 上 BF16 评估,保留 98.7% 的 AR 基线质量,生成吞吐量提升 2.42 倍(γ=0.8,块大小 S=16)。降噪器在约 2.1T token 上训练,骨干使用 25T token 预训练。总参数约 60B,每 token 活跃参数约 3B/塔。支持扩散、模拟 AR 和 AR 三种解码模式。

开源生态推理模型发布部署/工程

推荐理由:NVIDIA这个TwoTower把扩散解码接在已有的AR骨干上,几乎无损质量却让吞吐翻倍,并且开源可商用,对批量文本生成的团队是实在的加速工具。
16:03
IT之家(RSS)
56
Godot 基金会修改贡献指南,禁止 AI 直接生成代码与 AI 智能体 PR

Godot 基金会正式修改贡献指南,禁止开发者提交 AI 直接生成的代码、AI 智能体发起的 Pull Request,以及沟通过程中使用 AI 翻译器生成的文本。理由是近几个月“AI slop”问题持续消耗维护者精力、打击审查者积极性。新规允许 AI 用于“机械性的小任务”,但必须主动披露使用情况。所有贡献必须由能对代码负责的人类提交,并在出现问题时承担修复责任。目前基金会表示将采取保守态度,未来政策可能随技术发展重新评估。

开源生态行业动态
16:02
MarkTechPost(RSS)
69
Google Research 推出 TabFM:面向表格数据的零样本分类与回归基座模型

Google Research 发布 TabFM v1.0.0,一种面向表格数据的零样本基座模型,无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示,通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准(38 个分类、13 个回归数据集,样本量 700 至 15 万)上,TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub,Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。

Google开源生态数据/训练模型发布
15:32
Rohan Paul@rohanpaul_ai
68
一项研究通过分析政策文件、开源模型发布、GitHub活跃度、论文及美国专利发现:美国加强出口管制后,中国开发者在开源大语言模型项目上的活跃度远超美国开发者,美国政策非但未遏制中国AI发展,反而加速了其开源生态建设。Perplexity CEO Aravind Srinivas 补充称,中国建设数据中心速度更快,电力、许可、人力、劳动力、专业知识均不构成障碍。

Rohan Paul: Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...

开源生态政策/监管论文/研究
14:56
MiniMax (official)@MiniMax_AI
45
MiniMax 强化学习研究负责人姜松岩在 AI Engineer 大会第二天参加炉边谈话,与 Thom Wolf 探讨了稀疏注意力、从训练第一天就融入的原生多模态方案,以及开放权重对 AI 发展的意义。她强调分享了团队在这些方向的工作,并重申相信开放权重的重要性。

Olive Song: Backstage and onstage with @Thom_Wolf and @swyx . I really enjoyed the fireside chat! Thanks for having me back at @aiDo...

多模态开源生态行业动态
12:21
向阳乔木@vista8
61
美团发布并开源LongCat-2.0万亿参数MoE大模型

美团发布并开源LongCat-2.0,1.6万亿总参数、480亿激活参数(3%)的MoE大模型。使用35万亿token训练,在5万片国产芯片上“全程无回滚”完成。引入LongCat稀疏注意力(LSA),包含流感知索引、跨层索引和层级化索引,解决长文本注意力瓶颈。采用5-gram N-gram Embedding增加135B参数,在不增加MoE专家竞争的情况下增强局部上下文理解。训练使用6D并行技术适配国产算力。计划2026年6月30日发布并开源。

开源生态推理教程/实践数据/训练
12:06
François Chollet@fchollet
60
tufalabs 刚刚开源了他们获得第一名的 notebook。主推文表示,这有望解锁新一波更好的参赛作品。

Greg Kamradt: .@tufalabs just open sourced their 1st place notebook 👀

开源/仓库开源生态教程/实践
12:00
公众号:龙猫LongCat(美团)
精选82
美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型

美团于6月30日发布新一代万亿参数大模型LongCat-2.0并开源。总参数1.6T,平均激活约48B,原生支持1M超长上下文,在五万卡国产算力集群上完成全流程训练与推理。采用LSA稀疏注意力、零计算专家、ScMoE及MOPD多专家融合(Agent/Reasoning/Interaction三组专家)架构。评测中SWE-bench Pro获59.5,SWE-bench Multilingual获77.3。预览版已通过OpenRouter和longcat.ai开放,月调用量跻身OpenRouter全球前三。

开源生态推理模型发布编码
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)
推荐理由:国产算力上首个全流程自训的万亿开源模型,1M上下文和动态专家架构直指Agentic Coding场景,OpenRouter调用量已经冲到前三,不是Demo是生产力。
09:02
Rohan Paul@rohanpaul_ai
63
Agents-A1:35B参数Agent模型声称通过更长思考达到1T模型性能

中国团队发布Agents-A1,一个35B参数的agent模型,通过让模型学习更长的验证工作习惯(平均训练样本45K tokens),声称达到1T参数模型的性能。模型采用Apache-2.0许可,权重已开源至Hugging Face。训练方法:构建长动作记录数据,训练多个专家教师模型(搜索、科学、指令跟随、工具使用等),再将技能蒸馏至一个学生模型。Agents-A1在搜索、科学、编码、工具使用、指令跟随等长任务基准上表现优异。

智能体开源生态推理模型发布
07:31
Rohan Paul@rohanpaul_ai
33
AI周报:央行担忧,中国模型成本低50倍,Meta脑机接口78%准确率

Rohan Paul 新闻通讯要点:央行担忧 AI 淘金热可能引发下一场金融冲击;中国开发者通过灰色市场 API 以官方价格 5%-10% 购买 Claude 服务,且隐藏真实用户身份;Sakana Fugu 技术报告发布;中国 AI 模型每 token 成本比美国同行低至 50 倍;DeepSeek 发布新推理优化方法;Meta 开源无需手术的脑机接口系统,词准确率达 78%。

多模态开源生态行业动态
07:08
Ethan Mollick:One Useful Thing(RSS)
73
聊天机器人的黄昏

前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体AnthropicOpenAI大佬观点
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
05:59
TechCrunch:AI(RSS)
65
OpenClaw 正式登陆 Android 和 iOS

免费开源 AI 智能体 OpenClaw 现已推出 iOS 和 Android 应用。用户通过 OpenClaw Gateway 将手机与智能体及所需工具、技能连接,可在移动端运行智能体完成编程、餐食规划等任务。OpenClaw 今年早些时候因 MoltBook(号称完全由智能体运营的社交媒体站)走红,其创建者 Peter Steinberger 随后加入 OpenAI。尽管 MoltBook 后被证实部分由人类伪装智能体运行,但此事件推动了智能体生态扩张,如今 AI 智能体已嵌入更多场景,包括手机端。

智能体产品更新开源生态
02:28
Artificial Analysis@ArtificialAnlys
53
GLM-5.2:开源权重智能最高但最啰嗦的领先模型

GLM-5.2 在 Artificial Analysis Intelligence Index 中以 51 分成为开源权重智能最高的模型,但输出 token 达 1.41 亿(95% 推理),远超平均模型的 1.8 倍。相比之下,Claude Opus 4.8 输出 1.17 亿 token 得分 56,GPT-5.5 输出 7200 万 token 得分 55。近三分之二 token(8800 万)集中在 Humanity's Last Exam,是 GPT-5.5 的 3.2 倍,得分仅 40%(Opus 46%,GPT-5.5 44%)。AA-Omniscience 幻觉率评测中 GLM-5.2 仅得 4 分,远低于 Opus 4.8(27)、GPT-5.5(20)和 Gemini 3.5 Flash(23)。在 agentic 任务 GDPval-AA v2 上 GLM-5.2 为开源第一、整体第三,超过 GPT-5.5。其他开源模型如 DeepSeek V4 Pro 得分 44,落后 7 分。

开源生态推理评测/基准
00:30
Rohan Paul@rohanpaul_ai
75
美团发布开源编码模型LongCat-2.0,国产芯片从头训练

美团发布开源编码模型LongCat-2.0,采用1.6T参数MoE架构(活跃参数33B-56B),支持1M tokens上下文窗口。该模型在5万块国产芯片上从头训练,使用华为HCCL通信库,验证国内算力集群可胜任大模型预训练。已开源至longcat[.]ai和OpenRouter,调用量全球前三。与DeepSeek-V4-pro仅推理使用国产硬件不同,LongCat-2.0预训练和推理均依赖国产芯片。

开源生态模型发布编码
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)
6月30日
23:23
Peter Steinberger 🦞@steipete
48
Peter Steinberger澄清:OpenClaw未被OpenAI收购,希望获得建设性帮助

针对用户Cristian嘲讽“被OpenAI收购、拿到无限token却做出劣质应用”的推文,Peter Steinberger回应:OpenClaw未被收购,它是OpenClaw Foundation下的独立开源项目,由社区构建;OpenAI仅赞助token用量,他本人恰好在OpenAI工作。当前iOS和Android应用尚不完善,但已实现安全配对和推送通知并通过App Review。他表示当天收到约30条类似批评,希望得到建设性帮助,而非空耗注意力。

cristian rus: imagine getting acquired by @OpenAI, get unlimited AI tokens and still drop this slop abomination

OpenAI大佬观点开源生态
22:35
elvis@omarsar0
24
推荐阅读,如果你正在使用开放模型进行扩展。 顺便说一句,你应该思考如何使用开放权重模型进行扩展。

elvis: http://x.com/i/article/2071684582336782336

开源生态教程/实践
21:02
StepFun@StepFun_ai
50
Step 3.7 Flash 本月在 @OpenRouter 上跻身前十,路由了 4.29T tokens。 构建者正在通过真实的智能体运行、编码任务和长上下文工作流来推动它。 继续用难题来挑战。
开源生态行业动态
17:29
Rohan Paul@rohanpaul_ai
56
Coinbase CEO Brian Armstrong透露,Coinbase正通过其LLM网关实验默认使用中国开源模型GLM 5.2和Kimi 2.7,并根据提示词难度路由执行。他表示前沿模型适合规划,但用于执行可能"过度杀伤"。该决策背后引用前Meta PM及Perplexity CEO Aravind Srinivas观点:中国在数据中心建设速度、电力、许可、人力和专业知识方面均具显著优势。

Rohan Paul: Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...

大佬观点开源生态推理
16:48
Chubby♨️@kimmonismus
50
网友发现 Claude 应用新字符串显示,Anthropic 准备将 Fable 5 置于现有计划之外的独立信用系统,且只有完成身份验证后才能添加信用。Anthropic 之前称身份验证仅针对特定账户且与 Fable 无关,但新验证描述与 Fable 5 信用变动同时出现。主推文作者借此表达:越来越庆幸自己能本地运行越来越好的开源模型。

Chubby♨️: New Claude app strings suggest Anthropic is preparing to put Fable 5 behind a separate usage-credit system billed outsid...

Anthropic开源生态行业动态
16:38
The Decoder:AI News(RSS)
67
Deepseek发布DSpark推理框架,AI响应速度最高提升85%

Deepseek推出DSpark推理框架,采用推测解码技术,由小模型生成候选答案、大模型批量验证,并一次生成多个token而非单个,使每用户响应速度提升60–85%。系统基于置信度动态调整验证深度,减少无效计算。DSpark与Deepseek-V4-Pro模型(与北京大学联合开发)已在HuggingFace和GitHub以MIT许可证开源。高效推理降低对高端芯片需求,有助于中国与欧盟在芯片受限下获取更多AI性能,短期构成战略优势。

DeepSeek开源/仓库开源生态推理
16:30
MarkTechPost(RSS)
55
Meta AI 发布 Brain2Qwerty v2:非侵入式 MEG 脑到文本解码管线

Meta AI 近日发布 Brain2Qwerty v2,一种基于非侵入式脑磁图(MEG)信号的实时脑到文本解码管线,无需植入或手术。系统在 9 名志愿者约 22,000 句打字数据上训练(每人 10 小时),平均词准确率 61%(WER 39%),最高参与者达 78%,超过半数句子错误不超过一个词。管线由卷积编码器、Transformer 和字符级语言模型组成,并微调大语言模型提取语义表征,用 AI 智能体自动化改进解码流程但最终配置由人工选定。Meta 同时以 CC BY-NC 4.0 协议开源 v1 和 v2 训练代码。

Meta开源生态数据/训练模型发布
16:29
Rohan Paul@rohanpaul_ai
59
花旗研究:中国模型token价格低至18美分,企业转向成本控制引AI定价压力

花旗研究数据显示,中国模型每百万token收费低至18美分,而顶级模型均价4美元。OpenRouter上开源模型处理占比从1月34%升至6月65%,DeepSeek等中国模型因低价受关注。Gartner预测AI编码成本2028年将超普通开发者薪资。按用量付费使企业从“选最强模型”转向成本控制,OpenAI和Anthropic面临逐任务比价压力。前Meta PM及Perplexity CEO指出,中国能更快建设数据中心,电力、许可、人力、专业能力均不成问题,进一步压低成本。

Rohan Paul: Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...

DeepSeek开源生态现象/趋势
15:37
Hacker News 热门(buzzing.cc 中文翻译)
77
LongCat-2.0 开源:1.6T 总参数、48B 活跃参数的 MoE 模型

LongCat-2.0 正式开源,总参数 1.6 万亿,每 token 激活约 480 亿参数,采用 MoE 架构。新引入 LongCat Sparse Attention(LSA)和 N-gram Embedding 模块,支持百万级上下文窗口。模型在 5 万+ AI ASIC 上训练,消耗超 35 万亿 tokens,训练全程无回滚。在编码和智能体任务上表现优异,深度集成 Claude Code 等工具。提供 GitHub、HuggingFace 及 API 访问。

智能体开源生态推理模型发布
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)
‹ 上一页
123…36
下一页 ›