Palantir CEO透露,部分美国政府客户正在将敏感AI工作迁移至Nvidia的Nemotron开源模型。Nemotron可在气隙环境运行,隔离于不安全的外部网络,适合对数据泄露敏感的国防任务。Karp称Nemotron在机密战场级任务上表现相当或更优。更深层变化在于,模型质量不再是唯一购买决策因素,机构现在综合权衡速度、价格、主权、审计追踪和运营控制。美国开源模型为华盛顿提供了介于闭源实验室和海外技术栈之间的第三条路径。
Palantir CEO透露,部分美国政府客户正在将敏感AI工作迁移至Nvidia的Nemotron开源模型。Nemotron可在气隙环境运行,隔离于不安全的外部网络,适合对数据泄露敏感的国防任务。Karp称Nemotron在机密战场级任务上表现相当或更优。更深层变化在于,模型质量不再是唯一购买决策因素,机构现在综合权衡速度、价格、主权、审计追踪和运营控制。美国开源模型为华盛顿提供了介于闭源实验室和海外技术栈之间的第三条路径。
Firefox 推出官方原生 IP 保护功能,内置免费 VPN,每月赠送 50G 流量。开启方法:地址栏输入 about:config → 显示全部首选项 → 搜索 browser.ipProtection.enabled → 切换为 true。Claude Fable 5 回归上线,ZenMux 上限时免费使用。Fable 5 可输出高质量人像提示词,通过拆解塑料感根源、8 维度框架及自我检查环节,系统性避免塑料皮肤、畸形手等问题。ZenMux 提供无 RPM 限制、同屏 PK 功能,支持 Fable5、GPT-5.5、Opus4.8 等多模型对比,自动充值每笔返 20% 余额。
Claude Fable 5今天回归上线啦,ZenMux上限时免费使用真的太香了! 怎么用Fable 5输出高质量的「不会塑料 + 顶级人像提示词方法论以及户外美女人像prompt方法论大家收好! 说真的,我以为上次的Fable 5总结的A...
Anthropic 推出面向科学研究的 AI 工作台 Claude Science 公开测试版,科学家可通过自然语言与数字智能体交互执行端到端研究流程。该平台原生集成 NVIDIA BioNeMo Agent Toolkit,将 GPU 加速计算资源封装为可调用的技能模块。全球前 20 大制药公司中已有 18 家生产部署 BioNeMo。基因组分析工具 Parabricks 将处理时间从数小时压缩至数分钟;RAPIDS-singlecell 将 130 万细胞预处理和聚类工作流从 52 分钟缩短至 25 秒;nvMolKit 加速分子相似性搜索和构象生成最高达 3,000 倍。系统还提供 Evo 2、Boltz-2、OpenFold3 等加速开放模型。
Palantir CEO Alex Karp on what customers actually want, the real business of frontier labs, and the importance of open s...
数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。
Kimi K2.7 Code 开源权重模型已在 GitHub Copilot 中正式可用,成为 Copilot 模型选择器首个可选的开源权重模型,为编程工作流提供更低成本选择。该模型由 GitHub 托管于 Microsoft Azure,按供应商列表价格以用量计费。逐步向 Copilot Pro、Pro+ 和 Max 计划用户推送,用户可在 Visual Studio Code 1.127.0 或更新版本、Visual Studio 17.14.6 或更新版本、JetBrains 1.9.1-251 或更新版本、Xcode、Eclipse 等 IDE 及 Copilot CLI、GitHub.com、GitHub Mobile 等平台中选用。后续几周将扩展至 Copilot Business 和 Enterprise,当前默认关闭,需管理员在 Copilot 设置中启用策略。
Godot 开源游戏引擎发布新贡献政策,禁止“vibe coding”(AI 生成大量代码),因 AI 生成的 PR 使审阅时间成为瓶颈。大量 AI 生成代码将被禁止,仅允许代码补全等小型辅助工具。贡献者需披露是否使用 AI 辅助编写代码,同时禁止在 PR 讨论、议题、提案中使用 AI 生成文本。推文作者认为该规则执行不切实际,难以区分哪些代码是 AI 生成的。
葡萄牙政府7月1日宣布开源大语言模型AMALIA正式发布,这是首个基于欧洲葡萄牙语开发的模型。由60余位研究人员历时18个月开发,先期投资550万欧元,使用了Deucalion、MareNostrum 5等算力基础设施。第一阶段利用约4万亿个葡语单词训练出9B规模模型,后续多模态升级后具备理解文本、图像、声音的能力。今年内还将新增22B版本并获得智能体能力,需追加150万欧元投资。
Lift 是一个 PDF 到结构化数据的提取工具,本教程构建了完整的受控评估工作流。通过 4-bit NF4 量化,约 10B 参数模型可在 16 GB GPU(如 T4/L4)上运行。教程生成含干扰项的合成多页研究论文,测试模型在真实文档布局中恢复标题、作者、数据集、指标、超参数、局限性和仓库链接的能力,并输出结构化 JSON,实现模式引导的字段级评估。
UBS报告称约60%大公司正放缓AI支出,CFO和CTO聚焦账单上升与ROI不均,企业AI进入预算管控,任务被路由至更便宜模型。该趋势压力先给OpenAI和Anthropic。JP Morgan研究显示中国AI模型每token成本比美国低最多50倍,中国公司在OpenRouter平台流量从不足2%(2024年底)升至超45%(2026年4月)。arXiv研究证实美国芯片出口管制加速了中国开源AI生态发展。Google和Anthropic分别推出注重效率的Gemini 3.5 Flash和Claude Sonnet 5。
U.S. chip restrictions helped push China to build and spread open AI models. The authors tested this by looking at polic...
Osaurus AI App 推出 Mac 原生 AI 工作台,不是浏览器套壳,而是用 Swift 在本地运行图像生成。用户生成图片时自动卸载当前聊天模型,加载本地图像模型(支持任意 MLX 模型),在 GPU 上生成并保存真实文件后再切回聊天模型,全程无需联网。目前 6k GitHub Stars、15.5 万次下载,MIT 开源,适合在 Mac 上本地跑多模型切换。
Venice AI 获得由 Dragonfly 领投、Coinbase Ventures 等参投的 6500 万美元 A 轮融资,估值 10 亿美元。该平台提供 200 余个 AI 模型,注重隐私:用户输入加密且不存储数据,部分模型支持端到端加密(需付费订阅)。目前拥有 85 万独立访问用户、300 万活跃用户,日均 170 万次 API 调用,年化收入超 7000 万美元,已实现盈利。公司发行了 VVV 和 DIEM 两种加密代币,约 8% 用户使用加密支付。融资将用于购买 GPU 并自建数据中心。
ModelScope 上开源了 Boogu-Image-0.1-Edit-Turbo,一个 4 步蒸馏的 image-to-image 编辑模型,主打快速视觉编辑。支持物体替换、风格迁移、场景/背景修改,以及带文字感知的图像变换。
开源游戏引擎 Godot 正式更新贡献指南,明确禁止 AI 编写的代码、由 AI 智能体提交的拉取请求,以及人工交流中出现的 AI 生成文本(机器翻译除外)。Godot 基金会表示,大量低质量 AI 生成 PR 正“日益消耗和打击”维护者积极性,而 AI 无法承担代码责任,长期难以将代码审查转化为对新贡献者的指导。新政策旨在为低质量内容设置障碍,同时要求所有贡献来自能对其代码负责的人类,并在代码出现问题时自行修复。
瑞银分析师调研十余家企业IT负责人后发现,约六成企业已出台管控措施收紧AI开支。token调用成本是核心顾虑,Uber运营总监坦言AI投入回报微薄。DeepSeek等开源模型与中国本土大模型有望受益,尤其适合非代码类业务。短期内OpenAI、Anthropic等闭源厂商承压最大。谷歌推出Gemini 3.5 Flash,Anthropic发布Claude Sonnet 5以降低成本。瑞银称这一趋势为“良性调整阵痛”,无企业彻底叫停AI落地。
美团发布LongCat-2.0,总参数1.6万亿、每个token仅激活约480亿参数的MoE模型,从预训练到大规模部署全程运行在5万张国产算力芯片上,训练消耗超35万亿tokens,无回滚、无不可恢复loss突刺。Agent场景表现突出:在Terminal-Bench 2.1和SWE-bench Pro编程任务上追平Gemini 3.1 Pro,FORTE通用Agent任务与Claude Opus 4.6持平。最大输出128K,最高提供1M上下文,采用LSA稀疏注意力机制和N-gram Embedding优化长上下文与工具调用。已开放API接入,支持OpenAI Compatible和Anthropic API生态,可直接接入Claude Code和Codex等工作流。
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)NVIDIA 发布 Nemotron-Labs-TwoTower,基于冻结的自回归骨干 Nemotron-3-Nano-30B-A3B 的扩散语言模型。采用双塔架构:上下文塔冻结,降噪器塔训练,通过层对齐交叉注意力和状态播种协作。在 2×H100 上 BF16 评估,保留 98.7% 的 AR 基线质量,生成吞吐量提升 2.42 倍(γ=0.8,块大小 S=16)。降噪器在约 2.1T token 上训练,骨干使用 25T token 预训练。总参数约 60B,每 token 活跃参数约 3B/塔。支持扩散、模拟 AR 和 AR 三种解码模式。
Godot 基金会正式修改贡献指南,禁止开发者提交 AI 直接生成的代码、AI 智能体发起的 Pull Request,以及沟通过程中使用 AI 翻译器生成的文本。理由是近几个月“AI slop”问题持续消耗维护者精力、打击审查者积极性。新规允许 AI 用于“机械性的小任务”,但必须主动披露使用情况。所有贡献必须由能对代码负责的人类提交,并在出现问题时承担修复责任。目前基金会表示将采取保守态度,未来政策可能随技术发展重新评估。
Google Research 发布 TabFM v1.0.0,一种面向表格数据的零样本基座模型,无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示,通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准(38 个分类、13 个回归数据集,样本量 700 至 15 万)上,TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub,Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。
Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...
Backstage and onstage with @Thom_Wolf and @swyx . I really enjoyed the fireside chat! Thanks for having me back at @aiDo...
美团发布并开源LongCat-2.0,1.6万亿总参数、480亿激活参数(3%)的MoE大模型。使用35万亿token训练,在5万片国产芯片上“全程无回滚”完成。引入LongCat稀疏注意力(LSA),包含流感知索引、跨层索引和层级化索引,解决长文本注意力瓶颈。采用5-gram N-gram Embedding增加135B参数,在不增加MoE专家竞争的情况下增强局部上下文理解。训练使用6D并行技术适配国产算力。计划2026年6月30日发布并开源。
.@tufalabs just open sourced their 1st place notebook 👀
美团于6月30日发布新一代万亿参数大模型LongCat-2.0并开源。总参数1.6T,平均激活约48B,原生支持1M超长上下文,在五万卡国产算力集群上完成全流程训练与推理。采用LSA稀疏注意力、零计算专家、ScMoE及MOPD多专家融合(Agent/Reasoning/Interaction三组专家)架构。评测中SWE-bench Pro获59.5,SWE-bench Multilingual获77.3。预览版已通过OpenRouter和longcat.ai开放,月调用量跻身OpenRouter全球前三。
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)中国团队发布Agents-A1,一个35B参数的agent模型,通过让模型学习更长的验证工作习惯(平均训练样本45K tokens),声称达到1T参数模型的性能。模型采用Apache-2.0许可,权重已开源至Hugging Face。训练方法:构建长动作记录数据,训练多个专家教师模型(搜索、科学、指令跟随、工具使用等),再将技能蒸馏至一个学生模型。Agents-A1在搜索、科学、编码、工具使用、指令跟随等长任务基准上表现优异。
Rohan Paul 新闻通讯要点:央行担忧 AI 淘金热可能引发下一场金融冲击;中国开发者通过灰色市场 API 以官方价格 5%-10% 购买 Claude 服务,且隐藏真实用户身份;Sakana Fugu 技术报告发布;中国 AI 模型每 token 成本比美国同行低至 50 倍;DeepSeek 发布新推理优化方法;Meta 开源无需手术的脑机接口系统,词准确率达 78%。
前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)免费开源 AI 智能体 OpenClaw 现已推出 iOS 和 Android 应用。用户通过 OpenClaw Gateway 将手机与智能体及所需工具、技能连接,可在移动端运行智能体完成编程、餐食规划等任务。OpenClaw 今年早些时候因 MoltBook(号称完全由智能体运营的社交媒体站)走红,其创建者 Peter Steinberger 随后加入 OpenAI。尽管 MoltBook 后被证实部分由人类伪装智能体运行,但此事件推动了智能体生态扩张,如今 AI 智能体已嵌入更多场景,包括手机端。
GLM-5.2 在 Artificial Analysis Intelligence Index 中以 51 分成为开源权重智能最高的模型,但输出 token 达 1.41 亿(95% 推理),远超平均模型的 1.8 倍。相比之下,Claude Opus 4.8 输出 1.17 亿 token 得分 56,GPT-5.5 输出 7200 万 token 得分 55。近三分之二 token(8800 万)集中在 Humanity's Last Exam,是 GPT-5.5 的 3.2 倍,得分仅 40%(Opus 46%,GPT-5.5 44%)。AA-Omniscience 幻觉率评测中 GLM-5.2 仅得 4 分,远低于 Opus 4.8(27)、GPT-5.5(20)和 Gemini 3.5 Flash(23)。在 agentic 任务 GDPval-AA v2 上 GLM-5.2 为开源第一、整体第三,超过 GPT-5.5。其他开源模型如 DeepSeek V4 Pro 得分 44,落后 7 分。
美团发布开源编码模型LongCat-2.0,采用1.6T参数MoE架构(活跃参数33B-56B),支持1M tokens上下文窗口。该模型在5万块国产芯片上从头训练,使用华为HCCL通信库,验证国内算力集群可胜任大模型预训练。已开源至longcat[.]ai和OpenRouter,调用量全球前三。与DeepSeek-V4-pro仅推理使用国产硬件不同,LongCat-2.0预训练和推理均依赖国产芯片。
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)针对用户Cristian嘲讽“被OpenAI收购、拿到无限token却做出劣质应用”的推文,Peter Steinberger回应:OpenClaw未被收购,它是OpenClaw Foundation下的独立开源项目,由社区构建;OpenAI仅赞助token用量,他本人恰好在OpenAI工作。当前iOS和Android应用尚不完善,但已实现安全配对和推送通知并通过App Review。他表示当天收到约30条类似批评,希望得到建设性帮助,而非空耗注意力。
imagine getting acquired by @OpenAI, get unlimited AI tokens and still drop this slop abomination
http://x.com/i/article/2071684582336782336
Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...
New Claude app strings suggest Anthropic is preparing to put Fable 5 behind a separate usage-credit system billed outsid...
Deepseek推出DSpark推理框架,采用推测解码技术,由小模型生成候选答案、大模型批量验证,并一次生成多个token而非单个,使每用户响应速度提升60–85%。系统基于置信度动态调整验证深度,减少无效计算。DSpark与Deepseek-V4-Pro模型(与北京大学联合开发)已在HuggingFace和GitHub以MIT许可证开源。高效推理降低对高端芯片需求,有助于中国与欧盟在芯片受限下获取更多AI性能,短期构成战略优势。
Meta AI 近日发布 Brain2Qwerty v2,一种基于非侵入式脑磁图(MEG)信号的实时脑到文本解码管线,无需植入或手术。系统在 9 名志愿者约 22,000 句打字数据上训练(每人 10 小时),平均词准确率 61%(WER 39%),最高参与者达 78%,超过半数句子错误不超过一个词。管线由卷积编码器、Transformer 和字符级语言模型组成,并微调大语言模型提取语义表征,用 AI 智能体自动化改进解码流程但最终配置由人工选定。Meta 同时以 CC BY-NC 4.0 协议开源 v1 和 v2 训练代码。
花旗研究数据显示,中国模型每百万token收费低至18美分,而顶级模型均价4美元。OpenRouter上开源模型处理占比从1月34%升至6月65%,DeepSeek等中国模型因低价受关注。Gartner预测AI编码成本2028年将超普通开发者薪资。按用量付费使企业从“选最强模型”转向成本控制,OpenAI和Anthropic面临逐任务比价压力。前Meta PM及Perplexity CEO指出,中国能更快建设数据中心,电力、许可、人力、专业能力均不成问题,进一步压低成本。
Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...
LongCat-2.0 正式开源,总参数 1.6 万亿,每 token 激活约 480 亿参数,采用 MoE 架构。新引入 LongCat Sparse Attention(LSA)和 N-gram Embedding 模块,支持百万级上下文窗口。模型在 5 万+ AI ASIC 上训练,消耗超 35 万亿 tokens,训练全程无回滚。在编码和智能体任务上表现优异,深度集成 Claude Code 等工具。提供 GitHub、HuggingFace 及 API 访问。
关联讨论 6 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:美团 LongCat (@Meituan_LongCat)X:Emad Mostaque (@EMostaque)IT之家(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)