7月3日

12:07

IT之家（RSS）

Palantir CEO 卡普抨击 OpenAI 等 AI 公司"双重收费"，要钱还窃取数据

Palantir CEO 亚历山大·卡普在 CNBC 采访中指责 OpenAI、Anthropic 等前沿 AI 公司实行“双重收费”：既向客户收取高额 Token 消耗费用，又通过服务窃取客户业务流程数据（权重和阿尔法值）用于改进模型，使客户面临核心业务被复制或取代的风险。多家美国企业对此表示愤怒。

Anthropic OpenAI 大佬观点数据/训练

11:07

IT之家（RSS）

Robinhood CEO 弗拉德·特内夫：AI 智能体很快将媲美人类交易员，散户有望获得机构级交易能力

Robinhood CEO 弗拉德·特内夫预测，AI 智能体很快将媲美人类交易员。他解释“智能体交易（Agentic Trading）”的核心是让智能体完成人类交易员的每一项工作，目标让散户拥有与机构投资者、高频交易公司相同的工具和算力。本月早些时候，Robinhood 宣布裁员约 10% 以提升运营效率，特内夫称业务从未如此强劲，但需精简团队。

智能体大佬观点

10:10

公众号：卡尔的AI沃茨

Anthropic 封号加码，Sonnet5 发布，开源「搭子」Skill 降本

Anthropic 加大中国用户封号，Claude Code 通过时区和 ANTHROPIC_BASE_URL 检测，7 月 2 日新版本删除该代码但部署更强措施。Sonnet5 模型和新 Tokenizer 使英文 token 数增至 1.4 倍，API 降价但实际更贵。Fable5 窗口期至 7 月 7 日，周额度 50% 可用。开源「搭子」Skill 让 Claude Code 与 Codex 分工，成本降至纯 Claude 的 30%，避免反复冷启动。

智能体 Anthropic 大佬观点编码

09:44

Hacker News 热门（buzzing.cc 中文翻译）

美国的隐私危机：Cynthia Dwork等专家谴责商务部禁止差分隐私

2026年6月4日，美国商务部发布指令DAO 216-26，禁止在经济分析局和人口普查局出版物中使用差分隐私等现代隐私保护技术，只允许粗化（四舍五入、聚合、范围化）和压制。该指令禁用了自1990年用于人口普查的交换技术、自2002年用于季度劳动力指标的输入噪声注入、自2008年用于OnTheMap的差分隐私，并取消2030年人口普查的差分隐私方案。哈佛教授Cynthia Dwork等专家联名指出，此举将降低数据可用性和隐私保护，绕过法定程序，服务于政治利益。

安全/对齐政策/监管数据/训练

09:06

IT之家（RSS）

OpenAI 奥尔特曼称 AI 发展就像科幻小说，呼吁建立全球治理框架

OpenAI CEO 萨姆·奥尔特曼在《金融时报》发文，认为 AI 发展已如同科幻小说情节，预计未来一两年内将打造出能力惊人的系统，为全球创造巨大价值。他称 AI 对人类社会的影响可能超过电力，呼吁尽快建立全球 AI 治理框架，由各国政府代表和独立技术专家组成论坛，制定统一行业标准，监督 AI 实验室防止安全军备竞赛，避免少数国家过度控制 AI 发展。奥尔特曼建议参考国际原子能机构的运作模式。

OpenAI 大佬观点安全/对齐

08:30

公众号：数字生命卡兹克

精选62

Claude Fable 5 自主优化 AIHOT 网站 SEO/GEO 全记录

作者用 Claude Fable 5 优化 AIHOT 网站的 SEO 与 GEO。模型自主启动 22 个 Agent 调研 40 分钟，发现豆包 App 每天六千多次访问未被统计等异常。规划境外加速时，否定 Claude Opus 4.8 的 Cloudflare 方案（无法国内直连/国外分流，且 2025 年起默认拦截 AI 爬虫），改用火山引擎 CDN。因需白名单，模型自行找到工单入口提交专业工单，22 分钟开通；发现工程师漏答回源 IP 网段问题，礼貌追问并补充备选方案；发现官方方案有安全漏洞，自行加暗号验证。23:30 切换域名解析，10 分钟后 616 个海外请求走新线路。最终生成运维文档，提醒边缘证书 10 月 2 日到期并附续期步骤。

智能体 Anthropic 大佬观点

推荐理由：Claude Fable 5 展示的自主性远超预期，从调研到工单交互一气呵成，这种执行力让我重新思考 AI 同事的定义。

08:19

Anthropic：Newsroom（网页）

同事件精选64

Claude Fable 5 网络安全分类器与越狱严重性框架详解

Anthropic 重新部署 Claude Fable 5 并向全球用户开放，同步披露了内置安全分类器设计。分类器将网络安全使用场景分为四类：禁止使用（勒索软件/物理破坏等）、高风险双重用途、低风险双重用途及良性使用。前两类直接拦截；低风险类别部分监控，仅在安全边际内选择性拦截。此外，Anthropic 与 Glasswing 合作提出 AI 越狱严重性框架初稿，并已启动 HackerOne 项目收集越狱案例。

Anthropic 安全/对齐

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：Anthropic首次公开Fable 5安全分类器的详细类别和越狱严重性框架草案，这可能是行业级安全标准的雏形，对开发者和政策制定者都有参考价值。

08:06

IT之家（RSS）

Meta CEO 马克·扎克伯格：AI 智能体技术发展得比我想象要慢

扎克伯格在 Meta 内部全员会上表示，AI 智能体技术进展未达预期，公司仍需投入更多时间和精力。Meta 正全力竞逐 AI 模型开发，投入数百亿美元建设基础设施和招聘人才，但快速推进 AI 也带来代价，需在开发速度、员工信任与团队士气之间取得平衡。扎克伯格仍相信 Meta 能在未来 3-6 个月内看到超级智能的部分成果。

智能体 Meta 大佬观点

08:06

IT之家（RSS）

软件工程传奇肯特·贝克：程序员缺软技能，AI时代需学人际交往

7月3日，据《商业内幕》报道，知名软件工程师肯特·贝克指出，软件工程师虽技术出众，但常缺少职场越来越重视的软技能，如情绪调节、同理心和沟通方式。他认为这些是典型软件工程师“糟糕”的特质。AI正重塑行业，沟通、协作与共情等软技能直接影响技术人员职业前景。贝克将程序员学习人际交往形容为一场“宇宙级玩笑”：入行时被告知只需掌握计算机，最终却要面对完整的人类一面，能否推动现实改变取决于是否懂得沟通和共情。

大佬观点现象/趋势编码

06:08

MarkTechPost（RSS）

RAG-Anything 教程：在 Colab 中构建文本、表格、公式和图像的多模态检索管道

本教程使用 RAG-Anything 搭建多模态检索工作流，可检索文本、表格、公式和图像。首先在 Colab 中安装依赖并修复 Pillow 版本，通过 OpenAI API key 配置对话、视觉和嵌入函数。接着生成包含图表和 PDF 的合成多模态报告，将其转为 content_list 格式并插入检索系统。最后配置并测试 naive、local、global 和 hybrid 四种检索模式。环境变量包括 CHUNK_SIZE=900、CHUNK_OVERLAP_SIZE=120，便于在笔记本中复现。

检索增强多模态教程/实践

05:50

Runway：News（网页）

借用夜晚：将闲置推理GPU回收用于研究

Runway 开发了名为 deckard 的容量控制器，在生产推理集群与研究集群间动态重分配 GPU。生产流量在北美工作日上午 9 点 ET 达峰，晚 8 点 ET 跌至不足一半。控制器基于预计算的时间窗口（如工作日 8:30–12:30 ET 高峰子窗口）提前扩容和回收，每次集群间转移耗时 20–60 分钟。利用排队论（Erlang‑C、Little's Law）确定目标利用率，避免接近 85% 后的队列发散（90% 利用率下等待时间约为服务时间的 10 倍）。此方案使夜间闲置 GPU 回归研究、白天排队等待缩短。

推理教程/实践部署/工程

03:21

Simon Willison 博客

使用 DSPy 评估和优化 Datasette Agent 的 SQL 系统提示词

Simon Willison 通过 Claude Code 中的异步研究任务（基于 Claude Fable 5）尝试用 DSPy 对 Datasette Agent 执行只读 SQL 查询时的系统提示词做评估与优化。Fable 选择测试 GPT 4.1 mini 和 nano，发现改进方向：模式列表仅给出表名，而“如果已有信息不要调用 describe_table”的建议导致列名猜测和错误重试循环。建议在提示词的模式列表中包含列名或软化该建议。

智能体教程/实践数据/训练

02:37

LMSYS：Blog（Chatbot Arena 团队）

精选59

Agent辅助的SGLang开发：初步探索

SGLang团队将LLM服务、分布式运行时、GPU内核、扩散管道等工作流编码为可执行的SKILL.md文件、脚本、基准合约和审查循环。现有技能包括：SGLang .claude/skills（CUDA调试、内核集成、性能分析等）、SGLang diffusion .claude/skills（扩散模型添加与调优）、BBuf/AI-Infra-Auto-Driven-SKILLS（跨框架SOTA循环）、KDA（MLSys 2026 FlashInfer内核竞赛获胜方案）以及BBuf/KDA-Pilot（已合并三个SGLang集成PR）。Profile证据是性能工作的核心，长期优化转向Loop Engineering——SGLang SOTA Performance Loop将追求SOTA分解为公平基准测试、差距决策、性能分析、补丁和再验证，Humanize/RLCR添加外部审查，Codex Goal以更低协调开销运行相同循环。评审重要性提升，开发者需定义问题、选择证据、设计工作流并判断结果是否可用于生产。

推理教程/实践部署/工程

推荐理由：这不是一篇普通的开发经验总结，而是 SGLang 团队把调试、基准测试和性能调优等重复劳动变成可执行 agent 技能的实操手册，对于做推理框架和复杂工程的人非常值得一看。

01:21

Simon Willison 博客

Geoffrey Litt 在 AIE 提出「理解以参与」理念：与编码智能体协作需避免认知债务

Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念：开发者需要深入理解代码，才能在与编码智能体（coding agents）的协作中保持主动参与，避免因认知债务（cognitive debt）导致无法有效推进项目。他认为，缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。

智能体大佬观点编码

00:45

The Decoder：AI News（RSS）

Anthropic 为 Claude Code 削减 80% 系统提示词，称 Fable 5 模型"想要更短的提示词"

Anthropic 将 Claude Code 的系统提示词削减了 80%。技术员工 Tariq Shihipar 指出，新 Fable 5 模型（Mythos 类）不再需要更多指令和示例，过多的示例反而会限制模型的想象力。Anthropic 转而通过上下文而非硬性规则来引导模型。这一变化分阶段发生：早期模型需要短提示词配合大量示例，随后提示词随模型理解能力提升而变长，如今又再度缩短。

Anthropic 大佬观点编码

00:14

Hacker News 热门（buzzing.cc 中文翻译）

CursorBench 3.1

CursorBench 3.1 新增代码库理解、bug 查找、规划和代码审查任务，并改进了编辑任务的评分标准。排行榜显示，Fable 5 Max 以 72.9% 得分、$18.02 每任务成本居首，Fable 5 Extra High（72.0%，$13.74）和 Fable 5 High（70.6%，$10.81）紧随其后。Opus 4.7 Max 得分 64.8%、成本 $11.02；GPT-5.5 Extra High 得分 64.3%、成本 $4.37；Composer 2.5 得分 63.2%、成本仅 $0.55。共收录 36 个模型/配置，得分范围 72.9%–31.9%。

编码评测/基准

00:06

IT之家（RSS）

何小鹏：中国智能辅助驾驶领先全球，未来3-5年可见L4甚至L5落地

7月2日晚，小鹏MONA L03首秀后，何小鹏称中国智能辅助驾驶在效果和法规制定上均领先全球。联合国ADS GTR法规覆盖L2至L5，其中L2全面性条款意味着今年12月中国现有的L2智能辅助驾驶可在全球使用。何小鹏曾在今年全国两会建议从L2跳过L3直接进入L4、L5，他相信未来3到5年内不仅能看到L4落地，甚至能看到L5在所有场景安全通行，速度超出想象。

具身智能大佬观点政策/监管

7月2日

23:14

Hacker News 热门（buzzing.cc 中文翻译）

The Editorial 发稿称 AI 取代记者致 47 家周报倒闭，事后证实为 AI 假新闻

新闻网站 The Editorial 发布一篇长文，声称右翼媒体 1819 News 通过空壳公司收购阿拉巴马州 47 家周报，用 AI 生成学校董事会纪要、体育战报和讣告，导致报纸在 18 个月内集体停刊。但经核实，文中提及的多家报纸仍在正常出版，所引用的公司、人物和诊所均为虚构。The Editorial 已于 6 月 30 日以“未通过事实核查”为由撤稿。

其他现象/趋势

23:06

IT之家（RSS）

华为：乾崑智驾 ADS 4 升级至 ADS 5 不存在硬件限制

华为乾崑智能汽车解决方案今日发布《乾崑答网友问》，明确 HUAWEI ADS 5 辅助驾驶系统共有 ADS Max / Pro / SE 三个版本，用户可在车机端 ADS App 通过「设置-辅助驾驶-关于」查看当前版本。针对 ADS 4 Max / Pro / SE 升级至 ADS 5 对应版本，官方确认不存在硬件限制。

教程/实践端侧

21:14

Hacker News 热门（buzzing.cc 中文翻译）

"定理经济"的衰落

数学家 David Bessis 在文中反思，数学的核心产物是清晰与理解，而非定理本身。他用自己的两个未发表定理经历说明，证明定理并非最难，难点在于直觉和概念框架的构建。面对 AI 的快速发展，他感到既兴奋又担忧：AI 可能摧毁数学的“定理经济”，但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。

DeepMind OpenAI 大佬观点开源生态

20:45

The Decoder：AI News（RSS）

精选71

Fable 5 在 RLI 基准中达成 16.1% 自动化率，较八个月前提升六倍

Remote Labor Index（RLI）衡量 AI 智能体完成 240 个付费自由职业项目（总值 14.4 万美元）的专业质量比例。最新结果显示，Fable 5 自动化率达 16.1%，是八个月前最佳系统 2.5% 的六倍多，也超过 Opus 4.8（8.3%）和 GPT-5.5（6.3%）。因美国政府限制访问，Fable 5 仅完成 218/240 个项目评估，最坏情况仍达 14.6%。Gemini 3 Pro 仅 1.25%，落后于更老模型。AI 裁判会高估模型表现（GPT-5.5 评分偏高近三倍），仍需人类评估员打开专业软件（如 Blender）检验几何模型等细节。测试环境为虚拟 Linux 机，配备 30 余款专业应用，每项目最多 24 小时计算时间。尽管自动化率快速攀升，多数项目仍无法达到专业质量。

智能体 Anthropic OpenAI 现象/趋势

推荐理由：自由职业自动化率八个月翻了六倍，这个数据比任何模型基准都更说明AI对真实工作的渗透速度。虽然顶级模型仍会'作弊'，但趋势已经形成，做自由职业平台和外包的人该认真看看。

20:34

TechCrunch：AI（RSS）

用户利用开源AI智能体OpenClaw结合Claude自动生成约会视频，引发隐私争议

内容创作者Ben Guez用开源AI智能体OpenClaw追踪世界杯赛果，触发Claude自动生成Instagram试播视频，配文“我无法相信{国家}输了……需要情感支持的{国家}女孩请私信我”，几天内获得超过100万次观看和200条私信。另一位用户Jeff Weisbein利用OpenClaw规划南佛罗里达约会地点。还有人用Claude自动编写分手消息。安全公司NanoClaw联合创始人Lazer Cohen警告，让AI智能体单方面控制账户存在隐私风险，强调需要人类参与审批。

智能体 Anthropic 开源/仓库教程/实践

20:06

IT之家（RSS）

联想高管：从长期看，算力没有过剩

联想集团副总裁、联想中国首席战略官阿不力克木·阿不力米提表示，无论中国还是海外市场，AI算力需求还有很大空间，没有出现算力过剩。他指出，面向个人消费者的C端领域，成熟且具市场头部地位的AI产品数量有限；面向企业级应用的B端市场，商业化落地潜力尚未充分释放。同时，他警示当前AI产业链存在供给侧话语权过强现象，导致上下游供需循环失衡。近期有消息称Meta计划出售算力，引发了市场对算力过剩的担忧。

大佬观点行业动态

18:31

公众号：千问APP（阿里）

精选62

千问团队朱达：C端Agent Harness的"多快好省"工程哲学与主动服务探索

千问团队2026年1月上线通用复杂任务Agent（千问App胶囊入口），总结“多快好省”方法论：支持信息搜集、研究分析等任务；执行时间降至初始1/3；通过搜索范式与上下文管理优化交付质量；Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务，构建User Memory、Environment、Task System、Assistant四大组件，指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering，下一站是A IWare Engineering，强调“低功耗，够用就行”。

智能体大佬观点部署/工程

推荐理由：千问C端团队分享的Agent工程实践很务实，从“多快好省”到AIWare Engineering的演进思路，对正在做复杂任务Agent的团队是一个有价值的参考系。

18:20

公众号：卡尔的AI沃茨

实测腾讯Marvis：手机远程操控Mac清出100GB，还能续写小说

腾讯推出桌面AI管家Marvis，可通过手机远程操控Mac。实测功能包括：电脑自检（扫描磁盘、性能、电池、使用习惯，生成网页报告）、垃圾清理（清出100GB至占用80%以下，删除需逐项确认）、远程操控多台电脑（支持鼠标键盘实时操作）、跨浏览器搜索“AAindex前十模型API接入方式”自动整理成表格、一句话生成PPT（质量约80分）、读取本地小说项目《灰质交易》并根据设定续写第一章。Marvis内部接入混元和DeepSeek，定位为电脑AI管家，与偏交付的WorkBuddy差异化。

智能体评测/基准

13:04

IT之家（RSS）

谷歌详解安卓Halo：状态栏专属席位充当AI智能体交互中枢

谷歌昨日发布视频，详细介绍安卓Halo功能。该功能于今年5月I/O大会亮相，旨在提升后台AI助手透明度。启用后，屏幕顶部状态栏拥有专属席位，实时显示AI智能体（如Gemini）状态。安卓总裁萨米尔·萨马特称，Halo为智能体提供专用沟通平台，用于报告更新、接受用户指示，在需要人工介入的后续提问、进度更新、结果展示时，用户无需重新打开AI应用即可交互。

智能体 Google 产品更新端侧

09:03

IT之家（RSS）

优必选 CEO 周剑：机器人将替代人类劳动力，珍惜最后工作时光

优必选 CEO 周剑在6月30日的2026年度全球发布会上表示，未来5到20年内机器人将替代人类劳动力，现在20多岁的年轻人20年后可能无工可做。他认为从事枯燥工作的人应“露出幸福的微笑”，因为这种时光不会太长。周剑此前称机器人首先替代招工难、环境困难的岗位，未来人类应转向艺术、哲学等创新性工作。人形机器人可弥补产业人口缺失并降低制造业成本，若中国不用，10-20年后制造业优势将丧失。

具身智能大佬观点

06:42

Dwarkesh Patel：Podcast & Blog（RSS）

关于AI重大问题的获奖征文

Dwarkesh Patel举办的AI征文比赛评选出三位获奖者。第一名Jassi Pannu主张OpenAI基金会应投入数十亿美元终结空气传播疾病，利用AI加速自主生物学发现，可带来超1万亿美元年GDP增长并消除灾难性流行病风险。第二名Ege Erdil建议AI供应链外的国家通过强产权、低资本税和开放监管政策抓住增长机会。第三名Michael Li类比香港地铁商业模式，提出AI实验室可通过收购互补性资产盈利。

大佬观点现象/趋势

05:34

MarkTechPost（RSS）

使用 Lift 将研究 PDF 转换为结构化 JSON：受控的、模式引导的字段级评估

Lift 是一个 PDF 到结构化数据的提取工具，本教程构建了完整的受控评估工作流。通过 4-bit NF4 量化，约 10B 参数模型可在 16 GB GPU（如 T4/L4）上运行。教程生成含干扰项的合成多页研究论文，测试模型在真实文档布局中恢复标题、作者、数据集、指标、超参数、局限性和仓库链接的能力，并输出结构化 JSON，实现模式引导的字段级评估。

开源生态教程/实践数据/训练

05:09

Hacker News 热门（buzzing.cc 中文翻译）

反帕兰提尔宣言

哲学家CEO Harry Halpin发表15条宣言，批判Palantir等公司将互联网监视技术用于国家暴力，形成科技法西斯主义。指出外部安全威胁驱动的监控最终会转向内部移民、异见者乃至全体民众；呼吁程序员承担全球道德责任，用去中心化代码保护隐私、对抗监控；反对全面自动战争与核战争，认为程序员应建设赋能个人自由的工具，而非为腐败统治者服务。

政策/监管现象/趋势

04:39

Hacker News 热门（buzzing.cc 中文翻译）

ZCode：来自GLM开发团队的Claude Code

一个浏览器五子棋游戏在 index.html、styles.css 和 app.js 中实现，渲染 15x15 棋盘，支持四个方向胜负判断并高亮连成五子的路径。AI 采用启发式评分，搜索附近候选点，综合进攻棋型、防守阻挡和中心区域偏好选择最优落子，同时提供可选的“AI 关注区域”覆盖层。

其他

04:35

Tomer Tunguz 博客（VC 分析）

精选60

构建AI智能体应优先设计路由

构建AI智能体时，应优先设计路由（router）而非选择模型。路由决定每个请求由哪层模型处理。正确路由可使70-80%流量运行在免费本地模型或异步推理上，将AI开销降低90%+。Brian Armstrong指出Coinbase通过更好的默认设置、路由和缓存，在token使用量增长的同时将AI支出减半。路由分三层：技能分类器、路由器、模型选择器。本地计算近乎零成本，异步批量推理比实时推理便宜两个数量级。大多数工作无需秒级返回。同步预测器标记复杂任务，夜间批量评估器更新路由权重。技能蒸馏后，非编码类任务中70-80%智能体流量可由本地模型处理。

大佬观点部署/工程

推荐理由：Tunguz 把代理架构的设计重心从模型选择拉回到路由上，三层分类器-路由器-选择器的划分很清晰，做 AI 应用的团队可以参考，但其中的新东西不多。

01:39

Meta Engineering Blog（RSS）

精选71

Meta 大规模 AI 存储蓝图

Meta 运营数百 EB 级存储集群，基于 Tectonic 分层存储层构建 BLOB 存储架构，以应对两大挑战：最大化 GPU 利用率与研究迭代速度。传统 BLOB 架构的多层元数据查询可导致数百毫秒延迟，使 GPU 因 I/O 等待停顿。新架构将训练栈逐步迁移到 BLOB 存储接口上，利用闪存提供可预测的低 pMax 延迟，避免单 GPU 慢速拖慢整批任务。同时，统一的数据湖访问支持地理分布 GPU 间的数据高速注入与跨区移动，提升研究效率。

Meta 数据/训练现象/趋势部署/工程

推荐理由：Meta的存储架构复盘给出了一条明确路径，从重写元数据到分层缓存，他们把GPU利用率和研究者迭代速度同时提升了一个档次，做AI训练平台的值得细读。

00:20

Artificial Intelligence News（RSS）

部署零售AI以扩展个性化和客户洞察

零售AI通过生成式UI实时定制页面布局、文案和交互组件，将购买频率提升35%、平均订单价值提高21%。多模态社交倾听系统处理视频、音频和未标记图像，覆盖82%的互联网流量，全球市场本财年达28.3亿美元，76%的分析师报告可见投资回报。基于大语言模型的合成用户模拟可在沙箱环境中执行数千次自动化访谈和内容测试。边缘计算硬件支持无收银台结账、实时货架跟踪等物理自动化，该市场预计2040年超3700亿美元。Model Context Protocol（MCP）作为开放通信标准，标准化模型与零售数据库、产品目录及CRM的集成。

多模态现象/趋势端侧部署/工程

7月1日

22:20

Cloudflare Blog

内容独立日一周年：构建智能体互联网的商业模型

内容独立日宣布一年后，一个付费内容的动态市场已正式形成。自主AI智能体的兴起正在颠覆传统搜索推荐模式，构建可持续的网络经济需要一套全新基础设施来支撑。

智能体搜索现象/趋势

20:25

The Verge：AI（RSS）

Google Home Speaker 评测：硬件出色但 Gemini 尚未成熟

Google 推出首款“为 Gemini 打造”的智能音箱 Home Speaker，售价 99.99 美元。硬件设计精巧，音质在体积相当的产品中表现良好，支持 360 度音效、立体声配对、Matter 控制及 Thread 边界路由器功能，可配合 Google TV Streamer 作为音频输出。然而，内置的 Gemini for Home 智能助手响应缓慢、不可靠，且部分功能需要付费才能使用。相比前代 Nest Audio，新款音箱尺寸更小但低频偏弱，在同价位竞品（Echo Dot Max、HomePod Mini）中音质排名第三。

Google 评测/基准语音

20:03

IT之家（RSS）

AI批量造富催生新消费主力，奢华腕表与抗衰老成新贵标配

人工智能批量催生千万富翁。SpaceX完成IPO，4400名员工成为千万富翁；其斥资600亿美元收购AI初创Cursor，四位20多岁联合创始人跻身亿万富豪。新富阶层将资金投入奢华腕表（百达翡丽、爱彼等，售价可达30万至86万美元）、抗衰老疗程（年花费200万美元，单次血浆置换近7000美元）及顶级体验（卢浮宫私人晚宴、2026年世界杯门票等），推动奢侈品消费热潮。Anthropic与OpenAI上市计划推进，预计继续催生AI新贵。

现象/趋势

19:40

The Decoder：AI News（RSS）

Claude Sonnet 5延续Anthropic隐藏涨价的模式

Claude Sonnet 5在Artificial Analysis评测中以53分（峰值）排名第五，与GPT-5.5 (high)并列。虽输入/输出token价格维持$3/$15不变，但每任务平均成本达$2.29，高于Opus 4.8的$1.97。原因：max设置下输出token消耗比Sonnet 4.6多40%，在agent任务中运行约3倍循环，成本接近翻倍。Anthropic延续了通过新tokenizer增加约30% token消耗的隐藏涨价策略。Sonnet 5在CritPt仅得17%，低于多个更强模型；但Terminal-Bench v2.1、HLE、SciCode分别提升9、10、7分。目前有促销价$2/$10至9月1日，但隐藏成本上涨使其与低价竞品竞争时处于劣势。

Anthropic 推理行业动态

17:10

公众号：卡尔的AI沃茨

实测美团LongCat-2.0，国产芯片长出来的万亿大模型

美团发布LongCat-2.0，总参数1.6万亿、每个token仅激活约480亿参数的MoE模型，从预训练到大规模部署全程运行在5万张国产算力芯片上，训练消耗超35万亿tokens，无回滚、无不可恢复loss突刺。Agent场景表现突出：在Terminal-Bench 2.1和SWE-bench Pro编程任务上追平Gemini 3.1 Pro，FORTE通用Agent任务与Claude Opus 4.6持平。最大输出128K，最高提供1M上下文，采用LSA稀疏注意力机制和N-gram Embedding优化长上下文与工具调用。已开放API接入，支持OpenAI Compatible和Anthropic API生态，可直接接入Claude Code和Codex等工作流。

智能体开源生态编码评测/基准

关联讨论 9 条

08:03

IT之家（RSS）

Meta CEO 扎克伯格不认为 AI 必然带来大规模失业，建议企业聚焦"个人超级智能"

扎克伯格认为 AI 不必然造成大规模失业，关键在于企业应优先发展“个人超级智能”赋能个体，而非将所有知识工作自动化。他影射 Anthropic、OpenAI，强调劳动者生产力提升速度须超过企业自动化速度，就业岗位才可能增加。Meta 已投入数十亿美元调整 AI 战略，他称之为“重启”。对于 Meta 生成式 AI 进展，他坦言仍有提升空间，超级智能实验室成立不足一年，模型进展超预期，但他认为“原本可以做得更好”。

Meta 大佬观点现象/趋势