6月28日

21:10

The Decoder：AI News（RSS）

AI成为真正同事的关键：停止回答问题，开始完成任务

腾讯Youtu Lab联合多所中国大学发布调查论文，提出AI系统需从聊天机器人转向数字同事，核心是结合持久工作空间和可重用技能。思考型LLM（如OpenAI o1、DeepSeek-R1）采用链式推理实现慢思考；工作空间（如

智能体现象/趋势

21:08

Chubby♨️@kimmonismus

Anthropic的商业案例值得研究。2025年底至2026年初，其企业/商业领域的使用量出现了惊人增长，使其成为第一。

Anthropic 现象/趋势

15:56

Rohan Paul@rohanpaul_ai

研究：AI让自由职业市场更重价格竞争

一项新研究（arXiv: 2606.21880）表明，AI正在将部分自由职业市场变成价格竞赛，高技能简历的优势被削弱。在ChatGPT出现后，AI暴露程度最高的职业中，人力资本信号（经验、声誉）的重要性下降了约7.8%，而价格的重要性上升了约1.1%。强背景工作者失去了部分需求优势，需求向更便宜的工人转移，表明AI使这些工作者显得更可互换。

现象/趋势论文/研究

14:26

Rohan Paul@rohanpaul_ai

AI职业暴露研究：聊天日志高估部分职业影响

一项新研究指出，基于聊天日志的AI职业暴露评分可能将平台流行度误当作真实劳动力暴露。分析发现，此类平台指标往往高估计算机与办公室工作，低估食品、运输、生产和体力服务岗位。在将数据按真实就业分布重新加权后，估计的就业影响缩水42%至93%，部分结果几乎归零。研究提示当前测量可能更多反映平台采用情况而非实际工作流程改变。论文题为《谁在使用AI？平台选择与职业AI暴露的测量》。

现象/趋势论文/研究

12:33

Hacker News 热门（buzzing.cc 中文翻译）

对AI垃圾内容的回应来自罗宾·威廉姆斯

文章引用《心灵捕手》中罗宾·威廉姆斯饰演的Sean对Will的经典独白，指出面对AI生成的垃圾内容、海量建议与网络噪音，最好的回应不是更多信息，而是真实的个人体验与情感联结。Sean用艺术、战争、爱情、失去等话题质问Will，强调二手知识无法替代亲身经历。作者认为这段台词完美概括了AI slop问题的本质——信息堆砌不等于真正理解。

OpenAI 现象/趋势

11:24

ginobefun@hongming731

GPT-5.6 发布：Sol 旗舰、Terra 均衡、Luna 速度型，发布受政府限制

OpenAI 发布 GPT-5.6 系列，包括旗舰 Sol、均衡 Terra 和速度型 Luna。Sol 在 Terminal-Bench 2.1 得分为 88.8%（Ultra 模式 91.9%），领先 GPT-5.5 的 88.0% 和 Claude Mythos 5 的 84.3%；GeneBench v1 以更少输出 tokens 获更强结果，ExploitBench 接近此前 Mythos 但仅用约 1/3 输出 tokens。价格：Sol 输入 $5/百万 tokens、输出 $30，缓存读取九折。发布前 OpenAI 向美国政府展示能力，按政府要求先以有限预览上线，首批约 20 家合作伙伴可访问。

OpenAI 模型发布现象/趋势行业动态

11:00

IT之家（RSS）

精选76

四大顶级AI对决《文明VI》：Claude核平法国仍输，暴露感知与执行短板

英国前首相府数据科学家Liam Wilkinson搭建76个MCP工具，将Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等四个模型放入《文明VI》进行23场对局。Claude扮演葡萄牙时，因法国文化胜利逼近，花50回合研发核弹核平图卢兹，但法国最终以外交胜利获胜。Wilkinson发现：AI主动检查全局状态仅占1-2%（感知盲区），计划后10回合内执行率仅48-66%（知行差距）。结论是智商非瓶颈，感知与执行才是关键。

智能体推理现象/趋势

推荐理由：前首相府数据科学家让 Claude、GPT 等打《文明 VI》，揪出了 AI 的「感知盲区」和「知行差距」——更聪明的大脑解决不了睁不开眼、伸不出手的问题，做智能体的必须直面这两个工程瓶颈。

09:00

IT之家（RSS）

Anthropic 调研：约半数 Claude 用户称 AI 已可承担一半以上的工作

Anthropic对约9700名Claude用户的调研显示，33%受访者认为AI可完成自身30%至60%工作任务，14%认为比例为60%至90%，约4%称Claude能独立完成全部工作。展望未来12个月，26%用户预计AI将接手大部分工作。Claude Artifacts功能中，使用最多的场景是数据库查询（82%）、博客/文章创作（81%）和营销文案撰写（80%）。调研还发现，职场新人交由AI处理的任务占比最高且焦虑感最强，而Claude重度使用者则更乐观，认为自身价值在提升。

Anthropic 现象/趋势

05:56

Rohan Paul@rohanpaul_ai

中国AI模型价格仅为美国1/50，UBS称60%企业转向更便宜模型

J.P. Morgan报告显示，中国AI模型每token比美国便宜50倍，Qwen、DeepSeek、Kimi施压OpenAI和Anthropic定价。到2026年4月，中国公司在OpenRouter流量占比将从不足2%升至超45%。报告还指出企业AI token将商品化，多数任务无需前沿模型；AI已驱动标普500回报的65%-80%；NVIDIA仍主导AI加速器，但定制芯片可降总成本30%-40%；中国GPU自给率提升。UBS调查发现，60%监控AI预算的企业已转向更便宜模型，通过模型路由将简单任务分流至Qwen、DeepSeek、MiniMax等开源模型，以应对最高$35K/月账单及团队超配额200%的压力。

Rohan Paul: UBS says 60% of companies now watching AI budgets are moving to cheaper models and open-source Chinese models The pressu...

DeepSeek 开源生态现象/趋势