12:36

Ethan Mollick@emollick

虽然显然，缺乏可验证领域会使模型训练变得困难……但同样真实的是，模型在非可验证领域也变得越来越好。前沿是参差不齐的，但比我仅从可验证性预期的情况要好得多。

大佬观点数据/训练

12:07

IT之家（RSS）

Palantir CEO 卡普抨击 OpenAI 等 AI 公司"双重收费"，要钱还窃取数据

Palantir CEO 亚历山大·卡普在 CNBC 采访中指责 OpenAI、Anthropic 等前沿 AI 公司实行“双重收费”：既向客户收取高额 Token 消耗费用，又通过服务窃取客户业务流程数据（权重和阿尔法值）用于改进模型，使客户面临核心业务被复制或取代的风险。多家美国企业对此表示愤怒。

Anthropic OpenAI 大佬观点数据/训练

11:34

Berryxia.AI@berryxia

Orca论文：用"预测下一个状态"替代预测token/帧/动作

Orca论文提出“预测下一个状态”新范式，取代GPT式“预测下一个token”、视频“预测下一帧”和机器人“预测下一个动作”。它从125K小时视频和1.6亿事件标注中学习统一世界潜在表示，通过无意识学习（连续视频物理状态）和有意识学习（事件描述/VQA）捕获状态转换。冻结主干后，该潜在表示可同时读出文本、图像和机器人动作，且预训练无需动作标签即可生成机器人行动，表明理解物理世界隐含行动能力。

alphaXiv: Next state prediction instead of next token, frame or action. This paper, Orca, learns a unified world latent from video...

具身智能多模态大佬观点推理

11:12

François Chollet@fchollet

关于未来需要理解非常重要的一点：AI 的经济学即将彻底改变。我们很快就会进入一个可以将测试时计算转化为能力的时代--在软件史上，边际成本将首次变得至关重要。回想起来……是的。

François Chollet: One very important thing to understand about the future: the economics of AI are about to change completely. We'll soon ...

大佬观点推理

11:07

IT之家（RSS）

Robinhood CEO 弗拉德·特内夫：AI 智能体很快将媲美人类交易员，散户有望获得机构级交易能力

Robinhood CEO 弗拉德·特内夫预测，AI 智能体很快将媲美人类交易员。他解释“智能体交易（Agentic Trading）”的核心是让智能体完成人类交易员的每一项工作，目标让散户拥有与机构投资者、高频交易公司相同的工具和算力。本月早些时候，Robinhood 宣布裁员约 10% 以提升运营效率，特内夫称业务从未如此强劲，但需精简团队。

智能体大佬观点

11:06

Ethan Mollick@emollick

Fable："《Last and First Men》已不受版权保护。我希望你制作一部电影，使用你拥有的 API（ElevenLabs、Hugging Face）适当混合动画和图像来朗读这本书。给我前10-15分钟，在合适的断点结束。"

教程/实践视频

10:39

Rohan Paul@rohanpaul_ai

微软CEO纳德拉：AI时代护城河不在模型，而在公司独有的学习回路

微软CEO萨提亚·纳德拉指出，当智能成为可租赁的商品时，企业护城河不再是所使用的模型，而是公司独有的“学习回路”。他建议企业构建私有的“爬坡机器”——一个从公司特定任务、痕迹、评估和结果中持续改进模型的循环。私有评估成为战略记忆，工作流痕迹变成训练信号，人类判断用于引导复合增长。只消费基础模型可能泄露运营知识的深层价值，而建立严格学习回路的公司可将日常工作转化为累积的知识产权。未来的前沿不属于拥有最大模型的人，而属于拥有最佳学习回路的人。

Microsoft 大佬观点

10:10

公众号：卡尔的AI沃茨

Anthropic 封号加码，Sonnet5 发布，开源「搭子」Skill 降本

Anthropic 加大中国用户封号，Claude Code 通过时区和 ANTHROPIC_BASE_URL 检测，7 月 2 日新版本删除该代码但部署更强措施。Sonnet5 模型和新 Tokenizer 使英文 token 数增至 1.4 倍，API 降价但实际更贵。Fable5 窗口期至 7 月 7 日，周额度 50% 可用。开源「搭子」Skill 让 Claude Code 与 Codex 分工，成本降至纯 Claude 的 30%，避免反复冷启动。

智能体 Anthropic 大佬观点编码

10:00

向阳乔木@vista8

哎，为了用好模型，中国用户真的不容易… 基于这个开源写了个检测 Skill，安装指令： npx skills add joeseesun/qiaomu-ai-access Skill 开源地址： https://github.com/joeseesun/qiaomu-ai-access

1024: 判断当前浏览器环境是否更像中国用户 / 中国地区设备 https://github.com/yArna/isChinaUser

GitHub MCP/工具开源/仓库教程/实践

09:44

Hacker News 热门（buzzing.cc 中文翻译）

美国的隐私危机：Cynthia Dwork等专家谴责商务部禁止差分隐私

2026年6月4日，美国商务部发布指令DAO 216-26，禁止在经济分析局和人口普查局出版物中使用差分隐私等现代隐私保护技术，只允许粗化（四舍五入、聚合、范围化）和压制。该指令禁用了自1990年用于人口普查的交换技术、自2002年用于季度劳动力指标的输入噪声注入、自2008年用于OnTheMap的差分隐私，并取消2030年人口普查的差分隐私方案。哈佛教授Cynthia Dwork等专家联名指出，此举将降低数据可用性和隐私保护，绕过法定程序，服务于政治利益。

安全/对齐政策/监管数据/训练

09:41

meng shao@shao__meng

腾讯元宝离职员工反思大厂AI困境

一位在腾讯元宝工作大半年的匿名员工在 lastday 发文，分享元宝实际运营情况与个人思考。他提出，像腾讯这样营收稳定的超大型公司做 AI 需要极大决心，若仅为占位或高管短期目标，容易动作变形，沦为追逐短期数字和汇报的产物。并认为国内大厂中，只有字节跳动拥有不断做成新事物的决心和组织力，其余基本不行。

现象/趋势行业动态

09:06

IT之家（RSS）

OpenAI 奥尔特曼称 AI 发展就像科幻小说，呼吁建立全球治理框架

OpenAI CEO 萨姆·奥尔特曼在《金融时报》发文，认为 AI 发展已如同科幻小说情节，预计未来一两年内将打造出能力惊人的系统，为全球创造巨大价值。他称 AI 对人类社会的影响可能超过电力，呼吁尽快建立全球 AI 治理框架，由各国政府代表和独立技术专家组成论坛，制定统一行业标准，监督 AI 实验室防止安全军备竞赛，避免少数国家过度控制 AI 发展。奥尔特曼建议参考国际原子能机构的运作模式。

OpenAI 大佬观点安全/对齐

09:00

向阳乔木@vista8

AI Agent 网页分栏布局的交互设计规范参考

当前网页布局常见右侧 AI Agent、中间内容、左侧菜单的三栏结构。如何设计支持拖拽和隐藏的分栏以合理利用空间，用语言描述难以说清。推主发现现有的交互规范和标准可为 AI 学习参考，相关资料与效果图见评论与后两图。

智能体教程/实践

08:41

meng shao@shao__meng

Every 团队使用 Codex 的深度实践

Five team members with different backgrounds (Natalia, Dan, Katie, Austin, Kieran) used Codex in distinct workflows. Common patterns emerged: context matters more than prompts; let Codex design its own system; delegate repetitive tasks to background threads; and build audit/feedback loops. Their setups range from outcome-first (Austin) to long-running router threads (Dan) to portable context folders (Kieran). The article recommends picking one style that fits your work rather than overthinking.

Every 📧: Codex works best when the setup matches how you work. Long-running threads, local context folders, outcome-first prompts...

智能体 OpenAI 教程/实践编码

08:34

Berryxia.AI@berryxia

Claude Fable 5 因过度安全防护能力大幅削弱

Anthropic 发布的 Claude Fable 5（底层为 Mythos 模型）因安全防护过度触发，BridgeBench 测试显示：调试能力从 86.2 降至 25.9（降幅 70%），重构能力从 73.6 降至 38.4（降幅 48%），幻觉控制从 75.9 降至 61.7（降幅 19%）。大量正常编程任务被误判为高风险，回退到更弱的 Opus 4.8，但用户支付的是 Fable 5 两倍的价格。安全防护还限制了代码安全审查、新模型开发（被曝修改 prompt 生成错误结果）和生化相关任务。Anthropic 尚未对此作出解释。

BridgeMind: FABLE 5 CAME BACK NERFED. We re-ran the July 1st version of Claude Fable 5 on BridgeBench. The results are brutal: Debug...

Anthropic 安全/对齐编码评测/基准

08:34

Berryxia.AI@berryxia

刚入门 Vibe Coding 想快速拿到正向反馈？直接套用成熟优质案例模板是最优解把现成优秀模板喂给 YouWare，借助模板搭建你的第一个项目，上手速度直接拉满。

其他编码

08:30

公众号：数字生命卡兹克

精选62

Claude Fable 5 自主优化 AIHOT 网站 SEO/GEO 全记录

作者用 Claude Fable 5 优化 AIHOT 网站的 SEO 与 GEO。模型自主启动 22 个 Agent 调研 40 分钟，发现豆包 App 每天六千多次访问未被统计等异常。规划境外加速时，否定 Claude Opus 4.8 的 Cloudflare 方案（无法国内直连/国外分流，且 2025 年起默认拦截 AI 爬虫），改用火山引擎 CDN。因需白名单，模型自行找到工单入口提交专业工单，22 分钟开通；发现工程师漏答回源 IP 网段问题，礼貌追问并补充备选方案；发现官方方案有安全漏洞，自行加暗号验证。23:30 切换域名解析，10 分钟后 616 个海外请求走新线路。最终生成运维文档，提醒边缘证书 10 月 2 日到期并附续期步骤。

智能体 Anthropic 大佬观点

推荐理由：Claude Fable 5 展示的自主性远超预期，从调研到工单交互一气呵成，这种执行力让我重新思考 AI 同事的定义。

08:19

Anthropic：Newsroom（网页）

同事件精选64

Claude Fable 5 网络安全分类器与越狱严重性框架详解

Anthropic 重新部署 Claude Fable 5 并向全球用户开放，同步披露了内置安全分类器设计。分类器将网络安全使用场景分为四类：禁止使用（勒索软件/物理破坏等）、高风险双重用途、低风险双重用途及良性使用。前两类直接拦截；低风险类别部分监控，仅在安全边际内选择性拦截。此外，Anthropic 与 Glasswing 合作提出 AI 越狱严重性框架初稿，并已启动 HackerOne 项目收集越狱案例。

Anthropic 安全/对齐

同一事件，精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》

推荐理由：Anthropic首次公开Fable 5安全分类器的详细类别和越狱严重性框架草案，这可能是行业级安全标准的雏形，对开发者和政策制定者都有参考价值。

08:06

IT之家（RSS）

Meta CEO 马克·扎克伯格：AI 智能体技术发展得比我想象要慢

扎克伯格在 Meta 内部全员会上表示，AI 智能体技术进展未达预期，公司仍需投入更多时间和精力。Meta 正全力竞逐 AI 模型开发，投入数百亿美元建设基础设施和招聘人才，但快速推进 AI 也带来代价，需在开发速度、员工信任与团队士气之间取得平衡。扎克伯格仍相信 Meta 能在未来 3-6 个月内看到超级智能的部分成果。

智能体 Meta 大佬观点

08:06

IT之家（RSS）

软件工程传奇肯特·贝克：程序员缺软技能，AI时代需学人际交往

7月3日，据《商业内幕》报道，知名软件工程师肯特·贝克指出，软件工程师虽技术出众，但常缺少职场越来越重视的软技能，如情绪调节、同理心和沟通方式。他认为这些是典型软件工程师“糟糕”的特质。AI正重塑行业，沟通、协作与共情等软技能直接影响技术人员职业前景。贝克将程序员学习人际交往形容为一场“宇宙级玩笑”：入行时被告知只需掌握计算机，最终却要面对完整的人类一面，能否推动现实改变取决于是否懂得沟通和共情。

大佬观点现象/趋势编码

07:45

karminski-牙医@karminski3

本地大模型写文测试：Gemma4-31B 位列榜首

该测试通过内置提示词让本地小模型进行角色扮演，再由旗舰大模型评分并多次运行取平均，以评估写文能力。结果显示 Gemma4-31B 在所有项目中表现最佳，Qwen3.6-27B 位列第二，平均差距约 5%。测试发现这些模型普遍在“内心独白”任务上表现不佳，可能与参数量小及框架是否支持多 Agent 隔离有关。测试基于英文，作者未开源但已集成到角色扮演框架 plottery 中，用户可接入自选 API 测试。

智能体 Google 评测/基准