AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
6月22日周一
23:38DogeDesigner71SpaceX AI计算月入23.2亿美元
23:26Chubby♨️68五眼联盟警告:前沿AI数月内将大幅升级网络攻击
23:12Berryxia.AI12Claude Code 1995 发布?
22:43The Decoder:AI News(RSS)64五眼联盟警告:前沿AI模型数月内将重塑网络作战能力
22:40Hacker News 热门(buzzing.cc 中文翻译)79美国国家安全局局长:代号"Mythos"数小时内入侵几乎所有机密系统
22:11Ars Technica:AI(RSS)75Anthropic 频繁警告 AI 风险或触发出口禁令
22:05IT之家(RSS)70精选Anthropic 工程负责人:Claude Code 让程序员更孤独
22:05IT之家(RSS)43美光与 Anthropic 达成战略合作,含 AI 存储供应、技术研发及股权投资
21:26Chubby♨️38Sonnet 5 首次测试已启动
20:56Chubby♨️24Fable 5 今日从订阅中移除
20:11Berryxia.AI66Serva总结AI平台防封号四件套方案
17:39Hacker News 热门(buzzing.cc 中文翻译)65GLM-5.2 与 Claude Opus 4.8 正面较量:构建3D WebGL平台游戏
16:56Chubby♨️29用户 Kim 期待 Sonnet 5 发布
13:32数字生命卡兹克66AI用得好不好,跟你会不会管人,我觉得越来越是同一件事。
12:08歸藏(guizang.ai)41Anthropic 完成更强 Mythos 模型训练,名称未定或内部使用
11:39Yuchen Jin28Claude在OpenCode/Cursor中表现更好?
11:33SiliconFlow58GLM-5.2 超 Claude 登顶 HTML 设计榜
11:04IT之家(RSS)41消息称 Anthropic 或采用苹果 Digital ID 完成用户身份核验
10:20公众号:数字生命卡兹克49AI用得好不好,跟你会不会管人是同一件事
09:10ginobefun57今日早报精讲:Anthropic 代码量增 8 倍、苹果 AI 权力重构、GitHub Qubot
03:26Chubby♨️50Anthropic Mythos 更强版本完成训练
02:06Rohan Paul65Anthropic Mythos 数小时攻破 NSA 几乎所有机密系统
01:56Chubby♨️43Anthropic Mythos 新版本完成训练,更强但发布计划未明
6月21日周日
23:33TechCrunch:AI(RSS)68特朗普政府要求 Anthropic 下线两模型引争议
23:26Chubby♨️38Claude Sonnet 5 与 GPT-5.6 即将发布
23:05宝玉68翻译质量对比:Gemini 3.1 Pro 优于 Opus-4.8,工作流无法弥补
22:36Hacker News 热门(buzzing.cc 中文翻译)44Anthropic 将于2026年7月8日起对部分功能实施身份验证要求
18:31数字生命卡兹克21Anthropic大赦天下:解封被封账号,用户怒氪200刀
16:05AYi45自学程序员用Claude Code破解Linear A文字
08:36François Chollet65越拥抱AI,就越需要SaaS
08:08ginobefun49李飞飞预言职场哑铃化,Tokenmaxxing 三月退烧,Claude Code 上下文注入全解析
07:33MarkTechPost(RSS)64思科 AI 发布 FAPO:基于 Claude Code 的多步 LLM 流水线优化系统
03:31MiniMax (official)37DeepMind 等联合 YC 举办黑客马拉松
02:54Chubby♨️24Anthropic IPO或延迟,OpenAI抢跑融资
02:07Berryxia.AI57Claude Mythos出口管制后约200家美国机构仍保留顶级AI访问权限
02:07Berryxia.AI83同事件精选AlphaFold 之父 John Jumper 离开 Google DeepMind,加入 Anthropic同一事件,精选展示《AlphaFold 负责人 John Jumper 离职 Google DeepMind,加入 Anthropic》
02:01Hacker News 热门(buzzing.cc 中文翻译)66从PGP到Mythos:出口管制未能阻止任何人的简史
01:00TechCrunch:AI(RSS)65诺贝尔奖得主John Jumper离开DeepMind加入竞争对手Anthropic
6月20日周六
23:58Hacker News 热门(buzzing.cc 中文翻译)52如今,大型语言模型变得很复杂
22:26Nathan Lambert44前沿实验室自我服务无意义:知识开放非国家安全
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月22日
23:38
DogeDesigner@cb_doge
71
BREAKING: SpaceX 将从这三笔 AI 计算交易中每月获得约 23.2 亿美元。 • Anthropic: 12.5 亿美元/月 • Google: 9.2 亿美元/月 • Reflection: 1.5 亿美元/月 仅 AI 计算一项的年化收入就接近 280 亿美元。
AnthropicGoogle行业动态
23:26
Chubby♨️@kimmonismus
68
五眼联盟警告:前沿AI数月内将大幅升级网络攻击

五眼联盟(Five Eyes)网络机构警告,能够显著升级针对政府和企业的网络攻击的前沿AI模型可能仅需数月(而非数年)就能实现。该机构称前沿AI模型预计将超出当前行业预期,从根本上改变攻防网络能力。此前美国已禁止外国人访问Anthropic的Fable模型,担忧Mythos和Fable等系统可能同时改变进攻性和防御性网络安全。

Anthropic安全/对齐
23:12
Berryxia.AI@berryxia
12
如果Claude Code 在1995年发布的话。
Anthropic其他
22:43
The Decoder:AI News(RSS)
64
五眼联盟警告:前沿AI模型数月内将重塑网络作战能力

五眼联盟(澳大利亚、美国、英国、新西兰、加拿大)信号情报机构联合声明,前沿AI模型预计在数月内超出预期,从根本上改变进攻性和防御性网络能力。网络风险不能再被视为纯粹技术问题,而是核心业务风险与领导责任。AI降低了恶意行为者的准入门槛,增加了攻击速度和复杂度。该声明发布前不久,特朗普政府根据国家安全建议,决定阻止外国人访问Anthropic的Fable 5和Mythos 5模型。美国情报机构已提前接触这些模型,Anthropic员工正与NSA合作。

Anthropic安全/对齐政策/监管行业动态
22:40
Hacker News 热门(buzzing.cc 中文翻译)
79
美国国家安全局局长:代号"Mythos"数小时内入侵几乎所有机密系统

美国国家安全局局长(NSA director)公开表示,一个被称为“Mythos”的实体在数小时内突破了该国几乎所有机密系统。该声明来自《经济学人》一篇关于特朗普政府封锁人工智能公司Anthropic的报道,但报道中未提供关于“Mythos”身份及入侵方式的进一步细节。

Anthropic安全/对齐
关联讨论 2 条X:Kim (@kimmonismus)X:AI Safety Memes (@AISafetyMemes)
22:11
Ars Technica:AI(RSS)
75
Anthropic 频繁警告 AI 风险或触发出口禁令

FT分析显示,Anthropic在2026年官方声明、社媒和文章中每千词有5个风险/监管词汇,是OpenAI(0.6个)的8倍。上周美国禁止外国人使用Anthropic最新模型Mythos和Fable。批评者指责Anthropic及其CEO Dario Amodei反复警告AI危险,特别是Mythos的安全风险,直接促成禁令。Yann LeCun称这是“荒谬的恐惧营销”的结果。David Sacks则称Anthropic曾淡化对Fable安全措施的担忧。Amodei在禁令前发文称AI风险和威力已不可否认。该禁令被视为美国监管前沿模型的早期测试。

Anthropic安全/对齐政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)Ars Technica:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
22:05
IT之家(RSS)
精选70
Anthropic 工程负责人:Claude Code 让程序员更孤独

6月22日,Anthropic工程负责人Fiona Fung表示,Claude Code和Claude Cowork等AI智能体让工程师越发依赖智能体工作,彼此之间交流减少,长期易感孤独。团队为此组织编程午餐、黑客松和共同开发时段,重新创造面对面协作机会。调查显示Claude Code已成为创业公司最常用的AI编程工具,“氛围编程”兴起使“单人创业者”增多,但Fung强调协作仍不可或缺。

Anthropic大佬观点编码

推荐理由:Claude Code 团队内部反思 AI 编程的副作用,比外界批评更有说服力,编程午餐和结对编程的解法虽然简单,但至少正视了问题。
22:05
IT之家(RSS)
43
美光与 Anthropic 达成战略合作,含 AI 存储供应、技术研发及股权投资

美光科技与 Anthropic 宣布战略合作,将共同研究 HBM、DRAM 及 SSD 在 AI 训练和推理中的应用,优化性能与能效。双方签署长期内存和存储供应协议,为 Anthropic 算力扩张提供支持。美光已在内部部署 Claude 模型用于代码编写和工程设计。此外,美光参与了 Anthropic 的 H 轮融资,深化下一代 AI 基础设施合作。

Anthropic数据/训练行业动态
21:26
Chubby♨️@kimmonismus
38
Sonnet 5 首次亮相。模型速度极快,且未使用参考图。看来下周会很忙。Kim 评论称,若测试确认,这将是一次很棒的发版。

Jayden Davis: BREAKING: First Look at Sonnet 5 🚨 SVG of Nintendo Switch 2 This model is hella fast and it is impressive since I didn'...

Anthropic图像生成多模态模型发布
20:56
Chubby♨️@kimmonismus
24
快速提醒:今天是 Fable 5 正式从订阅中移除的日子。 让我们看看 Anthropic 如何回应。(Sonnet 5 作为补偿?)
Anthropic行业动态
20:11
Berryxia.AI@berryxia
66
Serva总结AI平台防封号四件套方案

Berry Xia推荐Serva总结的AI平台防封号方案,针对Claude/ChatGPT因风控被封号。四件套包括:eSIM卡(BeeSIM硬件+giffgaff英国号)获取真实海外手机号;静态住宅IP(EqualVPN美国家庭宽带)避免数据中心IP;指纹浏览器(AdsPower)模拟美国用户环境;虚拟卡(YIKA美国发卡)匹配账单地址。核心思路是将注册、登录、支付、使用全流程身份信号对齐为真实美国用户。单独用VPN或虚拟卡效果有限,四件套组合更稳定。原文附有详细截图步骤。

huangserva: http://x.com/i/article/2069009496891121664

AnthropicOpenAI教程/实践
17:39
Hacker News 热门(buzzing.cc 中文翻译)
65
GLM-5.2 与 Claude Opus 4.8 正面较量:构建3D WebGL平台游戏

最新开源 GLM-5.2(Z.ai,MIT 许可,1M token 上下文,输出定价 $4.4/百万 token)与 Claude Opus 4.8 在单次提示构建 3D WebGL 平台游戏任务上对比。Opus(Claude Code)用时 33 分 30 秒,成本约 $21.92;GLM-5.2(Pi/OpenRouter)用时 1 小时 10 分 40 秒,成本仅 $5.39。Opus 游戏更干净、能自检视觉输出(GLM-5.2 纯文本),但 GLM-5.2 价格低且开源权重可下载,始终可用。

Anthropic开源生态编码评测/基准
16:56
Chubby♨️@kimmonismus
29
用户 Kim 期待 Sonnet 5 发布

用户 Kim 期待 Sonnet 5 发布,指出 Sonnet 系列常在发布时强于老一代 Opus,如 Claude 3.5 Sonnet 在编程、速度和性价比上超越 Claude 3 Opus。Sonnet 的核心价值是将前沿智能转化为实用工作模型:足够快、足够便宜、足够可靠,支撑实际产品、智能体工作流和日常大规模编码。引用推文暗示本周可能迎来繁忙发布,包括 GPT-5.6 和 Sonnet 5。

Chubby♨️: So we get Claude-Sonnet-5 instead of Fable 5 soon. Looks like a busy week: probably GPT-5.6 and Sonnet 5. But hey, keep ...

Anthropic大佬观点编码
13:32
数字生命卡兹克@Khazix0918
66
AI用得好不好,跟你会不会管人,我觉得越来越是同一件事。

作者在端午节假期用Claude Opus 4.8重构AI新闻聚合站AIHOT的聚簇机制,消耗2000多万token,耗时一天屡次改阈值(0.72→0.71)、补多语言等边界情况仍问题百出。对比怀念已被下架的Claude Fable 5——后者只需给模糊目标就能自动跑完并填坑。由此总结:管理AI与管理人本质相同——越强的模型(如Fable 5)给方向即可(愿景/策略层),越弱的模型(如Opus 4.8、GPT-5.5、GLM-5.2)则需更细执行层指引,错配层级正是痛苦根源。

智能体Anthropic大佬观点编码
12:08
歸藏(guizang.ai)@op7418
41
据消息,Anthropic 已完成更强版本 Mythos 模型的训练,具体名称可能是 Mythos 5.1 或 Mythos 6,尚未确定,计划可能内部保留以加速后续开发。引用推文指出,停止对外提供模型(如 Fable 5、Mythos 5)不会减缓进展,反而因释放资源可能加速;实验室在现有模型受限时仍可继续推进能力,前沿实验室必须持续训练更强大系统以领先开源与对手,GLM-5.2 已证明这一点。

Andrew Curran: A new, more capable version of Mythos has emerged from training. I don't know whether it will be called Mythos 5.1 or My...

Anthropic行业动态
11:39
Yuchen Jin@Yuchenj_UW
28
我经常看到推文说"Claude在OpenCode/Cursor中的表现比在Claude Code中更好。" 这真的是真的吗? 很难相信Anthropic不会为自己的模型提供最好的适配,尤其是OpenCode还是开源的。希望能看到一些真实的例子。
Anthropic大佬观点编码
11:33
SiliconFlow@SiliconFlowAI
58
GLM-5.2 登顶 @Designarena 的 HTML Web 设计排行榜--击败了长期保持第一的 Claude Opus 4.6 & 4.7。 非常出色,现已通过 SiliconFlow API 提供使用! 开始构建 → https://www.siliconflow.com/models/glm-5-2

Design Arena: http://x.com/i/article/2067849694232080384

Anthropic编码评测/基准
11:04
IT之家(RSS)
41
消息称 Anthropic 或采用苹果 Digital ID 完成用户身份核验

苹果在 iPhone 上推出数字身份证(Digital ID)功能,用户可将美国护照存入苹果钱包。受美国模型出口管制政策影响,Anthropic 旗下的 Fable 5 与 Mythos 5 已对所有用户停用,理论上若上线身份核验限制仅美国公民可访问,Fable 5 有望重新开放。Anthropic 此前通过 Persona 平台进行身份核验,且是少数接入苹果年龄核验 API 的企业之一,基于合作基础可能选用苹果 Digital ID 完成国籍校验。但该方案需用户拥有 iPhone 并持有美国护照或居住在支持驾照录入的 14 个州,存在明显短板。

Anthropic政策/监管行业动态
10:20
公众号:数字生命卡兹克
49
AI用得好不好,跟你会不会管人是同一件事

作者用Claude Opus 4.8重构AIHOT聚簇算法,消耗约2000万token,但Opus 4.8在只有模糊目标时漏洞百出,需不断审查修补。对比曾被下架的Claude Fable 5,后者能直接理解模糊目标并优雅完成方案。作者将AI管理类比员工管理:不同能力层级需不同管理颗粒度——Prompt Engineering对应执行层指令,Harness Engineering对应策略层目标加约束,Fable 5已能承接愿景层目标。引用任正非“让听得见炮声的人做决策”,并指出未来模型(GPT-5.6、Fable 6等)将迫使管理者聚焦“思考应该思考什么”。

智能体AnthropicOpenAI大佬观点
09:10
ginobefun@hongming731
57
今日早报精讲:Anthropic 代码量增 8 倍、苹果 AI 权力重构、GitHub Qubot

Anthropic Claude Code 负责人 Fiona Fung 称工程师每季度交付代码量是 AI 普及前的 8 倍,采用常驻远程会话和定时 agent 自动生成 PR,以 bad/sad 质量框架守住质量。苹果 WWDC26 上库克卸任,John Ternus 接任;AI 权力重构:John Giannandrea 离开,Mike Rockwell 接手 Siri 并向 Craig Federighi 汇报,从谷歌挖来 Amar Subramanya 主导自研模型。新一代 Apple Foundation Models 包括端侧 30B 参数 AFM 3 Core 和 200B MoE AFM 3 Core Advanced,云端 AFM Cloud Pro,端侧需 iPhone 17 Pro 等设备。GitHub 公开内部数据分析智能体 Qubot,采用三层架构,返回正确答案速度提升 3 倍。

智能体AnthropicGitHub编码
03:26
Chubby♨️@kimmonismus
50
Anthropic 的 Mythos 模型更强大版本已结束训练。Mythos 于 4 月 7 日通过 Project Glasswing 上线,仅两个月后即迎来新迭代。目前仍存三点疑问:新版是否仍通过 Project Glasswing 发布;性能相比 Mythos-1 提升多少;能否通过 Fable 5.1(或后续命名)获得权限。消息来自可靠信源 Andrew Curran。

Chubby♨️: A new, more capable version of Anthropics Mythos has emerged from training. In itself, this is nothing out of the ordina...

Anthropic推理行业动态
02:06
Rohan Paul@rohanpaul_ai
65
经济学人报道,NSA 局长告知参议院情报委员会,Anthropic 的 AI 智能体 Mythos 在数小时内(而非数周)攻破了"几乎所有"机密系统。但文章作者 Shashank Joshi 澄清,该说法来自转述,且 Mythos 几乎肯定是在特殊测试条件下与其他工具协作完成的。他称原意是体现 Mythos 的强大能力,但未附加免责说明是个失误。

Shashank Joshi: This now widely circulated claim is based on a line I wrote last week (https://economist.com/briefing/2026/06/14/donald-...

Anthropic安全/对齐政策/监管
01:56
Chubby♨️@kimmonismus
43
Anthropic Mythos 新版本完成训练,更强但发布计划未明

Anthropic 的 Mythos 模型新版本已完成训练,距 4 月 7 日 Mythos‑1 通过 Project Glasswing 发布仅两个月。可靠消息源 Andrew Curran 确认新版更强,但名称(Mythos 5.1 或 Mythos 6)及是否公开尚不明确,也可能仅用于内部加速开发。目前不确定新版本是否通过 Project Glasswing 提供,以及用户能否通过 Fable 5.1 访问。引用推文称,停止 Fable 5 或 Mythos 5 的公开服务反而可能通过释放资源加速开发,前沿实验室必须持续训练更强模型以保持领先。

Andrew Curran: A new, more capable version of Mythos has emerged from training. I don't know whether it will be called Mythos 5.1 or My...

Anthropic行业动态
6月21日
23:33
TechCrunch:AI(RSS)
68
特朗普政府要求 Anthropic 下线两模型引争议

特朗普政府以国家安全为由要求 Anthropic 将 Fable 5 和 Mythos 5 模型下线。Anthropic 因难以限制外国国民使用而全面撤下模型。据悉,白宫接到亚马逊 CEO Andy Jassy 举报——亚马逊研究人员发现可绕过 Fable 5 的护栏。网络安全专家签署公开信要求撤销命令,认为移除这些高级网络安全能力对美国网络防御者构成危险。讨论认为此举可能带有报复色彩,与 Anthropic 此前呼吁放缓 AI 却又发布最强大模型的态度有关。

Anthropic安全/对齐政策/监管行业动态
23:26
Chubby♨️@kimmonismus
38
所以我们很快就会得到 Claude-Sonnet-5 而不是 Fable 5。 看起来是忙碌的一周:可能会有 GPT-5.6 和 Sonnet 5。 不过嘿,继续来吧!

leo 🐾: 🚨 BREAKING: The slug "claude-sonnet-5" has appeared on an Anthropic partner provider Gonna be a busy week next week 👀

AnthropicOpenAI行业动态
23:05
宝玉@dotey
68
宝玉认为翻译质量 Gemini 3.1 Pro 最好,Opus-4.8 自身写作能力不行导致翻译生硬,工作流无法弥补。@LinearUncle 分享 Claude Code 方案:设置 `/effort` 为 `ultracode` 后自动触发动态工作流,包括三位译者各出一稿、双语编辑评审、综合定稿、逐句校对,并用 Claude Code History Viewer 查看历史记录。

LinearUncle: Claude Code 设置/effort 为ultracode,然后翻译英文文章,你就会收获一个自动的多智能体流水线翻译流程: 先让 3 位风格各异的译者各出一稿 → 双语编辑对照原文评审挑出最佳译法 → 综合成定稿 → 最后逐句校对纠错...

智能体AnthropicGoogle教程/实践
22:36
Hacker News 热门(buzzing.cc 中文翻译)
44
Anthropic 将于2026年7月8日起对部分功能实施身份验证要求

Anthropic 宣布自2026年7月8日起,将对旗下 AI 产品的部分功能实施身份验证要求。届时用户在使用这些功能时需完成身份验证。该消息由 Reddit 社区 ClaudeAI 板块发布,目前社区已有相关讨论。

Anthropic安全/对齐政策/监管
18:31
数字生命卡兹克@Khazix0918
21
Anthropic大赦天下:解封被封账号,用户怒氪200刀

用户卡兹克24年初被封的Google账号被Anthropic解封,随即充值200美元。目前该用户拥有两个分别充值200美元的Claude Max账号,并可使用Claude原生Chrome插件进行浏览器操控。

Anthropic其他
16:05
AYi@AYi_AInotes
45
自学程序员用Claude Code破解Linear A文字

一个自学编程的人,用 Claude Code 破解了3500 年前克里特岛的 Linear A 文字🤯 过去三年我们一直在说 AI 会取代人类专家,Linear A 这个案例恰好反过来了,一个自学工程师用 Claude Code 写了几百行 Python,交叉比对两个公开数据库,输出了一套 408 词的词典,但他从头到尾没让 AI "自己判断",所有假设都是他提的,AI 只负责跑验证。 Tom 用的方法很朴素:

Boris Cherny: Cool way to use Claude Code: deciphering Linear A, a 3500 year old written language from Crete https://aiclambake.com/cl...

Anthropic现象/趋势编码
08:36
François Chollet@fchollet
65
François Chollet 指出,越拥抱AI,就越需要SaaS。Box CEO Aaron Levie 将 Salesforce 的 MCP 服务器接入 Claude Code 后,Salesforce 使用量达到此前的5倍。他开始查询以往懒得手工操作的客户和市场情报。智能体消除了操作摩擦,底层系统被更多查询而非取代。对持有 $CRM 的投资者而言,智能体时代是用户参与度的顺风车,而非颠覆风险,前提是数据平台能承载查询负载。

Podcast Alpha: Levie now uses Salesforce 5x more than at any point before. The Box CEO @levie connected Salesforce's MCP server to Clau...

AnthropicMCP/工具大佬观点现象/趋势
08:08
ginobefun@hongming731
49
李飞飞预言职场哑铃化,Tokenmaxxing 三月退烧,Claude Code 上下文注入全解析

李飞飞与David Roger提出“哑铃效应”:文本智能成本趋零,劳动力向顶尖1%专家和高能动性通才两极坍缩,中间岗位萎缩。Tokenmaxxing三月潮起——OpenAI工程师周耗2100亿token,Claude Code重度用户月花15万美元;五月迅速退烧——Amazon关闭排行榜,Uber烧光2026年全年预算,微软将工程师迁回Copilot CLI。数据揭示Agentic coding token消耗是普通问答千倍,70%耗于探索与修复;写代码效率增180%,但传导到发布仅剩30%增量。Claude Code八种上下文注入机制为高能动性通才提供工程抓手。

智能体Anthropic现象/趋势编码
07:33
MarkTechPost(RSS)
64
思科 AI 发布 FAPO:基于 Claude Code 的多步 LLM 流水线优化系统

思科 AI 推出 FAPO,一个由 Claude Code 驱动的多步 LLM 流水线自动化优化系统,基于 Apache 2.0 开源。FAPO 通过步骤级故障归因,从提示词、参数到链式结构逐级升级优化。在六项基准测试中,以 GPT-4.1-mini、GPT-5.4-mini 和 Gemma 3-12B 为任务模型,与 SOTA 优化器 GEPA 对比:18 个模型-基准比较中赢下 15 个,平均增益 +14.1 个百分点;在 HoVer 和 IFBench 上触发结构升级时六组全胜,平均增益达 +33.8 个百分点;仅在 AIME 上略逊 3.1 个百分点,在采样噪声范围内。防过拟合机制包括仅检查训练集、不可变文件及独立审查。

AnthropicGitHub产品更新部署/工程
03:31
MiniMax (official)@MiniMax_AI
37
在 Y Combinator 举行的 @googledeepmind / HUD Frontier / RSI RL Environments 黑客马拉松现场人潮涌动,共同赞助方还包括 @ExaAILabs @modal @AnthropicAI @FireworksAI_HQ @MiniMax_AI 等。期待各位工程师和研究员今天在 YC 的成果。

👩💻 Paige Bailey: 🙌 Huge crowd for the @googledeepmind / HUD Frontier / RSI RL Environments hackathon at @ycombinator! Cosponsors also in...

AnthropicDeepMind行业动态
02:54
Chubby♨️@kimmonismus
24
在这一点上,我很容易看到围绕Anthropic的戏剧性事件会迫使其推迟IPO,而OpenAI则竭尽全力抢先上市并在此过程中筹集更多资金。
AnthropicOpenAI大佬观点行业动态
02:07
Berryxia.AI@berryxia
57
Claude Mythos出口管制后约200家美国机构仍保留顶级AI访问权限

美国对Anthropic最强模型Claude Mythos实施出口管制后,仍有约200家早期用户(包括部分银行、Cisco、Dragos等)保留访问权限,普通用户和大多数组织已被挡在门外。据Bloomberg报道,这200家机构手握外界无法触及的顶级AI能力,形成“永久底层阶级”式的AI鸿沟。差距不是简单API购买能力能弥补,普通用户甚至见不到这些模型。

Chubby♨️: Roughly 200 organizations still have access to Claude Mythos. Just imagine the advance they have.

Anthropic政策/监管行业动态
02:07
Berryxia.AI@berryxia
同事件精选83
AlphaFold 之父 John Jumper 离开 Google DeepMind,加入 Anthropic

诺贝尔化学奖得主、AlphaFold 团队负责人 John Jumper 宣布离开 Google DeepMind,加入 Anthropic(休息一段时间后)。他在 GDM 工作近 9 年,博士毕业仅 6 个月便被 Demis Hassabis 委以重任领导 AlphaFold,实现了蛋白质结构预测突破。此前已有大批 OpenAI 核心研究员流入 Anthropic,Jeff Dean 也开始公开互动。评论称 Anthropic 在“收集无限宝石”。这位蛋白质科学家跨界 AI 安全与大模型,暗示下一个重大突破可能出现在意料之外的方向。

John Jumper: A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...

Anthropic安全/对齐行业动态
同一事件,精选展示《AlphaFold 负责人 John Jumper 离职 Google DeepMind,加入 Anthropic》
推荐理由:John Jumper从DeepMind跳槽Anthropic,不是普通的人事变动,而是AI人才流向的风向标。诺奖得主从蛋白质结构转向AI安全,这个跨界本身就暗示Anthropic在筹备下一个大突破。
02:01
Hacker News 热门(buzzing.cc 中文翻译)
66
从PGP到Mythos:出口管制未能阻止任何人的简史

美国白宫以国家安全为由,命令Anthropic限制AI模型Fable 5和Mythos出口,导致两款模型暂停向美国境外用户及境内外国公民提供服务。此前Anthropic仅向约150家受审查企业和政府机构开放Mythos。触发禁令的两个事件:Anthropic向一家被怀疑与中国有关联的韩国电信公司(普遍报道为SK电信)提供Mythos访问权限;亚马逊CEO称其研究人员找到了绕过Fable 5安全措施的方法,Anthropic否认“越狱”说法。文章回顾了1990年代美国政府试图阻止PGP加密软件传播、以及后来通过《瓦森纳协定》限制间谍软件出口但屡屡失败的案例,指出历史表明出口管制成效有限。

Anthropic政策/监管行业动态
01:00
TechCrunch:AI(RSS)
65
诺贝尔奖得主John Jumper离开DeepMind加入竞争对手Anthropic

诺贝尔化学奖得主John Jumper宣布离开Google DeepMind,加入竞争对手Anthropic。他在DeepMind工作近9年,曾领导AlphaFold团队,该团队因蛋白质结构预测模型获2024年诺贝尔奖。据Bloomberg报道,Jumper还参与谷歌编程工具开发。此外,Character AI联合创始人Noam Shazeer本周也离开DeepMind,转而加入OpenAI。

AnthropicDeepMind行业动态
6月20日
23:58
Hacker News 热门(buzzing.cc 中文翻译)
52
如今,大型语言模型变得很复杂

2022-2023年Meta的Llama架构还是干净的重复Transformer模块,如今LLM已复杂:多种注意力变体(查询分组、压缩、稀疏、线性、滑动窗口等)、混合专家从FFN扩张到注意力块和残差流、视觉/音频编码器从外挂变为融合、多GPU推理引入通信操作。Seb Raschka的架构图库可对比Llama 3与Nemotron 3 Ultra。PyTorch的FlexAttention通过Triton模板生成可组合注意力核。Andrej Karpathy加入Anthropic,强调架构可组合性与智能体自动研究循环的重要性。

Anthropic数据/训练现象/趋势
22:26
Nathan Lambert@natolambert
44
Nathan Lambert 评论称前沿实验室(Frontier labs)在自我服务无意义方面已是 SOTA。他认为 AI 虽为关键技术,但硅谷通过人才交流和酒吧传播知识,并非深度国家安全决策场景。引用 @willdepue 声称中国能完全访问 OpenAI 和 Anthropic 的 GitHub/Slack/docs,并怀疑中国开源模型中可能出现可抵赖的被窃架构方法。

will depue: there is no question, none at all, that china has full access to all of openai & anthropic's github/slack/docs today no ...

AnthropicOpenAI大佬观点安全/对齐
‹ 上一页
1…1011121314…50
下一页 ›