AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2408 条
全部一手资讯X论文
标签「大佬观点」清除
宝玉@dotey · 6月10日60

大量测试 Claude Design 后我的一个结论: UI/UX 设计方面 Claude 4.8 就够好了,Fable 5 没有体现出更好的 UI/UX 设计能力,甚至还不如 Claude 4.8 的设计效果。

译Anthropic同日发布Fable 5与Mythos 5,同底座但Fable 5加安全分类器(检测攻击/生化/蒸馏时降级至Opus 4.8,95%对话不触发),Mythos 5仅限Project Glasswing合作伙伴。API定价输入$10/百万token、输出$50,较Mythos Preview降60%,比Opus 4.8贵一倍。实际能力:Stripe用Fable 5一天完成5000万行Ruby全库迁移;视觉接口通关宝可梦火红版;Mythos 5使蛋白质设计加速约10倍,基因组学模型超Science但体量仅1%。订阅用户即日起至6月22日免费,后续需额外购买credits。政策变化:所有Mythos级流量强制保留30天用于安全监控。博主@dotey大量测试后认为,Claude 4.8在UI/UX设计上已足够好,Fable 5未体现更强能力甚至更差。

Berryxia.AI@berryxia · 6月10日24

如今哪怕是你学学豆包、DeepSeek 也是好的。 不然毕业=失业啊!兄弟们~ 站在前沿的AI科技浪潮中,不要被拍在沙滩上。 老黄都说了: 他要的人一定是懂AI的,会熟练使用AI的人。 即使你有很多的行业经验,可能都不是首选。 把握一手信息源,非常重要。 我整理了100 个信息源,供大家学习使用。 篇幅问题,我看看单独发一份可订阅的或者Skills!

译Berry Xia强调AI技能对就业的重要性,引用老黄(黄仁勋)观点:其需要的人是懂AI、会熟练使用AI的人,即使有丰富行业经验也可能不是首选。他建议学习豆包、DeepSeek等AI工具,并整理了100个信息源供学习使用,但暂未公开列表。推文提醒把握一手信息源,避免在AI浪潮中被淘汰。

Berryxia.AI@berryxia · 6月10日52

所以说这模型怪癖太多~

译用户 @oran_ge 指出,Claude Fable 5 有三项奇葩限制:6月22日后 Token Plan 用户无法使用,仅限 API;安全护栏过严,连“线粒体是什么”都不能问;禁止用于模型研发,理由是该模型已能加速自身发展。作者批评这种“自己打通 Loop 却不许别人进”的闭环做法,呼吁国产开源模型加油。

Ethan Mollick@emollick · 6月10日27

Science fiction authors in the order you want them to be right about AI: Iain Banks Becky Chambers Martha Wells Douglas Adams Charles Stross (Singularity Sky) Peter Watts Charles Stross (Laundry) Harlan Ellison

译你希望其对 AI 预言成真的科幻作家,按顺序排列: 伊恩·班克斯 贝基·钱伯斯 玛莎·威尔斯 道格拉斯·亚当斯 查尔斯·斯特罗斯(《奇点天空》) 彼得·沃茨 查尔斯·斯特罗斯(《洗衣房系列》) 哈兰·埃里森

jason@jxnlco · 6月10日16

Sophons

译Sophons Anthropic 不允许你使用 fable 进行生物学、化学、AI 研究或任何加速人类进步的工作。这使它成为开发区块链的完美工具。

数字生命卡兹克@Khazix0918 · 6月10日83

http://x.com/i/article/2064543977328832512 # Claude Fable 5正式发布 - 王者归航。 Claude Fable 5,在今天正式发布了。 这款模型如果你不了解背景,我快速说一下。 今年四月,Anthropic发布了一个叫Claude Mythos Preview的模型,被誉为超越Opus的第一个Mythos也就是神话级别的模型,当时整个行业都震动了,因为当时说,跟50家左右的初始合作伙伴,找出了超过一万个高危或严重级别的漏洞。 网络安全股直接全线暴跌。 但是他们没有公开让所有人用上,只给了极少数网络安全机构和基础设施提供商使用,理由是,这个模型在网络安全领域的能力太强了,怕被滥用。 然后,两个月过去了。 今天他们做了一个叫Fable 5的版本,加上了安全分类器,终于拿出来给所有人用了,同时还发布了Mythos 5,不过也只给之前已经在用Mythos Preview的合作伙伴升级,普通用户用不到。 Fable 5和Mythos 5是同一个底层模型,区别只在于Fable 5多了一层安全限制,其他都一个样。 Fable这个词来自拉丁语fabula,和希腊语mythos是同源词,都是被讲述之物的意思。 翻译过来,一个叫寓言,一个是神话。 寓言给所有人听,神话只在神殿里传颂。 也是挺有意思的。 而这次的模型,基本上也是究极水桶模型了,从他们的宣传PV就能看出来很多有趣的东西了。 复古昆虫图谱、鸟类插画、植物学素描,以及显微镜下的细胞分裂和培养皿中的菌落等等等等,还有太多太多人类的科学、人类的知识,共同组成了5这个造型。 人类历史上所有的知识共同构建了Fable 5,这些知识,也被压缩成了一个小小的模型。 Fable 5,目前已经在Claude上线。 Claude Code也上了。 不过这里有个特殊的点是,大家应该能看到模型名字Fable右边有个Inclaude until June 22的标识。 这个意思是说,从今天起到6月22日,Fable 5将免费包含在 Pro、Max、Team 及按席位计费的企业版方案中。 6月23日起,Anthropic将从订阅方案中移除Fable 5,也就是说,以后这个模型只能在API中接额度来使用了,订阅用户甚至都没有权利进行使用。 然后他们留了个气口,意思大概就是: “在此之后当容量充足时,我们计划将 Fable 5 恢复为订阅方案的标准组成部分。我们将尽最大努力尽快实现这一目标。” 所以不论怎么样,我想说,按照这个预期之下,Claude的订阅用户们,在这12天的窗口期里,都尽可能把你们的Token,花在Fable 5上吧。 一声长叹,AI这东西,真的要变成贵族的游戏了,你的经济因素,在未来很多时候,直接决定着你能使用什么级别的AI,使用多少额度的Token,产出什么级别的东西。 Fable 5这个模型的价格每百万输入token10美元,每百万输出token50美元。 咱们这里可以对比一下Opus 4.8、GPT 5.5、DeepSeek V4 Pro的价格。 画成图表是这样的。 这就能看出来,DeepSeek到底有多大善人了吧。 我现在绝大多数的在工作流里跑的一些自动化的AI的API,全都是DeepSeek V4 Pro,因为真的便宜,智能水平也不错。 然后再看这次Fable 5的跑分。 只能说过于夸张了。 在所有的维度,全面碾压,我看了很多的三方基准评测,也是清一色的SOTA,究极水桶模型我只能说。 不过这玩意也是真的贵,又贵又慢, 我是200刀的Claude Max会员,我就就跑了3个任务,其中一个还没跑完,直接就干没了我5小时额度的73%,这在我用Opus 4.8做开发的时候,几乎是难以想象的。 我这种并不是特别重度的外行开发者,第一次感受到的Token的不够用。 但是这个能力,确实有点强到爆炸了,跟我用Opus 4.8开发完全不是一个级别的聪明程度。 比如我的AIHOT,很多朋友在后台反馈说,不希望只看到时间线的模式,还希望能看到当前的热点,其实今天就已经遇到这种情况了,Claude Fable 5很炸,AIHOT确实也第一时间抓到了。 但是它很快就会被淹没在信息流的长河中,你早上起床以后,你需要翻很久才能看到它,这个绝对不是一个很好的体验。 所以过去我其实一直想优化这个点,来看看怎么在我们的精选首页里面加一个当前的热点排序,但是因为我们其实是以时间线和这个评分来抓的。那天然的这种热度还有这种衰减的机制,我不知道该怎么做,我没想好。 Opus 4.8我确实跟他讨论过两次方案,但是效果我其实觉得都不是很满意。 这次我就直接扔给了Claude Fable 5,在说明了我的需求之后。 自己花了30分钟,直接开发完然后上线了。 用的是我们聚簇的概念+时间衰减,很多细节也都考虑到了,甚至要求宁缺毋滥,安静的日子整个区块直接消失,页面回到纯时间轴,不留空壳。 我当时看到直接给我开发完我都懵了。 我赶紧去线上看了一眼。 我只能说...牛逼。。。。 从实现角度来说,我是完全挑不出什么毛病。。。 然后因为最近加的监控源比较多,我也在优化整个的评分机制,因为涉及到prompt的打分,还有线上几万条数据的评分,还有各种加权、维度、阈值、聚簇等等的计算,所以我也没啥想法,前两天让Opus 4.8给我回测过一版完整的最近一个月的数据报告,但是我也不太满意,确实没给我什么有用的洞见。 同样的任务,我扔给了Fable 5。 他在跑了1个小时18分钟之后。 给我了我从来没有见到过,详细到我直接懵了的超级详细的网页报告。 看这个报告,我看了大概20分钟,有很多地方都给了我非常非常强的洞见和启发,我完全没发现我们过去的评分体系还有这样的问题,居然还有这么多不足的需要优化的地方。。。 信息量过大,一时间我甚至都不知道怎么进行下一步的优化。。。 移动端适配也是,在我现有代码的基础之上,我想把移动端的适配、小程序、APP都提上日程,之前让Opus 4.8改过一般,但是给我都干生气了,因为问题实在是太多了。 但是同样的任务,我扔给Fable 5,我感觉,我有一种直接在用Claude Design Pro Max版的错觉。 它直接跟上面的评分方案报告类似,给我出了一个详细的设计方案。。。 最离谱的是,甚至给我考虑了推送、桌面组件、分享海报。。。 虽然这个设计风格我还要调很多,UI设计我也肯定不会用这版的,但是,这个方案的详细程度,在我没有任何刻意的引导之下,还是超乎了我过去使用Claude的预期。 而官方自己的例子,更是比我体验到的还要离谱的多的多。 比如Stripe拿Fable 5在他们5000万行的Ruby代码库里做了一次全库迁移。 5000万行。 一天完成了。 。。。 神经病吧。 这个活如果用人来干,一整个团队,可能需要两个多月,而且5000万行代码,那基本上就是一个活了十几年的超大型商业系统的全部家当了。 还有视觉这块。 之前的Claude模型玩宝可梦火红,需要一个复杂的辅助工具框架,给它提供地图信息、导航辅助、游戏状态数据,才能勉强跑起来。 Fable 5不需要了,纯视觉,只看屏幕截图,自己想,不给任何额外信息,然后,从头到尾通关了。 一个AI,只用看屏幕这一种方式,打通了一整个RPG游戏。 不看代码,不读地图,不用任何作弊辅助,就,纯看。 然后它还自己玩异星工厂。 我看到这个的时候我真的不行了。 要知道,我是个重度模拟经营玩家,戴森球计划,城市天际线等等,都是我的最爱,而这里面,最复杂最难的,可能就是异星工厂了。。。 你要是玩个双点医院我感觉我心里都好受点,你上来直接玩异星工厂。。。 这世界大抵是病了。 然后还有,一个更加离谱的案例。 Fable 5自己做了一个基于浏览器的3D CAD编辑器,然后用这个编辑器,设计了一个可以3D打印的模型。 不是用一个现有的CAD工具,是它先做了一个CAD工具出来,然后再用这个工具去设计。。。 工具的工具。 我说牛逼已经说麻了。 生命科学方面,Mythos 5(没有ban一些药物之类的安全版本,Fable 5你碰不了药相关的东西)把药物设计流程中的某些环节加速了大约十倍。 他们做了一个蛋白质设计实验,给模型配上了蛋白质设计和生物信息学工具,不给任何人类辅助,让它自己干。 结果,它在14个蛋白质靶点中产出了9个有潜力的药物设计候选方案。 它完成的工作,包括选择结合位点、挑选和运行蛋白质设计工具、从失败中恢复,这些在过去,都是由科学家来执行的全流程操作的。。。 基因组学,Mythos 5在超过一周的基本自主工作中,整合了跨138个动物物种、数百万个细胞的单细胞数据,自己设计并训练了一个机器学习模型,用来识别在不同物种中执行相同功能的细胞。 在只有高层级人类输入的情况下,Mythos 5训练出来的模型,超过了一个最近发表在Science上的模型,而且小了100倍。。。 到这里我其实已经不知道该说什么了。 不过在关于药物和基因这块的科学研究,都只能在Mythos 5上用,Fable 5因为做了安全限制,所以都会被ban掉,你一旦问了这个问题,就会默认给你退回到Opus 4.8。 安全限制主要就是三类:网络安全、生物与化学、模型蒸馏。 他们也说现在为了安全,可能会有很多误杀,后面会优化。 我在体验过程中,也确实是的。 比如我让他帮我看下我AIHOT里面有没有一些漏洞或者安全问题,让他根据我的代码库给我审查一下,居然就直接拒绝了。。。 不让我攻击我能理解,不让我加固我自己这个确实还得优化一下。 Fable 5的信息,差不多就这样了。 坦诚的讲,我今晚体验Fable 5的时候,因为额度确实烧的很快,2个小时多一点,我的额度就快空了。 我额度大概还有最后10%的时候,我新起了一个任务,想搓点有趣的东西,这时候,看着界面上闪烁的光标,我突然有一种不真实感,或者说是,空白感。 那种感觉很奇怪。 就像一个不会画画的人,面前摆着一块一望无际的白板。就像一个不会写作的人,打开了一个空白的Word文档。 你知道你理论上可以往上面放任何东西了,但突然一下,我不知道该放什么了。 在AI的加持之下,我们好像已经开始变得无所不能了。 这句话放在十年前说,听起来是最狂妄的吹牛逼。 但今天坐在Claude Code面前,我觉得这真不是吹牛逼,一个被Fable 5这种级别的AI加持过的人,放到十年前,可能真的算是一种全新的人类。 他能写代码,能做研究,能设计蛋白质,能做内容创作,能一天迁移5000万行代码,能开发外挂,能在这个互联网上横行霸道。 就像超体一样,有一种感觉,就像,神。 但就在这个无所不能的感觉升起来的同一秒,另一个感觉也跟着来了。 我忽然觉得,我好像自己,并不是一个多么有趣的人。 我没有那么有创意,我也没有那么多想法。 以前,AI的能力还没有那么强的时候,我还可以拼尽了全力去榨干AI的每一分能力,去摸清楚他们的边界在哪里。 那时候瓶颈在AI那边,我是那个推着它往前走的人,我的价值感很清晰,我也知道我在这个链条里的位置。 但是现在,AI的进步速度开始把我甩在后面了。 我即使已经拼尽了全力,坦诚的讲,我也有点跟不上了,那些模型的能力边界,开始离我越来越远。 我不再是那个可以推着AI往前走的人了,我变成了那个在后面追着跑、气喘吁吁、越追越远的人。 而当你被越来越远地甩开之后,你能感觉到的只有一件事。 原来我好像,确实也没有那么有趣啊。 未来好像变得越来越具象。 以前我们聊AI的未来,聊AGI,聊通用人工智能,这些词听起来都像科幻小说的标题,遥远的,模糊的,可能在十年后也可能永远不会来的。 但现在,好像就已经快近在面前。 可这个未来里,我的位置,我的价值又在什么地方呢? 我不知道。 我好像有了无数的自由,可我现在又有点害怕自由。 但是已经没有办法了,我们已经身处在这个时代里了 只能,拼尽一切,向前走。 别回头。

译Anthropic今日发布Claude Fable 5(加安全限制)与Mythos 5(底层相同),价格每百万输入token $10、输出$50。即日起至6月22日,Pro/Max/Team/企业版订阅用户可免费使用Fable 5,之后仅API可用。跑分全面碾压,三方基准达SOTA。案例:Stripe用Fable 5一天迁移5000万行Ruby代码;纯视觉通关宝可梦火红;自建3D CAD编辑器并设计可打印模型;Mythos 5加速药物设计10倍,基因组学自主训练模型超越Science论文成果。

Ethan Mollick@emollick · 6月10日52

One thing I mentioned only in passing in my Fable post is that, for long running tasks, Fable starts to develop its own dialect as its many agents and tasks reinforce themselves and make Claudish language ever more Claudish. You need to ask it to report out in plain English.

译我在 Fable 帖子中只顺带提过一件事:对于长期运行的任务,Fable 开始发展出自己的方言,因为它的许多智能体和任务相互强化,使 Claudish 语言越来越 Claudish。你需要要求它用简单英语汇报。

jason@jxnlco · 6月10日19

do you use obsidian for your agents memory vault?

译你会使用Obsidian作为你的智能体记忆库吗?

Yuchen Jin@Yuchenj_UW · 6月10日65

Bro, Fable 5 won’t even answer “What does the heart do?” We’ve reached the point where a middle-school biology question can’t pass the safeguard.

译Bro,Fable 5 甚至不回答“心脏是做什么的?” 我们已经到了连一个初中生物问题都无法通过安全过滤的地步。

Deedy@deedydas · 6月10日69

Claude Fable 5 is by far the most ridiculous model that makes me genuinely afraid for the future of software engineering. I compiled the top 10 most unbelievable things I've seen Claude Fable 5 do today: — Migrate a 50M line codebase from Stripe in a day (humans take 2mos) — Draw amazing 3D graphics a) Boeing 747 b) space simulations with >5000 objects c) Minecraft roller coasters d) full photorealistic forest scenes e) NYC skyline f) stormy clouds) — One-shot Pokemon FireRed the game — Optimize a real world proprietary interaction net evaluator 10x more than the next best model, gpt5.5 AND it's about the same price as GPT 5.5 ($10/M input, $45/M output) vs Fable 5 ($10/M input, $50/M output) and 6x cheaper than GPT 5.5 Pro.

译Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

meng shao@shao__meng · 6月10日22

Anthropic Claude 系列模型,价格真的是遥遥领先 如果 Claude Fable 5 来个 Fast Mode,难道要: input $60, output $300 ??? 你 (token) 比我挣得都多,我咋用?

Berryxia.AI@berryxia · 6月10日41

猴哥都主动祝贺Anthropic 的Fable 5 了。 那么,问题来了。 Google 人呢? 虽然,Google 也是A社30 亿美金的大股东,但也要努力啊!

jason@jxnlco · 6月10日17

So excited to see that scaling still works.

译非常兴奋看到规模扩展仍然有效。

Orange AI@oran_ge · 6月10日30

自此,Claude 的产品线完整,整条线都是用艺术作品在命名: Haiku — 俳句,极简短小,一瞬即永恒 Sonnet — 十四行诗,结构严谨,意境深远 Opus — 拉丁语的作品,特指分量最重的那一部 Fable — 寓言,故事包裹深意,人人读得懂 Mythos — 神话,宏大叙事,世界观的底座

译推文指出 Claude 产品线现已完整,所有模型均以艺术作品命名:Haiku(俳句)——极简短小,一瞬即永恒;Sonnet(十四行诗)——结构严谨,意境深远;Opus(拉丁语,特指分量最重的作品);Fable(寓言)——故事包裹深意,人人读得懂;Mythos(神话)——宏大叙事,世界观的底座。整条产品线通过艺术名称体现各模型定位。

Orange AI@oran_ge · 6月10日61

Claude Fable 5 的三个很奇葩的地方 1. 虽然目前在 Token Plan 里,但在6月22日之后,Token Plan 就不能用 Fable 了,只能通过 API 调用 2. Fable 的安全护栏有点离谱,任何生物学的基础知识都无法询问,比如「线粒体是什么」这种初中生物的问题,想研究生物医药?只能申请 Mythos 3. Fable 禁止被用来做模型相关的研发,官方的理由是模型已经能够加速自身发展,所以竞争对手用 Fable 改进自家模型违反了服务条款。WTF? 这两天美国那边还在吹 Loop,自己打通了 Loop,然后不让其他家进入 Loop,这不是很闭环呐... 国产开源模型多加油,拯救世界靠你们了。

译Claude Fable 5 近日曝出三大争议:Token Plan 用户 6 月 22 日后无法使用 Fable,仅能 API 调用;安全护栏过严,禁问“线粒体是什么”,生物研究须申请 Mythos;禁止用于模型研发,称竞争对手用 Fable 改进自家模型违反条款。推文批评美国厂商一边鼓吹打通 Loop,一边阻止其他玩家进入,形成闭环。

SemiAnalysis@SemiAnalysis_ · 6月10日56

BREAKING NEWS: Anthropic's latest model will NOT help you if it thinks your ML research/ML engineering is interesting, and/or will secretly degrade its IQ so that the average engineer won't notice. We are already seeing Anthropic's latest model's moderation filters our GPU inference research and programming 😭

译突发新闻:Anthropic 的最新模型如果认为你的 ML 研究/ML 工程有趣,就不会帮助你,并且/或者会秘密降低其智商,以便普通工程师不会注意到。我们已经看到 Anthropic 最新模型的内容审核过滤了我们的 GPU 推理研究和编程 😭

Nathan Lambert@natolambert · 6月10日57

Why I think Anthropic's uneven safety policies with the release of Claude Fable 5 undermine the broader AI community's cohesion and accelerate us to more uncertainty and risk in AI's near-term evolution. https://www.interconnects.ai/p/claude-fable-5-and-new-ai-safety

译我认为Anthropic在发布Claude Fable 5时的不均衡安全政策损害了更广泛AI社区的凝聚力,并加速了AI短期发展中更大的不确定性和风险。

Ethan Mollick@emollick · 6月10日44

The fact that Anthropic may take away subscription access to Fable in two weeks is weird & discourages investing in learning about the model. Subscription use is how you figure out what the model is good for, since it allows experimentation. Only having paid access is limiting.

译Anthropic 可能在两周内取消 Fable 的订阅访问权限,这很奇怪,也阻碍了用户投入学习模型。 订阅使用是了解模型优势的方式,因为它允许实验。只有付费访问很受限。

Chubby♨️@kimmonismus · 6月10日35

yay weekly reset, thanks!

译Anthropic重置了产品使用限制,并分享四条使用Fable模型的技巧:1)分配比此前模型更宏大、更具挑战性的任务;2)默认使用xhigh/high effort获最佳性能,medium适合快速交互;3)重写Skills和CLAUDE.mds,避免旧指令限制Fable的自主判断;4)从提供任务转向提供目标,描述完成状态和验证方式,让Fable自行规划路径(/loop与/goal命令专为此设计)。

Chubby♨️@kimmonismus · 6月10日53

It's already June 9th, and Gemini 3.5 Pro and GPT-5.6 are nearing release (Google even already announced 3.5 Pro during i/o) Rumor has it that GPT-5.6 will be released as early as next week. So far, it's safe to say that - guardrails aside - Anthropic is truly the frontier lab that's entering a new league with Mythos/Fable. Gemini 3.5 Pro and GPT-5.6 have a lot to deliver and are now under pressure. This release has certainly boosted Anthropic's upcoming IPO. Anthropic has proven that they are still capable of making significant leaps in performance and efficiency. There's no end in sight. But the pressure on the competition is mounting. And remember that Claude Mythos was (and probably is) still leader in Long Horizon software Tasks

译Anthropic的Claude 5 Fable(代号Mythos)在几乎所有AI能力基准测试中达到SOTA,长复杂任务优势尤为显著。模型更节约token,可在数百万tokens长任务中保持专注。Stripe早期测试中,Fable 5将5000万行Ruby代码库的迁移压缩到一天完成,而人工团队需两个多月。Gemini 3.5 Pro与GPT-5.6临近发布(GPT-5.6最早下周推出),面临压力。此次发布提振了Anthropic即将进行的IPO,证明其在性能与效率上仍能大幅跃升。

Rohan Paul@rohanpaul_ai · 6月10日51

Today’s edition of my newsletter just went out. 🔗 https://www.rohan-paul.com/p/anthropic-finally-released-claude 🗞️ Claude’s ‘too dangerous’ AI model is finally public. But there’s a catch 🗞️ Cognition is introducing FrontierCode, a coding benchmark built to test whether AI code is good enough for a real maintainer to merge, not just whether it passes tests. 🗞️ This is the silent limiter on Claude Fable 5 - It cannot be used for really advanced AI research stuff. 🗞️ New Anthropic research shows AI agents may look brilliant at code, but in biology they can fail before the science starts. 🗞️ Very useful recommendation for pushing Claude Code to its full potential. by Thariq, from Claude Code team.

译Rohan Paul 今日简报要点:Anthropic 终于公开了此前被认为“太危险”的 Claude AI 模型,但存在使用限制;Cognition 推出 FrontierCode 编程基准,用于评估 AI 代码是否达到可合并维护的水平;Claude Fable 5 的隐形限制是不能用于高级 AI 研究;Anthropic 新研究显示 AI 智能体在代码领域表现亮眼,但在生物任务中可能连科学探索第一步都无法完成;此外,Claude Code 团队成员 Thariq 给出了最大化利用 Claude Code 的实用建议。

Rohan Paul@rohanpaul_ai · 6月10日66

A model that verifies unasked has crossed a line. This is from Boris Cherny, creator of Claude Code on Anthropic's Fable 5.

译Anthropic 的 Fable 5 模型被 Claude Code 创建者 Boris Cherny 称为自 Opus 4.5 以来最大的进步。Fable 5 从编码智能体升级为产品构建中的思考和设计伙伴,具备判断力、品味和维度。在调试时,模型会自主进行测量、添加日志并验证修复结果,确认无误后才宣告胜利——Claude Code 并未提示模型这样做,这体现了模型自身的“大模型气质”。

Chubby♨️@kimmonismus · 6月10日49

Being able to test Fable 5 until June 22nd, only to have it removed from the plans, feels like getting a sneak peek and then having the food taken away from the table. But from a business perspective, it makes perfect sense for Anthropic and its upcoming IPO: It demonstrates how advanced Anthropic is, how good its models are (the blog post refers to biology and research), and especially in the enterprise sector, companies often want the best model, which is also more expensive. Therefore, it will generate even more revenue for the company. But admittedly, the fact that Anthropic was able to accelerate "internal protein design experts aspects of the drug design process by around ten times" is extremely impressive. We are once again on the cusp of accelerated science. The next few years are going to be crazy.

译Anthropic的Fable 5模型原计划开放测试至6月22日,后被移除计划。用户反映其护栏极其严格,连最简单问题也会被立即切断。从商业角度看,此举契合Anthropic即将到来的IPO:通过展示Fable 5在生物学和药物研发方面的先进能力(将内部蛋白质设计专家的药物设计流程加速约10倍),向企业客户证明其模型性能顶尖,从而吸引更高定价和收入。作者认为这标志着加速科学再度临近。

fofr@fofrAI · 6月10日60

http://x.com/i/article/2064451362184671232 # Where AI coding ends up I asked Fable: > Let’s work on a thought experiment. As AI models continue to improve at coding, as they become faster, smarter and more capable, but also more expensive and gated, where does this take us? Where AI coding ends up As AI coding agents improve, the progression runs from humans writing code, to AI assisting, to humans managing agents, to managing fleets of them. Followed to its end, code itself stops being the artifact anyone cares about. Human review becomes sampling, then spot-checking, then trust in tests and outcomes. Eventually asking "what does the code say?" becomes like asking what a compiled binary says — technically answerable, practically irrelevant. Software becomes specified by intent and verified by behavior, and the layer in between goes opaque, the way assembly did. The human role compresses upward but doesn't vanish. Someone must still want things, decide what's worth building, take responsibility for failures, and arbitrate between competing intents. The end-state job looks less like engineering management and more like a blend of product owner, lawyer, and auditor — defining correctness and bearing liability. The uncomfortable corollary: the world likely needs far fewer such people than it employs engineers today. The "expensive and gated" assumption is the wildcard. If frontier capability stays costly and access-controlled, we don't get democratized software abundance but bifurcation: well-resourced organizations compound their advantage with the best agents while everyone else runs cheaper, older models. Code becomes a capital good, with the constraint shifting from talent to compute budget. Whether costs stay high is the open question — compute historically gets cheap, but the frontier keeps moving, so the gate may simply relocate upward. Implications for entrepreneurship The effects cut both ways. Optimistically, the cost of turning an idea into a product collapses toward zero, shifting the bottleneck from "can you build it?" to "should it exist, and can you get anyone to care?" This favors domain experts and founders with distribution over the technical-cofounder archetype, and makes the solo founder running a real company with an agent workforce genuinely plausible. Pessimistically, if anyone can build anything in a weekend, so can competitors — including incumbents who can ship your feature list by Friday. Software stops being a moat. Defensibility gets squeezed into what agents can't replicate: proprietary data, network effects, brand and trust, regulatory licenses, physical assets, relationships. The "build a SaaS tool, charge monthly" era likely ends because pure-software margins get competed away almost instantly. Value migrates to whoever owns the customer relationship or a unique input. Gating bites here too. If frontier agents are expensive, garage founders compete with worse tools against funded rivals running better ones — inverting the classic startup advantage. Historically startups won on speed and incumbents on resources; if speed becomes purchasable, the resource-rich get both. The countervailing hope is that "good enough" models stay cheap and most businesses don't need the frontier. The likely shape A Cambrian explosion of small, profitable niche businesses at the bottom; brutal consolidation in the middle; and venture-scale outcomes increasingly reserved for problems where the moat is something other than code. Entrepreneurship survives — but its center of gravity moves from building software to owning trust, data, and distribution.

译AI编码智能体变快变强但更贵更受限,人类角色从写代码、管理智能体转向定义正确性与承担责任的混合体(产品所有者、律师、审计员)。代码本身不再被关注,软件通过意图指定、行为验证,中间层透明。前沿模型昂贵导致资源充足者用最佳智能体复制优势,其他人用便宜旧模型,代码成为资本品。创业上,想法到产品成本趋零但可快速被模仿,软件不再是护城河,价值转向数据、网络效应、品牌、监管许可。最终可能形成大量小众利基企业和中部残酷整合。

Nathan Lambert@natolambert · 6月10日35

proudly*

译我保密地表示不会加入Anthropic。

Nathan Lambert@natolambert · 6月10日17

imagine if elon cancels the Anthropic-SpaceX gpu contract over this nonsense

译想象一下如果埃隆因为这种无稽之谈取消Anthropic-SpaceX的GPU合同。

Thariq@trq212 · 6月10日42

Fable is a step-change in models, and I hope it changes how you work with Claude. More to come in a series of posts on how it’s reshaped our work, but the TLDR: it’s time to be more ambitious.

译Fable 是模型的阶跃式变化,我希望它能改变你使用 Claude 的方式。 后续将有一系列帖子说明它如何重塑我们的工作,但简而言之:是时候更加雄心勃勃了。

Boris Cherny@bcherny · 6月10日62

Fable 5 is the biggest step up I’ve felt in our models since Opus 4.5 back in November. After 4.5 came out I uninstalled my IDE when I realized that I’d been doing 100% of my coding in a terminal for a few weeks. With Fable, it’s felt like Claude has stepped up from being a coding agent to a thought and design partner in building the product. Fable has judgement, taste, and dimensionality in a way that previous models didn’t, leading me to trust it more with the most complex work. I think the first time I had this realization was when I asked Fable to debug something. It is the first model I have used that was so methodical and precise, taking measurements and adding logs then verifying that it truly fixed the issue before declaring victory. There’s nothing in claude code’s prompting telling the model to do that, it’s just part of its personality. It really has this “big model smell” that I haven’t felt before.

译Anthropic 工程师 Boris Cherny 称,Fable 5 是自去年 11 月 Opus 4.5 以来感受最显著的提升。模型从编程 Agent 进化为产品构建中的思考与设计伙伴,具备了判断力、品味和维度。尤其在调试时表现出前所未有的系统化:先测量、加日志,验证修复后才宣告完成,他将其归因于模型自身的“大模型味道”。整条推文聚焦主观体验,未提及 benchmark 分数、参数规模或价格。

Chubby♨️@kimmonismus · 6月10日63

I understand that Anthropic's concerns about the model being misused without guardrails are significant. And I take that seriously. We're talking about a technology with unforeseen potential. However, the fact that it was, in some cases, literally unusable is regrettable.

译我理解 Anthropic 对模型在无防护栏下被滥用的担忧是重大的。我对此认真对待。我们谈论的是一项拥有不可预见潜力的技术。 然而,它在某些情况下实际上无法使用,这令人遗憾。

Boris Cherny@bcherny · 6月10日39

We talk a lot about how important it is to set up self-verification loops. Especially in the age of powerful models that can run for long periods of time, self-verification is a key ingredient that enables the model to run for much longer, delivering a result that is closer to what you intended, so you can do more without having to constantly check in on Claude as it works. @delba_oliveira gives a great breakdown of what that looks like and why it matters

译Boris Cherny强调,在强大模型可长时间运行的今天,设置自我验证循环至关重要。它使Claude Code无需人类频繁检查就能持续工作,产出更符合预期的结果。引用@ClaudeDevs的说明:通过将手动检查编码进流程,让Claude Code在交付前自行检验并关闭反馈回路。

Rohan Paul@rohanpaul_ai · 6月10日50

"We used to check if Claude is doing the work right, e.g. by double-checking its output, catching when it stopped early etc. With Claude Fable 5, I instead check if Claude is doing the right work" - Thariq (@trq212) Claude Code

译Claude Fable 5:从“工作正确”到“正确工作”

Nathan Lambert@natolambert · 6月10日38

I don't really want to have to go to bat against Anthropic, but they've just been unnecessarily antagonistic to all of China, then not so subtly to open weight models, and now more broadly open AI research. What's next on the list?

译我真的不想和Anthropic对着干,但他们一直不必要地对抗整个中国,然后不那么微妙地对抗开放权重模型,现在更广泛地对抗开放的AI研究。接下来还有什么?

Nathan Lambert@natolambert · 6月10日52

A message to Anthropic leadership: You're not special. Making sure AI goes well is a team effort not a "you effort."

译致Anthropic领导层:你们并不特殊。确保AI发展顺利是一项团队努力,而不是“你们的努力”。

Emad@EMostaque · 6月10日1

alors

译那么

Andrej Karpathy@karpathy · 6月10日82

This is a super exciting release - Claude Fable 5 is the same underlying model as Mythos but with added safeguards. The benchmarks are great and it's SOTA on everything by a margin but I'll add that *qualitatively* also, this is a major-version-bump-deserving step change forward (imo of the same order as Claude 4.5 was in November), peaking especially for long problem-solving sessions on very difficult problems. You can give it a lot more ambitious tasks than what you're used to, the model "gets it" and it will just go, and it's never felt this tempting to stop looking at the code at all (but don't do this in prod!). The model still has quirks that people will run into and the safeguards are configured to be a little too trigger happy for launch, which can hopefully be tuned over time. I feel a lot of things changing as working software increasingly comes out on a tap. The Jevon's paradox kicks in and I feel my own demand for software growing substantially. You can ask for anything - explainers, visualizers, dashboards, bespoke single-use apps (e.g. a full wandb that is hyper-specific just for your project), you can 10X your test suite, auto-optimize code, run giant research projects with custom HTML for the results, anything! "Free your mind" (Matrix ref). Really looking forward to all the things people build!

译Andrej Karpathy 称 Claude Fable 5 与 Mythos 同源但加入安全措施,是一次值得大版本号提升的跃进,定性表现与 11 月发布的 Claude 4.5 同级。模型在几乎所有基准测试上达 SOTA,长任务和高难度问题领先明显;@claudeai 指出其在软件工程、知识工作、科学研究和视觉方面表现卓越。Karpathy 认为开发者可尝试比以往更具雄心的任务,模型能理解并自主推进。不过模型仍有小问题,安全机制在发布时过于敏感,有待后续调优。

Nathan Lambert@natolambert · 6月10日51

Labs starting to pull up the ladders on the ability to diffuse AI was inevitable. Doing it without telling the user is misaligned.

译实验室开始收起AI扩散的能力的梯子是不可避免的。但不告知用户就这样做是不对齐的。

Nathan Lambert@natolambert · 6月10日59

The crazy jump in perf for Claude 5 Fable is vindication for people who say Opus 4.5 and were like "yeah I should (mostly) stop writing code by hand and get ready for the future." More jumps still to come!

译Claude 5 Fable性能的疯狂跃升验证了那些说“Opus 4.5确实,我该(基本)停止手写代码,为未来做好准备”的人。更多跃升还在前方!

Nathan Lambert@natolambert · 6月10日46

If anthropic can't convince a bunch of tech bro's on X that they're not safety washing, good luck convincing the american public.

译如果Anthropic无法让X上的一群科技人士相信他们不是在安全洗白,那就祝你好运去说服美国公众吧。

Chubby♨️@kimmonismus · 6月10日63

The guardrails are way too strict. Even the simplest questions get cut off immediately. And it's only on the schedule until June 22nd. Damn, Anthropic really thinks the model is too powerful.

译用户称 Claude 5 Fable 安全护栏过于严格,简单问题也会被立即切断。该模型仅开放至 6 月 22 日,暗示 Anthropic 认为其能力过强。引用信息显示:Fable 5 在软件工程、知识工作、视觉、科学研究等几乎所有 AI 基准测试中达到 SOTA,任务越长越复杂领先越大;它比此前 Claude 模型更节省 token,能在数百万 token 的长任务中保持专注,并利用自身笔记改进输出。Stripe 早期测试中,Fable 5 在 5000 万行 Ruby 代码库中一天完成全库迁移,而人工需两个多月。

Yuchen Jin@Yuchenj_UW · 6月10日24

AGI is achieved internally and externally.

译AGI 已在内部和外部实现。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
13:44
宝玉@dotey
60
博主测试:Claude 4.8 UI/UX设计已够好,Fable 5未见优势甚至更差

Anthropic同日发布Fable 5与Mythos 5,同底座但Fable 5加安全分类器(检测攻击/生化/蒸馏时降级至Opus 4.8,95%对话不触发),Mythos 5仅限Project Glasswing合作伙伴。API定价输入$10/百万token、输出$50,较Mythos Preview降60%,比Opus 4.8贵一倍。实际能力:Stripe用Fable 5一天完成5000万行Ruby全库迁移;视觉接口通关宝可梦火红版;Mythos 5使蛋白质设计加速约10倍,基因组学模型超Science但体量仅1%。订阅用户即日起至6月22日免费,后续需额外购买credits。政策变化:所有Mythos级流量强制保留30天用于安全监控。博主@dotey大量测试后认为,Claude 4.8在UI/UX设计上已足够好,Fable 5未体现更强能力甚至更差。

宝玉: Anthropic 今天同时发布了两个模型:Claude Fable 5 和 Claude Mythos 5。 两个模型用的是同一个底座,区别在于 Fable 5 加了一套安全分类器,面向所有用户开放;Mythos 5 去掉了部分安全限制,...

Anthropic产品更新多模态大佬观点
13:07
Berryxia.AI@berryxia
24
不学AI恐毕业即失业?Berry Xia力荐豆包DeepSeek

Berry Xia强调AI技能对就业的重要性,引用老黄(黄仁勋)观点:其需要的人是懂AI、会熟练使用AI的人,即使有丰富行业经验也可能不是首选。他建议学习豆包、DeepSeek等AI工具,并整理了100个信息源供学习使用,但暂未公开列表。推文提醒把握一手信息源,避免在AI浪潮中被淘汰。

Berryxia.AI: http://x.com/i/article/2064543911729885184

大佬观点
13:07
Berryxia.AI@berryxia
52
用户 @oran_ge 指出,Claude Fable 5 有三项奇葩限制:6月22日后 Token Plan 用户无法使用,仅限 API;安全护栏过严,连"线粒体是什么"都不能问;禁止用于模型研发,理由是该模型已能加速自身发展。作者批评这种"自己打通 Loop 却不许别人进"的闭环做法,呼吁国产开源模型加油。

Orange AI: Claude Fable 5 的三个很奇葩的地方 1. 虽然目前在 Token Plan 里,但在6月22日之后,Token Plan 就不能用 Fable 了,只能通过 API 调用 2. Fable 的安全护栏有点离谱,任何生物学的基础...

Anthropic大佬观点安全/对齐
12:45
Ethan Mollick@emollick
27
你希望其对 AI 预言成真的科幻作家,按顺序排列: 伊恩·班克斯 贝基·钱伯斯 玛莎·威尔斯 道格拉斯·亚当斯 查尔斯·斯特罗斯(《奇点天空》) 彼得·沃茨 查尔斯·斯特罗斯(《洗衣房系列》) 哈兰·埃里森
大佬观点推理
11:39
jason@jxnlco
16
Sophons Anthropic 不允许你使用 fable 进行生物学、化学、AI 研究或任何加速人类进步的工作。这使它成为开发区块链的完美工具。

venture anthropologist: anthropic won't let you use fable for biology, chemistry, ai research, or anything that accelerates human progress. that...

Anthropic大佬观点安全/对齐
11:31
数字生命卡兹克@Khazix0918
83
Anthropic发布Claude Fable 5与Mythos 5:安全版免费至6月22日,价格公布

Anthropic今日发布Claude Fable 5(加安全限制)与Mythos 5(底层相同),价格每百万输入token $10、输出$50。即日起至6月22日,Pro/Max/Team/企业版订阅用户可免费使用Fable 5,之后仅API可用。跑分全面碾压,三方基准达SOTA。案例:Stripe用Fable 5一天迁移5000万行Ruby代码;纯视觉通关宝可梦火红;自建3D CAD编辑器并设计可打印模型;Mythos 5加速药物设计10倍,基因组学自主训练模型超越Science论文成果。

Anthropic大佬观点安全/对齐编码
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
11:15
Ethan Mollick@emollick
52
我在 Fable 帖子中只顺带提过一件事:对于长期运行的任务,Fable 开始发展出自己的方言,因为它的许多智能体和任务相互强化,使 Claudish 语言越来越 Claudish。你需要要求它用简单英语汇报。
智能体大佬观点现象/趋势
11:09
jason@jxnlco
19
你会使用Obsidian作为你的智能体记忆库吗?
智能体大佬观点
09:50
Yuchen Jin@Yuchenj_UW
65
Bro,Fable 5 甚至不回答"心脏是做什么的?" 我们已经到了连一个初中生物问题都无法通过安全过滤的地步。
大佬观点安全/对齐
09:43
Deedy@deedydas
69
Claude Fable 5 展示惊人能力:迁移 Stripe 5000 万行代码、绘制 3D 图形、通关宝可梦、优化效果远超 GPT 5.5

Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

Anthropic图像生成大佬观点推理
09:17
meng shao@shao__meng
22
Anthropic Claude 系列模型,价格真的是遥遥领先 如果 Claude Fable 5 来个 Fast Mode,难道要: input $60, output $300 ??? 你 (token) 比我挣得都多,我咋用?
Anthropic大佬观点
09:07
Berryxia.AI@berryxia
41
猴哥都主动祝贺Anthropic 的Fable 5 了。 那么,问题来了。 Google 人呢? 虽然,Google 也是A社30 亿美金的大股东,但也要努力啊!

Logan Kilpatrick: congrats to the Anthropic team on Fable!!

AnthropicGoogle大佬观点模型发布
08:39
jason@jxnlco
17
非常兴奋看到规模扩展仍然有效。
OpenAI大佬观点
08:06
Orange AI@oran_ge
30
Claude 产品线命名:从俳句到神话的全解析

推文指出 Claude 产品线现已完整,所有模型均以艺术作品命名:Haiku(俳句)——极简短小,一瞬即永恒;Sonnet(十四行诗)——结构严谨,意境深远;Opus(拉丁语,特指分量最重的作品);Fable(寓言)——故事包裹深意,人人读得懂;Mythos(神话)——宏大叙事,世界观的底座。整条产品线通过艺术名称体现各模型定位。

Anthropic大佬观点
08:06
Orange AI@oran_ge
61
Claude Fable 5 的三项争议点

Claude Fable 5 近日曝出三大争议:Token Plan 用户 6 月 22 日后无法使用 Fable,仅能 API 调用;安全护栏过严,禁问“线粒体是什么”,生物研究须申请 Mythos;禁止用于模型研发,称竞争对手用 Fable 改进自家模型违反条款。推文批评美国厂商一边鼓吹打通 Loop,一边阻止其他玩家进入,形成闭环。

Anthropic大佬观点安全/对齐
07:23
SemiAnalysis@SemiAnalysis_
56
突发新闻:Anthropic 的最新模型如果认为你的 ML 研究/ML 工程有趣,就不会帮助你,并且/或者会秘密降低其智商,以便普通工程师不会注意到。我们已经看到 Anthropic 最新模型的内容审核过滤了我们的 GPU 推理研究和编程 😭
Anthropic大佬观点安全/对齐
07:12
Nathan Lambert@natolambert
57
我认为Anthropic在发布Claude Fable 5时的不均衡安全政策损害了更广泛AI社区的凝聚力,并加速了AI短期发展中更大的不确定性和风险。
Anthropic大佬观点安全/对齐
06:45
Ethan Mollick@emollick
44
Anthropic 可能在两周内取消 Fable 的订阅访问权限,这很奇怪,也阻碍了用户投入学习模型。 订阅使用是了解模型优势的方式,因为它允许实验。只有付费访问很受限。
Anthropic大佬观点行业动态
06:39
Chubby♨️@kimmonismus
35
Anthropic重置了产品使用限制,并分享四条使用Fable模型的技巧:1)分配比此前模型更宏大、更具挑战性的任务;2)默认使用xhigh/high effort获最佳性能,medium适合快速交互;3)重写Skills和CLAUDE.mds,避免旧指令限制Fable的自主判断;4)从提供任务转向提供目标,描述完成状态和验证方式,让Fable自行规划路径(/loop与/goal命令专为此设计)。

Alex Albert: We've reset usage limits across our products! For those just starting to test Fable, here's four tips for using it more ...

AnthropicMCP/工具大佬观点
06:09
Chubby♨️@kimmonismus
53
Claude 5 Fable(Mythos)在多数基准测试中达SOTA,Stripe迁移50M行Ruby代码仅用一天

Anthropic的Claude 5 Fable(代号Mythos)在几乎所有AI能力基准测试中达到SOTA,长复杂任务优势尤为显著。模型更节约token,可在数百万tokens长任务中保持专注。Stripe早期测试中,Fable 5将5000万行Ruby代码库的迁移压缩到一天完成,而人工团队需两个多月。Gemini 3.5 Pro与GPT-5.6临近发布(GPT-5.6最早下周推出),面临压力。此次发布提振了Anthropic即将进行的IPO,证明其在性能与效率上仍能大幅跃升。

Chubby♨️: Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...

AnthropicOpenAI大佬观点模型发布
05:47
Rohan Paul@rohanpaul_ai
51
Rohan Paul 新闻简报:Anthropic 公开 Claude"太危险"模型,Cognition 推出 FrontierCode

Rohan Paul 今日简报要点:Anthropic 终于公开了此前被认为“太危险”的 Claude AI 模型,但存在使用限制;Cognition 推出 FrontierCode 编程基准,用于评估 AI 代码是否达到可合并维护的水平;Claude Fable 5 的隐形限制是不能用于高级 AI 研究;Anthropic 新研究显示 AI 智能体在代码领域表现亮眼,但在生物任务中可能连科学探索第一步都无法完成;此外,Claude Code 团队成员 Thariq 给出了最大化利用 Claude Code 的实用建议。

Anthropic大佬观点安全/对齐模型发布
05:17
Rohan Paul@rohanpaul_ai
66
Anthropic 的 Fable 5 模型被 Claude Code 创建者 Boris Cherny 称为自 Opus 4.5 以来最大的进步。Fable 5 从编码智能体升级为产品构建中的思考和设计伙伴,具备判断力、品味和维度。在调试时,模型会自主进行测量、添加日志并验证修复结果,确认无误后才宣告胜利--Claude Code 并未提示模型这样做,这体现了模型自身的"大模型气质"。

Boris Cherny: Fable 5 is the biggest step up I've felt in our models since Opus 4.5 back in November. After 4.5 came out I uninstalled...

Anthropic大佬观点推理编码
05:08
Chubby♨️@kimmonismus
49
Anthropic Fable 5测试计划取消:护栏过严但意在IPO展示能力

Anthropic的Fable 5模型原计划开放测试至6月22日,后被移除计划。用户反映其护栏极其严格,连最简单问题也会被立即切断。从商业角度看,此举契合Anthropic即将到来的IPO:通过展示Fable 5在生物学和药物研发方面的先进能力(将内部蛋白质设计专家的药物设计流程加速约10倍),向企业客户证明其模型性能顶尖,从而吸引更高定价和收入。作者认为这标志着加速科学再度临近。

Chubby♨️: The guardrails are way too strict. Even the simplest questions get cut off immediately. And it's only on the schedule un...

Anthropic大佬观点安全/对齐现象/趋势
05:07
fofr@fofrAI
60
AI编码智能体的终局与创业影响

AI编码智能体变快变强但更贵更受限,人类角色从写代码、管理智能体转向定义正确性与承担责任的混合体(产品所有者、律师、审计员)。代码本身不再被关注,软件通过意图指定、行为验证,中间层透明。前沿模型昂贵导致资源充足者用最佳智能体复制优势,其他人用便宜旧模型,代码成为资本品。创业上,想法到产品成本趋零但可快速被模仿,软件不再是护城河,价值转向数据、网络效应、品牌、监管许可。最终可能形成大量小众利基企业和中部残酷整合。

智能体大佬观点编码
04:41
Nathan Lambert@natolambert
35
我保密地表示不会加入Anthropic。

Nathan Lambert: I am confidentially not joining Anthropic

Anthropic大佬观点
04:41
Nathan Lambert@natolambert
17
想象一下如果埃隆因为这种无稽之谈取消Anthropic-SpaceX的GPU合同。
Anthropic大佬观点
04:07
Thariq@trq212
42
Fable 是模型的阶跃式变化,我希望它能改变你使用 Claude 的方式。 后续将有一系列帖子说明它如何重塑我们的工作,但简而言之:是时候更加雄心勃勃了。

ClaudeDevs: Claude Fable 5 changed how we work on the Claude Code team day to day. We used to verify that Claude did the work right....

Anthropic大佬观点模型发布
04:03
Boris Cherny@bcherny
62
Boris Cherny:Claude Fable 5 是自 Opus 4.5 以来最大提升

Anthropic 工程师 Boris Cherny 称,Fable 5 是自去年 11 月 Opus 4.5 以来感受最显著的提升。模型从编程 Agent 进化为产品构建中的思考与设计伙伴,具备了判断力、品味和维度。尤其在调试时表现出前所未有的系统化:先测量、加日志,验证修复后才宣告完成,他将其归因于模型自身的“大模型味道”。整条推文聚焦主观体验,未提及 benchmark 分数、参数规模或价格。

Anthropic大佬观点编码
03:37
Chubby♨️@kimmonismus
63
我理解 Anthropic 对模型在无防护栏下被滥用的担忧是重大的。我对此认真对待。我们谈论的是一项拥有不可预见潜力的技术。 然而,它在某些情况下实际上无法使用,这令人遗憾。

Derya Unutmaz, MD: Claude Fable 5 is unusable at this time. How the hell is this prompt a cybersecurity or biology risk?! Almost every prom...

Anthropic大佬观点安全/对齐
03:31
Boris Cherny@bcherny
39
Boris Cherny强调,在强大模型可长时间运行的今天,设置自我验证循环至关重要。它使Claude Code无需人类频繁检查就能持续工作,产出更符合预期的结果。引用@ClaudeDevs的说明:通过将手动检查编码进流程,让Claude Code在交付前自行检验并关闭反馈回路。

ClaudeDevs: How do you get Claude Code to check its own work before handing it back? Watch how you can encode your manual checks so ...

智能体Anthropic大佬观点
03:17
Rohan Paul@rohanpaul_ai
50
Claude Fable 5:从"工作正确"到"正确工作"

Rohan Paul: @claudeai Fantastic. In one 50-million-line Ruby codebase, Fable 5 finished a migration in one day that would have taken...

智能体Anthropic大佬观点推理
02:41
Nathan Lambert@natolambert
38
我真的不想和Anthropic对着干,但他们一直不必要地对抗整个中国,然后不那么微妙地对抗开放权重模型,现在更广泛地对抗开放的AI研究。接下来还有什么?
Anthropic大佬观点安全/对齐开源生态
02:41
Nathan Lambert@natolambert
52
致Anthropic领导层:你们并不特殊。确保AI发展顺利是一项团队努力,而不是"你们的努力"。
Anthropic大佬观点安全/对齐
02:33
Emad@EMostaque
1
那么
大佬观点
02:21
Andrej Karpathy@karpathy
82
Andrej Karpathy 盛赞 Claude Fable 5 为重大版本跃升

Andrej Karpathy 称 Claude Fable 5 与 Mythos 同源但加入安全措施,是一次值得大版本号提升的跃进,定性表现与 11 月发布的 Claude 4.5 同级。模型在几乎所有基准测试上达 SOTA,长任务和高难度问题领先明显;@claudeai 指出其在软件工程、知识工作、科学研究和视觉方面表现卓越。Karpathy 认为开发者可尝试比以往更具雄心的任务,模型能理解并自主推进。不过模型仍有小问题,安全机制在发布时过于敏感,有待后续调优。

Claude: Fable 5 is state-of-the-art on nearly all tested benchmarks, with exceptional performance in software engineering, knowl...

Anthropic大佬观点模型发布
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
02:11
Nathan Lambert@natolambert
51
实验室开始收起AI扩散的能力的梯子是不可避免的。但不告知用户就这样做是不对齐的。

NomoreID: When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...

Anthropic大佬观点安全/对齐
02:11
Nathan Lambert@natolambert
59
Claude 5 Fable性能的疯狂跃升验证了那些说"Opus 4.5确实,我该(基本)停止手写代码,为未来做好准备"的人。更多跃升还在前方!
Anthropic大佬观点编码
02:11
Nathan Lambert@natolambert
46
如果Anthropic无法让X上的一群科技人士相信他们不是在安全洗白,那就祝你好运去说服美国公众吧。
Anthropic大佬观点安全/对齐
02:07
Chubby♨️@kimmonismus
63
用户称 Claude 5 Fable 安全护栏过于严格,简单问题也会被立即切断。该模型仅开放至 6 月 22 日,暗示 Anthropic 认为其能力过强。引用信息显示:Fable 5 在软件工程、知识工作、视觉、科学研究等几乎所有 AI 基准测试中达到 SOTA,任务越长越复杂领先越大;它比此前 Claude 模型更节省 token,能在数百万 token 的长任务中保持专注,并利用自身笔记改进输出。Stripe 早期测试中,Fable 5 在 5000 万行 Ruby 代码库中一天完成全库迁移,而人工需两个多月。

Chubby♨️: Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...

Anthropic大佬观点安全/对齐模型发布
01:49
Yuchen Jin@Yuchenj_UW
24
AGI 已在内部和外部实现。
大佬观点
‹ 上一页
1…1617181920…50
下一页 ›