AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
5月29日周五
03:14Rohan Paul78Anthropic估值超越OpenAI,达9650亿美元
03:14TechCrunch:AI(RSS)78同事件精选Anthropic 融资 650 亿美元,估值逼近 1 万亿,IPO 在即同一事件,精选展示《Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元》
03:06Claude48新模型发布前,内部团队如何极限测试
02:39Claude Code:GitHub Releases(RSS)73同事件精选Claude Code v2.1.154 发布:新增 Opus 4.8 与动态工作流同一事件,精选展示《在Claude Code中引入动态工作流》
02:35Anthropic:Newsroom(网页)81精选Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元
02:22Anthropic75Anthropic完成650亿美元H轮融资
02:21OpenCode60Opus 4.8 现已登陆 OpenCode
02:14Chubby♨️82Anthropic估值逼近万亿美元大关
02:09elvis65Claude Code 推出动态工作流,用户分享四个月实践经验
01:51Boris Cherny88Claude Opus 4.8发布,编码能力与诚实度提升
01:44Rohan Paul76Claude Opus 4.8发布,性能显著提升并推出"动态工作流"
01:38宝玉76Anthropic 发布 Claude Opus 4.8,推出 fast mode 与 dynamic workflows
01:37Perplexity59Claude Opus 4.8 向 Max 用户开放
01:36Thariq76Claude Opus 4.8发布:更智能更协作
01:36OpenRouter80Claude Opus 4.8上线,性能提升价格不变
01:31AYi72Claude Opus 4.8发布:更敏锐更诚实更持久
01:31AYi63Cursor真牛逼,这么快就上线了Claude Opus 4.8!
01:21Claude:Blog(网页)78精选在Claude Code中引入动态工作流
01:19ClaudeDevs83Claude Opus 4.8现已登陆Claude Code
01:19ClaudeDevs68Claude Code 新增动态工作流功能
01:19🚨 AI News | TestingCatalog82Claude Opus 4.8 全面推送,新增思考强度选项
01:19🚨 AI News | TestingCatalog69Claude Opus 4.8发布,SWE-bench Pro得分提升
01:19🚨 AI News | TestingCatalog73Claude Code 推出动态工作流,可并行处理数百子智能体完成复杂任务
01:18Artificial Analysis80Anthropic 发布 Claude Opus 4.8,成为 GDPval-AA 基准新领导者
01:18Ars Technica:AI(RSS)68伊利诺伊州通过AI安全里程碑法律获巨头支持
01:14Chubby♨️75Opus 4.8 已上线,德国也可用
01:14Chubby♨️83Opus 4.8发布,智能体编码能力大幅提升
01:14Chubby♨️70Claude Opus 4.8上线,可自定义推理强度
01:14Chubby♨️51Anthropic发布Claude Opus 4.8,对话更自然协作更强
01:14The Verge:AI(RSS)68Claude 的新模型在"出错时更'诚实'"
01:14TechCrunch:AI(RSS)72同事件精选Anthropic 发布 Opus 4.8 并推出新型"动态工作流"工具同一事件,精选展示《Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级》
01:12Yuchen Jin62Opus 4.8 发布,性能惊人
01:12Yuchen Jin72Opus 4.8发布,SWE-Bench Pro得分创新高
01:12Ethan Mollick57Opus 4.8与GPT-5.2 Pro同台:单次生成创意Shader对比
01:12Ethan Mollick64Opus 4.8 用 Claude Code 独立开发并测试新 RPG 游戏
01:08Hacker News 热门(buzzing.cc 中文翻译)87克劳德 作品4.8
01:06Claude82Claude Opus 4.8发布,判断力与自主性提升
01:06swyx67Claude支持任务中途更新指令且不破坏缓存
01:05Anthropic:Newsroom(网页)85精选Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
00:42Yuchen Jin17粉丝数遵循大模型缩放定律
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月29日
03:14
Rohan Paul@rohanpaul_ai
78
Anthropic完成650亿美元H轮融资,投后估值达9650亿美元,已超越OpenAI此前8520亿美元的估值。本轮融资由Altimeter Capital、红杉资本等领投,三星、SK海力士等作为战略基础设施合作伙伴加入。Claude的年化营收已突破470亿美元。此轮距离其三个月前300亿美元的融资估值大幅增长。

Rohan Paul: Wow. Anthropic secures a massive post-money valuation of $965B after raising $65 B. Just three months earlier, in Februa...

AnthropicOpenAI行业动态
关联讨论 13 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)Anthropic:Newsroom(网页)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)X:Anthropic (@AnthropicAI)
03:14
TechCrunch:AI(RSS)
同事件精选78
Anthropic 融资 650 亿美元,估值逼近 1 万亿,IPO 在即

Anthropic 完成 650 亿美元的 Series H 融资,投后估值达 9650 亿美元。这可能是这家 AI 公司在备受期待的 IPO 前的最后一轮私募融资。

Anthropic行业动态
同一事件,精选展示《Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元》
推荐理由:65亿美元、估值逼近万亿,这是Anthropic上市前最后一轮融资,同日还发了Claude Opus 4.8,信号很明显,它要给OpenAI的IPO制造压力。
03:06
Claude@claudeai
48
在我们发布新模型之前,这些团队会尝试将其"击垮"。 他们用它构建,将其推向极限,并告诉我们它在哪里表现不足。他们的发现让最终模型变得更好。
Anthropic安全/对齐行业动态
02:39
Claude Code:GitHub Releases(RSS)
同事件精选73
Claude Code v2.1.154 发布:新增 Opus 4.8 与动态工作流

Claude Code 更新至 v2.1.154 版本,正式引入 Opus 4.8 模型。新功能包括“动态工作流”,可通过 /workflows 指令让 Claude 在后台编排数十到数百个 AI 智能体协同处理复杂任务。Opus 4.8 的快速模式现已可用,成本降低为 2 倍标准费率可实现 2.5 倍速度提升。其他更新有:精简系统提示词成为默认设置(除 Haiku、Sonnet 及 Opus 4.7 及更早版本外),优化多选题决策逻辑,简化 /simplify 命令。此次更新修复了包括后台会话管理、终端渲染在内的多个 bug,并增强了自动模式对数据外泄的检测能力。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《在Claude Code中引入动态工作流》
推荐理由:Claude Code 这版把多 agent 编排做成了产品功能,动态工作流让一个 prompt 能调度上百个 agent,再加上 Opus 4.8 快速模式只要 2 倍价格,做复杂任务的开发者可以试一下。
02:35
Anthropic:Newsroom(网页)
精选81
Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元

Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,投后估值达 9650 亿美元。公司表示其旗舰模型 Claude 的企业部署持续增长,年化收入已突破 470 亿美元。此轮融资将用于推进 AI 安全与可解释性研究、扩展算力以满足 Claude 的需求,并规模化产品与合作伙伴关系。Anthropic 近期已显著扩大计算容量,并宣布 Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。

Anthropic行业动态
关联讨论 13 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)Anthropic:Newsroom(网页)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)X:Anthropic (@AnthropicAI)
推荐理由:65B的融资规模基本封死了其他玩家追赶的门槛,Claude的算力和研发投入将远超同行,做应用的可以放心上船了。
02:22
Anthropic@AnthropicAI
75
我们已完成650亿美元的H轮融资,投后估值达9650亿美元,由AltimeterCap、Dragoneer、Greenoaks和红杉资本领投。 这笔投资将帮助我们推进研究,并扩大产能以满足对Claude日益增长的需求。
Anthropic行业动态
关联讨论 13 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)Anthropic:Newsroom(网页)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)X:Anthropic (@AnthropicAI)
02:21
OpenCode@opencode
60
Opus 4.8 现已在 OpenCode 中可用。
Anthropic产品更新推理
02:14
Chubby♨️@kimmonismus
82
Anthropic 最新估值:9650亿美元 最新年化营收:470亿美元(2025年底为90亿美元) 距离1万亿美元仅一步之遥

Anthropic: We've raised $65 billion in Series H funding at a $965 billion post-money valuation, led by @AltimeterCap, Dragoneer, @G...

Anthropic行业动态
关联讨论 13 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)Anthropic:Newsroom(网页)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)X:Anthropic (@AnthropicAI)
02:09
elvis@omarsar0
65
Claude Code 新增"动态工作流"研究预览功能,可动态编写编排脚本并行启动大量协同子代理,处理复杂任务。提示词中使用"workflow"即可触发。有用户表示已通过 -p 或 Agent SDK 实现类似想法约四个月,认为代理间交互效果显著,但也提醒需注意 token 消耗。

ClaudeDevs: New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...

智能体Anthropic产品更新
01:51
Boris Cherny@bcherny
88
Claude Opus 4.8今日发布。这是我们迄今最强的编码模型:在SWE-bench Pro上得分提升(从64.3到69.2),并且对自己的工作更加诚实。它会在不确定时告诉你,并能发现自己的错误,而不是过早宣布成功。价格与4.7版相同。

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

Anthropic模型发布编码
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:44
Rohan Paul@rohanpaul_ai
76
Claude Opus 4.8发布,性能显著提升并推出"动态工作流"

Anthropic发布Claude Opus 4.8模型。其快速模式速度提升2.5倍,同时成本降低3倍。在agentic终端编码基准测试上,性能从66.1%大幅提升至74.6%,成为GDPval-AA基准的新领导者。新推出“动态工作流”功能,可通过Claude Code将大型工程任务分解为数十至数百个并行子任务,由多个AI智能体协同处理并互相验证。官方介绍称,该版本在判断力、诚实度以及独立工作能力上均有提升,今日起以相同价格提供服务。

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

智能体Anthropic模型发布编码
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:38
宝玉@dotey
76
Anthropic 发布 Claude Opus 4.8,推出 fast mode 与 dynamic workflows

Anthropic 发布 Claude Opus 4.8,价格与 Claude Opus 4.7 持平。该模型核心改进是更诚实,能更真实地判断自身进度并承认不确定性,更适合长时间独立运行。同步推出 fast mode,在同一模型上实现约 2.5 倍速度提升且价格降低三倍。重要新功能是 Claude Code 的 dynamic workflows(动态工作流),它能将大型任务拆解,并行派出大量子智能体执行与验证,适用于跨文件的大规模代码任务。官方以用其将 Bun 从 Zig 移植到 Rust 作为案例。需注意,该功能消耗的 token 远多于普通会话。

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

智能体Anthropic模型发布编码
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:37
Perplexity@perplexity_ai
59
Claude Opus 4.8 现已面向 Max 订阅用户在 Perplexity 和 Computer 上提供。
Anthropic产品更新推理
01:36
Thariq@trq212
76
我觉得你会非常喜欢 Opus 4.8。 它和基准测试显示的一样聪明,但以温暖协作的方式表达和运用这种智能。 工作流是利用它的绝佳方式--我已沉迷其中。相关文章即将推出。

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:36
OpenRouter@OpenRouter
80
Opus 4.8 已在 OpenRouter 上线! 价格与 4.7 相同,在智能体编码、推理和计算机使用方面均有提升。 代码缺陷未被发现的概率比 4.7 低约 4 倍。 Opus 4.8 Fast Mode 也已上线--现在只需 2 倍价格,即可获得 2.5 倍速度。
智能体Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:31
AYi@AYi_AInotes
72
Claude Opus 4.8发布:更敏锐更诚实更持久

天啊,Claude Opus 4.8!!! 他来了!他终于来了!!! 时隔37天 Anthropic打出了本赛季最漂亮的一次反击, 更敏锐的判断力, 更诚实的自我认知, 更长时间的独立工作, 关键是加量不加价!加量不加价!!! 伟大的Anthropic! 他继承了大语言模型的光荣传统! 在这一刻他不是一个模型在战斗! 他不是一个人!!!

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

Anthropic模型发布
01:31
AYi@AYi_AInotes
63
Cursor已上线Claude Opus 4.

AYi: 上周 Cursor 送了我 1 万美金额度, 我以为往死里造 7 天怎么也得花到 3000 美金, 结果实际一看, 300 多美金都没花到。 7这几天我用 Claude Opus 4.7 thinking xhigh MAX 跑了几十次, ...

Anthropic现象/趋势编码
01:21
Claude:Blog(网页)
精选78
在Claude Code中引入动态工作流

Claude Code 推出“动态工作流”功能,使 Claude 能端到端处理复杂任务。该功能通过动态编写脚本,在单个会话中并行运行数十到数百个子智能体来完成工作,并会在结果呈现前进行验证。它适用于跨代码库的 bug 查找、大规模迁移(如将 Bun 从 Zig 移植到 Rust)等需要多角度分析的任务。该功能现已在研究预览阶段可用,支持 Claude Code CLI、桌面端、VS Code 扩展以及 API、Amazon Bedrock、Vertex AI 等平台,面向 Max、Team 及已启用的 Enterprise 计划用户。

智能体Anthropic产品更新编码
关联讨论 5 条Claude:Blog(网页)Claude Code:GitHub Releases(RSS)X:邵猛 (@shao__meng)X:Claude Devs (@ClaudeDevs)X:Thariq (@trq212)
推荐理由:动态工作流第一次让 Claude Code 能独立搞定需要并行协调的大规模工程任务,Bun 从 Zig 到 Rust 只用了十一天,这对复杂代码库的维护和迁移是降维打击。
01:19
ClaudeDevs@ClaudeDevs
83
Opus 4.8今日已在Claude Code上线。 几点值得了解:🧵

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

Anthropic推理模型发布编码
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:19
ClaudeDevs@ClaudeDevs
68
Claude Code 新功能(研究预览):动态工作流。 Claude 会即时编写一个编排脚本,然后并行启动大量协调的子智能体来处理你最复杂的任务。 在提示词中使用"workflow"一词即可开始使用。
智能体AnthropicMCP/工具产品更新
关联讨论 5 条Claude:Blog(网页)Claude Code:GitHub Releases(RSS)X:邵猛 (@shao__meng)X:Claude Devs (@ClaudeDevs)X:Thariq (@trq212)
01:19
🚨 AI News | TestingCatalog@testingcatalog
82
ANTHROPIC 🔥:Claude Opus 4.8 正在向所有用户推送。 此次发布还包含更新的思考强度选择器,提供低、中、高、额外和最大选项。 > 切换到 Opus 4.8 来完成你最具雄心的工作--现在你可以设置思考强度,以平衡深度或速度。
Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:19
🚨 AI News | TestingCatalog@testingcatalog
69
ANTHROPIC 🔥: Claude Opus 4.8 在 SWE-bench Pro 上取得 69.2% 的分数,而 Opus 4.7 为 64.3%。 Benchmarks 👀

🚨 AI News | TestingCatalog: ANTHROPIC 🔥: CLAUDE OPUS 4.8 IS ROLLING OUT TO ALL USERS. The release also includes an updated Thinking effort selector...

Anthropic推理模型发布评测/基准
01:19
🚨 AI News | TestingCatalog@testingcatalog
73
Claude Code 推出动态工作流,可并行处理数百子智能体完成复杂任务

Anthropic 为 Claude Code 新增“动态工作流”功能。面对复杂任务,Claude 能动态编写编排脚本,在单个会话中并行运行数十到数百个子智能体,并在结果呈现给用户前进行自我核查。该功能适用于传统单一智能体难以一次处理的挑战,例如整个服务的 bug 排查、涉及数百个文件的代码库迁移等场景。引用内容指出,Claude 会先制定计划,然后运行数百个并行子智能体并验证其工作。

Claude: Also new in Claude Code: dynamic workflows (research preview). For the hardest tasks, Claude makes a plan, runs hundreds...

智能体Anthropic产品更新编码
01:18
Artificial Analysis@ArtificialAnlys
80
Anthropic 发布 Claude Opus 4.8,成为 GDPval-AA 基准新领导者

Anthropic 正式发布了 Claude Opus 4.8 模型。该模型在人工智能分析公司的 GDPval-AA 基准(专注于智能体的现实工作任务)上,以“max”努力设置获得了 1890 分。这一成绩比前代 Opus 4.7 高出 137 分,并以 121 分的优势领先于次优模型 GPT-5.5 xhigh。在直接对比中,这意味着 Opus 4.8 对 GPT-5.5 xhigh 拥有约 67% 的胜率。Anthropic 在模型公开发布前,为人工智能分析公司提供了早期访问权限以进行评测。

智能体Anthropic模型发布评测/基准
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:18
Ars Technica:AI(RSS)
68
伊利诺伊州通过AI安全里程碑法律获巨头支持

伊利诺伊州通过一项AI安全监管的里程碑式法律,要求进行安全测试。AI公司Anthropic和OpenAI均表示支持该法案。

AnthropicOpenAI安全/对齐政策/监管
01:14
Chubby♨️@kimmonismus
75
Opus 4.8 已上线!甚至在德国也能用了!!
Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:14
Chubby♨️@kimmonismus
83
Opus 4.8 已上线。基准测试显示其在智能体编码方面有显著提升,但更重要的是: "Opus 4.8 现已提供快速模式。这是同一个模型,速度提升约 2.5 倍,且价格比之前降低了三倍。"

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

智能体Anthropic模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:14
Chubby♨️@kimmonismus
70
太好了!我可以关闭自适应思考并自行设置推理强度了。 终于!

Chubby♨️: Opus 4.8 is live! Even in Germany!!

Anthropic推理模型发布
01:14
Chubby♨️@kimmonismus
51
Anthropic发布了Claude Opus 4.8版本。据官方(@alexalbert__)介绍,这是基于用户对4.7版本反馈的改进,重点修复了问题。4.8模型在理解细微差别方面表现更好,对话感觉更自然,在编程(coding)到知识工作(knowledge work)等各种任务中都是更强大的协作者。

Alex Albert: Excited to release Opus 4.8 today! We heard your feedback on 4.7 and have made many fixes for 4.8. 4.8 understands nuanc...

Anthropic大佬观点模型发布
01:14
The Verge:AI(RSS)
68
Claude 的新模型在"出错时更'诚实'"

Anthropic 在周四发布了其最新模型 Claude Opus 4.8。新模型在生成错误内容时,更倾向于主动标示不确定性,并减少做出无根据的断言。在内部评估中,其产出未经证实断言的可能性比前代模型降低约 4 倍。

Anthropic安全/对齐模型发布
01:14
TechCrunch:AI(RSS)
同事件精选72
Anthropic 发布 Opus 4.8 并推出新型"动态工作流"工具

Anthropic 发布了最新的 Opus 4.8 大语言模型,并为该模型引入了一个名为“Dynamic Workflows”的新工具。该工具旨在协调由多个子代理组成的群组,以执行复杂任务。

智能体Anthropic推理模型发布
同一事件,精选展示《Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级》
推荐理由:Opus 4.8 是 Anthropic 对 Opus 4.7 失望反应的快速回应,亮点不在跑分而在模型能主动标记不确定性,这比正确率更实用。动态工作流让跨子 agent 的代码迁移成为现实,开发团队值得关注。
01:12
Yuchen Jin@Yuchenj_UW
62
Opus 4.8 发布了。 天啊!
Anthropic模型发布
01:12
Yuchen Jin@Yuchenj_UW
72
Opus 4.8在SWE-Bench Pro上得分69.2%,比GPT-5.5高出10分。 发布博客中最有趣的部分是"动态工作流": "这项新功能(目前处于研究预览阶段)允许Claude在Claude Code中承担更大的任务。Claude可以规划工作,然后在单个会话中运行数百个并行子智能体(使用Opus 4.8时,智能体可以运行更长时间)。它在向用户报告之前会先验证其输出。"
智能体Anthropic模型发布编码
01:12
Ethan Mollick@emollick
57
Opus 4.8与GPT-5.2 Pro在相同任务上展示了其代码生成能力。两者均通过"一次性生成"(single shot)的方式,为twigl平台创建可运行的视觉shader。具体任务为:用数学生成一个"无限的新哥特式塔楼城市部分淹没于巨浪汹涌的暴风雨海洋中"的场景。这则推文通过并列展示,体现了两个顶级大语言模型在创意编程领域的直接对比。

Ethan Mollick: Had early access to GPT-5.2. Its an impressive model. Here is GPT 5.2 Pro's version of "create a visually interesting sh...

Anthropic多模态模型发布
01:12
Ethan Mollick@emollick
64
Opus 4.8 在 Claude Code 中构建并测试了一款新的 RPG 游戏,包括 3 本 PDF 手册和冒险内容、测试笔记、一个网站,以及一个可玩的单人冒险--然后将其全部部署到 Netlify。全程没有我的任何反馈。 https://stillpoint-osr.netlify.app
智能体Anthropic教程/实践编码
01:08
Hacker News 热门(buzzing.cc 中文翻译)
87
克劳德 作品4.8

Anthropic 发布了新版模型 Claude Opus 4.8。该模型的具体技术参数、性能基准与定价等详情暂未提供。本文提供了其官方公告页面的链接,并记录了该新闻在 Hacker News 上的讨论热度。

Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:06
Claude@claudeai
82
介绍 Claude Opus 4.8:它在 Opus 4.7 基础上,拥有更敏锐的判断力、对自身进展更诚实,并且能比前代更长时间独立工作。 今日发布,价格不变。
Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
01:06
swyx@swyx
67
开发者可以在任务执行过程中更新Claude的指令,而不会破坏提示词缓存或需要通过用户轮次来传递更新。

Claude: Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...

Anthropic推理模型发布
01:05
Anthropic:Newsroom(网页)
精选85
Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增“动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。此外,其诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。

智能体Anthropic推理模型发布
关联讨论 5 条X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)The Decoder:AI News(RSS)MarkTechPost(RSS)X:邵猛 (@shao__meng)
推荐理由:Opus 4.8看着是常规升级,但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头,快速模式降价三倍更是直接拉低了实时场景的入场券。
00:42
Yuchen Jin@Yuchenj_UW
17
今天粉丝数达到15万。 3个月前才10万。显然我的粉丝数遵循大模型缩放定律。 感谢大家喜欢我的吐槽,AGI即将到来。 更令人兴奋的是:Opus 4.8今天发布,也许GPT-5.6也会?!
AnthropicOpenAI大佬观点
‹ 上一页
1…3637383940…50
下一页 ›