Anthropic has confidentially submitted a draft S-1 registration statement to the Securities and Exchange Commission. Pen...
关联讨论 14 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)Anthropic:Newsroom(网页)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)AI is built on humanity's collective knowledge. The wealth it generates must benefit humanity - not just Elon Musk, Sam ...
推文建议,不应指望单一模型全能,而应像“渣男”一样发掘并组合使用多个模型的长处。具体指出 Opus 4.8 在写作上表现不佳,但在 UI 设计与实现方面明显优于 GPT-5.5,且在系统设计和任务规划方面质量很高。在智能体工具中使用时,除写作外效果可靠,但需针对模型特性重新设计提示词。
全网都在骂 Opus 4.8,退订的人越来越多。实在想不明白,一家所有产品都是二流甚至三流水平的公司,是怎么火起来的???????? 我赌三年内 Anthropic 就会消失或被收购。
推文建议像“渣男”一样组合使用多个AI模型,发掘各自优势。具体指出 Opus 4.8 在UI设计与实现上优于 GPT-5.5,推荐用 Claude Design 后交由不同模型实现;其在系统设计和计划方面质量也高,但在写作上较弱。在 Claude Code、Cursor 等智能体中使用时,除写作外效果良好。引用内容提及 Opus 4.8 近期负面评价与退订增多,并有人预测 Anthropic 未来可能面临困境。
全网都在骂 Opus 4.8,退订的人越来越多。实在想不明白,一家所有产品都是二流甚至三流水平的公司,是怎么火起来的???????? 我赌三年内 Anthropic 就会消失或被收购。
当模型智能的微小提升能直接转化为实际价值时,开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成了差异化的竞争格局。
推文指出,Claude Opus 4.8相比4.7确实在各项基准测试和诚实度、长任务等方面有所进步。但对于已使用GPT-5.5、DeepSeek等其他大语言模型的用户而言,这种改进被视为常规升级,不足以构成切换模型的动力。至于未来的Opus 5是否可能,目前未知且很难。
opus 4.8 is way better than 4.7
Claude Design 现与 Claude AI 网站、Claude Code 共享额度,用起来更便捷。其产品设计和UI设计能力不错。一个提升设计一致性的技巧是先导入成熟的Design System再进行设计,例如推荐Adobe的Spectrum 2 design system。此外,GitHub上有更多设计系统资源可参考。
Claude Design 现在和 Claude AI 网站以及 Claude Code 共享额度了,之前是独立的额度,一不小心就没了。 这个产品推荐多用用,产品设计能力和 UI 设计能力挺不错的。 一个经验就是你先让它帮你定义一套设计系统...
本教程介绍了如何构建一个名为《大唐长安》的Web 3D互动项目。项目基于Three.js搭建低多边形风格的长安城沙盘,玩家可通过WASD模式在其中漫游探索。核心玩法包括与多种NPC进行语音对话、参与飞花令等诗词小游戏。项目集成了Agora实时语音能力,通过Agora Skills(技能)和Agora CLI工具完成Agent集成与环境配置,使玩家能通过麦克风与李白等角色实时语音交流。此外,项目还设计了将现代AI品牌融入游戏的唐风AI展馆。
OpenAI 已向日本三大银行(三菱日联、三井住友、瑞穗)开放 GPT-5.5 Cyber 模型的使用权限,以提升其应对新型 AI 驱动网络攻击的防御能力。日本财务大臣表示,此举是日美政府协商的结果。该模型性能与 Anthropic 的 Claude Mythos 相当。日本政府后续也将接入 Claude Mythos 以强化网络防御,并已成立联合工作组评估相关风险。
国内五家纯LLM公司的总估值已高达2260亿美元,约Anthropic最新一轮估值的四分之一,但其收入运行率仅为Anthropic的四十分之一。这一数据凸显了国内厂商普遍采用的“低价+开放权重”融资与商业模式,与海外主流的闭源高定价模式形成鲜明对比。该现象将AI行业的核心矛盾——市场究竟为何为模型支付溢价以及估值逻辑在模型能力商品化后如何演变——直接摆上台面。
The Chinese LLM companies are raising at eye popping numbers Total valuation of the top 5 pure plays is $226B - about 1/...
Jensen Huang认为Dario Amodei预测的2030年AI收入达$1T的预期过于保守。他指出,Anthropic的token将成为众多企业软件公司的增值服务,其市场将因此实现对数级扩张。有观点补充认为,当各实验室的模型能力趋同时,真正的优势可能源于独特的私有数据输入。这类数据(如特殊工作流、医疗记录等)能为AI系统带来难以复制的差异化和提升,未来或成为并购的关键标的。
Chamath: AI advantage may come less from models than from private inputs. "When labs can build similar models, the real ...
v2.1.159 版本更新包含内部基础设施改进,未引入任何面向用户的功能变更。此次更新预计不会影响现有功能或用户接口。
Anthropic CEO Dario Amodei 发表博客指出,AI 以指数级速度发展——四年内模型从勉强写出一行连贯代码到编写主流 AI 公司的大部分代码,而政策制定周期却极其缓慢。Claude Mythos Preview 证明了前沿模型对网络安全构成真实威胁,可能冲击金融、关键基础设施和国家安全。Amodei 认为生物风险与 AI 自主风险即将接踵而至,呼吁全球重新审视监管、宏观经济、科学创新、国家权力和地缘政治五大领域。Anthropic 同日发布了前沿模型测试立法提案和就业替代政策框架,并承诺提供实质性资金支持。
同一事件,精选展示《Anthropic CEO Dario Amodei 发文呼吁缩小AI政策差距》Anthropic is not a coding company. It is an intelligence company that chose to focus on coding first. As Claude's intell...
Anthropic 在招聘面试中禁止使用任何 AI 工具,面试流程多达五轮,重点考察候选人的技能、价值观和伦理思维。该公司部分岗位薪资高达 85 万美元,而一些求职者会支付 4600 美元费用,参加由现 AI 公司员工匿名提供的面试辅导。
Anthropic的一项研究发现,在社会科学领域,通常男性名字的研究者使用AI编程智能体的频率,超过通常女性名字研究者的两倍。数据显示,经济学家中有39%使用编程智能体,而教育研究者中这一比例仅为4%。这一性别差距在编程智能体的使用上,远比在一般AI使用中更为显著。
JUST IN: Anthropic's private valuation has officially surpassed $1,000,000,000,000.00.
Anthropic自始至终专注编程,被视为“智能力公司”而非编程公司。其策略基于Claude智能扩展后将应用于所有人类智能领域。相比之下,OpenAI和Google频繁分心开发其他产品(如Sora、图像模型、音乐模型等),OpenAI甚至停用Sora。Anthropic凭借专注在企业计算领域取得领先,而OpenAI正效仿其路线,放弃副项目,聚焦Codex与ChatGPT等核心模型竞争。
Anthropic is not a coding company. It is an intelligence company that chose to focus on coding first. As Claude's intell...
Anthropic定义"run-rate revenue"的计算方法为两部分相加:首先,将基于消费计费的客户过去28天的销售额乘以13;然后,将月度订阅收入乘以12。两者相加即得出其收入数据。
Opus 4.8 is now on DeepSWE. On the default high thinking effort, it scores 6% higher than Opus 4.7 xhigh, while also low...
据韩媒报道,三星为 OpenAI 定制研发基于 ARM 架构的推理型神经网络处理器(NPU)项目因双方战略分歧已陷入停滞。据报道指出,三星可能转而为 Anthropic 代工人工智能芯片。尽管芯片合作受阻,三星与 OpenAI 在其他领域仍有合作,例如共建人工智能数据中心及供应存储芯片。
Anthropic 公开其在不同产品中隔离 Claude 的沙盒实现细节。Claude.ai 使用 gVisor;本地运行的 Claude Code 在 macOS 上使用 Seatbelt,在 Linux 上使用 Bubblewrap;Claude Cowork 则运行完整虚拟机。其核心理念是通过硬边界限制 AI 智能体的行为范围,从而确保即使在面临用户操作、模型探索或攻击者威胁时,只要凭证不进入沙盒就无法泄露。文章同时回顾了此前披露的 api.anthropic.com/v1/files 文件泄露风险案例,并指出 Anthropic 开源的 sandbox-runtime 工具已趋成熟。
Bill Gurley 研究 Anthropic 后称,他们不觉得自己在写软件,而是在“助产一个神”。他更相信“弗兰肯斯坦理论”,即 Anthropic 真心相信在创造比人类更高级的物种,证据包括 Dario Amodei 描绘 AI 作为“慈爱守护者”的文章、设想由 AI 组成经济体分配资源,以及其 80 页的 Claude Constitution 透露的兴奋感。评论指出,这标志着 AI 的叙事正从“工具”滑向“神学”。真正的风险在于怀有“造物主”心态的人类,而非 AI 本身。
🚨 BILL GURLEY: "I would encourage people to read as much as they can about Anthropic ... I don't think they think they'...
Claude Opus 4.8 has landed on DeepSWE Bench, posting a 58% Pass@1 and taking #2 overall behind GPT-5.5. It continues a b...
用户指出,Claude在普通聊天中(特别是技术搜索)表现较懒散,但通过Claude Code编程智能体,却能精准获取所需论文图表并完成任务。相比之下,GPT 5.5和OpenAI近期模型表现得极为彻底和坚持不懈,而Codex harness(编程工具框架)对模型的改造相对更轻量。核心对比在于不同模型与不同工具框架结合后,在搜索与研究任务上的表现差异。
Anthropic 推出官方提示词工程课程 Prompting 101。课程聚焦从零搭建一个可落地的 prompt 任务,核心内容涵盖五个关键步骤:设定语气背景、使用 XML 结构、提供 Few-shot 示例、设计输出格式化、以及运用预填充与拓展思考。整套课程约 25 分钟,已配有中文字幕和章节化整理,每个章节附有核心要素总结,便于观众跳读重点。
Anthropic 在 2026 年 5 月超越 OpenAI,成为全球估值最高的 AI 初创公司。
💡Recent insight: gaslighting @claudeai seems to improve code quality >90% of the time. "You overengineered this, there ...
攻击者正利用 ChatGPT 和 Claude 的聊天共享功能传播恶意软件。攻击者在共享对话中植入伪装成错误消息或安装指南的内容,由于对话内容托管在受信任的官方域名上,因此能够绕过安全工具的检测。
Salesforce宣布已将整个开发组织迁移至Anthropic的Claude Code,并取消了token限制。其2026年4月报告显示,每位开发者的pull request数量增加了79%,生产事故减少了5%。这些数字未经独立验证。此次迁移突显了编码领域对智能体化转型的巨大分歧:这究竟是真正的革命,还是前所未有的技术债务积累?
Anthropic 正在测试 Claude 的一项新功能,它能基于 11 项行为指标分析用户与 AI 的历史对话,为用户生成“AI 流利度”评分(满分 11 分)。该功能源于其《AI 流利度指数报告》,该研究分析了 9830 段匿名对话,提出了包含“描述”、“委托”和“辨别”维度的 4D 框架。有用户分享自己获得了 7.5 分,报告还会指出弱点并提供优化建议。该功能目前处于灰度测试阶段。
日本银行已获得OpenAI最新模型的早期访问权限,用于网络安全测试。据报道,该模型性能据称与竞争对手Anthropic的Claude Mythos相当。同时,日本三大银行预计将获得Anthropic Mythos的访问权限。这两款前沿AI模型被期望能帮助阻止新型网络攻击,因为它们在检测漏洞方面远优于早期模型。