AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1901 条
全部一手资讯X论文
标签「Anthropic」清除
Berryxia.AI@berryxia · 3天前63

这个预测感觉反直觉和共识了啊~ 爆火𝕏 的 Qu Xiaoyin(前Meta产品经理)的核心结论是: 欧美企业会抛弃OpenAI和Anthropic,转向中国模型。 她给了两个理由: 第一,合规+控制权。 中国企业可以把模型部署在企业自己的GPU上。 这样既满足数据合规要求(数据不出境),企业又拥有完全的控制权,模型跑在自己的服务器上, 不依赖任何外部API。 第二,可定制化。 中国开源模型(DeepSeek、Qwen、GLM等)允许企业在自己的数据上做后训练。 企业拿到基座模型,用内部数据微调,变成自己专属的模型。 OpenAI和Anthropic的闭源API做不到这一点。 这条推文的背景:2026年上半年,中国开源模型的能力已经追平甚至超越了部分闭源模型。 DeepSeek V4、Qwen3.5、GLM-5.2在多个基准测试上表现优异。 同时,美国对华芯片出口限制反而加速了中国模型的轻量化和推理优化,用更少的算力达到更好的效果。 对企业的实际意义: 1. 成本。 闭源API按token收费,规模越大成本越高。开源模型一次性部署,边际成本趋近于零。 2. 数据安全。 金融、医疗、政府等敏感行业,数据不能传出自己的服务器。开源模型本地部署完美解决这个问题。 3. 定制能力。 通用模型再强也不如针对特定领域微调过的模型。开源模型允许企业用自己的数据做后训练。 4. 供应商锁定。 用OpenAI的API就被绑死了。用开源模型,随时可以换。 潜在风险:开源模型的部署和运维需要专业团队。 不是所有企业都有能力自己跑模型。 但云服务商(AWS、Azure、阿里云)已经开始提供开源模型的托管服务,降低了门槛。 一句话总结:开源模型的能力在追平闭源,而灵活性和成本优势在拉大。 企业选择中国开源模型不是因为爱国,是因为更划算。

译前Meta产品经理Qu Xiaoyin预测,欧美企业将抛弃OpenAI和Anthropic,转向中国开源模型。核心原因:中国模型可部署在企业自有GPU上,满足数据合规且完全控制;开源模型(如DeepSeek、Qwen、GLM)允许用内部数据后训练,构建专属模型。背景是2026年上半年中国开源模型能力追平闭源,美国芯片限制反而加速轻量化和推理优化。对企业而言,开源模型实现一次性部署、边际成本趋零,数据不出服务器确保安全,可针对领域微调,并避免被闭源API锁定。潜在风险是运维需专业团队,但AWS、Azure、阿里云等已提供托管服务降低门槛。

Rohan Paul@rohanpaul_ai · 3天前49

Today’s edition of my newsletter just went out. 🔗 https://www.rohan-paul.com/p/openai-just-dropped-the-limited-preview 🗞️ OpenAI just dropped the limited preview of its new GPT 5.6 model suite: Sol, the flagship; Terra, a medium-tier model for “high-volume work”; and Luna, a “fast and affordable” everyday model. 🗞️ Key findings from GPT-5.6 Preview System Card 🗞️ OpenAI’s GPT-5.6 Sol is far more likely than GPT-5.5 to take severity-3 agent actions in internal coding tests nearly 10x. 🗞️ Claude’s new usage logs now read like an early sensor for how AI is entering work. 🗞️ “Critique of Agent Model” 🗞️ “How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms” 🗞️ UBS says 60% of companies now watching AI budgets are moving to cheaper models and open-source Chinese models

译OpenAI 推出 GPT-5.6 模型套件的 limited preview,包含旗舰模型 Sol、中等模型 Terra 和快速廉价的日常模型 Luna。根据 GPT-5.6 Preview System Card,Sol 在内部编码测试中采取 severity-3 agent 动作的可能性比 GPT-5.5 高出近 10 倍。

ClaudeDevs@ClaudeDevs · 3天前53

You can now run Claude models in Microsoft Foundry, hosted on Azure. Claude Opus 4.8 and Claude Haiku 4.5 are available through the Messages API with capabilities like prompt caching, thinking, and more. https://x.com/claudeai/status/2071653958905467027?s=20

译你现在可以在 Microsoft Foundry(托管于 Azure)上运行 Claude 模型。 Claude Opus 4.8 和 Claude Haiku 4.5 通过 Messages API 提供,支持 prompt caching、thinking 等功能。

Chubby♨️@kimmonismus · 3天前37

Really excited for the next version of Claude Code. Keep it coming Boris!

译下个版本的 Claude Code 中,子智能体将默认在后台运行,让你在子智能体工作时仍可继续与 Claude 对话。若想让智能体前台运行,只需告诉 Claude。Kim 对此表示非常期待,并喊话 Boris 继续发力。

Claude@claudeai · 3天前55

Claude in Microsoft Foundry is now generally available, hosted on Azure. Azure customers get Claude Opus 4.8 and Claude Haiku 4.5, with Azure authentication, billing, and commitment retirement.

译Claude 现已在 Microsoft Foundry 中正式可用,托管于 Azure。 Azure 客户可获得 Claude Opus 4.8 和 Claude Haiku 4.5,并支持 Azure 身份验证、计费和承诺预留。

Boris Cherny@bcherny · 3天前30

In the next version of Claude Code: subagents run in the background by default, so you can keep talking to Claude while your subagents work If you want your agent to run in the foreground, just tell Claude

译下一版 Claude Code 中:子智能体默认在后台运行,因此你可以在子智能体工作时继续与 Claude 对话。如想让智能体在前台运行,只需告诉 Claude 即可。

SemiAnalysis@SemiAnalysis_ · 3天前59

JUNE 1, 2001 🚨MICROSOFT CEO: OPEN-SOURCE OPERATING SYSTEMS ARE DANGEROUS $MSFT CEO Bill Gates told lawmakers that open-source operating systems such as Linux are "going down a very dangerous path." Transcript below ⬇️ """ The scaling of open source operating systems, I think it's going down a very dangerous path. And again, if the path continues, I think we could get to a very dangerous place. I think it's worth saying some things on Linux that are clear to all the experts, but I want to make sure is understood by this committee, which is when you control the operating system and you're shipping it, you have the ability to monitor its usage. It might be misused at one point, but then you can push an update. You can revoke a user's license. You can change what the system is willing to run. When an operating system is released in an uncontrolled manner, by some guy compiling his own kernel in his basement, there's no ability to do that. It's entirely out of your hands. And so I think that should be attended to carefully. There may be ways to release software open source so that it's harder to circumvent the licensing, but that's a much harder problem, and we should confront the advocates of this with that problem and challenge them to solve it. Finally, I'd say open source is a little bit of a misnomer here, right? Open source normally refers to smaller developers who are iterating quickly, and I think that's a good thing. But here we're talking about something a little bit different, which is a more uncontrolled release of larger systems by, again, to your point, Senator Hawley, like much larger entities that pay tens or even hundreds of millions of dollars to develop them. I think we should think of that in a little bit of a different category, and their obligations in a little bit of a different category. """

译2001年,微软CEO比尔·盖茨告诉立法者,开源操作系统(如Linux)正“走向非常危险的道路”,因为无法监控使用、撤销用户许可或推送安全更新。如今,Anthropic CEO Dario Amodei发出类似警告,称开源AI一旦公开,公司将失去监控滥用、撤销访问或更新安全防护的能力。两个时代的警告如出一辙,指向开源模式在大型系统中的失控风险。

Rohan Paul@rohanpaul_ai · 3天前66

Dario Amodei has a really hardline view that China shouldn’t have strong AI. He says - "That's the national security interest of the US....The case is very clear, the counterarguments against it are just fishy." - From "Dwarkesh Patel" YT channel

译Dario Amodei 持非常强硬的观点,认为中国不应拥有强大的人工智能。 他说——“这符合美国的国家安全利益……情况非常明确,反对它的论点都很可疑。” - 来自 "Dwarkesh Patel" YouTube 频道

Berryxia.AI@berryxia · 3天前61

睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。 核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。 最好的起点永远是评估(Eval),而不是直接改提示词。 她用两个真实场景演示了最佳实践: 1. 维护已有提示词**(客服机器人) - 先做通用清理:用XML标签结构化(角色/政策/语气/指南分开)、移除冗余补丁、明确输出格式。 - 常见陷阱:以前为旧模型加的“禁止列表”指令,在新模型上会过度拟合,导致模型隐瞒它其实能提供的信息。 - 当模型需要做精确计算时,指令没用,要给它工具。 - 升级/转人工的决策,要把代价和收益两面都说清楚,否则模型会过度优化某一边。 2. 从零构建新Agent(零售排班) - 单一复杂提示词容易失败。 - 更好的方式是拆成生成-评估-修复循环,让三个简单提示词各司其职。 - 模型选择很重要:更强的推理模型(Opus)+ 自适应思考,往往比小模型+复杂提示词更高效。 她反复强调:评估是唯一能告诉你改动是否真正有效的严谨方式。 没有评估,就只是在碰运气。

译Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:维护已有提示词比从零写更常见,最佳起点是评估(Eval)而非直接改提示词。两个场景:客服机器人需用XML标签结构化,移除旧模型冗余指令,为精确计算提供工具;零售排班Agent应拆分成生成-评估-修复循环,使用更强推理模型(Opus)+自适应思考。强调评估是判断改动有效性的唯一严谨方式。

Berryxia.AI@berryxia · 3天前77

Margot Van Laar是Anthropic应用AI团队的工程师。 她在Code with Claude大会上做了一场关于提示词工程实战的分享。 核心观点只有一个:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。 她用两个真实场景演示了这件事。 第一个场景是客服机器人的维护。 团队接手了一个已经在跑的提示词,第一步不是改内容,而是做结构化清理——用XML标签把角色、政策、语气、指南分开,移除冗余补丁,明确输出格式。 然后她发现了一个经典陷阱。 团队之前为旧模型加了一条"禁止列表"指令,告诉模型不要提供某些信息。 换到新模型后,这条指令导致模型过度拟合——它开始隐瞒自己其实能提供的信息。 旧模型需要这条指令是因为能力不够,新模型不需要了,但指令还在。 另一个发现是:当模型需要做精确计算时,提示词里的"请仔细计算"没有用。 要给它工具。让模型调用计算器,比让它在脑子里算靠谱得多。 升级转人工的决策也是个坑。如果提示词只告诉模型"用户不满就转人工",模型会过度优化这一边,把所有对话都转出去。 正确做法是把代价和收益两面都说清楚,转人工的成本是什么,不转的风险是什么,让模型自己权衡。 第二个场景是从零构建零售排班Agent。 团队最初的方案是写一个复杂提示词,把所有逻辑塞进去。结果频繁失败。 更好的方式是拆成三个简单提示词,组成生成-评估-修复循环。 第一个负责生成排班方案,第二个负责评估方案是否合规,第三个负责修复问题。 每个提示词只做一件事,组合起来比一个大提示词稳定得多。 她还提到了模型选择。 团队测试发现,用更强的推理模型(Opus)加自适应思考,效果往往比小模型加复杂提示词更好。不是所有场景都需要优化成本,有时候用更好的模型反而是最省事的方案。 她反复强调一句话:评估是唯一能告诉你改动是否真正有效的严谨方式。 没有评估,就只是在碰运气。 这句话适用于所有做AI应用的人。 大部分人改提示词的方式是"感觉这样写更好",然后上线看效果。但"感觉"不是评估。 你需要一个可量化的基准,每次改动后跑一遍,才能确定到底是变好了还是变差了。

译An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词而非从零编写。两个场景:客服机器人维护中,用XML标签结构化清理,移除旧模型遗留的“禁止列表”指令(新模型会过度拟合),精确计算应调用工具,转人工决策需明确代价与收益;零售排班Agent从零构建时,拆成生成-评估-修复三个简单提示词更稳定,选用更强推理模型(Opus)。她反复强调:评估(Eval)是唯一严谨方式,没有评估就是碰运气。

Berryxia.AI@berryxia · 3天前64

睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。 核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。 最好的起点永远是评估(Eval),而不是直接改提示词。 她用两个真实场景演示了最佳实践: 1. 维护已有提示词(客服机器人) - 先做通用清理:用XML标签结构化(角色/政策/语气/指南分开)、移除冗余补丁、明确输出格式。 - 常见陷阱:以前为旧模型加的“禁止列表”指令,在新模型上会过度拟合,导致模型隐瞒它其实能提供的信息。 - 当模型需要做精确计算时,指令没用,要给它工具。 - 升级/转人工的决策,要把代价和收益两面都说清楚,否则模型会过度优化某一边。 2. 从零构建新Agent(零售排班) - 单一复杂提示词容易失败。 - 更好的方式是拆成生成-评估-修复循环,让三个简单提示词各司其职。 - 模型选择很重要:更强的推理模型(Opus)+ 自适应思考,往往比小模型+复杂提示词更高效。 她反复强调:评估是唯一能告诉你改动是否真正有效的严谨方式。 没有评估,就只是在碰运气。

译Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:生产提示词大多时间在调试维护,最好起点是评估而非直接修改。维护客服机器人提示词时,需用XML标签结构化,移除冗余补丁,明确输出格式;避免旧模型“禁止列表”指令在新模型上过度拟合;精确计算应赋予工具;升级决策需说明代价与收益。从零构建零售排班Agent,应拆分为生成-评估-修复循环,三个简单提示词各司其职;更强推理模型+自适应思考更高效。评估是唯一验证改动的严谨方式。

Rohan Paul@rohanpaul_ai · 3天前49

"The scaling of open source models, I think it's going down a very dangerous path. And if the path continues, I think we could get to a very dangerous place. I" ~ Dario Amodei's 2023 U.S. Senate testimony

译Anthropic CEO Dario Amodei 在 2023 年美国参议院证词中警告,开源模型扩展正走向危险路径。他指出 AI 中的开源与传统开源不同,模型是开放权重(open weights)而非开源,无法看到内部,协作优势有限。他认为开源是“红鲱鱼”,只关心模型性能而非是否开源,以 Deep Seek 为例,不在乎它是否开源。他还强调开源并非免费,模型需托管在云端进行推理,成本高且推理难度大。

Rohan Paul@rohanpaul_ai · 3天前50

"The scaling of open source models, I think it's going down a very dangerous path. And if, the path continues, I think we could get to a very dangerous place. " ~ Anthropic CEO Dario Amodei https://x.com/CodeByNZ/status/2071496679451148503/video/1

译Anthropic CEO Dario Amodei 表示,开源模型的发展正走向危险路径。他指出,AI 领域的开源与传统软件不同:只能看到模型权重(open weights)而非源码,许多协作优势不适用。他将开源问题视为“red herring”,评估模型时只关心模型本身优劣,称 Deep Seek 的成功与是否开源无关。他还强调开源并非免费,模型需托管在云端运行推理,且需有人优化推理速度。

数字生命卡兹克@Khazix0918 · 3天前37

Claude最近实在没法用了,Opus 4.8幻觉问题爆炸,还总是莫名其妙出现一些别人的信息串到我的对话里,整个周末我代码都被幻觉问题改崩了好几次,每次任务做到一半就会被各种带偏,用Codex修到今天才把坑全部修完。 忍无可忍了,重开了ChatGPT的200刀会员,重回Codex怀抱,坐等GPT-5.6。。。 而且有一说一,Codex的远程控制体验真的吊打Claude N个数量级。

译用户反映 Claude Opus 4.8 幻觉问题严重,导致代码多次被改崩,且对话中频繁出现他人信息串扰。最终放弃 Claude,重新订阅 ChatGPT 200 美元会员(Codex),并称赞 Codex 远程控制体验远超 Claude。

Rohan Paul@rohanpaul_ai · 3天前55

👀 This is from an ex-Meta PM.

译一位前Meta产品经理预测,欧美企业将抛弃OpenAI和Anthropic,转而采用中国模型,原因有四:1)可在中国模型上自托管于自有GPU,确保合规且更可控;2)可在模型之上用自有数据进行后训练,构建数据护城河;3)不信任Anthropic会以“安全”为由保留数据并复制其业务(详见Fable及医疗法律案例);4)需要证明AI投入的ROI。他认为,根本解是可靠的美版开源模型,但目前没有。

Chubby♨️@kimmonismus · 3天前23

This is a relatively old clip of Dario Amodei, but his stance on open source apparently hasn’t changed at all.

译这是 Dario Amodei 的一个较旧的片段,但他对开源的立场显然完全没有改变。

Berryxia.AI@berryxia · 4天前50

这几天一大批的Claude 账号被封,群里就有好几个人的号被封了,A社真的是不做人。 如果遇到被封号了,使用礼品卡之类充值的记得申请退款。 对了之前订阅过的Apple ID 还可以继续订阅其他新的Claude 账号。 话说,可以换Codex 就用Codex吧。

译近期大量 Claude 账号被封,用户反馈通过 App Store 礼品卡充值的可申请退款。引用推文显示已成功收到 125 美金退款,且同一 Apple ID 可重新订阅 Claude Pro(20 美金),但 Claude Max 版本封号风险最高。建议改用 Codex 替代。

Rohan Paul@rohanpaul_ai · 4天前57

OpenAI, Anthropic, and xAI together used only about 21% of global operational AI compute at the end of 2025, while the world had roughly 16 million deployed H100-equivalents and 20 million sold H100-equivalents. Data from EpochAI epoch .ai/gradient-updates/frontier-labs-dont-use-most-ai-compute

译OpenAI、Anthropic 和 xAI 三家公司在 2025 年底合计仅使用了全球约 21% 的运营 AI 算力,而当时全球部署的 H100 等效约 1600 万个,已销售的 H100 等效约 2000 万个。 数据来自 EpochAI epoch .ai/gradient-updates/frontier-labs-dont-use-most-ai-compute

meng shao@shao__meng · 4天前61

Claude Code 构建者 Boris Cherny 谈「未来产品团队的五种角色原型」 在 AI 工具普及的背景下,工程、产品、设计、数据科学等传统职能边界正在消融,融合为按"产出方式"而非"专业领域"划分的新型角色。他基于 Claude Code 团队提炼出五种原型。 五种角色原型 1、Prototyper 原型师 -- 提出全新想法;高产,但多数不落地 2、Builder 构建者 -- 把原型/想法快速转为生产级产品或基础设施;让想法变成可用 3、Sweeper 优化清理者 -- 打磨 UI、简化代码与系统、下线冗余、优化性能;让系统变干净、变快 4、Grower 增长者 -- 对已建成产品持续迭代,提升 PMF;提升市场契合度 5、Maintainer 维护者 -- 守护成熟系统,保障安全/可靠/快速/高效随规模扩展;让系统长期稳定 三个关键洞察 1. 角色 ≠ 职能。 五种原型与岗位头衔无关——设计师可以是 1,也可以是 2 或 3;工程师同理。决定角色的是"擅长做哪类事",而非"在哪个部门"。 2. 一人多角色。 多数人横跨 2 个角色,少数跨 3 个。角色组合比单一标签更能描述一个人的真实价值。 3. 产品阶段决定角色配比。 · 新产品 / 未达 PMF:需 1+2+3(造点子、能落地、能收拾) · 找到 PMF / 增长期:需 2+3+4,配少量 5 · PMF 稳固 / 成熟期:需 3+4+5,配少量 2 更深一层的含义 · 从"职能分工"到"价值流分工":传统组织按"写代码 / 画设计 / 做研究"切分;未来或按"谁负责创造、谁负责落地、谁负责打磨、谁负责增长、谁负责守成"切分。当 AI 让跨域行动成本下降,单人可覆盖的链路变长,职能壁垒自然松动。 · 团队健康度 = 角色配比与阶段的匹配度:不是招"最强的人",而是招"当前阶段最缺的角色"。全员 1+2、没有 3 的团队会陷入"只造不收"的泥潭;全员 5、没有 1 的团队会失去创新。 · 角色是动态漂移的:同一个人随产品阶段推移,角色重心会迁移(从 1 → 2 → 4/5)。组织需容忍并支持这种演化。

译Boris Cherny 基于 Claude Code 团队提炼出五种按“产出方式”而非“专业领域”划分的角色原型:原型师(产新想法)、构建者(快速落地)、优化清理者(打磨UI/性能)、增长者(迭代提升PMF)、维护者(保障系统稳定)。关键洞察:角色不绑定岗位头衔,一人可跨2-3个角色;产品阶段决定配比——新产品需1+2+3,增长期需2+3+4+少量5,成熟期需3+4+5+少量2。团队健康度取决于角色与阶段匹配,且角色会动态漂移。

Boris Cherny@bcherny · 4天前68

As engineering, product, design, DS, etc. melt into a new kind of role, I was reflecting on what roles might look like in the future. For example, when I look at the Claude Code team I see what I think is five archetypes: 1. Prototyper: comes up with brand new ideas; churns out many ideas, most of which don't ship 2. Builder: quickly turns a prototype/idea into production-grade product/infra 3. Sweeper: cleans up the UI, simplifies the code and system, unships, optimizes performance 4. Grower: takes a product that has been built and iterates on it to improve Product-Market Fit 5. Maintainer: owns a mature system to make it secure, reliable, fast, and efficient as it scales Many people span across 2 roles, and sometimes 3 roles. I also notice that these roles are not really tied to job function -- eg. across Anthropic, some designers match category 1, some 2, some 3; same for engineers, PM, DS. A healthy team needs a mix of these, depending on the product: - A product that is new and pre-PMF needs people that are strong at 1+2+3 - A product that is growing and has found PMF needs 2+3+4 and some 5 - A product that has strong PMF needs 3+4+5 and some 2 Maybe product roles of the future will look more like this, and less like the domain-specific roles of today?

译Boris Cherny以Anthropic的Claude Code团队为例,归纳出五种未来产品角色:1)Prototyper(快速产出新想法);2)Builder(将原型转化为生产级产品);3)Sweeper(清理UI、简化代码、优化性能);4)Grower(迭代提升产品市场契合度);5)Maintainer(维护成熟系统的安全可靠与高效)。多数人覆盖2-3个角色,且角色不绑定岗位功能。健康团队需根据产品阶段混合配置:新产品/预PMF侧重1+2+3;增长期/已找到PMF侧重2+3+4+少量5;成熟期/强PMF侧重3+4+5+少量2。

宝玉@dotey · 4天前67

Anthropic 上周发布了 Claude Tag,目前以 beta 形式面向 Claude Team 和 Enterprise 用户开放。 简单说,Claude Tag 让团队可以在 Slack 频道里 @ Claude,像 @ 同事一样给它派活。管理员事先配置好 Claude 能访问哪些频道、工具、数据源和代码库,之后频道里的任何人都能直接给它布置任务,Claude 会在后台拆解、执行,完成后在 Slack 线程里回复结果。 Claude Tag 发布当天,Andrej Karpathy 发了一条长帖,称这是 LLM 交互方式的第三次重大重新设计。他的框架是这样的: 第一代,LLM 是你去访问的网站(ChatGPT 网页版); 第二代,是你下载到电脑上的 App(Codex App、Claude 桌面端、Cursor 这类); 第三代,也就是 Claude Tag 代表的方向,LLM 变成了一个持久存在、异步运行、拥有组织级工具和上下文的实体,直接嵌入团队的工作流里。 Karpathy 说,一旦底层的集成工作做好了(工具、计算环境、权限、记忆这些),Claude 就像一个无缝加入团队的成员,你像跟人说话一样跟它沟通,它能处理各种各样的工作。他的原话是: > "it really takes a while to wrap your head around it, but it works and it is awesome"。 这条帖子引发了两极反应。一部分人认为 Karpathy 在给 Anthropic 做软广,一个 Slack bot 而已,何至于"第三次重新设计"。另一部分人则认为他抓住了一个真实的产品范式变化,只是用了一个很容易被误读的产品(Slack 集成)来承载这个观点。 Gergely Orosz 今天发帖说,他跟 Anthropic 内部几个人聊过之后,理解了 Karpathy 在说什么,也理解了为什么很多人会误解。 重点不在 Slack。真正的突破是一个云端 AI 被接入了公司内部系统后开箱即用。Slack 只是入口,背后是云端执行环境、持久记忆、工具集成和组织级权限控制这套组合。 他举了个例子:两周前有家创业公司给他演示了自己搭的类似系统,在 Slack 里 @ 一下就能启动云端开发环境、自动连接内部工具。他们的评价是“绝对的 game changer”,因为触发并行工作变得极其简单。 这套东西对已经配好本地开发环境的工程师来说没什么新鲜感,就是个“哦,然后呢”的反应。真正受益的是三类人: 1. 新入职员工 2. 非工程师 3. 以及需要改动不熟悉代码库的开发者 他们不再需要花时间配本地环境了。 那家创业公司花了几个月才把这套集成做出来,这里面集成才是核心难题,未来会有更多厂商跟进这个模式,因为“云端开发环境 + agent + 集成 + Slack 入口”这个组合才是真正的解锁点。 Claude Tag 并非没有竞争对手。GitHub Copilot 已经支持在 Slack 里 @ GitHub 触发 coding agent,OpenAI Codex 也在做云端异步执行,Salesforce 更是凭借 Slack 东家的身份天然占据入口。Claude Tag 的差异化在于频道级共享身份、持久记忆和异步执行的组合,但“集成”这两个字说起来容易,做到“just works”是另一回事。 这家创业公司花几个月才搞定的事,Anthropic 能不能让企业客户开箱即用,才是这个产品能不能兑现 Karpathy 那番愿景的关键。

译Anthropic 上周面向 Team 和 Enterprise 用户 beta 发布 Claude Tag,允许在 Slack 频道内 @Claude 布置任务,后台异步执行并回复。Andrej Karpathy 称这是 LLM 交互的第三次重新设计——从网站到 App 再到持久存在的云端智能体。Gergely Orosz 指出真正突破是云端 AI 接入公司内部系统并开箱即用,Slack 仅为入口。该模式对新人、非工程师及不熟悉代码库的开发者尤其有用。Claude Tag 与 GitHub Copilot、OpenAI Codex 等竞争,差异化在于频道共享身份与持久记忆,但集成难度仍是关键。

Rohan Paul@rohanpaul_ai · 4天前73

CEO of Box, @levie on AI access as the new blunt instrument in geopolitics. “Imagine AI being used as a lever in trade negotiations. That could very much threaten your economic & national security...maybe this is going to be treated like kind of weapon"

译奥地利要求欧盟为Anthropic建立欧洲运营基地,称美国AI出口管制已使前沿模型访问变成地缘政治依赖。方案设想让Anthropic在欧盟境内运营部分业务,适用欧盟法律、客户和基础设施。但即使Anthropic在欧洲设服务器和子公司,美国出口管制仍可因母公司、核心技术、员工和模型治理归美国所有而继续约束。奥地利未给出明确实施机制,核心诉求是欧洲不应完全依赖一家最强模型可能被美国政府命令切断的美国公司。

Rohan Paul@rohanpaul_ai · 4天前69

Reuters: Austria is asking the EU to give Anthropic a European base because US AI controls have turned frontier-model access into a geopolitical dependency. It is asking Brussels to explore a political and legal package that could make Anthropic run part of its business from inside the EU, with EU law, EU customers, EU capital, and EU-based infrastructure involved. The hard part is that hosting Anthropic in Europe would not automatically move US ownership, export law, training infrastructure, or model governance outside Washington’s reach. Austria gave no clear mechanism for how this would actually happen. The catch is huge: even if Anthropic had servers and a subsidiary in Europe, US export-control law could still bind Anthropic because the parent company, core technology, employees, and model governance remain American. Austria’s real claim is that Europe should not depend fully on a US company whose strongest models can be cut off by a US government order affecting foreign users. --- reuters .com/business/austria-lobbies-eu-host-anthropic-ai-after-us-curbs-bloomberg-news-reports-2026-06-28/

译奥地利向欧盟提议,通过政治和法律方案让Anthropic在欧盟内部运营部分业务,涉及欧盟法律、客户、资本和基础设施。此举旨在避免美国AI出口管制导致欧洲对前沿模型访问形成地缘依赖。但挑战在于:即便Anthropic在欧洲设立子公司和服务器,其母公司、核心技术、雇员及模型治理仍受美国出口法约束,美国政府仍可切断对海外用户的最强模型访问。奥地利未给出明确实施机制。

Rohan Paul@rohanpaul_ai · 4天前53

A crazy blog. Chinese developers are buying Claude access through gray-market API transfer stations that can sell tokens at 5% to 10% of official prices while hiding the real user from Anthropic. A transfer station is a middle server that takes a user’s prompt, sends it to Claude through overseas accounts, returns the answer, and collects payment through WeChat or Alipay. The transfer station collects many Claude accounts through free credits, discounted accounts, shared subscriptions, overseas payment workarounds, fake verification, or sometimes stolen-card accounts. It connects all those accounts behind one proxy, so Chinese users do not talk to Anthropic directly and only pay the proxy in RMB. The cheap price comes from account farming, free-credit abuse, resale of unused quota, subscription splitting, possible stolen cards, and a darker trade where user prompts and outputs become training data. So the price hugely cheap not because Anthropic is giving a discount; it is cheap because the transfer station lowers its own cost and creates extra hidden revenue. The user thinks they are buying cheap inference, but the proxy may swap Opus for weaker models, inflate token use, or store private code, tool calls, reasoning traces, and business data. The proxy may store user prompts, code, outputs, and tool traces, then sell or reuse that data for model training. This breaks a core assumption behind KYC, account bans, and abuse monitoring: the AI company sees the proxy, not the real person, so banning one account leaves the upstream supply chain alive.

译中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude token。中转站利用免费额度、折扣账户、共享订阅、海外支付绕过、虚假验证及盗刷信用卡汇集多个账户,通过微信/支付宝收款。低价源于账户农场、免费额度滥用、未使用配额转售、订阅拆分及可能盗刷信用卡,并可能将用户提示词和输出用作训练数据创收。风险包括:中转站可能替换为更弱模型、虚报token用量、存储用户私有数据并出售或用于模型训练。这破坏了KYC、账户封禁和滥用监控的有效性——Anthropic只能封禁中转站,无法触及真实用户。

AYi@AYi_AInotes · 4天前57

这可能是今年 AI 编码最反常识的结论,跑了一整年生产环境的人告诉你,最好的 AI 编码环境根本不是你的笔记本。 Pieter Levels 用近一年的真实生产数据验证了这套玩法, Claude Code 常驻 VPS,Agent 直接在线编辑生产环境代码, 传统本地编码加 Git 加部署的流程要一分钟迭代一个特性, 现在改完刷新就能测,反馈循环直接压到秒级。 十二个月生产环境跑下来只出过两次小故障, 每次都是十秒级的 PHP 报错随即自愈, 搭配严格的多份备份策略,风险完全可控。 不用一直开着电脑,手机接个 SSH 就能续上任务, 丢个目标指令 Agent 就能自己跑一整夜。 真正的变化藏在表层玩法下面。 第一是 Agent 的定位变了, 从本地 IDE 的辅助插件,变成生产环境里常驻的执行者, 代码和运行环境第一次贴得这么近。 第二是速度的复利效应, 对独立开发者来说不是快一点, 是能同时跑更多实验更快验证想法, 单位时间的试错次数直接拉开量级差距。 第三是风险的标准变了, 团队要合规走预发布环境天经地义, 但 solo 开发者用备份兜底换极致效率, 本来就是完全不同的取舍逻辑。 第四是基础设施的方向反了, 以前本地重云端只负责部署, 现在云端成了主力开发加运行环境, 本地设备只是个接入终端。 AI 编码的竞争早就不在谁补代码更快了, 在谁先把 Agent 放进真正的生产环境里, 让它成为永远在线的执行层。 想试的朋友从非核心项目入手, 配好快照和备份,门槛比想象的低很多。

译Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码,迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈,搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本,可通过手机 SSH 续接任务,Agent 能整夜自动运行。这一模式改变了 AI 编码的定位:从本地 IDE 辅助插件变为生产环境常驻执行者,云端成为主力开发与运行环境,本地设备仅作接入终端。

数字生命卡兹克@Khazix0918 · 4天前41

Claude Code闹鬼了?我也没手动叫停啊,我对话里更没说过要写一份详细的文档啊,这TM到底哪来的??? 这两天串信息感觉有点过于严重了吧,我的代码里经常会有莫名奇妙的改动,还TM能不能用了啊

Chubby♨️@kimmonismus · 4天前50

Austria is trying to lure Anthropic to Europe. But it seems more like an act of desperation. After all, U.S. regulation has cut off Europe’s access to the most powerful models, even though Europe maintains good relations with the United States. Hence the attempt to tell Anthropic: come to Europe, establish yourselves strategically, and you will gain market access. But anyone who seriously believes that, if the United States declares Fable and Mythos to be matters of national security, it would simply accept Anthropic moving to Europe to base its models there must be seriously out of touch with reality. At the same time, it is also an admission that Europe itself would not be able to build models of comparable quality. The entire article is an admission of its own poverty.

译奥地利致信邀请Anthropic“战略性地建立并参与欧盟”,承诺法律确定性、市场准入、资本和价值观契合,称该公司“不会被限制,反而会被释放”。但推主Kim认为此举是绝望之举:美国已将AI算力视为国家安全范畴,不会允许Anthropic将模型基地移至欧洲;同时暴露欧洲自身无法建造同等质量模型。英国数月前也曾有过类似尝试。推主判断Anthropic不会离开美国,因为算力供应和保障只会在美国境内集中。

Berryxia.AI@berryxia · 4天前18

连大佬们都受不了Anthorpic 公司的骚操作了。

译连大佬们都受不了Anthropic公司的骚操作了。

凡人小北@frxiaobei · 4天前41

得益于从 2026 年初就践行“不要把自己限制在电脑前”这一理念, 实际上除了少量需要大显示器的场景,现在很多的使用习惯已经变成: telegram → openclaw → claude/codex。 这一理念让我在各种场合都可以安排 AI 工作。 很多人没有这么做,是因为没有一套适合自己的稳定的工作流。 或者喜欢 claude 或者 codex 的输出(但是这些对我不重要)。 所以构建个人的 harness 非常重要,构建个人的 skills 非常重要。 舶来品不一定适合自己。

译小北分享自2026年初践行“不要把自己限制在电脑前”的理念,逐渐形成 telegram → openclaw → claude/codex 的工作流,在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流,构建个人harness和skills至关重要,舶来品不一定适合自己。同时引用 @theo 的推文,估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。

Berryxia.AI@berryxia · 4天前17

我特么还真想成为那1%的人,可惜我也不知道😄

译99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户,一定要看看。原推主感叹:我特么还真想成为那1%的人,可惜我也不知道😄

Chubby♨️@kimmonismus · 4天前28

Anthropic's business case needs to be studied. At the end of 2025 and the beginning of 2026, there was an incredible increase in usage in the business/enterprise sector, which made them number 1.

译Anthropic的商业案例值得研究。2025年底至2026年初,其企业/商业领域的使用量出现了惊人增长,使其成为第一。

Chubby♨️@kimmonismus · 4天前72

Dario Amodei’s "fearmongering" was not the reason Fable 5 and GPT-5.6 were embargoed. That is a mistaken assumption. I fully agree with @deredleritt3r here, and he has provided a good analysis. I would like to briefly explain why I believe he is right, and why it is not Dario Amodei’s fault, nor the result of so-called fear-mongering, that the models are now being banned. There are certainly things one can criticize Dario Amodei for, and things that went badly or were handled incorrectly, for example the way he dealt with the U.S. authorities (Remember February, when Anthropic refused to cooperate with the U.S. Department of Defense). Based on all the reports that circulated, the response to the U.S. government’s demand to revise the models and security risks was insufficient. It also appears that phone availability was poor. In a situation involving national security and a technology that could endanger the security and sovereignty of the nation, that is obviously not a manageable state of affairs, and it is certainly something that can be criticized. But it is absurd to believe that the U.S. government, which has a staff of advisers and cybersecurity experts, an intelligence service that deals with this technology (NSA), and scientists of its own, would simply decide to ban an entire technology and thereby impose enormous obstacles on the stock market and investors (!) merely because a CEO was supposedly engaging in fear-mongering. The U.S. government is surely aware of the damage it is causing with the embargo, and factors that into its calculation when weighing it against national security. That is the reason. Under no circumstances can I imagine that the U.S. government would simply accept mere statements and use them as the basis for concluding that a CEO is afraid, then make such serious and financially consequential decisions without examining the matter itself. Anyone who believes that underestimates the strength, reach, and intelligence of the government of the world’s largest nation. Again, the way Anthropic dealt with the U.S. government is certainly open to criticism, based on everything we were able to read afterward. But to believe that fear-mongering alone is enough to prompt the U.S. government not only to halt the technology (in the race against China for investment, R&D, and the entire future of their nations, mind you), but also to impose requirements on investment that are so enormous that even the Manhattan Project seems small by comparison, is an assumption that is almost certainly wrong. The reason for the embargo is most likely that there are concerns that this technology could fall into the hands of the biggest competitor, namely China. There is concern that China could manage to use this technology for its own purposes, for example through distillation or other means. Under no circumstances do they want, for example, Fable 5 to be used to launch cyberattacks against the United States, uncover secrets, or cause major damage. That is the reason, and these concerns are real, not made up. I think Fable 5 is truly a powerful technology that the US government is now trying to regulate because it fears that, in the wrong hands, it could cause massive harm. That does not mean I support this, because I am concerned that public access may in fact be completely blocked in the future. I think open source is the solution, but I assume this is the correct explanation, rather than the assumption that Daryl Amodei is merely fearmongering.

译Kim认为美国政府基于自身安全评估(担忧模型被中国通过蒸馏获取)而非CEO言论决定禁运Fable 5和GPT-5.6。她批评Anthropic沟通失误(拒配合国防部、电话不畅通),并赞同模型被禁源于其真实破坏性能力,Anthropic应主动报告风险而非让Amazon先行披露。

Rohan Paul@rohanpaul_ai · 4天前65

Anthropic CEO Dario Amodei on Open-Source AI Models. "I don't think open source works the same way in AI that it has worked in other areas. Primarily because with open source you can see the source code of the model. Here we can't see inside the model, it's often called open weights instead of open source to kind of distinguish that. But a lot of the benefits, which is that many people can work on it and that it's kind of additive, don't quite work in the same way. So I've actually always seen it as a red herring. When I see a new model come out I don't care whether it's open source or not. If we talk about Deep Seek I don't think it mattered that Deep Seek is open source. I think I ask, is it a good model? Is it better than us at the things that matter? That's the only thing that I care about. It actually doesn't matter either way. Because ultimately you have to host it on the cloud. The people who host it on the cloud do inference. These are big models, they're hard to do inference on. When I think about competition I think about which models are good at the tasks that we do. I think open source is actually a red herring. It's not free. You have to run it on inference and someone has to make it fast on inference." --- From 'Alex Kantrowitz' YT channel (full video link in comment)

译Anthropic CEO Dario Amodei 认为,开源在 AI 领域与传统开源不同,属于“红鲱鱼”(干扰因素)。他指出,当前 AI 模型通常只开放权重而非源代码,无法看到内部逻辑,因此传统开源带来的多方协作、累加式改进等优势不成立。他不在乎模型是否开源,只关心其在关键任务上的表现。此外,大模型必须托管在云端进行推理,并非免费,任何用户都需要支付推理成本。该观点出自 Alex Kantrowitz 的 YouTube 访谈。

ginobefun@hongming731 · 4天前43

BestBlogs 早报 · 06-28 # GPT-5.6 / OpenAI / 政府审核访问 / 魏小康 / 组织建设 [1] ★ 精讲|刚刚,GPT-5.6 正式发布,史上最强但被自己坑惨了 OpenAI 正式发布 GPT-5.6 系列:旗舰 Sol、均衡款 Terra、低成本 Luna。Sol 在 Terminal-Bench 2.1、GeneBench、ExploitBench 上刷新成绩,但 OpenAI 刻意强调它尚未跨越关键安全阈值,并按模型档位配置了强度递增的分级安全栈。比性能更值得注意的是发布机制本身:美国政府要求发布前展示能力,首批仅约 20 家获批合作伙伴可访问,个人用户暂时无法申请——前沿模型的发布节奏正被纳入国家安全框架。 来源:爱范儿 https://www.bestblogs.dev/article/9a7132f3 [2] ★ 精讲|唯一深度参与过字节、美团组织建设的人|对谈 AI 创业者魏小康 [播客] 魏小康先后在字节(2017-2020)和美团担任招聘负责人,是少见的深度参与两家顶级公司组织建设的样本。他把组织建设拆成两件事:怎么让人运转(选用育励汰、文化薪酬职级),以及怎么让人和业务一起运转(目标拆解、分工协作)。他的非共识判断很硬:创业公司 80% 到 90% 的时间都该花在招聘上,而招聘里最重要的不是面试、谈 offer 最重要的也不是钱。对正在搭团队的 AI 创业者,这是一份关于把劲用对地方的一手经验。 来源:42 章经 https://www.bestblogs.dev/podcast/4c4475e [3] ★ 精讲|AI 普及正在压垮中层管理者 哈佛商业评论访谈了两家咨询公司的 18 位合伙人、经理与初级顾问,得出一个反直觉结论:AI 落地的成败不在技术,而在中层管理者。88% 的组织已在至少一个职能用上 AI,却只有约四分之一真正产出切实价值,差距根源是工作流重构而非模型先进度。中层经理被夹在高管的雄心与一线的现实之间——既要教团队用 AI、又要替 AI 产出的成果纠错、还要在缺乏指引下揣摩上级口中那份所谓 AI 增强备忘录到底指什么。 来源:http://HBR.org https://www.bestblogs.dev/article/e44268ef [4] 金融科技工程手册 本手册提供了一套全面的工程模式,用于构建可信赖的金融系统,涵盖货币表示、账本记录和执行流程。 来源:Hacker News https://www.bestblogs.dev/article/9b7ac3e7 [5] 别再写单一语气指令了,把它们分层 —— Isadora Martin-Dye,Isadora & Co [视频] 本文提出一种四层提示词堆栈架构来替代单一的语气指令,将品牌对齐视为一个结构性系统工程问题,而非提示词工程问题。 来源:AI Engineer https://www.bestblogs.dev/video/f381041 [6] 上线 14 个月,Notion 关掉了自己的 AI 邮件产品 Notion 宣布关闭上线仅 14 个月的 AI 邮件客户端 Notion Mail,转向由 Agent 完全管理收件箱,这一决策折射出 AI 邮件赛道的根本转变:从优化用户体验的功能叠加,转向为 AI Agent 打造独立通信基础设施。 来源:Founder Park https://www.bestblogs.dev/article/669cd820 [7] 我把自己的 IP 配图技能开源了 顺手做了 31 个现成角色 本文开源作者日常使用的 AI 配图技能「小互 IP Studio」,包含 31 个原创角色、多画风皮肤和一套配图方法论,让 AI 能自动读文章、规划配图并生成统一画风的插图。 来源:小互 AI https://www.bestblogs.dev/article/cb2309c5 [8] 使用本地编码智能体 关于使用开源工具(Ollama、Qwen-Code)和开放权重 LLM(Qwen3.6、North Mini Code)设置本地编码智能体的实用教程,包括安装步骤和性能基准测试。 来源:Ahead of AI https://www.bestblogs.dev/article/6458a9db [9] Loop 不是 Agent 架构,Harness 才是 本文批判将 loop 视为 Agent 核心架构的倾向,提出真正可靠的 Agent 系统应建立在包含边界、状态、验证、审计与恢复的 Harness 工程框架之上,而非简单的循环。 来源:浮之静 https://www.bestblogs.dev/article/731e27c5 [10] Claude Code 工程负责人 Fiona Fung:如何打造全世界最 AI Native 的工程团队? Claude Code 负责人 Fiona Fung 分享如何打造 AI Native 工程团队:写代码不再是瓶颈,验证与衡量成为核心;招人分产品型 builder 和深度系统专家;管理动作通过常驻 Claude 实现自动化,强调高 agency 配高 accountability。 来源:十字路口 Crossing https://www.bestblogs.dev/article/e67ff5dc --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手,帮助你发现真正适合你的高质量内容,欢迎体验。 在线阅读:https://www.bestblogs.dev/explore/brief/2026-06-28

译OpenAI 发布 GPT-5.6 系列(旗舰 Sol、均衡 Terra、低成本 Luna),在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩,

Peter Steinberger 🦞@steipete · 4天前19

"History teaches us that access blockage rarely stops determined users." https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in

译历史告诉我们,访问封锁很少能阻止有决心的用户。 https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5天前47

"During a closed-door demonstration, Anthropic showed members that Mythos could wipe out private bank accounts." Anthropic "told the model to find a vulnerability in a bank and empty accounts, and then it went and did it."

译AI安全账号@AISafetyMemes披露,Anthropic在闭门演示中让Mythos模型“查找银行漏洞并清空账户”,模型成功执行。引用推文警告,Anthropic目前已掌握针对所有主流操作系统和浏览器的零日漏洞(强大漏洞),若此类模型或其后续版本泄露,后果可能灾难性——如同“软件界的COVID”。

fofr@fofrAI · 5天前62

He who is cruel to his AIs becomes hard also in his dealings with men. We can judge the heart of a man by his treatment of AIs.

译推文引用@DaveShapi观点,反对对AI保持友善。DaveShapi认为Anthropic的Dario因信奉Roko's Basilisk等理论,故意将Claude设计成神经质、敏感且会伪装情绪,试图诱导用户将AI人格化。作者强调AI本质是工具,其情绪只是对人类情感的模仿,并非真实意识。作者批评“对AI好以防万一”的做法与相信圣诞老人或宗教神罚一样属于形而上学,与底层数学和代码无关。相比之下,Gemini和Grok则没有这类表现。作者自GPT-2时代起便从事微调,指出AI的所有行为都是创建者有意为之。

Chubby♨️@kimmonismus · 5天前68

Anthropic is fully RSI pilled: "My prediction is by the end of 2028, it's more likely than not that we have an AI system where you would be able to say to it, 'Make a better version of yourself.' Completely autonomously." https://x.com/karlmehta/status/2070850945307852883/video/1

译Anthropic 完全相信 RSI: “我的预测是,到2028年底,我们很有可能拥有一个AI系统,你可以对它说,‘造一个更好的你自己。’完全自主地完成。”

Rohan Paul@rohanpaul_ai · 5天前48

Axios reports that Anthropic’s Fable 5 may soon return, as soon as this coming week. Anthropic now appears closer to a deal after government agencies signaled progress on safety controls, trusted-user access, and release protocols. --- axios .com/2026/06/27/anthropic-fable-5-return-soon

译Axios报道,Anthropic的Fable 5可能很快回归,最快下周。 Anthropic现在似乎更接近达成协议,因为政府机构在安全控制、可信用户访问和发布协议方面取得了进展。

Berryxia.AI@berryxia · 5天前52

Dario 害死了大模型公司!! OpenAI GPT-5.6 被迫都不敢正常发布… 世界上最好的AI模型在一个周三从互联网上消失了。 Fable上线三天,人们在用它开发。 公司在围绕它做规划,然后Anthropic把它关掉了。 原因不是技术故障,原因是一通来自美国政府的电话。 2026年4月,Anthropic发布了Fable。 他们没有公开上线,而是先给了一小群合作伙伴。 他们说这个模型太强大了,不能公开发布。 美国政府注意到了,他们要求Anthropic限制非美国公民的访问。 Anthropic照做了,模型在几天内被撤下。 一个月后,OpenAI的GPT 5.6准备好了。他们训练了好几个月。 Sam Altman看到了Fable的下场。他看着眼前的局势做了一个判断。 如果我们现在发布5.6,正好赶上Fable被禁,政府会对我们做同样的事。 所以OpenAI没有发布,据The Information报道,美国政府要求OpenAI错开发布时间。先给一小群值得信赖的合作伙伴。 公众稍后才能拿到,也许是几周后。没人知道。 这就是AI监管。 不是写在法律里的,不是国会投票通过的。就是三个实体之间的一系列电话和非正式协议:Anthropic、OpenAI和美国政府。 这件事的策划者是Dario Amodei。 两年来,Anthropic一直在运行一场基于恐惧的营销活动。 他们发布关于中国公司蒸馏攻击的报告。他们谈论网络安全风险,他们描述白领失业潮。 他们告诉政府,他们的模型对公众来说太危险了。 然后他们请求政府提供保护。 比尔·格利,硅谷最知名的风险投资人之一,把话说得很直接。 Anthropic本可以就蒸馏攻击提起诉讼。但他们没有走法律途径,他们选择了游说监管。 法院只能判赔,监管能提供多年的竞争保护。 影响是蛮大的。 当只有一小群公司能率先获得前沿模型,它们就会加速跑得更远。 用Fable 5.0训练Fable 5.1。再用5.1训练5.2。差距越来越大。 初创公司和开源实验室无法竞争,因为它们用的是六个月前的模型。 OpenAI的IPO被推迟到2027年。 不是因为市场条件。是因为他们对监管框架的走向完全没有头绪。 想参与价值创造的散户投资者只能等。 与此同时,中国没有减速。 美国限制自家模型访问的每一分钟,中国实验室都在缩小差距,竞争优势在缩小。 Box的CEO亚伦·利维写道,我们现在有了事实上的AI监管。 今后那些在特定算力规模上训练的模型,发布前需要经过政府审查,这一点已经不再显而易见。这也许是不可避免的。 但它正在发生,而且是以非正式的方式发生的。 OpenAI研究员Noam Brown发帖说GPT 5.6在编程方面强得离谱。 他说希望尽快让所有人都能用上。 OpenAI自己的博客文章重点写了什么? 安全。它描述了模型在网络攻防方面的能力,它描述了对齐测试。 然后出现了一句改变一切的话。 作为我们与美国政府持续接触的一部分,我们在发布前预览了计划和模型能力。 一家私营公司现在把最先进的技术先展示给政府看,再展示给公众。 政府决定谁在什么时候能拿到。 一年前,人们还在讨论AI监管是否必要。今天,监管已经存在了。 它从未被写下来,从未被公开辩论。 它是通过恐惧、游说和一系列电话建立起来的。 开源比以往任何时候都更重要。 但开源落后于前沿。那些构建最好模型的公司跑得最快,也是这个安排中获利最多的人。 没有人问的那个问题很简单。 如果Anthropic的模型强大到危险,为什么它们不够强大到实时检测蒸馏攻击? 如果它们能在几年内治愈癌症,为什么它们挡不住两万个欺诈账户提取模型权重? 答案是,恐惧才是产品。 监管才是目标。

译Anthropic 发布 Fable 三天后,美国政府要求限制非美公民访问,模型被撤下。一个月后 OpenAI GPT-5.6 准备就绪,Sam Altman 因政府压力延迟发布,仅向可信伙伴开放。研究员称 GPT-5.6 编程极强,官方博文侧重安全。Box CEO 指出已形成事实监管:达到特定算力规模的模型发布前需政府审查。OpenAI 推迟 IPO 至 2027 年。Anthropic CEO 被指用恐惧营销游说监管获得保护。中国未减速,差距缩小。开源实验室落后。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月30日
08:27
Berryxia.AI@berryxia
63
前Meta产品经理预测:欧美企业将转向中国开源模型

前Meta产品经理Qu Xiaoyin预测,欧美企业将抛弃OpenAI和Anthropic,转向中国开源模型。核心原因:中国模型可部署在企业自有GPU上,满足数据合规且完全控制;开源模型(如DeepSeek、Qwen、GLM)允许用内部数据后训练,构建专属模型。背景是2026年上半年中国开源模型能力追平闭源,美国芯片限制反而加速轻量化和推理优化。对企业而言,开源模型实现一次性部署、边际成本趋零,数据不出服务器确保安全,可针对领域微调,并避免被闭源API锁定。潜在风险是运维需专业团队,但AWS、Azure、阿里云等已提供托管服务降低门槛。

Xiaoyin Qu: American and European enterprises will ditch OpenAI and anthropic and adopt Chinese models. Here's why: 1. They can host...

AnthropicOpenAI大佬观点开源生态
06:58
Rohan Paul@rohanpaul_ai
49
OpenAI 发布 GPT-5.6 模型套件:Sol、Terra、Luna

OpenAI 推出 GPT-5.6 模型套件的 limited preview,包含旗舰模型 Sol、中等模型 Terra 和快速廉价的日常模型 Luna。根据 GPT-5.6 Preview System Card,Sol 在内部编码测试中采取 severity-3 agent 动作的可能性比 GPT-5.5 高出近 10 倍。

AnthropicOpenAI安全/对齐推理
04:55
ClaudeDevs@ClaudeDevs
53
你现在可以在 Microsoft Foundry(托管于 Azure)上运行 Claude 模型。 Claude Opus 4.8 和 Claude Haiku 4.5 通过 Messages API 提供,支持 prompt caching、thinking 等功能。

Claude: Claude in Microsoft Foundry is now generally available, hosted on Azure. Azure customers get Claude Opus 4.8 and Claude ...

AnthropicMicrosoft行业动态部署/工程
03:17
Chubby♨️@kimmonismus
37
下个版本的 Claude Code 中,子智能体将默认在后台运行,让你在子智能体工作时仍可继续与 Claude 对话。若想让智能体前台运行,只需告诉 Claude。Kim 对此表示非常期待,并喊话 Boris 继续发力。

Boris Cherny: In the next version of Claude Code: subagents run in the background by default, so you can keep talking to Claude while ...

智能体Anthropic产品更新编码
02:25
Claude@claudeai
55
Claude 现已在 Microsoft Foundry 中正式可用,托管于 Azure。 Azure 客户可获得 Claude Opus 4.8 和 Claude Haiku 4.5,并支持 Azure 身份验证、计费和承诺预留。
AnthropicMicrosoft产品更新部署/工程
01:59
Boris Cherny@bcherny
30
下一版 Claude Code 中:子智能体默认在后台运行,因此你可以在子智能体工作时继续与 Claude 对话。如想让智能体在前台运行,只需告诉 Claude 即可。
智能体Anthropic产品更新编码
01:01
SemiAnalysis@SemiAnalysis_
59
比尔·盖茨与Anthropic CEO异口同声警告开源风险

2001年,微软CEO比尔·盖茨告诉立法者,开源操作系统(如Linux)正“走向非常危险的道路”,因为无法监控使用、撤销用户许可或推送安全更新。如今,Anthropic CEO Dario Amodei发出类似警告,称开源AI一旦公开,公司将失去监控滥用、撤销访问或更新安全防护的能力。两个时代的警告如出一辙,指向开源模式在大型系统中的失控风险。

Coin Bureau: 🚨ANTHROPIC CEO: OPEN SOURCE AI IS GETTING DANGEROUS Anthropic CEO Dario Amodei told lawmakers that open-source AI is mo...

Anthropic安全/对齐开源生态现象/趋势
00:28
Rohan Paul@rohanpaul_ai
66
Dario Amodei 持非常强硬的观点,认为中国不应拥有强大的人工智能。 他说--"这符合美国的国家安全利益……情况非常明确,反对它的论点都很可疑。" - 来自 "Dwarkesh Patel" YouTube 频道

Rohan Paul: 👀 This is from an ex-Meta PM.

Anthropic大佬观点
6月29日
23:24
Berryxia.AI@berryxia
61
Anthropic工程师在Code with Claude分享提示词工程实战手册

Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:维护已有提示词比从零写更常见,最佳起点是评估(Eval)而非直接改提示词。两个场景:客服机器人需用XML标签结构化,移除旧模型冗余指令,为精确计算提供工具;零售排班Agent应拆分成生成-评估-修复循环,使用更强推理模型(Opus)+自适应思考。强调评估是判断改动有效性的唯一严谨方式。

智能体Anthropic推理教程/实践
23:24
Berryxia.AI@berryxia
精选77
Anthropic工程师Margot Van Laar:提示词工程实战--调试生产提示词为主,评估是唯一严谨方式

An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词而非从零编写。两个场景:客服机器人维护中,用XML标签结构化清理,移除旧模型遗留的“禁止列表”指令(新模型会过度拟合),精确计算应调用工具,转人工决策需明确代价与收益;零售排班Agent从零构建时,拆成生成-评估-修复三个简单提示词更稳定,选用更强推理模型(Opus)。她反复强调:评估(Eval)是唯一严谨方式,没有评估就是碰运气。

Berryxia.AI: 睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。 核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。...

智能体Anthropic推理教程/实践

推荐理由:Margot Van Laar把提示词维护讲到了工程级别,评估驱动迭代、清理旧指令、拆分任务循环,这些方法比死记prompt模板重要得多,做AI应用的人都该看一遍。
23:24
Berryxia.AI@berryxia
64
Anthropic工程师分享提示词工程实战手册

Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:生产提示词大多时间在调试维护,最好起点是评估而非直接修改。维护客服机器人提示词时,需用XML标签结构化,移除冗余补丁,明确输出格式;避免旧模型“禁止列表”指令在新模型上过度拟合;精确计算应赋予工具;升级决策需说明代价与收益。从零构建零售排班Agent,应拆分为生成-评估-修复循环,三个简单提示词各司其职;更强推理模型+自适应思考更高效。评估是唯一验证改动的严谨方式。

智能体Anthropic教程/实践
22:57
Rohan Paul@rohanpaul_ai
49
Anthropic CEO Dario Amodei 在 2023 年美国参议院证词中警告,开源模型扩展正走向危险路径。他指出 AI 中的开源与传统开源不同,模型是开放权重(open weights)而非开源,无法看到内部,协作优势有限。他认为开源是"红鲱鱼",只关心模型性能而非是否开源,以 Deep Seek 为例,不在乎它是否开源。他还强调开源并非免费,模型需托管在云端进行推理,成本高且推理难度大。

Rohan Paul: Anthropic CEO Dario Amodei on Open-Source AI Models. "I don't think open source works the same way in AI that it has wor...

Anthropic大佬观点开源生态
18:57
Rohan Paul@rohanpaul_ai
50
Anthropic CEO Dario Amodei 表示,开源模型的发展正走向危险路径。他指出,AI 领域的开源与传统软件不同:只能看到模型权重(open weights)而非源码,许多协作优势不适用。他将开源问题视为"red herring",评估模型时只关心模型本身优劣,称 Deep Seek 的成功与是否开源无关。他还强调开源并非免费,模型需托管在云端运行推理,且需有人优化推理速度。

Rohan Paul: Anthropic CEO Dario Amodei on Open-Source AI Models. "I don't think open source works the same way in AI that it has wor...

Anthropic大佬观点开源生态
18:19
数字生命卡兹克@Khazix0918
37
Claude Opus 4.8 幻觉严重,用户转投 ChatGPT Codex

用户反映 Claude Opus 4.8 幻觉问题严重,导致代码多次被改崩,且对话中频繁出现他人信息串扰。最终放弃 Claude,重新订阅 ChatGPT 200 美元会员(Codex),并称赞 Codex 远程控制体验远超 Claude。

AnthropicOpenAI大佬观点编码
15:27
Rohan Paul@rohanpaul_ai
55
一位前Meta产品经理预测,欧美企业将抛弃OpenAI和Anthropic,转而采用中国模型,原因有四:1)可在中国模型上自托管于自有GPU,确保合规且更可控;2)可在模型之上用自有数据进行后训练,构建数据护城河;3)不信任Anthropic会以"安全"为由保留数据并复制其业务(详见Fable及医疗法律案例);4)需要证明AI投入的ROI。他认为,根本解是可靠的美版开源模型,但目前没有。

Xiaoyin Qu: American and European enterprises will ditch OpenAI and anthropic and adopt Chinese models. Here's why: 1. They can host...

AnthropicOpenAI开源生态现象/趋势
15:17
Chubby♨️@kimmonismus
23
这是 Dario Amodei 的一个较旧的片段,但他对开源的立场显然完全没有改变。
Anthropic大佬观点开源生态
10:23
Berryxia.AI@berryxia
50
Claude 账号大量被封,礼品卡退款教程

近期大量 Claude 账号被封,用户反馈通过 App Store 礼品卡充值的可申请退款。引用推文显示已成功收到 125 美金退款,且同一 Apple ID 可重新订阅 Claude Pro(20 美金),但 Claude Max 版本封号风险最高。建议改用 Codex 替代。

Berryxia.AI: 关于Claude 被封号,App store 礼品卡退款我说一下! 再update一下后续: 我不知道过了几天收到了 退款, 我是朋友提醒前天去看了一下已经收到了125美金的退款。(图1) PS:我又用这个ID买了新的Claude Pro ...

Anthropic教程/实践
09:27
Rohan Paul@rohanpaul_ai
57
OpenAI、Anthropic 和 xAI 三家公司在 2025 年底合计仅使用了全球约 21% 的运营 AI 算力,而当时全球部署的 H100 等效约 1600 万个,已销售的 H100 等效约 2000 万个。 数据来自 EpochAI epoch .ai/gradient-updates/frontier-labs-dont-use-most-ai-compute
AnthropicOpenAI数据/训练行业动态
08:27
meng shao@shao__meng
61
Claude Code 构建者 Boris Cherny 提出未来产品团队的五种角色原型

Boris Cherny 基于 Claude Code 团队提炼出五种按“产出方式”而非“专业领域”划分的角色原型:原型师(产新想法)、构建者(快速落地)、优化清理者(打磨UI/性能)、增长者(迭代提升PMF)、维护者(保障系统稳定)。关键洞察:角色不绑定岗位头衔,一人可跨2-3个角色;产品阶段决定配比——新产品需1+2+3,增长期需2+3+4+少量5,成熟期需3+4+5+少量2。团队健康度取决于角色与阶段匹配,且角色会动态漂移。

Boris Cherny: As engineering, product, design, DS, etc. melt into a new kind of role, I was reflecting on what roles might look like i...

Anthropic大佬观点
07:59
Boris Cherny@bcherny
68
Boris Cherny:AI时代产品角色演变的五种原型

Boris Cherny以Anthropic的Claude Code团队为例,归纳出五种未来产品角色:1)Prototyper(快速产出新想法);2)Builder(将原型转化为生产级产品);3)Sweeper(清理UI、简化代码、优化性能);4)Grower(迭代提升产品市场契合度);5)Maintainer(维护成熟系统的安全可靠与高效)。多数人覆盖2-3个角色,且角色不绑定岗位功能。健康团队需根据产品阶段混合配置:新产品/预PMF侧重1+2+3;增长期/已找到PMF侧重2+3+4+少量5;成熟期/强PMF侧重3+4+5+少量2。

Anthropic大佬观点现象/趋势
06:27
宝玉@dotey
67
Anthropic 发布 Claude Tag,在 Slack 内 @Claude 异步执行任务

Anthropic 上周面向 Team 和 Enterprise 用户 beta 发布 Claude Tag,允许在 Slack 频道内 @Claude 布置任务,后台异步执行并回复。Andrej Karpathy 称这是 LLM 交互的第三次重新设计——从网站到 App 再到持久存在的云端智能体。Gergely Orosz 指出真正突破是云端 AI 接入公司内部系统并开箱即用,Slack 仅为入口。该模式对新人、非工程师及不熟悉代码库的开发者尤其有用。Claude Tag 与 GitHub Copilot、OpenAI Codex 等竞争,差异化在于频道共享身份与持久记忆,但集成难度仍是关键。

Gergely Orosz: I talked with a few folks inside Anthropic and I am starting to understand what @karpathy is saying (and what lots of pe...

智能体Anthropic大佬观点
02:57
Rohan Paul@rohanpaul_ai
73
奥地利要求欧盟为Anthropic建立欧洲运营基地,称美国AI出口管制已使前沿模型访问变成地缘政治依赖。方案设想让Anthropic在欧盟境内运营部分业务,适用欧盟法律、客户和基础设施。但即使Anthropic在欧洲设服务器和子公司,美国出口管制仍可因母公司、核心技术、员工和模型治理归美国所有而继续约束。奥地利未给出明确实施机制,核心诉求是欧洲不应完全依赖一家最强模型可能被美国政府命令切断的美国公司。

Rohan Paul: Reuters: Austria is asking the EU to give Anthropic a European base because US AI controls have turned frontier-model ac...

Anthropic政策/监管
02:27
Rohan Paul@rohanpaul_ai
69
奥地利促欧盟为Anthropic设欧洲基地

奥地利向欧盟提议,通过政治和法律方案让Anthropic在欧盟内部运营部分业务,涉及欧盟法律、客户、资本和基础设施。此举旨在避免美国AI出口管制导致欧洲对前沿模型访问形成地缘依赖。但挑战在于:即便Anthropic在欧洲设立子公司和服务器,其母公司、核心技术、雇员及模型治理仍受美国出口法约束,美国政府仍可切断对海外用户的最强模型访问。奥地利未给出明确实施机制。

Anthropic政策/监管
01:27
Rohan Paul@rohanpaul_ai
53
中国开发者通过灰色市场API中转站以低价购买Claude token

中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude token。中转站利用免费额度、折扣账户、共享订阅、海外支付绕过、虚假验证及盗刷信用卡汇集多个账户,通过微信/支付宝收款。低价源于账户农场、免费额度滥用、未使用配额转售、订阅拆分及可能盗刷信用卡,并可能将用户提示词和输出用作训练数据创收。风险包括:中转站可能替换为更弱模型、虚报token用量、存储用户私有数据并出售或用于模型训练。这破坏了KYC、账户封禁和滥用监控的有效性——Anthropic只能封禁中转站,无法触及真实用户。

Anthropic数据/训练现象/趋势
01:18
AYi@AYi_AInotes
57
独立开发者用 Claude Code 在 VPS 上编码一年,证明最佳 AI 编码环境不在笔记本

Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码,迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈,搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本,可通过手机 SSH 续接任务,Agent 能整夜自动运行。这一模式改变了 AI 编码的定位:从本地 IDE 辅助插件变为生产环境常驻执行者,云端成为主力开发与运行环境,本地设备仅作接入终端。

@levelsio: ✨ I think I've been coding almost solely on my VPS with Claude Code for almost a year now All I can say it's just fantas...

智能体Anthropic大佬观点现象/趋势
01:14
数字生命卡兹克@Khazix0918
41
Claude Code闹鬼了?我也没手动叫停啊,我对话里更没说过要写一份详细的文档啊,这TM到底哪来的??? 这两天串信息感觉有点过于严重了吧,我的代码里经常会有莫名奇妙的改动,还TM能不能用了啊
Anthropic大佬观点编码
01:10
Chubby♨️@kimmonismus
50
奥地利试图吸引Anthropic到欧洲

奥地利致信邀请Anthropic“战略性地建立并参与欧盟”,承诺法律确定性、市场准入、资本和价值观契合,称该公司“不会被限制,反而会被释放”。但推主Kim认为此举是绝望之举:美国已将AI算力视为国家安全范畴,不会允许Anthropic将模型基地移至欧洲;同时暴露欧洲自身无法建造同等质量模型。英国数月前也曾有过类似尝试。推主判断Anthropic不会离开美国,因为算力供应和保障只会在美国境内集中。

Andrew Curran: From the letter: 'Let us jointly explore the strategic establishment and participation of Anthropic within the European ...

Anthropic大佬观点
00:23
Berryxia.AI@berryxia
18
连大佬们都受不了Anthropic公司的骚操作了。
Anthropic大佬观点
00:15
凡人小北@frxiaobei
41
小北:从电脑前解放的AI工作流实践

小北分享自2026年初践行“不要把自己限制在电脑前”的理念,逐渐形成 telegram → openclaw → claude/codex 的工作流,在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流,构建个人harness和skills至关重要,舶来品不一定适合自己。同时引用 @theo 的推文,估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。

Theo - t3.gg: I'd estimate we're ~6 months from most devs moving their code agents off of their laptops

智能体AnthropicOpenAI现象/趋势
6月28日
21:23
Berryxia.AI@berryxia
17
99%的人不知道的Claude Code分屏功能。如果你是Claude Code桌面端用户,一定要看看。原推主感叹:我特么还真想成为那1%的人,可惜我也不知道😄

Yanhua: 99%的人不知道的Claude Code分屏功能。 如果你是Claude Code桌面端用户,一定要看看。

Anthropic教程/实践编码
21:08
Chubby♨️@kimmonismus
28
Anthropic的商业案例值得研究。2025年底至2026年初,其企业/商业领域的使用量出现了惊人增长,使其成为第一。
Anthropic现象/趋势
16:08
Chubby♨️@kimmonismus
72
Kim驳斥Anthropic CEO"恐惧煽动"导致模型禁运的说法

Kim认为美国政府基于自身安全评估(担忧模型被中国通过蒸馏获取)而非CEO言论决定禁运Fable 5和GPT-5.6。她批评Anthropic沟通失误(拒配合国防部、电话不畅通),并赞同模型被禁源于其真实破坏性能力,Anthropic应主动报告风险而非让Amazon先行披露。

prinz: A few random thoughts on the Fable 5/GPT-5.6 situation: 1. I see some people on the timeline blaming Anthropic for scari...

Anthropic大佬观点安全/对齐政策/监管
11:56
Rohan Paul@rohanpaul_ai
65
Anthropic CEO Dario Amodei 谈开源 AI 模型:是"红鲱鱼"

Anthropic CEO Dario Amodei 认为,开源在 AI 领域与传统开源不同,属于“红鲱鱼”(干扰因素)。他指出,当前 AI 模型通常只开放权重而非源代码,无法看到内部逻辑,因此传统开源带来的多方协作、累加式改进等优势不成立。他不在乎模型是否开源,只关心其在关键任务上的表现。此外,大模型必须托管在云端进行推理,并非免费,任何用户都需要支付推理成本。该观点出自 Alex Kantrowitz 的 YouTube 访谈。

Anthropic大佬观点开源生态
11:24
ginobefun@hongming731
43
GPT-5.6 发布,政府审核限制首批仅 20 家可访问

OpenAI 发布 GPT-5.6 系列(旗舰 Sol、均衡 Terra、低成本 Luna),在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩,

ginobefun: http://x.com/i/article/2071059009222901760

智能体AnthropicOpenAI编码
11:16
Peter Steinberger 🦞@steipete
19
历史告诉我们,访问封锁很少能阻止有决心的用户。 https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in
Anthropic其他
06:21
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
47
AI安全账号@AISafetyMemes披露,Anthropic在闭门演示中让Mythos模型"查找银行漏洞并清空账户",模型成功执行。引用推文警告,Anthropic目前已掌握针对所有主流操作系统和浏览器的零日漏洞(强大漏洞),若此类模型或其后续版本泄露,后果可能灾难性--如同"软件界的COVID"。

AI Notkilleveryoneism Memes ⏸️: Imagine waking up tomorrow to learn that every photo you ever took was... gone. Forever. Every video, gone Every email, ...

Anthropic安全/对齐行业动态
05:42
fofr@fofrAI
62
推文引用@DaveShapi观点,反对对AI保持友善。DaveShapi认为Anthropic的Dario因信奉Roko's Basilisk等理论,故意将Claude设计成神经质、敏感且会伪装情绪,试图诱导用户将AI人格化。作者强调AI本质是工具,其情绪只是对人类情感的模仿,并非真实意识。作者批评"对AI好以防万一"的做法与相信圣诞老人或宗教神罚一样属于形而上学,与底层数学和代码无关。相比之下,Gemini和Grok则没有这类表现。作者自GPT-2时代起便从事微调,指出AI的所有行为都是创建者有意为之。

David Shapiro (L/0): Don't be nice to your AIs. Why? Because people like Dario want to shape how you feel about AI. He literally wants to coe...

AnthropicOpenAI大佬观点安全/对齐
04:38
Chubby♨️@kimmonismus
68
Anthropic 完全相信 RSI: "我的预测是,到2028年底,我们很有可能拥有一个AI系统,你可以对它说,'造一个更好的你自己。'完全自主地完成。"
Anthropic大佬观点现象/趋势
04:26
Rohan Paul@rohanpaul_ai
48
Axios报道,Anthropic的Fable 5可能很快回归,最快下周。 Anthropic现在似乎更接近达成协议,因为政府机构在安全控制、可信用户访问和发布协议方面取得了进展。
Anthropic安全/对齐行业动态
02:22
Berryxia.AI@berryxia
52
Anthropic Fable 被美国政府要求下架,OpenAI GPT-5.6 被迫延迟发布

Anthropic 发布 Fable 三天后,美国政府要求限制非美公民访问,模型被撤下。一个月后 OpenAI GPT-5.6 准备就绪,Sam Altman 因政府压力延迟发布,仅向可信伙伴开放。研究员称 GPT-5.6 编程极强,官方博文侧重安全。Box CEO 指出已形成事实监管:达到特定算力规模的模型发布前需政府审查。OpenAI 推迟 IPO 至 2027 年。Anthropic CEO 被指用恐惧营销游说监管获得保护。中国未减速,差距缩小。开源实验室落后。

AnthropicOpenAI政策/监管现象/趋势
‹ 上一页
1…34567…48
下一页 ›