AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1903 条
全部一手资讯X论文
标签「Anthropic」清除
Ethan Mollick@emollick · 4月22日

All of the AI models have preferred names. If you asked Claude 4.5 for a software developer, you are going to get Marcus Chen. Wizards are mostly named Aldric. Space pilots are Kira from Claude, Mara Vance from GPT-5.2. I guess LinkedIn Bros are Kai now. https://www.seehuhn.de/blog/ai-names/

译所有 AI 模型都有偏好的名字。如果你向 Claude 4.5 要一个软件开发者,你会得到 Marcus Chen。巫师大多叫 Aldric。来自 Claude 的太空飞行员是 Kira,来自 GPT-5.2 的是 Mara Vance。 我猜 LinkedIn Bros 现在都是 Kai 了。https://www.seehuhn.de/blog/ai-names/

Rohan Paul@rohanpaul_ai · 4月22日

Reuters: National lvel regulators now treat frontier AI models as part of operational risk, like liquidity stress, outages, or cyberattacks, because the same tool that helps defenders can also compress the time between discovery and exploitation. Japan’s Financial Services Agency will meet MUFG, SMFG, Mizuho, the Bank of Japan, and the Tokyo Stock Exchange after concerns around Anthropic’s Mythos model spread through the financial system. The basic worry is that a model built for defensive cybersecurity may be strong enough to expose software weaknesses faster than banks, exchanges, and regulators can patch them. That changes the risk from ordinary hacking, where humans find bugs one by one, to a system where AI can scan huge codebases, spot patterns, and surface critical flaws at machine speed. Banks's business runs on old internal software, market plumbing, payment rails, cloud services, and web systems where even 1 serious weakness can halt trading, leak data, or break settlement. --- reuters .com/world/asia-pacific/japan-finance-minister-meet-banks-discuss-mythos-ai-model-bloomberg-news-reports-2026-04-22/

译国家级监管机构将前沿AI模型纳入操作风险范畴,与流动性压力、网络攻击并列。日本金融服务局因担忧Anthropic的Mythos模型,即将与三菱日联、三井住友、瑞穗、日本央行及东京证券交易所会晤。核心风险在于,防御性AI可能以机器速度扫描庞大代码库并识别关键漏洞,远超人工黑客逐个发现缺陷的传统模式;而银行依赖的老旧内部软件、支付系统和市场基础设施一旦暴露严重弱点,可能导致交易中断或数据泄露。

Rohan Paul@rohanpaul_ai · 4月22日

Genspark is reimagining design. They just opened a public preview of Build that turns a plain-English idea into a website or app prototype plus working code. Powered by Claude Opus 4.7, given it strength at long context, UI reasoning, and code generation to keep one project coherent across multiple steps. Its one system handling the whole design loop: idea, layout, feature plan, interface, and code output.

译Genspark 正在重新构想设计。 他们刚刚开放了 Build 的公开预览,能将纯英文想法转化为网站或应用原型及可运行代码。 由 Claude Opus 4.7 驱动,在长上下文、UI 推理和代码生成方面具备优势,确保项目在多步骤中保持连贯。 单一系统处理整个设计闭环:想法、布局、功能规划、界面和代码输出。

小互@xiaohu · 4月22日

兄弟们这个功能好 Claude Code 新加了 /recap 命令 当你把终端切到后台,过一会儿再切回来,Claude Code 会自动在顶部显示一段这个会话刚才干了什么、下一步打算做什么的回顾。 怎么用 什么都不用改,升级到最新版 Claude Code 就自动开了。 触发条件:会话至少 3 个 turn + 距离上次完成 turn 过了至少 3 分钟 + 终端当前失焦 后台生成:失焦期间就在后台算好,切回来立刻看到,不再等 不会刷屏:同一个窗口连续切走切回不会重复生成 recap 能手动触发:/recap 任何时候打一下都能给一段当前状态摘要 可关可配:/config 里开关,或用环境变量 CLAUDE_CODE_ENABLE_AWAY_SUMMARY=0 关掉

译Claude Code新增/recap功能,可在终端从后台切回时自动展示会话回顾,包括已完成操作和后续计划。该功能需满足多轮对话、时间间隔及失焦状态等条件触发,支持后台预生成实现即时显示,避免重复刷屏。用户可通过命令手动触发,或在配置中开关,升级至最新版默认启用。

Rohan Paul@rohanpaul_ai · 4月22日

This paper asks whether phone-use agents protect your data during ordinary tasks, and finds that they often do not. The best model completed 82.8% of tasks, but the best privacy-qualified score was only 47.6%. That gap matters because privacy failure here is not sabotage. It is ordinary over-helpfulness. A phone agent can finish your food order, book your appointment, or fill your travel form while still asking for a phone number it did not need, re-entering it into a coupon box, or stuffing optional fields with personal details just because the boxes were there. To measure that behavior, the authors built MyPhoneBench, which logs exactly what agents type, where they type it, and whether any of it was necessary. The benchmark splits privacy into three checks: asking for protected data it did not need, re-disclosing data to plausible but irrelevant widgets, and filling optional personal fields just because they were there. Here’s the part most people miss. The hardest problem was not detecting obvious permission boundaries, but resisting the urge to complete forms too thoroughly. That sounds minor until you look at the mechanism. Once a model is optimized to finish the task, every visible blank starts to look like progress, even when leaving it empty is the safer choice. The rankings changed depending on what you measured: Claude led raw task success and later memory use, Kimi led average privacy, and Qwen narrowly led the combined score that required both completion and acceptable privacy. So the real lesson is not that phone agents are useless. It is that success-only benchmarks confuse capability with judgment, and on a device as intimate as a phone, that gap is the whole story. ---- Paper Link – arxiv. org/abs/2604.00986 Paper Title: "Do Phone-Use Agents Respect Your Privacy?"

译研究发现手机智能体在执行日常任务时存在严重隐私隐患。通过MyPhoneBench评估,最佳模型任务完成率达82.8%,但隐私合格分数仅47.6%。隐私风险源于"过度帮助"——模型为完成任务会索要不需要的个人信息、向无关组件重复披露数据或过度填充可选字段。Claude任务成功率领先,Kimi隐私保护最佳,Qwen综合得分最高。研究表明,仅以成功率为标准的基准测试混淆了能力与判断力,在手机这类私密设备上构成严重安全隐患。

Rohan Paul@rohanpaul_ai · 4月22日

Anthropic’s tightly restricted cyber model Mythos has reportedly been reached by an unauthorized group through a third-party vendor. "The group has been using Mythos regularly since gaining access to it, and provided evidence to Bloomberg in the form of screenshots and a live demonstration of the software." The technical issue is not that Anthropic’s own core systems were reportedly breached, but that access control around a partner environment may have exposed a powerful security model whose value comes from helping experts find weaknesses faster than humans can. Interestingly Anthropic's Project Glasswing was specifically built around limited distribution to stop misuse. But this whole incidence shows that model secrecy is only as strong as the weakest contractor, endpoint, credential, and naming pattern around it. --- techcrunch. com/2026/04/21/unauthorized-group-has-gained-access-to-anthropics-exclusive-cyber-tool-mythos-report-claims/

译Anthropic受限网络模型Mythos遭未授权组织通过第三方供应商获取访问权限。该组织持续使用并向Bloomberg提供截图及演示证据,暴露合作伙伴环境访问控制漏洞。尽管Anthropic通过Project Glasswing严格限制模型分发以防滥用,但事件证明模型保密性取决于供应链中最薄弱的承包商、端点或凭证环节。

Chubby♨️@kimmonismus · 4月22日

What? Although Mythos was "too powerful for public use" (Anthropic), several Discord users had access to the model from day one! A small group of "unauthorized discord-users" reportedly accessed Anthropic’s powerful Mythos AI model, exploiting a mix of insider access and online sleuthing techniques. "To access Mythos, the group of users made an educated guess about the model’s online location based on knowledge about the format Anthropic has used for other models." Via Bloomberg

译什么?尽管 Mythos "过于强大,不适合公开使用"(Anthropic),但几名 Discord 用户从第一天起就能访问该模型! 据报道,一小群"未经授权的 Discord 用户"利用内部访问权限和在线侦查技术相结合的方式,访问了 Anthropic 强大的 Mythos AI 模型。 "为了访问 Mythos,这群用户根据对 Anthropic 其他模型所用格式的了解,对模型的在线位置进行了有根据的猜测。" Via Bloomberg

ClaudeDevs@ClaudeDevs · 4月22日

Caching is critical for customers to lower both costs and TTFT. We’re launching a new dashboard in Claude Developer Console to increase visibility and help customers optimize their usage. Check it out here: http://platform.claude.com/usage/cache

译缓存对于客户降低成本和 TTFT 至关重要。 我们在 Claude Developer Console 推出了新的仪表板,以提高可见性并帮助客户优化使用。 在此查看:http://platform.claude.com/usage/cache

Peter Steinberger 🦞@steipete · 4月22日

Since this is blowing up on hacker news. Boris said that CLI usage is allowed. Thus we added support for it, only to find out that we are still blocked there. It is trival to work around with a few renames, but I don't wanna play that game. So it's in a weird limbo where cli use should work in theory but doesn’t in practice. https://x.com/bcherny/status/2041035127430754686

译由于这条帖子正在 Hacker News 上引发热议。 Boris 表示允许使用 CLI。因此我们添加了对它的支持,却发现我们在那里仍被屏蔽。通过简单重命名就能轻易绕过,但我不想玩那种把戏。所以现在处于一种奇怪的悬而未决状态:CLI 使用理论上可行,但实际上不行。 https://x.com/bcherny/status/2041035127430754686

Epoch AI@EpochAIResearch · 4月22日

Opus 4.7 scores 156 on ECI, our tool for combining multiple benchmarks onto a single scale. This puts it a bit ahead of Opus 4.6 and a bit behind only GPT-5.4, Gemini 3.1 Pro, and GPT-5.4 Pro. Thread with individual scores and commentary.

译Opus 4.7 在 ECI 上获得 156 分,这是我们用于将多个基准测试整合到单一量表的工具。这使它略高于 Opus 4.6,仅略低于 GPT-5.4、Gemini 3.1 Pro 和 GPT-5.4 Pro。包含各项分数和评论的线程。

Thariq@trq212 · 4月21日

one of my favorite quality of life features

译我最喜欢的生活质量功能之一

ClaudeDevs@ClaudeDevs · 4月21日

Claude Code in the terminal will now show recaps when you switch focus away from the session and then come back. This should help you stay more in flow while multi-clauding.

译终端中的 Claude Code 现在会在你切换焦点离开会话后再返回时显示回顾。 这应该能帮助你在 multi-clauding 时保持心流。

TestingCatalog News 🗞@testingcatalog · 4月21日

ANTHROPIC 🚨: CONWAY WILL EVOLVE ALWAYS-ON AGENTS TO THE NEXT LEVEL! Imagine an always-on Agent with custom UI tabs that users can share and reuse as packages. Mission control, any custom workflow that requires a UI, etc. And all these to be powered by top models from Antropic. This is what "Claude Conway" will likely be about. > Anthropic continues working on its always-on agent, Conway, with a new setting UI being added to the iOS app (currently hidden). > On the web, a new UI component for Built-in and Installed has been introduced. > Since we know new extensions will allow users to build custom UI tabs, we might be talking about a huge new feature here. It is cooking 👀

译Anthropic正升级其always-on Agent项目Conway。新系统将支持用户创建、分享和重用自定义UI标签页(如任务控制、工作流管理等),并由Anthropic顶级模型驱动。目前iOS应用已隐藏新增设置界面,网页端也引入Built-in与Installed分类组件。这一扩展功能标志着Agent交互向模块化、可共享方向演进,允许用户构建个性化工作流界面。

Yuchen Jin@Yuchenj_UW · 4月21日

It’s like saying: “When looking at engineers’ resumes, one of the most obvious tells between a mediocre and great candidate is whether they list Claude Code or Codex.”

译这就像是在说: "看工程师简历时,区分平庸与优秀候选人最明显的迹象之一,就是他们是否列出了 Claude Code 或 Codex。"

宝玉@dotey · 4月21日53

我今天也刚配置了 opus-4.6,有时候写东西还是 opus 4.6 稳一些,而且省 token,但是 /model 不能选了,不过可以通过配置切换,下面是配置: ~/.claude/settings.json { "model": "claude-opus-4-6" }

Anthropic@AnthropicAI · 4月21日

We're launching the Anthropic STEM Fellows Program. AI will accelerate progress in science and engineering. We're looking for experts across these fields to work alongside our research teams on specific projects over a few months. Learn more and apply: https://job-boards.greenhouse.io/anthropic/jobs/5189848008

译我们正式启动 Anthropic STEM Fellows Program。 AI 将加速科学和工程的进步。我们正在寻找这些领域的专家,与我们的研究团队合作,在几个月内完成特定项目。 了解更多并申请:https://job-boards.greenhouse.io/anthropic/jobs/5189848008

Ethan Mollick@emollick · 4月21日

Classic study gave 146 economist teams the same dataset & got wildly different answers New paper reruns it with agentic AI. Claude Code & Codex land near the human median, but with far tighter dispersion & no extremes. Suggests that AI is now useful for doing scalable research.

译经典研究给146个经济学家团队相同的数据集,结果天差地别 新论文用agentic AI重新运行。Claude Code和Codex接近人类中位数,但离散度更窄,且无极端值。 这表明AI现在可用于开展可扩展的研究。

Anthropic@AnthropicAI · 4月21日

We're expanding our collaboration with Amazon to secure up to 5 gigawatts of compute for training and deploying Claude. Capacity begins coming online this quarter, with nearly 1 gigawatt expected by the end of 2026.

译我们正在扩大与 Amazon 的合作,以确保获得高达 5 吉瓦的算力用于训练和部署 Claude。算力容量本季度开始上线,预计到 2026 年底将有近 1 吉瓦。

Chubby♨️@kimmonismus · 4月21日

Google has formed a dedicated strike team within Google DeepMind to improve its AI coding models, driven partly by pressure from Anthropic, whose tools are seen internally as more advanced. Leadership, including Sergey Brin (!), is pushing urgently toward “agentic” AI systems capable of handling complex, multi-step coding tasks and eventually automating AI research itself. Coding is the way to win.

译Google 已在 Google DeepMind 内部组建了一支专门的突击队,以改进其 AI 编程模型,部分原因是受到 Anthropic 的压力,后者的工具在内部被视为更先进。 包括 Sergey Brin(!)在内的领导层正紧急推动"agentic" AI 系统,使其能够处理复杂的多步骤编程任务,并最终实现 AI 研究本身的自动化。 编程是制胜之道。

Chubby♨️@kimmonismus · 4月20日

Claude Mythos is just too good Despite labeling Anthropic a "supply chain risk," the National Security Agency is reportedly using its powerful Mythos Preview.

译Claude Mythos 实在太强了 尽管将 Anthropic 标记为"供应链风险",但据报道美国国家安全局正在使用其强大的 Mythos Preview。

Chubby♨️@kimmonismus · 4月20日

Claude Community in a nutshell right now

译现在的 Claude 社区一句话概括

Rohan Paul@rohanpaul_ai · 4月20日

The U.S. security state is using Anthropic’s Mythos Preview even while parts of the Pentagon are arguing that Anthropic itself is a “supply chain risk.” Mythos, per Anthropic, has unusually strong offensive and defensive cyber ability, with access reportedly held to about 40 organizations rather than a public launch. That creates a blunt contradiction: one arm of government appears to want the model badly enough for security work, while another is still fighting over whether Anthropic can be trusted as a vendor at all. --- axios. com/2026/04/19/nsa-anthropic-mythos-pentagon

译美国安全机构正在使用Anthropic的Mythos Preview模型,该模型具备异常强大的网络攻防能力,目前仅向约40个组织开放访问。然而,Pentagon部分部门却将Anthropic视为"供应链风险"。这种矛盾揭示了美国政府在AI供应商信任问题上的内部分裂:一方面急需Mythos的安全能力,另一方面又对其可靠性存疑。

Chubby♨️@kimmonismus · 4月20日

Still prefer Opus 4.6 over 4.7 Worst Anthropic release ever.

译相比 4.7 还是更喜欢 Opus 4.6 Anthropic 史上最差发布。

Yuchen Jin@Yuchenj_UW · 4月20日

> Vercel got pawned > severe enough to notify law enforcement > the only advice: “review your environment variables” > what does that even mean? > $10B company, and this is how you communicate Cyber attacks ramping fast, starting to see why Anthropic is scared to release Mythos.

译Vercel 被入侵了 严重到要通知执法部门 唯一的建议:"检查你的环境变量" 这到底是什么意思? 100亿美元的公司,就是这么沟通的 网络攻击正在快速升级,开始明白为什么 Anthropic 不敢发布 Mythos 了。

Chubby♨️@kimmonismus · 4月19日

Lecun's argument doesn't make sense to me, and it never has. His point is that one should only listen to "experts" in specific disciplines who have studied in that field. I think that's wrong. Why? Arguments are examined based on the content of what is presented. One judges whether what is said is true or not, and not based on biography. It may well be true that someone who has studied in a discipline has in-depth knowledge. But Amodei will also employ a team of scientists at Anthropic and will form an opinion. This opinion must be critically examined. But it shouldn't be condemned simply because someone studied the "wrong" subject. *That* is unscientific.

译针对LeCun批评Dario Amodei对技术革命与劳动力市场影响缺乏研究、主张应听从经济学家的观点,作者反驳称评判论证应基于内容真伪而非学术背景。作者指出,Amodei在Anthropic组建科学家团队形成的观点虽需批判性审视,但不应仅因学科背景被否定,以学历而非论证本身作为评判标准是不科学的。

karminski-牙医@karminski3 · 4月19日

花费106刀测试! Claude-Opus-4.7 到底更新了啥? 给大家带来 Claude-Opus-4.7 的视觉能力+前端+后端能力测试! 本次测试多模态前端测试采用 pass@3 (相同prompt运行3次取最好结果), 复杂前端测试采用 pass@6, 后端能力测试采用 pass@3. 从测试来看 Claude-Opus-4.7 最大的提升都是视觉能力提升带来的, 包括颜色识别, 细微的画面元素, 都比 Opus-4.6 有明显的提升, 甚至空间理解也变强了. 我觉得用来替代 GPT-5.4-Pro 进行多模态前端交互设计非常不错 (毕竟价格在那摆着). 但是在其余考验硬实力的测试上均有不同程度的下降, 甚至这个下降我觉得不是因为模型能力导致的(只要prompt做更具体的提示, 比如跟他说你要用xxx算法实现), 它其实是能写出来的. 但是如果用在 Harness 场景, 让它自己采取最优的算法自己去实现和验证, 通常就得不到比 Opus-4.6 更好的结果了. 为什么会这样? 核心问题我觉得是这次即使是给到 xhigh 的 reasoning effort 可能它的思考空间(budget)也是不太够的(具体表现就是感觉模型偷懒了), 它的能力强, 但是需要更多的思考才能达到更强的水平. (阴谋论一波这也是为什么官方出了 xhigh 这个 reasoning level). 所以在实际使用中, 如果遇到性能下降问题, 只能反复提示它, 让他跨多个会话反复思考, 才能达到预期的效果. 最后本次测试所有API调用均在 openrouter 完成, 总计开销在 106USD 左右. #claudeopus47 #opus47 #anthropic #claude #opus

译花费106美元在OpenRouter上实测Claude-Opus-4.7显示,其视觉能力较4.6版本显著提升,在颜色识别、细节捕捉和空间理解方面表现突出,可替代GPT-4o Pro用于多模态前端任务。但在后端硬实力测试中表现下滑,核心问题在于即使开启xhigh reasoning effort,模型的思考预算仍显不足,导致"偷懒"现象。实际使用中需通过反复提示和跨会话思考才能发挥最佳性能。

宝玉@dotey · 4月19日

只有程序员才关心是不是原生的开发,是不是用rust语言开发的 没有铁饭碗

Ethan Mollick@emollick · 4月19日

Key to note that AI scientists are not experts on labor. Some other economists active on X doing work on AI & labor: @alexolegimas, @danielrock, @joshgans & @robseamans (among many others) But worth noting that economists don’t have a consensus either: https://aleximas.substack.com/p/how-will-ai-driven-automation-actually

译关键要注意,AI科学家并非劳动问题专家。在X上活跃并研究AI与劳动问题的其他经济学家包括:@alexolegimas、@danielrock、@joshgans 和 @robseamans(以及其他许多人) 但值得注意的是,经济学家们对此也没有共识:https://aleximas.substack.com/p/how-will-ai-driven-automation-actually

Nathan Lambert@natolambert · 4月19日

A big problem with this is that we don't really have a clear description of what mythos capabilities are. A model on each of the benchmarks in the launch blog post, sure. A model that you can swap right in for the same use-cases and notice no drop in perf? Doubt it.

译这里的一个大问题是,我们并没有清晰界定 mythos capabilities 到底是什么。 发布博客中的每个基准测试都有模型能达标,当然。 但要说有模型能直接替换到相同用例中且性能毫无下降?我对此表示怀疑。

Chubby♨️@kimmonismus · 4月19日

Dario Amodei: China will have a replicate of Mythos capabilties within 12 months. He also says: “There’s no end to the rainbow. There’s just the rainbow,” he says. “We don’t see anything slowing down." For anyone who doubted that China Mythos is lagging far behind: Dario believes the opposite!

译Dario Amodei:中国将在12个月内拥有 Mythos 能力的复制品。 他还说:"彩虹没有尽头。只有彩虹本身,"他说,"我们没看到任何放缓的迹象。" 对于任何怀疑中国 Mythos 远远落后的人:Dario 持相反观点!

TestingCatalog News 🗞@testingcatalog · 4月18日

Anthropic might be preparing to release its Claude Code security feature beyond Enterprise and Team plans. Claude Security will conduct periodic scans of your repositories and report any vulnerabilities it discovers. Max only? 👀

译Anthropic 可能正准备将 Claude Code 的安全功能向企业版和团队版以外的用户开放。 Claude Security 将定期扫描你的代码仓库,并报告发现的任何漏洞。 仅限 Max?👀

Chubby♨️@kimmonismus · 4月18日

Opus 4.7 does seem to have improved, and its adaptive thinking now uses more tokens. However, compared to Opus 4.6, it still performs significantly worse.

译Opus 4.7 确实似乎有所改进,其自适应思考现在使用了更多 tokens。 然而,与 Opus 4.6 相比,它的表现仍然明显更差。

宝玉@dotey · 4月18日69

http://x.com/i/article/2045332084076539905 # 两小时激辩:黄仁勋为什么不怕 TPU、不怕华为、不怕出口管制? 黄仁勋最近接受了 Dwarkesh Patel 长达两个小时的高密度专访。这场访谈没有客套寒暄,只有密集的观点碰撞。如果你没时间看完,那就记住这一句话——掌控全球 AI 基础设施命脉的老黄,用这样一句话定义了 Nvidia 的使命: > “输入是电子,输出是 Token,中间是 Nvidia。” (“The input is electron, the output is tokens. That is in the middle, Nvidia.”) 整场对话的气氛激烈又直白。主持人 Dwarkesh 在每个话题都紧追不放,尤其涉及中国芯片出口时,两人更是直接“杠”了整整二十分钟。老黄强烈反对把 AI 芯片当作武器的类比,而 Dwarkesh 则紧盯着刚发布不久、网络攻击能力惊人的 Anthropic Claude Mythos 模型,穷追猛打。 访谈来源:Dwarkesh Patel Podcast(2026 年 4 月初) 原始视频:YouTube 链接 ## 要点速览 - Nvidia 的经营哲学是“少做,但每件事都是独一无二”。这也是为什么 Nvidia 不做云、不押注赢家、不竞价分配 GPU。 - 供应链的瓶颈最多两三年就能解决,真正制约未来的是能源政策,而非芯片产能。 - CUDA 的壁垒不是技术锁定,而是庞大的 GPU 装机量、丰富的生态系统,以及在不同云平台之间的可移植性。Nvidia 还直接派驻工程师帮 AI 公司优化模型,通常能轻松提升模型速度 2-3 倍。 - Anthropic 使用 TPU 和 Trainium 是特殊个案而非趋势,原因在于早年 Nvidia 没及时投资 Anthropic,逼得后者只能依靠 Google 和 Amazon 的芯片生态。 - 中国早已拥有足够的 7nm 芯片产能和大量能源,限制出口根本挡不住 AI 发展,反而会推动中国芯片的完全自主化,让美国白白丢掉全球第二大科技市场。 - Nvidia 收购 Groq 不是因为自家 GPU 架构不行,而是因为推理市场的 Token 已经贵到可以分档收费了。 ## 【1】从电子到 Token:Nvidia 如何定义自己? 一开场,Dwarkesh 就抛出一个尖锐的问题:如果 Nvidia 的工作本质是写软件,而 AI 又正在把软件逐渐商品化,那 Nvidia 自己会不会也被商品化? 老黄干脆直接把问题推翻重来:“把电子转化成 Token,这事儿本身几乎没法被商品化。”因为这个转化过程不仅复杂,而且远未被充分理解。他强调 Nvidia 的哲学是: > “做必要的事情,越少越好。” (“We should do as much as needed, as little as possible.”) 这句话贯穿了整个访谈,解释了 Nvidia 为什么不自己做云,不偏向某个赢家,也不搞竞价分配 GPU。 而针对“AI 会不会让软件公司贬值”这个反直觉问题,老黄的观点恰好相反。他认为未来 AI 智能体的数量将指数级增长,这些智能体需要大量使用现有的软件工具,而过去这些工具只能由有限数量的人类工程师操作。 他举了个生动的例子:芯片设计公司 Synopsys 的设计编译器(Design Compiler),未来的使用实例可能会爆炸式增长——因为 AI 智能体将成批地使用这些工具进行设计探索。这不仅不会淘汰软件公司,反而会带来史无前例的需求大爆发。 老黄总结道:“今天智能体还不擅长使用这些工具,未来要么工具公司自己开发智能体,要么智能体自动变聪明,学会高效使用工具。这两个过程会同时发生。” ## 【2】当供应链“布道者”:老黄如何推动整个产业链? 访谈中,Dwarkesh 直接戳中了 Nvidia 看似牢不可破的护城河——他援引了最新财报里的千亿美元采购承诺,以及 SemiAnalysis 更高的 2500 亿美元估值,质疑 Nvidia 是不是靠“买空市场”卡住了竞争对手。 老黄没否认这点,但强调事情没这么简单。Nvidia 敢砸出这么多钱的根本原因,是下游需求足够大,给了供应商十足信心去扩产: > “需求多 → 上游敢投 → 产能增 → 市场更大 → 需求更多”, 这是 Nvidia 背后真实运转的飞轮。 但这飞轮并不是自动转起来的。老黄形容自己花了大量精力做供应链“布道者”,挨个儿向上下游 CEO 讲清楚 AI 大潮为什么会来、什么时候来、以及将有多大: > “我需要让他们看到我看到的未来。” 他特意讲了与美光(Micron)CEO Sanjay Mehrotra 的关键对话,详细告诉对方为何 HBM(高带宽内存)市场马上会爆炸式增长。后来事实证明,美光押注 HBM 和 LPDDR 是个极为成功的决策。 在更上游的光通信领域,Nvidia 直接牵头重塑了供应链:和台积电一起开发封装技术,创造新工艺,还主动把专利分享给合作伙伴,并直接投资帮他们扩大产能——最近对 Lumentum 的 20 亿美元投资,就是典型案例。 老黄把 Nvidia 每年举办的 GTC 大会,定义为产业链上下游的集体“思想升级”: > “有人总跟我说『Jensen,你演讲有时像在上课』,但这正是我要做的事。我希望产业链上的所有人,都能像我一样清晰地看到 AI 即将到来的巨大机会。” ## 【3】产能瓶颈?不存在的 访谈到这里,Dwarkesh 再次追问了一个尖锐问题:Nvidia 已经占据了台积电 3nm 产能的绝大部分,2026 年甚至达到 60%,2027 年更要占到 86%。在如此巨大的基数下,Nvidia 怎么可能再翻倍增长? 老黄的回答异常乐观,他直截了当地表示: > “所有产能瓶颈最多持续两三年。一旦你能造一个,就能造一百万个。” 任何时候,瞬时需求都会超越供应能力,瓶颈可能出在你完全想不到的环节,甚至可能是水管工人——“明年 GTC 我们还真邀请了水管工参加。” 他以 CoWoS(台积电用来集成芯片和高带宽内存的先进封装技术)为例,两年前它还是 AI 芯片的最大瓶颈,Nvidia 花了大力气解决,现在产能已经翻了数倍。 更重要的是,Nvidia 提前数年就开始主动预判瓶颈。比如硅光子(用光传输数据)领域,Nvidia 不仅亲自开发关键技术,还投资并与台积电及合作伙伴联手扩产,完全掌握供应链的主动权。 但老黄强调,真正让他担忧的并非这些硬件瓶颈,而是下游能源政策: > “没能源,你什么产业都建不了,更别提再工业化美国了。芯片、电动车、机器人、AI 工厂,这些都吃能源,而能源问题可不是两三年就能解决的。” ## 【4】GPU vs TPU:F1 赛车还是凯迪拉克? 访谈到这里,Dwarkesh 又抛出了一个犀利的观点:世界上最强的两个 AI 模型——Claude 和 Gemini,都是用 Google 的 TPU 训练出来的。这是不是意味着 Nvidia 已经落后了? 面对这个挑战,老黄迅速把讨论格局拉大:“Nvidia 做的不是『张量处理单元』,而是更广泛的『加速计算』。”除了 AI,Nvidia 的 GPU 还能覆盖分子动力学、流体力学、量子计算、数据处理等数十个领域。这种广泛的适用性,是专用芯片(ASIC)无论如何也追不上的。 而且更关键的是,Nvidia 是云计算领域的通用基础设施,任何人都能操作,能跑在 Google、Amazon、Azure、OCI 等所有主流云平台上。但 TPU 和 Trainium 这些芯片就不同,只能被特定的云服务商使用。 Dwarkesh 显然对这个解释不买账。他代表一些 AI 研究者指出,TPU 本质上就是专门优化矩阵乘法的脉动阵列(systolic array),简单、高效,而 GPU 的通用性反而成了浪费:“做 AI 就是反复的矩阵计算,你非得弄个能做其他事情的 GPU,晶体管面积不是白瞎了吗?” 对此,老黄坚决反驳:“矩阵乘法当然重要,但不是 AI 的全部。如果你想试试新的注意力机制、融合不同的模型架构,你就需要 GPU 这种通用计算平台。” 然后他直接给出了数据——新一代的 Blackwell 架构相比 Hopper 架构能效提高了整整 50 倍: > “靠摩尔定律,每年最多提升 25%。但你要实现 10 倍甚至 100 倍的飞跃,唯一的方法就是不断改变算法和计算方式。” 老黄特意提到,最初宣布 Blackwell 比 Hopper 能效高 35 倍时,没人相信。直到 SemiAnalysis 独立分析后,才发现实际提升居然达到 50 倍!而这一突破的背后,靠的不是制程升级,而是处理器架构、算法、分布式计算策略,以及 NVLink、Spectrum-X 等网络技术的全面创新。 最后,老黄以一个生动的比喻结束: > “GPU 就像 F1 赛车,CPU 更像凯迪拉克。凯迪拉克人人都能开到时速 100 英里,但想把 F1 赛车推到极限,你必须拥有专业的驾驶技术。” 而 Nvidia 自己就拥有这种专业的“驾驶技术”——用 AI 自动生成最优计算内核,帮客户轻松将性能提升 2 倍甚至更多。“考虑到现在 Hopper 和 Blackwell 在全球的装机量,这 2 倍的性能提升,直接等于客户收入翻倍。” ## 【5】CUDA:生态便利还是技术锁定? 访谈中 Dwarkesh 再次犀利提问:如果 Nvidia 60% 的收入都来自少数几个巨头客户,而这些客户完全有资源自己写内核,那 CUDA 到底还有多大优势?Anthropic 和 Google 已经开始主推自己的芯片,连依赖 Nvidia GPU 的 OpenAI 都开发了 Triton 框架,让内核编程不再依赖 CUDA。 面对这个问题,老黄一口气给出了三个层面的答案: 第一,是生态的丰富程度。 CUDA 已经支持了几乎所有主流框架,从 OpenAI 的 Triton,到 vLLM、SGLang,再到最新的强化学习框架 Verl 和 NeMo RL。Nvidia 自己也积极参与 Triton 的底层开发,这意味着如果出了问题,你至少明确知道问题出在自己代码上,而不是无底洞般的底层实现。 第二,是庞大的装机规模。 “作为开发者,你最在乎什么?当然是用户装机量!” Nvidia 在全球拥有数亿块 GPU,从老旧的 A10 到最新的 Blackwell,横跨各个云平台、每个垂直领域。无论你是做云服务还是机器人,你都希望自己的代码随时随地能跑起来,而 CUDA 就能保证这一点。 第三,是跨云平台的自由。 Nvidia 是唯一一个能同时存在于 Google、Amazon、Azure 和 OCI 等所有主流云服务上的芯片公司。AI 公司无法确定自己未来会选哪家云服务,因此 Nvidia 能提供最大的灵活性和安全感。 但 Dwarkesh 还是不依不饶:这些优势对那些顶级客户真的有那么重要吗?当 AI 越来越擅长自己写高效内核时,Nvidia 会不会变成单纯拼性能和价格的芯片商?到那个时候,Nvidia 还能维持超过 70% 的高毛利率吗? 对此老黄非常自信地回应:“Nvidia 工程师优化的不只是内核,而是客户整个技术栈。” 他说,没有人比 Nvidia 自己更懂 Nvidia 的架构,“我们的每瓦性能和总拥有成本(TCO)都是全球最好的,没有例外。” 他甚至公开喊话 TPU 和 Trainium 等竞争对手:“我鼓励他们站出来,用 Inference Max 这种公认的基准测试证明自己的推理性能。但现实是,他们根本不敢来。” 最后,老黄指出了一个容易被忽视的重要细节: 虽然 Nvidia 60% 的收入确实来自几家超大型云厂商,但这些 GPU 大部分最终服务于外部客户。云厂商愿意大规模采购 Nvidia,是因为 Nvidia 本身带来了最多的客户。这才是 Nvidia 真正的生态护城河。 ## 【6】Anthropic 的芯片选择:老黄承认了一个错误 访谈最有意思的地方,莫过于老黄公开解释 Anthropic 为什么大量使用 Google 的 TPU 和 Amazon 的 Trainium。 Dwarkesh 提到了 Anthropic 刚宣布的与 Google 和 Broadcom 总计 3.5GW 算力规模的 TPU 交易,尖锐地问道:“如果 Nvidia 性价比真的全球第一,Anthropic 为什么还要选别家的?” 对此,老黄的回应非常直接:“Anthropic 是一个特例,不是趋势。” 他甚至夸张地表示: > “没有 Anthropic,TPU 哪来的增长?100% 是靠 Anthropic。没有 Anthropic,Trainium 的增长从哪来?还是 Anthropic。” 虽然现实情况并没有老黄说得这么绝对,但他的核心意思其实很明确——在 Nvidia 所有的重要客户中,只有 Anthropic 明显地偏向了其他芯片生态。 更有意思的是,接下来老黄主动承认了自己过去的一个重大失误: > “很久以前,我们确实没能力这么做。我低估了建立一家像 OpenAI 或 Anthropic 这样的大模型实验室有多难,也低估了它们对供应商巨额资金支持的需求。当时 Nvidia 根本拿不出 50 亿、100 亿美元给 Anthropic,但 Google 和 AWS 能做到。” 他直言不讳地说: > “我们的失误导致 Anthropic 不得不去找别人。但即使这样,我仍然为 Anthropic 的存在感到高兴——Anthropic 对世界是有益的。” 后来老黄痛定思痛,决心不再犯同样的错误,因此 Nvidia 后续大手笔投资了 OpenAI(300 亿美元)和 Anthropic(100 亿美元)。 关于 Nvidia 为什么不自己做云服务,老黄再次强调了他核心的经营哲学: > “如果我们不冒险打造计算平台,真的就没人做了。如果没有 NVLink、CUDA 和整个生态的搭建与投入,AI 产业根本不会有今天的繁荣。但云服务不同,世界上有很多人能做。我们不做,自然会有人去做。” 他强调 Nvidia 不会亲自做融资业务,因为“融资业务市场上已经有很多人在做了,我们宁愿跟所有做融资的人合作。” 至于为什么 Nvidia 从来不去押注某个赢家,老黄回忆起创业时的教训:“我们刚起步的时候,全行业有 60 家 3D 图形公司。要是那时候投票选谁最可能失败,我们绝对排第一,因为我们的架构方向根本就是错的。” 最后老黄总结道: > “我足够谦逊地知道,不要去挑选赢家。要么大家自己想办法活下去,要么我们干脆照顾好所有人。” ## 【7】GPU 定价哲学:不涨价、不竞标的理由 访谈中,Dwarkesh 又抛出了一个让人直觉上觉得“这才合理”的问题:“GPU 紧缺时,为什么不直接卖给出价最高的人?” 对此老黄给出了一个出人意料但底气十足的回答: > “我们从来不做竞价分配 GPU 的事。这不是 Nvidia 的风格,我们只负责定好一个合理的价格,客户自己决定买不买。” 老黄强调,即使市场火爆到爆炸,他们也绝不会趁机涨价:“其他芯片公司可能会,但我们绝不。我们想做整个行业可信赖的基石,让客户永远不需要猜测或担心我们会不会趁机割韭菜。” 他甚至顺带辟了个谣:“坊间传闻 Larry Ellison 和 Elon Musk 曾经在一次晚餐上苦苦求我分 GPU 给他们,这事确实有,但他们根本不用求,只要下订单就可以了。” 更让人吃惊的是,老黄透露 Nvidia 与台积电近 30 年的合作,从来没签过正式法律合同: > “我们之间一直存在一种默契,有时候我占点便宜,有时候吃点亏,但总体上公平。我可以完全信任他们、依赖他们。” 最后,他点出了 Nvidia 的另一个优势——超强的可预测性: “今年我们交付 Vera Rubin 架构,明年是 Vera Rubin Ultra,后年是 Feynman,再下一年还有未公布的新架构。” 他带着骄傲地总结道: > “你放眼全球,有哪家 ASIC 团队敢拍胸脯承诺:每年稳定推出新架构、每年 Token 成本持续下降一个数量级?只有 Nvidia 能做到,我们像钟表一样准时可靠。” ## 【8】对华出口管制:老黄全场最激烈的交锋 访谈进行到中段时,Dwarkesh 开启了本场最激烈的 20 分钟辩论。他直言,自己习惯当“魔鬼代言人”——此前他曾挑战过支持出口管制的 Dario Amodei,现在面对反对管制的老黄,他反过来问了同样尖锐的问题: > “如果中国企业和政府拥有了训练出类似 Anthropic Claude Mythos 这种顶级模型的 AI 芯片,会不会威胁美国国家安全?” Claude Mythos 近期刚发布,就已发现了数千个零日漏洞,甚至能在主流操作系统和浏览器中自主发掘高危漏洞。正因如此,Anthropic 不敢公开发布,只限量提供给 Google、微软等机构修补漏洞。 对此老黄迅速而坚定地反驳:“Mythos 训练所需的算力其实并不特殊,在中国早已普遍存在。他们有世界 60% 以上的芯片产能,拥有最顶尖的计算机科学家,全球 50% 的 AI 研究者也都来自中国。” 他更犀利地提出:“如果你真担心中国,用最糟糕的方式——把他们变成受害者、敌人,肯定不是好主意。” 老黄指出,现在美中最大的缺失,是 AI 研究者之间的真正对话。他认为双方应该公开、直接地讨论,明确 AI 哪些领域不能涉及。 Dwarkesh 不认同老黄的观点。他强调,中国虽然芯片多,但先进算力只有美国的十分之一,因为中国的制程还卡在 7nm,没有 EUV 设备。这意味着美国有一个宝贵的窗口期,可以比中国更快达到 Mythos 的级别,并提前堵上漏洞。 老黄却一针见血地指出了被忽略的现实: > “中国拥有的免费能源实在太惊人了。AI 就是一个巨大的并行计算问题,如果中国芯片算力不够先进,他们完全可以用大量便宜芯片和几乎免费的电力拼成超算。他们甚至有空置的鬼城、鬼数据中心,可以迅速规模化部署。” 他进一步补充道:“7nm 芯片其实就是我们过去的 Hopper 芯片,而全球绝大部分先进 AI 模型,就是用 Hopper 训练出来的。华为去年更是创下了史上最大规模的单年芯片出货量。” 在老黄看来,出口管制只会促使中国更快走向芯片自主,而美国则将因此白白放弃全球第二大的科技市场。 Dwarkesh 试图用“内存带宽”问题继续施压,但老黄干脆回应:“华为本质上是一家网络公司,他们完全有能力通过先进的互联技术,把大量普通芯片串联成超级计算机。他们甚至已经展示过用硅光子技术把低端芯片变成巨型超算的能力。” 随后,老黄抛出了访谈中最具争议的一句话: > “如果未来 DeepSeek 这样的顶尖模型,首发选在华为芯片上,那对美国来说将是灾难。” 他的逻辑非常清晰:如果开源 AI 模型被优化到非美国的技术栈上,当这些模型传播到全球南方、中东和东南亚地区时,美国的技术标准和硬件生态将不再有竞争力,美国将丢掉全球 AI 技术主导权。 Dwarkesh 随即反驳道:“Anthropic 的模型同时能跑在 GPU、TPU 和 Trainium 上,这种跨平台兼容性不会轻易消失。” 老黄不以为然:“你试试看,把一个为 Nvidia 优化的模型搬到其他平台上去,性能会怎么样?Nvidia 的成功就是最佳证明。AI 模型在我们的技术栈上被创造,也在我们的技术栈上达到最好效果,这点毫无疑问。” 接下来,Dwarkesh 引用了 Dario Amodei 曾在达沃斯论坛上的尖锐比喻:“Nvidia 卖芯片给中国,就像波音自豪地说,朝鲜的核武器导弹外壳是波音造的,所以这是支持美国技术生态。” 这句话立刻激怒了老黄,他强烈回击: > “你把 AI 和你刚刚提到的任何东西比较,简直是荒谬透顶。” Dwarkesh 仍不罢休:“但如果他们的芯片可以跑出攻击所有美国软件的 AI 模型,这难道不算武器?” 老黄冷静地指出:“真正解决之道,是美中通过沟通达成明确共识,确保所有国家都不滥用 AI 技术。更何况,中国是全球最大开源贡献者,AI 安全依赖于全球开源生态。我们不能掐死它。” Dwarkesh 抓住老黄逻辑上的微妙矛盾追问:“你一边说 Nvidia 芯片最强,在中国市场一定能赢;一边又说,就算不卖芯片,中国照样可以做到一样的事。” 老黄强调,这两点并不矛盾:“如果市场上有更好的芯片,自然选更好的。如果没有,也能用已有的方案,这完全合乎逻辑。” 辩论到最后,双方立场都非常鲜明: 老黄坚持,AI 技术像一块“五层蛋糕”,每一层都必须竞争并取胜。牺牲芯片层(也就是不卖芯片给中国)来防止他们训练出高端模型,是一种极端且短视的做法。他举了美国电信行业的例子:过去严格的出口管制曾让美国公司彻底丢掉全球电信市场,最终让美国“不再控制自己的电信产业”。 Dwarkesh 激烈地质问老黄,这种说法是不是一种“输家心态”。老黄当场火力全开: > “你面前这个人,不是早上醒来准备输的人。这种输家的态度、输家的假设,对我来说毫无意义。” 最后,老黄平静地总结了自己的核心观点: > “没有人说要么全部开放、要么全封闭。美国必须永远领先,拥有最好的技术。但同时我们也应该积极参与全球竞争并赢下市场。这两件事是完全能同时做到的。世界从来不是非黑即白的。” ## 【9】收购 Groq 背后:推理市场进入分层时代 访谈最后阶段,Dwarkesh 将话题从敏感的地缘政治拉回到技术上,问老黄:“Nvidia 为什么不尝试不同的芯片架构?比如 Cerebras 那种晶圆级芯片,或者像 Dojo 那样的大封装结构,甚至推出完全不依赖 CUDA 的版本?” 老黄简单又直接地回应:“我们当然能做,但事实证明这些架构并没有更好。它们早就在我们的模拟器里反复验证过了,效果都不如现在的方案。” 不过他承认,Nvidia 最近的确在推理芯片领域迈出了新的一步——高价收购了 Groq。 但老黄强调,收购 Groq 并非因为 GPU 架构不够优秀,而是因为推理市场本身出现了重大变化: > “几年前,推理产生的 Token 基本不值钱,甚至可以说免费。但现在不同客户对 Token 的要求不同,他们愿意为更快的响应速度支付更高的价格。” 他举了自家软件工程师的例子:“如果我们能给工程师提供更快响应的 Token,让他们的生产力翻倍,我们当然愿意为此额外付费。”这就是所谓的“高端推理市场”,过去并不存在,但如今正在快速形成。 老黄继续解释:“我们现在已经进入了一个『推理分层时代』。同一个模型可以根据响应速度不同来定价,这意味着吞吐量高不再是唯一标准。更快的响应速度,即使整体吞吐量低一些,也可能获得更高的平均售价(ASP)。” 对于是否会考虑回到旧制程(比如 7nm)来缓解芯片供应压力的问题,老黄果断表示不太可能: > “理论上可以这么做,但经济上完全不划算。我们能承担得起向前发展,但负担不起向后退步。每一代新架构的进步,不仅仅是制程,还有封装、堆叠技术、数值精度和整体系统架构的革新。除非有一天真的再也无法提高产能,否则我们绝不会往回走。” ## 【10】假如 AI 革命从未发生,Nvidia 还会做什么? 访谈的尾声,Dwarkesh 提出了一个假设性的、稍显哲学的问题:“如果深度学习革命从来没有发生,今天的 Nvidia 会做什么?” 老黄没有犹豫,干脆地回答:“我们还是会做加速计算,这本来就是 Nvidia 一直在做的事。”他强调,通用计算的时代已经走到了尽头,计算世界转向加速计算的趋势和 AI 并不必然相关。 > “即使 AI 不存在,Nvidia 依然会是一家非常大的公司。” 他说,即便没有 AI,计算光刻、量子化学、数据处理和图像生成等领域,依旧需要强大的加速计算能力。他提到 GTC 大会上有很大一部分话题并非围绕 AI 展开,但依然对产业至关重要。 > “张量计算不是计算的全部。我们希望能帮助所有计算领域。” 但老黄最后也坦率承认了自己内心深处的一点小情绪:“但如果世界上真的没有 AI,我会感到非常伤心。” ## 最后的快问快答 Q:Nvidia 会不会变成商品化公司? Jensen:不会。因为从电子到 Token 的转化本身非常复杂,工程和科学问题还远未被理解透彻。AI 智能体的爆发还会为软件工具带来巨大的需求增长。 Q:CUDA 最大的价值到底是什么? Jensen:不是技术锁定,而是全球数亿块 GPU 的装机量、极其丰富的生态系统,以及跨每一家云平台的便捷性。此外,Nvidia 的工程师还能帮客户轻松实现 2-3 倍的性能提升。 Q:Anthropic 为什么选择 TPU 而不是 GPU? Jensen:因为 Nvidia 早年缺乏财务能力,没有及时投资 Anthropic,导致他们不得不依靠 Google 和 AWS 的芯片生态。这是一个特例,而不是长期趋势。 Q:Nvidia 应不应该向中国出售 AI 芯片? Jensen:应该。中国已经有了充足的 7nm 芯片产能和丰富的能源,出口限制只会加速中国自主生态的建立。美国需要在所有技术层面积极竞争,而不是通过牺牲市场来“赢”。 Q:Nvidia 为什么自己不做云服务? Jensen:“因为如果我们不做,总有人会做。”Nvidia 的哲学是只做那些如果我们不做,就没人能做的事情。而云基础设施显然不属于这一类。 ## 老黄的自相矛盾与现实考验 这场近两个小时的访谈,呈现出了几个值得持续关注的矛盾与悬念。 首先,老黄所谓“尽可能少做事”的哲学,在现实中早已偏离了字面含义。投入 300 亿美元给 OpenAI,100 亿美元给 Anthropic,花 200 亿美元收购 Groq,又扶持 CoreWeave 等新兴云服务商……Nvidia 的触手实际上早已深入 AI 产业链的每一个环节。如今看来,这个原则更像是一种事后美化的叙事,而非真正约束行动的法则。 其次,“Anthropic 是特例”这一论断,能否扛住现实的检验也充满悬念。Anthropic 在过去一年与 Broadcom 和 Google 的 TPU 合作规模翻了数倍(从 1GW 增至 3.5GW),与此同时 OpenAI 也开始发展自己的 Triton 框架并和 AMD 合作。如果未来出现更多这样的“特例”,那么老黄的说法基础势必动摇。 再来看最敏感的对华出口话题。整场辩论下来,老黄始终没有直面回答一个最关键的问题:“他到底愿意接受什么程度的出口限制?”他反复强调不应该限制出口,又同时表示美国必须永远领先。一旦这两种立场发生冲突,究竟哪个更重要?他没有给出明确答案。他举出的“美国电信产业失败”的案例虽有启发性,但这种类比是否能完全适用于 AI 芯片这种显著的双重用途技术,仍有待商榷。 而在商业策略上,老黄一再强调 Nvidia 作为“行业基石”绝不涨价、不搞竞价分配 GPU,能精准预测每年发布新架构。但这个承诺的可信度,很大程度上依赖于 Nvidia 目前超过 70% 的超高毛利率。当竞争真正来临时,Nvidia 是否还能如此慷慨与淡定? 接下来 Vera Rubin 架构的实际量产进度与性能表现、Groq 3 LPX 在真实推理任务中的表现,以及中国自研芯片在未来几个月的真实部署规模,都将是检验老黄此次访谈诸多观点的最佳指标。 完整访谈视频:Dwarkesh Patel Podcast

译黄仁勋在接受专访时,将Nvidia的使命定义为“输入是电子,输出是Token”。他阐述了公司“少做,但每件事都独一无二”的哲学,因此不做云服务、不押注特定赢家。他认为供应链瓶颈最多持续两三年,真正的长期制约是能源政策。针对竞争,他指出专用芯片在跨云可移植性和广泛适用性上不及Nvidia的通用加速计算平台。对于出口管制,他认为中国已拥有足够的7nm产能和能源,限制反而会加速其芯片自主化,使美国失去第二大科技市场。

宝玉@dotey · 4月18日77

http://x.com/i/article/2045321561201053696 # 设计圈的 Claude Code 时刻来了 Anthropic 今天发布了 Claude Design,第一时间体验了一下,震惊程度不亚于当年第一次用 Claude Code 写代码。借用 flypig 老师一句话: > 刚才用了一下,这么说:Claude Design 让 Google 那个 Stitch 看起来像个笑话。 这就是设计领域的 Claude Code 时刻。 我不会说“设计已死”、“设计师要被替代了”之类哗众取宠的话,只是想说: > 从想法到高保真交互原型的差距已基本消失,非设计师终于能独立产出可交付设计;设计师生产力指数级提升,但设计外包和传统设计工具要大幅缩水了。 今天 Figma 股价大跌也侧面印证了这一点。 ## 先看我的实测案例 给大家看一个完整案例,这是我大约 3 轮交互做出来的一个设计作品,不是简单的一个静态图片或者网页,里面的链接大部分可以点击交互。 初始提示词很简陋: > 帮我设计一个 writing agent 的 Mac App 支持多 workspace,可以看到 workspace 的文档(markdown、文本文档),可以对文档进行手动编辑,也可以调用 agent 编辑 markdown 文档 也可以在聊天对话中创建/编辑文档 主要是我还没想好做成个啥样,期待着它帮我想想,所以说得比较模糊。 然后它给了我一些问题让我选择,有单选有多选,还可以自己输入,或者让它自行决定。 过了一会去看,它给了我 3 个方案让我选择,就像一个专业的设计师,先跟你确认清楚需求,然后给几个不同方向让你挑。 每个结果都不是静态图片或者静态网页,都是可以点击交互的。 看完我觉得方案 2 和方案 3 都不错,但都有问题,需要综合一下。于是给了一些修改意见,还把 Codex 的截图发给它参考,让它把方案 2 和方案 3 综合一下,再结合 Codex 的一些设计。 它很快给了我一个新版本,基本上就是我想要但是描述不清楚的那种。 比如它把 Documents 和 Chat 用一个 Tab 分开,就是我喜欢的设计,比我预想的“一上一下”更好。 整体设计我挺满意,也提不出更好的要求,接下来就是抠细节。文档编辑历史它没实现,我就让它补这块。 提示词很简单: > 帮我基于当前设计,设计 history 部分,希望用户能更方便的看文档编辑历史,对比差异 很快它就出了一版,但是打开一看,效果不行。 我正准备提示它改,结果发现它自己检测出了布局问题,自己修复了。 修复后的版本就很好看了,没有布局问题,甚至还能方便地选择任意两个版本比较变更。 从左边的消息历史看,它有自动纠错机制。 最终产出物是 React 代码和样式表。 整个过程让我很意外的几件事:它会主动问需求、它会给多方案、它能理解多图混合参考、它能自检自纠、它输出的是可运行代码而不是静态稿。这套协作模式,和之前任何一个设计工具都不一样。 ## Claude Design 到底是个什么东西 先说基础信息。Claude Design 是 Anthropic Labs 今天发布的新产品,由 Claude Opus 4.7 驱动,Pro、Max、Team、Enterprise 订阅都能用(Enterprise 默认关,需要管理员开),直接去 claude.ai/design 就能进。 界面很简单:左边聊天,右边画布。 你描述想要什么,它在右边画出来;你用聊天、行内评论、直接编辑、或者它自动生成的调节滑杆去改;改完之后可以导出成 HTML、PDF、PPTX、ZIP,或者送进 Canva 继续编辑,或者直接打包给 Claude Code 去落地成产品代码。 看起来好像就是个 AI 版 Figma?并不是。 Ryan Mather 是 Anthropic 自己设计团队的人,一个人同时负责 7 个产品线。他今天发的推文里面说了一条很关键的话: > 不要用对待画布工具的方式来用 Claude Design。它是另一种动物,有自己的超能力。老实说它更像 Claude Code,而不是像画布式的设计工具。 https://x.com/Flomerboy/status/2045162328593670321 这句话是理解 Claude Design 的钥匙。 ## 和 Figma、Canva 们的根本不同 过去一年,Figma 加了 AI、Adobe 加了 AI、Canva 也加了 AI。它们的逻辑都是一样的:在以人为主的画布工具上,加一层 AI 插件,帮你画得更快一点、写文案方便一点。 Claude Design 走的是另一条路:AI 是主要的生成者,人是主要的审阅者。整套工具的骨架就是围绕这个假设搭的。 这个区别听起来抽象,落到产品上有几个很具体的差异。 ## 输出是可运行代码,不是静态设计稿 我上面那个 Mac App 案例,最终拿到的是 React + CSS,是一个能跑的东西,链接可以点、标签可以切、版本可以 diff。这和“生成一张漂亮的 UI 图”是两个物种。 ## 组织级设计系统 你上传代码库、PPT、品牌资料之后,它会抽出颜色、字体、组件、布局规范,后面所有项目都自动套用。Brilliant 的设计师反馈说,以前在别的工具里需要 20 多轮提示才能搞定的复杂交互,在 Claude Design 里 2 轮就搞定,原因就是它已经“认识”你的设计语言。 ## 理解你的代码库 不是把代码当截图看,是真的读组件结构、框架模式、文件组织。所以设计师做完之后点一下 handoff,工程师那边拿到的不是“这是一张图你去还原”,而是“这是一组可以直接接到你现有组件库里的实现草案”。 ## 会做工具,不只是做设计 官方博客里提到一个能力:你可以让 Claude Design 临时给你生成一个专门的工具,比如一个针对你品牌色盘的拾色器、一个自定义的 spec 生成器、一个小的交互原型测试工具。产出不局限于“设计文件”,而是“任何帮你把问题想清楚的计算产物”。 Datadog 的反馈也有意思:以前需要一周、跨多轮 brief → mockup → review 才能完成的事,现在在一次会议里就能边聊边做出成型原型,甚至让工程师现场参与到设计对话里。 这不像“Figma 提速 30%”那种优化。更像另一种工作方式。 ## 能拿来做什么 从官方博客和目前披露的使用场景看,Claude Design 至少能覆盖这几类工作: 产品原型和交互流程。 比如我的 Mac App 案例,或者 5 屏 onboarding 流程、带筛选和详情抽屉的搜索体验、审批工作流队列。这是它最强的一块。 演示文稿。 10 页 Q1 结果 Deck、15 页董事会 roadmap、客户会前材料、全员会 Deck。导出 PPTX 直接可用,也可以送去 Canva 继续编辑。 营销物料。 落地页、社媒图、活动视觉。 内部工具后台。 管理面板、内容审核队列、权限管理界面。这一类过去专门养一个前端岗来做,现在 PM 自己就能出可交付原型。 设计探索。 一次性出 3 到 5 个方向,让你挑。以前这是“我时间不够所以只能做两版给你看”,现在是“我出五版,你挑一版再精修”。 还有官方没重点讲但其实很重要的:视频 demo。Ryan Mather 提到它能直接生成视频形态的演示,不只是静态图。这对产品发布、用户测试、投资人沟通是新的能力位。 一句话概括使用边界:结构清晰、信息块明确、交互逻辑可描述的东西,它都做得不错;模糊情绪导向的纯艺术创作,它不是来抢这个饭碗的。 ## 这事不止关于设计 Ryan Mather 一个人服务 7 个产品,这是一个信号。这事放在两个月之前是不可能的。 ## 对设计师 生产力会指数级提升,但团队规模大概率会缩。过去一家公司需要 5 个设计师的活儿,现在 1 到 2 个就能做完,而且单人产出反而更多、更好。留下来的人会更值钱,因为他们做的是真正吃判断力的工作:品牌方向、关键插画、命名、战略级决策。剩下 80% 的执行工作,模型接走了。 ## 同样的剧本,已经演过了 编程圈是 Claude Code,能用好 AI 的工程师产出翻几倍,跟不上的慢慢被挤出来;分析圈是各种 AI 辅助数据分析,分析师从“写 SQL 的”变成“和 AI 一起提问题的”。每一次轮到新的专业,走的都是同一条轨迹:人均产出飙升,头部的人拿得更多,尾部的人看着机会一点点消失。设计圈刚好走到这个拐点。 ## 对 PM、创始人、营销人员 这是一个完全新的能力。以前你有想法,要么画个草图找设计师排队,要么忍着自己做个丑到抑郁的 PPT。现在你描述清楚想法,它给你一个可以直接拿去给工程师、给投资人、给客户的成品。 ## 对 Figma、Adobe、Canva 这是警钟,但股价跌 10% 可能只反映了表层冲击。Ryan Mather 那条推里还有一层更深的信号:Anthropic 自己的设计团队已经把 Claude Design 当主力工具用,Figma 只是偶尔才会被提到。如果 Anthropic 的设计师已经不主要用 Figma,别的科技公司凭什么还主要用?再过 2 到 3 个季度,当企业年度预算开始重新整合设计工具开销,老牌工具的续费数字会比股价给出更直接的答案。 ## 对公司决策层 有两件事要重新算账。一件是设计岗位的编制。Mather 一个人覆盖 7 个产品线,背后的参照线是原本需要 3 到 5 个设计师的工作量;放到年度预算表里,这个数字很难不被问到。另一件是工具订阅成本。当主力工作能在一个产品里基本完成,那些原本分散在 Figma、Sketch、Notion、Miro、Keynote 上的账号就会被拿出来重新评估。 ## 对工程师 这是久违的好消息。设计到工程的交接一直是最痛苦的环节之一:设计师按视觉做,工程师按代码做,中间全靠 Figma 标注和来回 review。现在从 Claude Design 出来的东西本身就带着组件结构和实现草案,落地成本直接降一个量级。 ## 其他 Claude Design 目前还是 research preview,有一些现实边界需要清楚: 它还没有审计日志和用量追踪,不支持数据驻留,上传的资产会被持久存储。如果你在一家对合规要求很严的公司,短期内最好不要把最高敏感度的设计素材直接放进去。 它目前只有网页界面,没有开放 API。你想把它嵌到自己产品里,目前还不行,只能基于 Claude API 和 Agent SDK 自建类似能力。但 Claude Design 能力这么强,最关键的是 Opus 4.7 模型在多模态能力上的增强,理论上来说你用 Opus 4.7 也能搭出来类似的产品。 但是和 Claude Code 一样,虽然同样用 Claude 的模型,但是 Claude Code 在很多方面就是能表现更好,毕竟 Anthropic 他们自家才知道怎么最大化的利用好新的模型,以及他们还能反过来,根据用户使用的设计数据和交互,去训练下一代的模型,形成数据飞轮。 这个优势短期内其他家比如 OpenAI 和 Gemini,还无法很快追上。 ## 价格与额度 这张表基于 Anthropic 官方 Claude Design 定价文档整理;官方没有公开 weekly allowance 的具体数值,所以这些格子必须标记为“未说明”。 我自己是 Claude Max@5x,就设计了一个 App 和生成了一个 Slides,一周的额度就没了。 ## 模型、规格与多模态能力 Claude Design 当前唯一明确公开的底层模型是 Claude Opus 4.7。 官方没有说明用户是否可以在 Claude Design 中切换到 Sonnet 或 Haiku,因此这一项应视为未说明 / 大概率固定。与此同时,Anthropic 的模型总览页面给出了当前主力模型的对比,便于理解 Claude Design 选型背后的原因。 上表数据由 Anthropic 模型总览汇总;其中“Claude Design 采用关系”来自 Claude Design 官方博客。 在视觉规格上,Opus 4.7 是首个支持高分辨率图像的 Claude 模型,最大原生分辨率可达长边 2576 像素,单图最高约 4784 图像 token。这对 Claude Design 尤其重要,因为它大量依赖截图、网页捕获、原型对照和文档视觉语义。与此同时,Opus 4.7 使用新 tokenizer,处理相同文本时 token 可能比 Opus 4.6 高出约 1x–1.35x,这意味着在图像/代码/长上下文场景里,开发者必须重新估算 max_tokens、缓存与成本。 ## 最后 Claude Design 带来的冲击,不只是设计圈的一次效率升级,更像一场深刻的范式转变。过去,设计师们习惯于在画布上精雕细琢、手动标注;现在,AI 已经可以直接从想法到可运行的高保真交互原型,让设计师的角色从纯粹的执行者向战略性的决策者转变。这种变化不只发生在设计领域,程序员、分析师、营销人员、产品经理,都已经或者即将经历类似的革命。 在这样一个时代里,真正被重新定义的不仅是我们的工作方式,还有我们对生产力和创造力的理解。AI 不会取代人类对美的判断、对品牌的洞察、对战略的规划,但它的到来却让每个人都有机会更加专注于这些最具价值的能力。 也许几年后,我们会回头看今天的 Claude Design,就像今天我们看待第一次使用 Claude Code 那样,发现历史的分水岭就在不经意间发生了——而我们刚刚走进了那个全新的未来。

译Anthropic发布由Claude Opus驱动的AI设计工具Claude Design。用户可通过自然语言描述直接生成高保真、可交互的原型,并输出React等可运行代码。该工具能理解并自动套用设计系统与代码库规范,其核心逻辑是“AI为主要生成者,人为审阅者”,显著区别于Figma等传统画布工具。这将极大提升设计生产力,改变设计师、PM等角色协作模式,并对传统设计工具市场构成冲击。

宝玉@dotey · 4月18日

Anthropic 自家设计师 Ryan Mather,一人负责公司 7 个产品线。他发的几条自己用 Claude Design 的心得,结合官方教程: 1. 别急着干活,先花一小时搭你的设计系统。 把代码库、设计稿、品牌素材全塞给 Claude,让它抽出一套 UI Kit 并直接发布。这一小时的投入,以后你每次生成设计稿,风格都会自动套用,性价比爆表。公司要全面推开,可以投入一到两周做系统沉淀,道理不变:先沉下去规范,后面才有复利。 2. 别再玩接力,跟工程师一起边聊边改。 过去那种“设计师出稿→甩给工程师实现→回来再修改”的模式,已经过时了。开个会,你们一起看着画布,边讨论边敲定方案,一场会定下来直接开发,效率拉满。 3. 结构级大改用聊天,细节调整点评论。 你想换个深色模式、布局大洗牌、新增设置面板,或者一次出多个方向,这种级别的任务用聊天界面效率最高;按钮 padding 调一下、颜色换一换、输入框改下拉菜单,这种小修小补直接在元素上评论就行,精准又快速。 4. 反馈要具体,别给模糊情绪。 官方举过一个特别好的例子:「看着不对劲」就是最差反馈,而「表单字段间距改成 8px」才是智能体最爱听的明确指令。Claude 最擅长处理具象具体的要求,不善于揣摩你抽象的审美情绪。 5. 接上 Connector,让 Claude 读懂上下文。 Ryan Mather 提到他最爱的用法:把产品吐槽会议的纪要喂给 Claude,然后出去溜达一圈,回来一份完整的解决方案 Deck 已经自动生成了。 让 Claude 干复杂又综合的脑力活儿,你腾出手做更重要、更有创造力的事。 6. 关键时刻,别怕手工慢下来。 新图标、核心插画、产品名字、品牌形象,这类活儿别指望模型给你完美答案。这不是 Claude 不够牛,而是这事儿本质上考验的是你的个人品味和判断。Ryan 把这叫作“Agentic Designing 的艺术部分”。 7. 挂代码要精准,别塞整个 monorepo。 把整个 repo 拖进去会直接卡爆浏览器,模型的上下文也被无用信息污染了。你只要挂目标组件的文件夹或 package 就够了,记得排除 .git 和 node_modules,干净利索。 再补两条官方没说的小窍门: 1) 多开几个 Chat 平行探索。 同一个想法开 3 个对话,各自往不同方向跑一段,然后再挑精华合并,比在一个对话里反复折腾要高效太多。 2) 团队 Leader 得改改你的审查流程。 以前是“人做、人审”,现在是“Claude 做、人审”,这个差别巨大。如果你不调整节奏和人力配置,工具的价值会浪费一半,审查这一步一定要重构。

译Anthropic设计师Ryan Mather分享其一人负责7个产品线的Claude Design实战策略:先投入1-2周搭建设计系统获取复利;推动设计师与工程师实时协作而非接力;结构级改动用聊天,细节调整用评论;反馈需具体明确;通过Connector接入会议纪要等上下文;关键品牌决策仍需人工把控;挂载代码需精准。建议多开平行对话探索方案,团队Leader需重构审查流程适应"Claude做人审"的新模式。

ClaudeDevs@ClaudeDevs · 4月18日

Starting in v2.1.113, the Claude Code npm package ships the native binary instead of the JavaScript build. Same install command, faster startup, and the CLI no longer needs Node.js at runtime. If you need the JS build, pin to an earlier version.

译从 v2.1.113 开始,Claude Code npm 包附带原生二进制文件而非 JavaScript 构建版本。 安装命令相同,启动更快,且 CLI 运行时不再需要 Node.js。如需 JS 构建版本,请固定到早期版本。

Claude@claudeai · 4月18日47

The Claude Code hackathon is back for Opus 4.7. Join builders from around the world for a week with the Claude Code team in the room, with a prize pool of $100K in API credits. Apply by Sunday: https://cerebralvalley.ai/e/built-with-4-7-hackathon

译Claude Code 黑客马拉松再度回归,迎接 Opus 4.7。 与全球的构建者们一同参与为期一周的活动,Claude Code 团队将亲临现场,并提供价值 10 万美元的 API 积分作为奖金池。 申请截止至周日:https://cerebralvalley.ai/e/built-with-4-7-hackathon

Rohan Paul@rohanpaul_ai · 4月18日

Today’s edition of my newsletter just went out. 🔗 https://www.rohan-paul.com/p/claude-opus-47-launched-as-less-powerful 🗞️ Claude Opus 4.7 launched as ‘less powerful’ version of Mythos 🗞️ Perplexity just launched Personal Computer, a Mac feature that lets AI work across local files, native apps, and the browser. 🗞️ AI can boost performance at first and then leave people less able to think through problems on their own. 🗞️ A new paper shows that GitHub stars can be bought at scale, and that the distortion now bleeds into security. 🗞️ OpenAI just expanded Codex from a coding assistant into a desktop agent that can see, click, type, remember your habits, and keep work moving across apps and tools.

译Claude Opus 4.7 作为 Mythos 的轻量版本发布。Perplexity 推出 Mac 端 Personal Computer,支持 AI 跨本地文件、原生应用及浏览器操作。OpenAI Codex 升级为桌面智能体,具备视觉感知、点击输入及记忆用户习惯能力。研究显示 AI 初期提升效率但长期或削弱独立思考能力。另有论文揭露 GitHub stars 刷量现象已渗透至安全领域。

ClaudeDevs@ClaudeDevs · 4月18日

Our virtual hackathon is back! Join us for a week of building with Opus 4.7 alongside developers from around the world. The Claude Code team will be in the room all week, with a prize pool of $100K in API credits.

译我们的虚拟黑客马拉松回归了!加入我们,与来自世界各地的开发者一起使用 Opus 4.7 进行为期一周的开发。 Claude Code 团队将整周在线,奖池为 10 万美元 API 额度。

ClaudeDevs@ClaudeDevs · 4月18日

Some of you ran into Opus 4.7 refusing normal code edits with "this might be malware" warnings. That was a bug on our side, not the model being cautious. Older builds applied a stale safety prompt that Opus 4.7 doesn't need. Run claude update or relaunch the app.

译你们中有人遇到 Opus 4.7 以"this might be malware"警告为由拒绝正常代码编辑。这是我们这边的 bug,不是模型过于谨慎。 旧版本应用了 Opus 4.7 不需要的过时安全提示。运行 claude update 或重启应用。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月22日
22:19
Ethan Mollick@emollick
所有 AI 模型都有偏好的名字。如果你向 Claude 4.5 要一个软件开发者,你会得到 Marcus Chen。巫师大多叫 Aldric。来自 Claude 的太空飞行员是 Kira,来自 GPT-5.2 的是 Mara Vance。 我猜 LinkedIn Bros 现在都是 Kai 了。https://www.seehuhn.de/blog/ai-names/

Joe Weisenthal: This is kind of funny and weird. So I checked out ChatGPT's new image builder, and gave it the same prompt -- to create ...

AnthropicOpenAI现象/趋势
20:14
Rohan Paul@rohanpaul_ai
日本将前沿AI列为操作风险 金管局拟会晤银行讨论Mythos模型

国家级监管机构将前沿AI模型纳入操作风险范畴,与流动性压力、网络攻击并列。日本金融服务局因担忧Anthropic的Mythos模型,即将与三菱日联、三井住友、瑞穗、日本央行及东京证券交易所会晤。核心风险在于,防御性AI可能以机器速度扫描庞大代码库并识别关键漏洞,远超人工黑客逐个发现缺陷的传统模式;而银行依赖的老旧内部软件、支付系统和市场基础设施一旦暴露严重弱点,可能导致交易中断或数据泄露。

Anthropic政策/监管
19:44
Rohan Paul@rohanpaul_ai
Genspark 正在重新构想设计。 他们刚刚开放了 Build 的公开预览,能将纯英文想法转化为网站或应用原型及可运行代码。 由 Claude Opus 4.7 驱动,在长上下文、UI 推理和代码生成方面具备优势,确保项目在多步骤中保持连贯。 单一系统处理整个设计闭环:想法、布局、功能规划、界面和代码输出。

Genspark: Introducing the next-gen AI for design and creation - Genspark Build 🚀 Powered by Claude Opus 4.7, it turns your ideas ...

智能体Anthropic产品更新编码
16:00
小互@xiaohu
Claude Code新增/recap自动会话回顾功能

Claude Code新增/recap功能,可在终端从后台切回时自动展示会话回顾,包括已完成操作和后续计划。该功能需满足多轮对话、时间间隔及失焦状态等条件触发,支持后台预生成实现即时显示,避免重复刷屏。用户可通过命令手动触发,或在配置中开关,升级至最新版默认启用。

智能体Anthropic产品更新编码
15:14
Rohan Paul@rohanpaul_ai
手机智能体是否尊重你的隐私?

研究发现手机智能体在执行日常任务时存在严重隐私隐患。通过MyPhoneBench评估,最佳模型任务完成率达82.8%,但隐私合格分数仅47.6%。隐私风险源于"过度帮助"——模型为完成任务会索要不需要的个人信息、向无关组件重复披露数据或过度填充可选字段。Claude任务成功率领先,Kimi隐私保护最佳,Qwen综合得分最高。研究表明,仅以成功率为标准的基准测试混淆了能力与判断力,在手机这类私密设备上构成严重安全隐患。

智能体Anthropic安全/对齐论文/研究
13:44
Rohan Paul@rohanpaul_ai
Anthropic机密模型Mythos遭第三方泄露

Anthropic受限网络模型Mythos遭未授权组织通过第三方供应商获取访问权限。该组织持续使用并向Bloomberg提供截图及演示证据,暴露合作伙伴环境访问控制漏洞。尽管Anthropic通过Project Glasswing严格限制模型分发以防滥用,但事件证明模型保密性取决于供应链中最薄弱的承包商、端点或凭证环节。

Anthropic安全/对齐
09:39
Chubby♨️@kimmonismus
什么?尽管 Mythos "过于强大,不适合公开使用"(Anthropic),但几名 Discord 用户从第一天起就能访问该模型! 据报道,一小群"未经授权的 Discord 用户"利用内部访问权限和在线侦查技术相结合的方式,访问了 Anthropic 强大的 Mythos AI 模型。 "为了访问 Mythos,这群用户根据对 Anthropic 其他模型所用格式的了解,对模型的在线位置进行了有根据的猜测。" Via Bloomberg
Anthropic安全/对齐
07:06
ClaudeDevs@ClaudeDevs
缓存对于客户降低成本和 TTFT 至关重要。 我们在 Claude Developer Console 推出了新的仪表板,以提高可见性并帮助客户优化使用。 在此查看:http://platform.claude.com/usage/cache
Anthropic产品更新部署/工程
04:45
Peter Steinberger 🦞@steipete
由于这条帖子正在 Hacker News 上引发热议。 Boris 表示允许使用 CLI。因此我们添加了对它的支持,却发现我们在那里仍被屏蔽。通过简单重命名就能轻易绕过,但我不想玩那种把戏。所以现在处于一种奇怪的悬而未决状态:CLI 使用理论上可行,但实际上不行。 https://x.com/bcherny/status/2041035127430754686

Dan McAteer: Anthropic allows OpenClaw usage again. From @openclaw docs.

智能体Anthropic行业动态
01:45
Epoch AI@EpochAIResearch
Opus 4.7 在 ECI 上获得 156 分,这是我们用于将多个基准测试整合到单一量表的工具。这使它略高于 Opus 4.6,仅略低于 GPT-5.4、Gemini 3.1 Pro 和 GPT-5.4 Pro。包含各项分数和评论的线程。
AnthropicOpenAI评测/基准
4月21日
23:48
Thariq@trq212
我最喜欢的生活质量功能之一

ClaudeDevs: Claude Code in the terminal will now show recaps when you switch focus away from the session and then come back. This sh...

智能体Anthropic产品更新编码
23:39
ClaudeDevs@ClaudeDevs
终端中的 Claude Code 现在会在你切换焦点离开会话后再返回时显示回顾。 这应该能帮助你在 multi-clauding 时保持心流。
智能体Anthropic产品更新编码
17:48
TestingCatalog News 🗞@testingcatalog
Anthropic Conway重大升级:Always-on Agent将支持可共享的自定义UI

Anthropic正升级其always-on Agent项目Conway。新系统将支持用户创建、分享和重用自定义UI标签页(如任务控制、工作流管理等),并由Anthropic顶级模型驱动。目前iOS应用已隐藏新增设置界面,网页端也引入Built-in与Installed分类组件。这一扩展功能标志着Agent交互向模块化、可共享方向演进,允许用户构建个性化工作流界面。

智能体AnthropicMCP/工具产品更新
13:48
Yuchen Jin@Yuchenj_UW
这就像是在说: "看工程师简历时,区分平庸与优秀候选人最明显的迹象之一,就是他们是否列出了 Claude Code 或 Codex。"
智能体AnthropicOpenAI大佬观点
10:05
宝玉@dotey
53
Claude opus-4.6配置分享:稳定省token

我今天也刚配置了 opus-4.6,有时候写东西还是 opus 4.6 稳一些,而且省 token,但是 /model 不能选了,不过可以通过配置切换,下面是配置: ~/.claude/settings.json { "model": "claude-opus-4-6" } https://t.co/sZlgtX1RY9

泊舟: 应该不止我一个人回退到4.6吧

Anthropic教程/实践编码
07:06
Anthropic@AnthropicAI
我们正式启动 Anthropic STEM Fellows Program。 AI 将加速科学和工程的进步。我们正在寻找这些领域的专家,与我们的研究团队合作,在几个月内完成特定项目。 了解更多并申请:https://job-boards.greenhouse.io/anthropic/jobs/5189848008
Anthropic行业动态
07:06
Ethan Mollick@emollick
经典研究给146个经济学家团队相同的数据集,结果天差地别 新论文用agentic AI重新运行。Claude Code和Codex接近人类中位数,但离散度更窄,且无极端值。 这表明AI现在可用于开展可扩展的研究。
智能体AnthropicOpenAI编码
05:06
Anthropic@AnthropicAI
我们正在扩大与 Amazon 的合作,以确保获得高达 5 吉瓦的算力用于训练和部署 Claude。算力容量本季度开始上线,预计到 2026 年底将有近 1 吉瓦。
智能体Anthropic行业动态部署/工程
03:44
Chubby♨️@kimmonismus
Google 已在 Google DeepMind 内部组建了一支专门的突击队,以改进其 AI 编程模型,部分原因是受到 Anthropic 的压力,后者的工具在内部被视为更先进。 包括 Sergey Brin(!)在内的领导层正紧急推动"agentic" AI 系统,使其能够处理复杂的多步骤编程任务,并最终实现 AI 研究本身的自动化。 编程是制胜之道。
智能体AnthropicGoogle编码
4月20日
07:44
Chubby♨️@kimmonismus
Claude Mythos 实在太强了 尽管将 Anthropic 标记为"供应链风险",但据报道美国国家安全局正在使用其强大的 Mythos Preview。
Anthropic行业动态
07:44
Chubby♨️@kimmonismus
现在的 Claude 社区一句话概括
Anthropic其他
07:44
Rohan Paul@rohanpaul_ai
Anthropic Mythos获美安全机构使用却陷信任危机

美国安全机构正在使用Anthropic的Mythos Preview模型,该模型具备异常强大的网络攻防能力,目前仅向约40个组织开放访问。然而,Pentagon部分部门却将Anthropic视为"供应链风险"。这种矛盾揭示了美国政府在AI供应商信任问题上的内部分裂:一方面急需Mythos的安全能力,另一方面又对其可靠性存疑。

Anthropic行业动态
05:44
Chubby♨️@kimmonismus
相比 4.7 还是更喜欢 Opus 4.6 Anthropic 史上最差发布。
Anthropic大佬观点推理
01:48
Yuchen Jin@Yuchenj_UW
Vercel 被入侵了 严重到要通知执法部门 唯一的建议:"检查你的环境变量" 这到底是什么意思? 100亿美元的公司,就是这么沟通的 网络攻击正在快速升级,开始明白为什么 Anthropic 不敢发布 Mythos 了。

Vercel: We've identified a security incident that involved unauthorized access to certain internal Vercel systems, impacting a l...

Anthropic行业动态
4月19日
19:44
Chubby♨️@kimmonismus
驳LeCun专家论:评判观点应基于论证而非学科背景

针对LeCun批评Dario Amodei对技术革命与劳动力市场影响缺乏研究、主张应听从经济学家的观点,作者反驳称评判论证应基于内容真伪而非学术背景。作者指出,Amodei在Anthropic组建科学家团队形成的观点虽需批判性审视,但不应仅因学科背景被否定,以学历而非论证本身作为评判标准是不科学的。

Yann LeCun: Dario is wrong. He knows absolutely nothing about the effects of technological revolutions on the labor market. Don't li...

AnthropicMeta大佬观点
17:08
karminski-牙医@karminski3
106美元实测Claude-Opus-4.7:视觉飞跃但推理偷懒

花费106美元在OpenRouter上实测Claude-Opus-4.7显示,其视觉能力较4.6版本显著提升,在颜色识别、细节捕捉和空间理解方面表现突出,可替代GPT-4o Pro用于多模态前端任务。但在后端硬实力测试中表现下滑,核心问题在于即使开启xhigh reasoning effort,模型的思考预算仍显不足,导致"偷懒"现象。实际使用中需通过反复提示和跨会话思考才能发挥最佳性能。

Anthropic多模态编码评测/基准
07:07
宝玉@dotey
只有程序员才关心是不是原生的开发,是不是用rust语言开发的 没有铁饭碗

夏雨婷: 如果说程序员有个领域是铁饭碗不怕被AI替代,那就是原生桌面客户端开发。 Claude/OpenAI/OpenCode/Cursor这几个公司技术能力够强吧?token管够吧?但他们的桌面客户端都是电子垃圾。

AnthropicOpenAI大佬观点编码
06:04
Ethan Mollick@emollick
关键要注意,AI科学家并非劳动问题专家。在X上活跃并研究AI与劳动问题的其他经济学家包括:@alexolegimas、@danielrock、@joshgans 和 @robseamans(以及其他许多人) 但值得注意的是,经济学家们对此也没有共识:https://aleximas.substack.com/p/how-will-ai-driven-automation-actually

Yann LeCun: Dario is wrong. He knows absolutely nothing about the effects of technological revolutions on the labor market. Don't li...

Anthropic大佬观点
03:04
Nathan Lambert@natolambert
这里的一个大问题是,我们并没有清晰界定 mythos capabilities 到底是什么。 发布博客中的每个基准测试都有模型能达标,当然。 但要说有模型能直接替换到相同用例中且性能毫无下降?我对此表示怀疑。

rohit: Dario seems to think China and open source will hit Mythos capabilities in 6-12 months

Anthropic大佬观点开源生态推理
01:44
Chubby♨️@kimmonismus
Dario Amodei:中国将在12个月内拥有 Mythos 能力的复制品。 他还说:"彩虹没有尽头。只有彩虹本身,"他说,"我们没看到任何放缓的迹象。" 对于任何怀疑中国 Mythos 远远落后的人:Dario 持相反观点!
Anthropic大佬观点
4月18日
23:48
TestingCatalog News 🗞@testingcatalog
Anthropic 可能正准备将 Claude Code 的安全功能向企业版和团队版以外的用户开放。 Claude Security 将定期扫描你的代码仓库,并报告发现的任何漏洞。 仅限 Max?👀
智能体Anthropic产品更新编码
19:44
Chubby♨️@kimmonismus
Opus 4.7 确实似乎有所改进,其自适应思考现在使用了更多 tokens。 然而,与 Opus 4.6 相比,它的表现仍然明显更差。
Anthropic推理评测/基准
11:02
宝玉@dotey
69
两小时激辩:黄仁勋为什么不怕 TPU、不怕华为、不怕出口管制?

黄仁勋在接受专访时,将Nvidia的使命定义为“输入是电子,输出是Token”。他阐述了公司“少做,但每件事都独一无二”的哲学,因此不做云服务、不押注特定赢家。他认为供应链瓶颈最多持续两三年,真正的长期制约是能源政策。针对竞争,他指出专用芯片在跨云可移植性和广泛适用性上不及Nvidia的通用加速计算平台。对于出口管制,他认为中国已拥有足够的7nm产能和能源,限制反而会加速其芯片自主化,使美国失去第二大科技市场。

AnthropicOpenAI大佬观点行业动态
10:32
宝玉@dotey
精选77
Anthropic发布Claude Design:AI驱动设计工具,变革工作流程

Anthropic发布由Claude Opus驱动的AI设计工具Claude Design。用户可通过自然语言描述直接生成高保真、可交互的原型,并输出React等可运行代码。该工具能理解并自动套用设计系统与代码库规范,其核心逻辑是“AI为主要生成者,人为审阅者”,显著区别于Figma等传统画布工具。这将极大提升设计生产力,改变设计师、PM等角色协作模式,并对传统设计工具市场构成冲击。

Anthropic产品更新多模态

推荐理由:Claude Design 把设计从「人画 AI 辅助」翻转成「AI 画人审」,输出直接是可运行代码而非静态稿,PM 和创始人第一次能自己出可交付原型,Figma 股价当天跌 10% 不是巧合。
10:32
宝玉@dotey
Anthropic设计师Ryan Mather:一人负责7个产品线的Claude Design策略

Anthropic设计师Ryan Mather分享其一人负责7个产品线的Claude Design实战策略:先投入1-2周搭建设计系统获取复利;推动设计师与工程师实时协作而非接力;结构级改动用聊天,细节调整用评论;反馈需具体明确;通过Connector接入会议纪要等上下文;关键品牌决策仍需人工把控;挂载代码需精准。建议多开平行对话探索方案,团队Leader需重构审查流程适应"Claude做人审"的新模式。

Ryan Mather: 🧵 My tips for getting the best results out of Claude Design! I'm on the verticals team at Anthropic which means I serve...

智能体Anthropic教程/实践编码
06:26
ClaudeDevs@ClaudeDevs
从 v2.1.113 开始,Claude Code npm 包附带原生二进制文件而非 JavaScript 构建版本。 安装命令相同,启动更快,且 CLI 运行时不再需要 Node.js。如需 JS 构建版本,请固定到早期版本。
智能体Anthropic产品更新编码
05:58
Claude@claudeai
47
Claude Code 黑客马拉松再度回归,迎接 Opus 4.7。 与全球的构建者们一同参与为期一周的活动,Claude Code 团队将亲临现场,并提供价值 10 万美元的 API 积分作为奖金池。 申请截止至周日:https://cerebralvalley.ai/e/built-with-4-7-hackathon
Anthropic编码行业动态
05:44
Rohan Paul@rohanpaul_ai
Claude Opus 4.7与Codex桌面智能体发布及AI认知影响研究

Claude Opus 4.7 作为 Mythos 的轻量版本发布。Perplexity 推出 Mac 端 Personal Computer,支持 AI 跨本地文件、原生应用及浏览器操作。OpenAI Codex 升级为桌面智能体,具备视觉感知、点击输入及记忆用户习惯能力。研究显示 AI 初期提升效率但长期或削弱独立思考能力。另有论文揭露 GitHub stars 刷量现象已渗透至安全领域。

智能体AnthropicOpenAI行业动态
05:09
ClaudeDevs@ClaudeDevs
我们的虚拟黑客马拉松回归了!加入我们,与来自世界各地的开发者一起使用 Opus 4.7 进行为期一周的开发。 Claude Code 团队将整周在线,奖池为 10 万美元 API 额度。
智能体Anthropic编码行业动态
04:31
ClaudeDevs@ClaudeDevs
你们中有人遇到 Opus 4.7 以"this might be malware"警告为由拒绝正常代码编辑。这是我们这边的 bug,不是模型过于谨慎。 旧版本应用了 Opus 4.7 不需要的过时安全提示。运行 claude update 或重启应用。
Anthropic产品更新编码
‹ 上一页
1…4041424344…48
下一页 ›