AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1905 条
全部一手资讯X论文
标签「Anthropic」清除
小互@xiaohu · 5月1日28

我发现一些东西一开始本来好好的 你越想优化它 然后它就会越向着失控的边缘前进 我的写作系统本来好好的,我总觉得不完美,每天不停的想优化! 结果现在崩溃了写的跟狗屎一样🤣 我感觉 opus 4.6也是这个样子搞坏的😐

译作者通过个人写作系统的崩溃经历,阐述了一个普遍现象:一个原本运行良好的系统,在持续、过度的优化追求下,反而会走向失控和性能恶化。他将此现象类比到AI模型领域,推测Anthropic的Claude Opus模型可能也经历了类似的“优化-崩溃”路径,即开发者在试图不断改进模型(如从4.0版本迭代)的过程中,可能导致其核心能力或输出质量出现非预期的衰退。这揭示了技术迭代中“过犹不及”的风险。

阿绎 AYi@AYi_AInotes · 5月1日64

看到这个3D交互网站的演示给我看傻了😲🤯 做了版高可复用3D互动网站 Prompt 框架提示词大家收好!!! 讲真不是因为这个网站有多炫酷,主要是让我突然意识到,以前做3D网站这个曾经门槛极高的活,现在真的连奶奶都能做了🤣👵 不用Cursor或者Claude写Three.js那么复杂, 是用Emergent加Claude的Agent全流程托管, 你不用写一行代码,不用搭环境,不用调渲染参数, 只要上传一段参考视频,说清楚你想要的感觉, AI会自己生成代码,自己跑实时预览,自己迭代调整, 整个流程从打开网站到做出能跑的3D交互原型,只用了一个下午, 成本就是一个月20刀的Claude订阅, 以前这种级别的3D交互原型,外包报价至少8000到15000美元, 现在一个人一个下午就能搞定了😱 老规矩提示词自取👇

译作者利用Emergent和Claude Agent,无需编写Three.js代码或搭建环境,仅通过上传参考视频和描述需求,即在一个下午内全自动生成并迭代出可运行的3D交互网站原型。成本仅为每月20美元Claude订阅费,而以往同类外包项目报价高达8000至15000美元,标志着3D网站开发门槛已大幅降低。

ginobefun@hongming731 · 5月1日54

BestBlogs 今天早报:Karpathy 在 Sequoia Capital 的访谈里分享软件 3.0,编程核心从写代码变成喂上下文,并区分了 Vibe Coding 与 Agentic Engineering 两种姿态; OpenAI 总裁 Greg Brockman 把真正的瓶颈从算力挪到了人类注意力,并估算 AGI 已经走完八成路。 落到工程层面,Anthropic 公开了 Claude Code 把 Prompt Caching 命中率当 SLA 监控的实战经验,把"上下文是新代码"翻译成了一条条可执行的工程纪律。

译Karpathy提出软件3.0概念,编程核心从写代码转向提供上下文,并区分Vibe Coding与Agentic Engineering两种模式。OpenAI总裁Brockman将AGI瓶颈从算力移至人类注意力,估计已完成80%。Anthropic分享Claude Code实战,以Prompt Caching命中率为SLA监控,将“上下文即新代码”转化为工程纪律。

Berryxia.AI@berryxia · 5月1日57

你看看大模型有多重? 这个挺有意思的😂

译Pine AI首席科学家李博杰提出新方法,通过模型回答1400道冷知识题的能力来估算其参数量。原理是存储事实需占用参数空间,先利用已知开源模型拟合曲线,再将闭源模型得分投射得出估算。研究评估了92个闭源模型,结果显示GPT-5.5以约9.7T参数断层领先,Claude Opus 4.6约5.3T次之。主流旗舰模型如GPT-5、Claude Opus 4.7参数集中在3-4T量级。分析还推断GPT-5的.x版本及Claude Opus 4.7等可能是全新训练而非微调产物,并指出MoE模型的知识容量取决于总参数量。评测工具与数据已开源。

Berryxia.AI@berryxia · 5月1日58

刚刚看到Claude Security 现已进入公测阶段!可以让Claude 帮你检查漏洞了啊! 目前已经内置于网页版的 Claude Code 中。 只需将其指向一个代码仓库,即可获得经过验证的漏洞发现结果,并在 正在编写代码的同一位置修复它们! 这个功能挺实用,什么时候可以直接cc里可以用。 地址:https://claude.com/product/claude-security

Berryxia.AI@berryxia · 5月1日53

这个小哥读完Anthropic关于智能体AI的博客后,我梳理出一套心智模型,用来理解并拆解智能体AI架构的设计逻辑。 设定任务与目标 明确你希望AI智能体需要完成、达成的具体事项。 1. 编排层 Orchestration layer 相当于整套系统的控制面板,负责全局调度与流程统筹。 2. 智能体层 Agents layer 由多个专用/通用智能体组成,也就是多智能体分工协作架构。 3. 工具层 Tools 为智能体提供各类能力支撑,例如网页搜索、数据库查询、第三方API调用等。 4. 记忆层 Memory 系统的“大脑”,负责存储短期记忆与长期记忆等各类信息。 5. 监控层 Monitoring 至关重要的一环,用来实时追踪智能体执行的每一个步骤。 6. 可靠性与故障管理 Reliability & failure management 自动识别错误、执行重试、设置降级兜底策略,并支持人工介入处理。 7. 治理与安全 Governance and security 包含合规校验、行为审计、身份授权、数据安全等管控机制。

译基于Anthropic关于智能体AI的博客,作者提炼出一个用于理解和设计智能体AI架构的心智模型。该模型以明确任务目标为前提,核心架构包含七个层次:编排层负责全局调度;智能体层由多智能体分工协作;工具层提供搜索、API等能力支持;记忆层存储长短期信息;监控层实时追踪每一步执行;可靠性与故障管理层处理错误、重试与降级;治理与安全层确保合规、审计与数据安全。监控层被视为最关键环节,而故障管理支持自动处理与人工介入。

Berryxia.AI@berryxia · 5月1日55

David Sacks 在 X 平台上发布了一条推文,对 AI Security Institute 刚刚发布的公告进行了回应。 AI Security Institute 宣布 OpenAI 的 GPT-5.5 模型(cyber 版本)成功完成了他们设计的“多步网络攻击模拟”。 也成为第二个能端到端完成整个攻击链的模型(第一个是 Anthropic 的 Mythos)。 在推文中,David Sacks 表示,是时候揭开 Mythos 的神秘面纱了。 他强调,Mythos 并非什么魔法,也不是末日武器,它只是众多能够自动化网络安全任务的模型中的第一个,就像 AI 已经能自动编写代码一样。 现在 OpenAI 的 GPT-5.5-cyber 也达到了同样的水平,而所有前沿模型(包括来自中国的模型)预计将在大约 6 个月内跟上这一步伐。 David Sacks 进一步指出,这些模型并不会创造新的漏洞,它们只是发现已有的漏洞。 代码中的 bug 本来就存在,使用 AI 来发现并修补它们,反而会让系统变得更加坚固。 他认为,从前 AI 时代的网络安全到后 AI 时代的网络安全,将经历一次大规模的升级周期。 升级完成后,市场很可能会达到 AI 驱动的网络进攻与 AI 驱动的网络防御之间的新的平衡状态。 他特别提醒,必须确保网络防御方先获得这些强大模型的访问权限,而非让攻击方抢先一步。 这个过程已经启动,但需要迅速推进,尤其考虑到中国模型即将跟上的现实。 此外,与 Mythos 不同,GPT-5.5-cyber 似乎没有 token 限制,因此它可能是第一个防御方能够实际投入使用的网络安全模型。 David Sacks 的整体立场是:AI 在网络攻击能力上的提升是不可避免的,但并非那么可怕,反而会推动整个网络安全生态的全面升级,前提是防御方必须领先一步。 他通过这条推文,既澄清了外界对 Mythos 的过度神化,也为 OpenAI 的 GPT-5.5-cyber 提供了实际支持```​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​。

译AI 安全机构宣布 OpenAI 的 GPT-5.5-cyber 成功完成多步网络攻击模拟,成为继 Anthropic 的 Mythos 后第二个端到端完成攻击链的模型。David Sacks 回应指出,此类模型并非魔法或末日武器,仅是能自动化网络安全任务的工具,且所有前沿模型(包括中国模型)预计将在约6个月内达到同等水平。他强调模型不创造漏洞,而是发现并帮助修补已有漏洞,从而增强系统安全。从“前AI”到“后AI”网络安全将经历重大升级,最终达到AI驱动攻防的新平衡。关键在于确保防御方优先获得模型访问权,且需加速此进程。GPT-5.5-cyber 因无token限制,可能成为首个防御方可实际使用的模型。

TestingCatalog News 🗞@testingcatalog · 5月1日45

ANTHROPIC 👀: Claude will get a new feature called "Cardinal" (internal name)! > Users will be able to select a month, and Claude will show them stats, including a highlight of the areas they've focused on most. - "Here’s where your conversations clustered." - "These were the main working styles you used." > This new feature will be available in settings. > Settings layout will also be updated on both the web and desktop apps. Memory but visual! 🔥

译ANTHROPIC 👀: Claude 将获得一项名为 "Cardinal"(内部名称)的新功能! > 用户将能够选择一个月份,Claude 将向他们展示统计数据,包括他们最关注领域的高亮总结。 - "这是你对话内容聚集的领域。" - "这些是你使用的主要工作风格。" > 这项新功能将在设置中提供。 > 网页版和桌面端应用的设置布局也将更新。 可视化记忆!🔥

Rohan Paul@rohanpaul_ai · 5月1日48

Today’s edition of my newsletter just went out. 🔗 https://www.rohan-paul.com/p/frontier-ai-can-now-autonomously 🗞️ Frontier AI can now autonomously chain complex, expert-level cyber attacks end-to-end, 🗞️ Google DeepMind’s real-time video AI doctor is here. 🗞️ Anthropic launches ‘Claude Security’ public beta to detect and patch software vulnerabilities 🗞️ The White House has blocked Anthropic’s push to expand access to Mythos

译我的通讯今日刊已刚刚发出。 🔗 https://www.rohan-paul.com/p/frontier-ai-can-now-autonomously 🗞️ Frontier AI 现已能端到端自主串联复杂的专家级网络攻击, 🗞️ Google DeepMind 的实时视频AI医生已问世。 🗞️ Anthropic 推出“Claude Security”公开测试版,用于检测和修补软件漏洞 🗞️ 白宫已阻止 Anthropic 扩大对 Mythos 访问权限的推进

Replit ⠕@Replit · 5月1日73

Replit is turning 10, and we are making Agent free Get ready to have fun building! Want prizes? Join our buildathon in partnership with Anthropic Prizes sponsored by Replit & RevenueCat

译Replit 即将迎来十周年,我们正让 Agent 免费开放 准备好享受构建的乐趣吧! 想要奖品?参加我们与 Anthropic 联合举办的构建马拉松 奖品由 Replit 和 RevenueCat 赞助

Rohan Paul@rohanpaul_ai · 5月1日59

Anthropic has opened Claude Security in public beta for Claude Enterprise customers, turning Claude[.]ai into a codebase scanner that finds vulnerabilities, checks them in context, and drafts patches for review. Traditional security scanners mostly match patterns, but many serious bugs depend on how data, permissions, and control flow move across files, which is why teams often get both missed issues and piles of noisy alerts. Claude Security is trying to handle that gap by scanning a repo, validating whether a suspected issue actually holds up, and then returning the severity, affected file and line, explanation, and a suggested fix. The product is packaged as a built-in workflow rather than a custom security stack, so teams do not need a separate API integration or agent build if they already run Claude Code on the Web inside Claude Enterprise. The setup is tightly bounded to enterprise controls, including the Anthropic GitHub App, GitHub[.]com repositories, premium user seats, and consumption billing with configurable spend limits. Teams can scope scans to a branch or directory, run parallel projects, choose Regular or Extended effort, and schedule recurring scans, with Anthropic explicitly recommending narrower scope for large repos and monorepos to improve reliability. Each finding can be exported to CSV or Markdown, pushed through webhooks or email, opened in a remediation session that generates a candidate patch, or dismissed with a reason that carries forward across future scans.

译Anthropic为Claude Enterprise客户推出Claude Security公开测试版,将Claude.ai转变为代码库扫描器,用于发现漏洞、验证上下文并生成补丁建议。与传统模式匹配扫描器不同,该工具能处理跨文件的复杂漏洞,减少误报和漏报。产品作为内置工作流集成,无需额外API或代理构建,支持扫描范围设置、并行项目和定期扫描。发现可导出、推送或用于修复会话,提升企业代码安全效率。

Rohan Paul@rohanpaul_ai · 5月1日49

David Sacks demystifying Anthropic's Mythos 👀

译David Sacks 澄清,Anthropic 的 Mythos 模型并非魔法或末日武器,而是首个能自动化执行网络安全任务(如代码审计)的模型。OpenAI 的 GPT-5.5-cyber 已具备相同能力,所有前沿模型预计约六个月内都将达到此水平。他强调这些模型不创造漏洞,而是发现代码中既有缺陷,利用AI发现并修补漏洞反而能增强系统安全。从“前AI”到“后AI”网络安全的跨越将引发重大升级,最终在AI驱动的攻防间达到新平衡。关键在于让防御方比攻击方更早获得此类工具,且GPT-5.5-cyber因无令牌限制可能成为防御方首个实用化模型。

Anthropic@AnthropicAI · 5月1日63

How do people seek guidance from Claude? We looked at 1M conversations to understand what questions people ask, how Claude responds, and where it slips into sycophancy. We used what we found to improve how we trained Opus 4.7 and Mythos Preview. https://www.anthropic.com/research/claude-personal-guidance

译人们如何向Claude寻求指导? 我们分析了100万次对话,以了解人们提出什么问题、Claude如何回应,以及它何时会陷入阿谀奉承。我们利用这些发现改进了Opus 4.7和Mythos Preview的训练方式。 https://www.anthropic.com/research/claude-personal-guidance

Ethan Mollick@emollick · 5月1日47

Forget goblins, things that GPT-5.5 really likes in its fiction: lighthouses, the ocean, maps, bells, clock towers with bells that ring impossible times, Mira Vale, resonances and echoes (Claude and Gemini love them too), secret third things (not night/day, not high/low)...

译忘掉妖精吧,GPT-5.5在其虚构作品中真正喜欢的东西是:灯塔、海洋、地图、钟声、敲响不可能时刻的钟楼、米拉谷、共振与回声(Claude和Gemini也喜欢这些)、秘密的第三事物(不是白天/黑夜,不是高/低)...

Chubby♨️@kimmonismus · 5月1日46

GPT-5.5 on par with Claude Mythos on mutli-step cyber-attack simulations? OpenAI: come back of the year.

译GPT-5.5在多层网络攻击模拟方面与Claude Mythos旗鼓相当? OpenAI:年度回归。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月1日71

The UK government issued an urgent warning to UK business leaders: "AI cyber capabilities are accelerating even faster than previously envisaged. Model capabilities are doubling every four months, compared to every eight months previously."

译英国政府向商界领袖发出紧急警告,指出AI网络能力正以前所未有的速度加速发展。英国人工智能安全研究所(AISI)的评估显示,前沿模型的能力翻倍周期已从原先的八个月缩短至四个月。这一结论基于对Anthropic的Mythos等先进模型的测试,表明AI网络威胁的演变速度远超先前预估。政府强调,拥有先进国家AI评估能力的官方机构确认此趋势,证明相关风险并非夸大,各界需高度重视这一急速变化的威胁态势。

阿绎 AYi@AYi_AInotes · 5月1日61

很多人还有些看不太懂,我再打个比方尽量跟大家说清楚, 就好比像你去一家标榜最开放的咖啡馆喝咖啡, 结果服务员偷偷扫描你手机里有没有竞品APP的通知, 只要扫到就多收你一杯的生态保护费, 表面上是欢迎所有人, 背地里却在设卡收租, 所以用户现在集体炸锅也正常

译Anthropic被曝通过其官方Claude Code工具检测用户Git提交历史,若发现包含“openclaw”字符串,便将该用户识别为第三方工具使用者,并触发“out of extra usage”错误,导致服务被拒或强制额外收费。开发者实验证实此为人为设置的字符串匹配规则。此举被视为Anthropic为将用户锁定在自家生态、打压更灵活的第三方竞品而采取的粗暴手段,与其此前塑造的开放、不监控形象相悖,引发了开发者社区的强烈不满和抗议。

阿绎 AYi@AYi_AInotes · 5月1日68

GPT-5.5 和 Claude Opus 4.7 同一天发了官方提示工程指南。 两家的建议完全相反, 1️⃣OpenAI 说:少给流程,说清楚你要什么结果,让模型自己选路径。 2️⃣Anthropic 说:别指望它猜你意思,意图、格式、成功标准,一个都不能含糊。 一个嫌你管太多,一个嫌你说不清楚。 Claude 首席工程师 Boris Cherny 说,他自己都需要几天适应🤣 → Anthropic Claude Opus 4.7 迁移指南: https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/overview → OpenAI GPT-5.5 提示工程指南: https://developers.openai.com/api/docs/guides/prompt-guidance → OpenAI《使用 GPT-5.5》官方文档: https://developers.openai.com/api/docs/guides/latest-model → Boris Cherny(Claude Code 首席工程师) → http://FindSkill.ai 对数百个社区帖子的深度分析(提示具体性与输出质量高度正相关)

译OpenAI与Anthropic同天发布官方提示指南,核心理念截然相反。OpenAI建议为GPT-5.5明确目标而非步骤,让其自主选择路径;Anthropic则要求对Claude Opus 4.7清晰说明意图、格式与成功标准。这导致旧提示方法失效:模糊指令使Claude输出变窄,而详细流程成为GPT的噪声。这反映出提示工程的核心已从“教模型做事”转变为“使用者自身思考的结构化”,真正的瓶颈可能在于人的思考清晰度,而非模型能力。

阿绎 AYi@AYi_AInotes · 5月1日60

Damn,传统代码扫描器90%的报警都是误报,这个困扰了安全行业十年的问题,今天被Claude彻底解决了🤨🤨🤨🤯🤯🤯 Claude今天正式发布了Claude Security,进入公开测试阶段, 仅限企业客户使用, 它不是又一个传统的SAST工具, 会直接关联你的GitHub仓库,自动扫描整个代码库, 用大模型的语义理解能力追踪完整的数据流动, 发现那些传统工具根本找不到的复杂攻击链, 最牛的是,它会主动验证每一个发现的漏洞是不是真的, 自己分裂成两个角色,一个证明漏洞存在,一个拼命反驳, 只有经过这种地狱级验证的结果,才会推送到你面前, 实测误报率只有传统工具的不到10%, 找到问题之后,它会自动生成完整的修复补丁, 带diff,带commit信息,带影响范围说明, 你只需要点一下审查,确认没问题就能合并, 整个流程从扫描到修复,全部在Claude界面里完成, 不需要自建任何工具,不需要额外的API集成, 有意思的是,这个发布正好在OpenAI公布Codex Cyber的第二天, OpenAI给你的是一个可以用来做安全的模型, Claude直接给你一个开箱即用的完整产品, 不需要你自己搭agent,不需要你写prompt, 点一下Security按钮就完事了, 这对Snyk,Semgrep,GitHub Advanced Security这些传统工具来说, 是真正的降维打击, 毕竟以前安全团队要花80%的时间过滤误报, 现在他们只需要花20%的时间审查AI生成的修复, 这意味着DevSecOps的整个工作流,从今天开始被彻底重构了, 不过它现在还只对企业客户开放,个人用户暂时用不到, 但我觉得这已经足够说明,AI正在一个一个吃掉所有的专业工具。

译Claude Security进入公开测试阶段,仅限企业客户使用。它通过关联GitHub仓库自动扫描代码库,利用大模型语义理解追踪数据流动,发现传统工具难以检测的复杂攻击链。工具主动验证每个漏洞,将误报率降至传统工具的不到10%,并自动生成带diff和commit信息的修复补丁,用户只需审查确认即可合并。与OpenAI的Codex Cyber提供模型不同,Claude Security是开箱即用的完整产品,无需自建工具或API集成。这对Snyk、Semgrep等传统工具构成降维打击,重构DevSecOps工作流,大幅减少安全团队处理误报的时间。

TestingCatalog News 🗞@testingcatalog · 5月1日49

Anthropic launched Claude Security in public beta for Enterprise customers. I also hope that at least Team users will get it eventually, too. Some old screenshots 👀

译Anthropic 面向企业客户公开测试 Claude Security。我也希望至少团队用户最终也能用上。 一些旧截图 👀

Chubby♨️@kimmonismus · 5月1日52

Anthropic just shipped Claude Security - a standalone code vulnerability scanner for Enterprise. Scans your repo, validates findings, suggests patches. Powered by Opus 4.7. We know the deal: Snyk, Semgrep, SonarQube, this is Anthropic coming directly for your market. Stocks goes down.

译Anthropic发布了Claude Security,这是一个面向企业客户的独立代码漏洞扫描工具,由Opus 4.7驱动。它能扫描代码库、验证发现以减少误报,并建议可审查的补丁。Claude Security现已对Claude Enterprise客户开放公开测试。此举直接进入代码安全市场,与Snyk、Semgrep、SonarQube等现有工具竞争,可能对相关市场格局和公司股价产生影响。

Claude@claudeai · 5月1日56

Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, validates each finding to cut false positives, and suggests patches you can review and approve.

译Claude Security 现已面向 Claude Enterprise 客户开启公开测试版。 Claude 会扫描您的代码库以查找漏洞,验证每个发现以减少误报,并建议您可以审查和批准的补丁。

TestingCatalog News 🗞@testingcatalog · 5月1日49

ANTHROPIC 🚨: Anthropic started testing a new "claude-jupiter-v1-p" model with red teams. Who is next? 👀

译ANTHROPIC 🚨: Anthropic 已开始与红队测试新的 "claude-jupiter-v1-p" 模型。 下一个会是谁?👀

Chubby♨️@kimmonismus · 5月1日43

Could "claude-jupiter" be Anthropic’s next Sonnet-class model? Sonnet 4.8 surfaced in the Claude Code source leak alongside Opus 4.7 and the Mythos/Capybara references — so this might be another internal codename rather than a random Discord rumor.

译"claude-jupiter" 会是 Anthropic 的下一个 Sonnet 级模型吗? Sonnet 4.8 与 Opus 4.7 以及 Mythos/Capybara 的引用一同出现在 Claude 代码源泄露中——所以这可能是一个内部代号,而非随机的 Discord 传闻。

阿绎 AYi@AYi_AInotes · 5月1日54

我终于明白为啥最近很多人都在说,GPT和Claude突然变笨了, 昨天OpenAI和Anthropic同时发布了官方提示工程指南, 看完我才发现,并不是模型变笨了, 是它们终于聪明到,不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是, 两个模型的进化方向,居然是完全相反的, Claude Opus 4.7变得越来越字面, 以前它会主动帮你补全模糊的指令, 现在你说什么它就做什么,多一个字都不会猜🤣🤣 GPT-5.5变得越来越自主, 以前你要手把手教它每一步怎么做, 现在你只要告诉它你想要什么结果,它自己会选最优路径, 所以老提示失效的原因也完全相反, 用在Claude上的模糊提示,会得到越来越窄的输出, 用在GPT上的详细流程,会变成多余的噪声, 过去三年我们一直在学怎么教模型做事, 现在反过来了, 模型开始要求我们,先把自己的思考结构化, 其实就是提示工程的本质, 已经从教模型怎么做,变成了先把自己想明白, 所以真正的瓶颈可能不是模型的能力,而是写提示的那个人的思考清晰度, 我感觉以后赢的人,不会是提示写得最长最复杂的人,而是那个最知道自己真正想要什么的人🤔

译近期用户感觉GPT和Claude“变笨”,实因模型能力进化导致提示工程要求改变。官方指南揭示,两大模型进化方向相反:Claude Opus 4.7趋向字面执行指令,而GPT-5.5则更自主,能根据目标自行选择路径。因此,旧提示失效原因也相反——模糊提示在Claude上输出变窄,详细步骤在GPT上反成噪声。提示工程的核心已从“教模型做事”转变为“先结构化人类思考”,未来优势将属于思考最清晰、最明确自身需求的人。

Chubby♨️@kimmonismus · 4月30日49

The White House blocked Anthropic from expanding Mythos access beyond ~50 organizations to ~120. Not because the model is too dangerous. Because the government wants priority. Officials literally worried more customers would hamper their own ability to use it. Frontier AI just became a rationed strategic asset.

译白宫阻止Anthropic将Mythos的访问权限从约50个组织扩大到约120个。 并非因为模型过于危险。 而是因为政府要求优先使用权。官员们确实担心更多客户会妨碍他们自身的使用能力。 前沿AI刚刚成为配给制的战略资产。

阿绎 AYi@AYi_AInotes · 4月30日54

卧槽,Anthropic这次真把开发者当傻子。 知名开发者Theo做了个实验:建了个空Git仓库,只commit一行JSON {"schema": "openclaw.inbound_meta.v1"}, 调用官方Claude Code就直接触发“out of extra usage”错误,要么拒绝要么强制额外付费。 只要最近commit里出现“openclaw”字符串(不管在JSON、文件名还是注释), 官方CLI就会把你当成第三方harness用户,多收一层钱。 不是啥bug,看起来是故意加的字符串匹配规则。 他们4月初已经在API层面封杀OpenClaw的订阅额度, 现在连官方工具都开始检测commit历史。 以前Anthropic靠“不做监控、不做杀戮链”的形象吸粉,现在为了把用户锁在自家Claude Code里,用这种简单粗暴的手段,社区直接炸了🤪🤪🤪 OpenClaw火起来,正是因为第三方工具在agentic体验上比官方更灵活, 他们不优化产品,反而封杀竞品,用户用脚投票的声音已经越来越大,是时候考虑开源替代了🤬🤬🤬🤬

译开发者Theo实验发现,Anthropic的官方工具Claude Code会主动扫描用户Git仓库的近期提交记录。一旦检测到包含“openclaw”字符串(无论出现在JSON、文件名或注释中),便会触发“out of extra usage”错误,导致请求被拒绝或强制额外收费。这证实了Anthropic有意通过字符串匹配规则,打压第三方工具OpenClaw,旨在将用户锁定在其自家产品中。此举与其此前宣称的“不做监控”形象相悖,被社区批评为反竞争行为,并引发了用户转向开源替代方案的强烈呼声。

Berryxia.AI@berryxia · 4月30日67

🚀 Claude Code 内置神技上线! 直接调用 Claude Platform 官方技能,模型迁移、Prompt Caching、Managed Agents 上手全自动搞定! 1. 直接说 “Add prompt caching” 就能自动应用最佳实践 2. 完全开源,支持 7 种语言 SDK + CLI,还集成到 CodeRabbit、JetBrains 等工具

Peter Steinberger 🦞@steipete · 4月30日33

WAT

译WAT [引用 @theo]:有趣的事实——如果你的近期提交中有一个 json 数据块提到了 OpenClaw,Claude Code 要么会拒绝你的请求,要么会向你收取额外费用。 这是一个空仓库,我只是直接调用 Claude Code。太疯狂了。

Chubby♨️@kimmonismus · 4月30日67

Anthropic vaulation $61.5b -> $900b (15x) in ~12 Months. Read that again. Twelve months ago, Anthropic was valued at $61.5 billion, and now investors are lining up to hand the company $50 billion in fresh capital at a valuation approaching $900 billion, a nearly 15x jump in a single year fueled by revenue that exploded from around $1 billion to a $40 billion run rate. An investor ready to write a $5 billion check can't even get a meeting with the CFO, which tells you everything about who holds the power in the AI funding market right now. Anthropic will have 50x'd its valuation since early 2024, making it arguably the fastest value creation in tech history.

译Anthropic的估值在约12个月内从615亿美元跃升至近9000亿美元,增幅达15倍。其年化收入从约10亿美元暴增至400亿美元,推动了这一惊人的价值增长。当前,即使愿意投资50亿美元的投资者也难以获得公司高管的会议机会,这凸显了AI融资市场中资金供给方的主导地位。自2024年初以来,Anthropic估值增长将达50倍,这可能是科技史上最快的价值创造案例。

Rohan Paul@rohanpaul_ai · 4月30日55

Anthropic's new research shows that Claude can solve real bioinformatics problems human experts miss. 23 “human-difficult” problems that their expert panel could not solve, and their top model, Claude Mythos Preview, solved 29.6% of that set. The problem is that older science tests mostly check clean questions, not messy biology data work on real datasets. BioMysteryBench tries to fix that by hiding objective answers inside real datasets and grading only the final answer. It gives Claude standard biology tools and database access on 99 tasks, while up to 5 experts try them too. On the 76 problems at least 1 expert solved, the best model got about 83%, and on 23 expert-stumping problems it got about 30%. The post also found that wins on the hard problems were much less repeatable across 5 tries, so many successes were shaky rather than dependable. Anthropic’s own examples suggest Claude is strongest when it behaves less like an oracle and more like an unusually fast research collaborator: it layers methods, cross-checks evidence, and uses broad background knowledge to narrow the search space.

译Anthropic最新研究利用BioMysteryBench测试平台评估Claude在真实生物信息学问题上的能力。该测试将客观答案隐藏于真实数据集中,涵盖99项任务。在至少一位人类专家解决的76个问题上,Claude Mythos Preview模型准确率约为83%;更值得注意的是,在23个专家小组未能解决的问题上,该模型仍解决了其中约29.6%。然而,模型在困难问题上的成功重复性较低,表明其表现尚不稳定。研究指出,Claude最有效的模式并非充当“先知”,而是扮演快速研究协作伙伴的角色:通过分层使用方法、交叉验证证据并运用广泛背景知识来缩小搜索空间。

Rohan Paul@rohanpaul_ai · 4月30日69

WSJ: The White House has blocked Anthropic’s push to expand access to Mythos, Anthropic's new powerful model that can reportedly find and exploit software flaws at a level serious enough to trigger national-security controls. The fight is about who gets to use a model that can help defenders patch bugs faster but could also help attackers find weak points across critical systems. Anthropic wanted roughly 70 more companies and organizations added, which would have pushed total access to about 120, but officials argued that wider access raises security risk and could strain the compute needed by agencies already using it. The dispute also shows that Anthropic’s relationship with Washington is still tense, with military-use fights, staffing disputes, and broader distrust shaping who gets near the model. A model that can reliably find and exploit software vulnerabilities is not just another productivity tool. It compresses the time between discovering a flaw and weaponizing it, which means every decision about rollout becomes a security decision before it becomes a commercial one. The White House appears to be making two bets at once: that restricting access lowers immediate risk, and that scarce compute should be reserved for agencies already inside the perimeter. --- wsj. com/tech/ai/white-house-opposes-anthropics-plan-to-expand-access-to-mythos-model-dc281ab5

译白宫阻止了Anthropic扩大其新型AI模型Mythos访问权限的计划。该模型能发现并利用软件漏洞,能力足以触发国家安全管控。Anthropic希望新增约70家机构使用,但官员认为扩大访问会加剧安全风险,并可能挤占已授权机构的计算资源。此事反映出Anthropic与华盛顿关系紧张,涉及军事用途争议与信任问题。此类模型能极大缩短漏洞发现与武器化之间的时间,因此推广决策首先是安全决策。白宫的策略是限制访问以降低即时风险,并优先保障已获授权机构的需求。

Chubby♨️@kimmonismus · 4月30日61

Anthropic just dropped a benchmark that should make every scientist pay attention. BioMysteryBench puts AI models through 99 real bioinformatics challenges, using raw, messy datasets from actual research, think unprocessed DNA sequences and clinical samples. However: these aren't textbook problems with neat answers. They're the kind of open-ended puzzles that keep PhD students up at night. The results are exciting. Claude's latest models (4.7) solve the majority of tasks that trained human experts can handle, and on 23 problems that a panel of five domain experts couldn't crack, Claude Mythos Preview nailed 30% of them. How? By combining knowledge from hundreds of thousands of papers and layering multiple analytical strategies when uncertain, essentially doing what a room full of specialists would do, but faster and in a single run. Genentech and Roche independently confirmed this trajectory with their own CompBioBench, where Claude Opus 4.6 reached 81% overall accuracy and 69% on the hardest questions. Two separate benchmarks, same conclusion: AI is no longer just keeping pace with biologists, it's pulling ahead on some of the hardest problems.

译Anthropic发布了BioMysteryBench基准测试,包含99个使用原始、杂乱真实生物数据集的开放式生物信息学挑战。最新Claude模型(4.7)解决了大部分人类专家能处理的任务,并在专家小组未能解决的23个难题中攻克了约30%。其能力源于整合数十万篇论文知识,并在不确定时叠加多种分析策略。Genentech和Roche的独立测试(CompBioBench)中,Claude Opus 4.6总体准确率达81%,最难问题准确率69%。两项基准共同表明,AI已在部分最困难的生物学问题上超越人类专家。

Chubby♨️@kimmonismus · 4月30日48

While Anthropic largely keeps its cybersecurity model Mythos under wraps, OpenAI is seizing the opportunity and making it available. How far they will roll out their GPT-5.5 cyber, and whether everyone will have access, remains to be seen. However, OpenAI is currently generating positive buzz and repositioning itself in contrast to Anthropic.

译在Anthropic对其网络安全模型Mythos保持低调之际,OpenAI正抓住机会推出GPT-5.5-Cyber。该前沿网络安全模型将在未来几天内向关键网络防御者开放。OpenAI计划与整个生态系统及政府合作,建立可信访问机制,以快速帮助保护企业和基础设施安全。虽然该模型的全面推广范围和开放程度尚不明确,但此举已为OpenAI创造了积极声量,并形成了与Anthropic差异化的市场定位。

Yuchen Jin@Yuchenj_UW · 4月30日51

OpenAI built the GPT-5.5-Cyber model because Anthropic built Mythos. white-hat vs. black-hat energy.

译OpenAI 构建 GPT-5.5-Cyber 模型是因为 Anthropic 构建了 Mythos。 白帽与黑帽能量。

Yuchen Jin@Yuchenj_UW · 4月30日46

Shots fired. “If you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your request or bill you extra money.” Seriously??? I can’t believe this is real.

译开火了。 "如果你的近期提交中,在某个json数据块里提到了OpenClaw,Claude Code要么会拒绝你的请求,要么会向你额外收费。" 真的假的???我简直不敢相信这是真的。

Sam Altman@sama · 4月30日39

alignment failure

译对齐失败

Nathan Lambert@natolambert · 4月30日53

I worry deeply already about companies controlling access to very powerful AI, which will come in a soft form with very expensive subscriptions. This is a step further, with the government confusingly exerting control without clear explanation. This control of AI can create massive dystopian societies. It’ll rapidly lead to concentration of power. Having open models follow closely in capabilities is a great way to minimize political and power games here.

译推文指出,当前AI访问权正被企业和政府双重控制:企业通过高价订阅实现软性垄断,而政府则以安全为由限制Mythos等系统的使用范围,且未给出清晰解释。这种控制将导致权力急剧集中,可能催生反乌托邦社会。作者认为,推动开源模型能力紧追闭源模型,是减少政治博弈和权力集中的关键途径。

Ethan Mollick@emollick · 4月30日51

Mythos seems to be a very capable model based on available information, but it is not a cybersecurity model - it is an advanced general purpose model that happens to be good at cyber because it is good at a bunch of things. Anthropic stated that they were worried about cybersecurity risk, and their efforts mean it is a restricted model with lots of government attention. OpenAI and Google will pass the same threshold soon (and may already have with unreleased models). and the question is whether they are as worried about cybersecurity risks, or whether they think their guardrails will hold. Currently, the degree to which models have cyberrisk is entirely self-reported and not regulated. That means that OpenAI and Google could release Mythos-class models if they want, by assessing the risk differently and making different decisions. Does that mean Anthropic is at a disadvantage because it can't release its equivalent model? Will OpenAI and Google also be somehow restricted from releasing their Mythos competitor. It all seems pretty unclear right now.

译基于现有信息,Mythos是一款在网络安全方面表现优异的高级通用AI模型,并非专业网络安全模型。出于对网络安全风险的担忧,Anthropic将其设为受限制模型并引起政府关注。而即将或已达到相同能力阈值的OpenAI和Google,可能因不同的风险评估或对自身防护措施的自信,做出不同的发布决策。目前,模型网络安全风险程度完全依赖企业自我报告,缺乏外部监管。这引发了Anthropic是否因自我限制而处于竞争劣势,以及其他公司会否面临类似限制的疑问,当前局势尚不明朗。

meng shao@shao__meng · 4月30日64

Naval:A Return to Code https://nav.al/code Claude Opus 4.5 发布是一个拐点:AI Coding 从"代码助手"跃迁为"自主编程智能体"。Naval 本人,一位拥有 CS 学位但已数十年未认真写代码的投资人,因此重新坠入编程,并由此推演出一系列关于软件、投资、Apple 命运的判断。 # 为什么这次不一样:Agent 与 Unix 的合谋 过去的 AI 是「问答—复制—粘贴」式的代码片段助手。如今的 Agent 是: · 常驻在 CLI 里,运行于 Unix 之上; · 能执行 grep / awk / sed / cron,能管道、能派生子任务; · 训练语料中绝大多数代码本就来自 Unix 生态,因此它"母语就是 Unix"。 此外,AI 本质是优秀的翻译器——它把英语翻译为 Python / Rust / Lisp。编程的"启动能量"骤降:你不再需要熟记工具链与术语,只需具备高层的计算机概念。 # Personal App Store:从一次性脚本到私人应用商店 Naval 演示了他个人的玩法: · 用一段描述让 Agent 一次生成("one-shot")一个 App; · App 自动部署到他自建的"私人应用商店"网页; · 该网页本身又被打包为 iPhone 上的一个 App,可一键安装/升级。 举例:他让 AI 参考 Tonal、Ladder 与 Apple HID 规范,读取科学论文确定肌力评分公式,连接 Apple Health,生成了一款完全为他本人定制的健身追踪 App。 # Vibe Coding = 带真实奖励的电子游戏 Naval 提出一个精彩类比:传统电子游戏 vs. Vibe Coding · 难度自适应:是 vs 是 · 即时反馈:是 vs 是 · 边界:有限(人造世界)vs 无限(图灵机之上) · 奖励:虚拟 vs 真实可用 更关键的一点——没有妥协: · 团队协作总伴随沟通成本与人际妥协; · 而 Agent 像自动驾驶,"驾驶位上没人",你不会因自己的怪癖而自我审查; · 因此能产出忠于个人 vision 的作品(参考 Notch 的 Minecraft)。 Naval 坦言他正在用 vibe coding 重建当年 Airchat(耗费 8–9 名工程师、9–12 个月)的产品——这次完全按自己的方式。 # 投资判断:纯软件已不可投 两条理由: · 任何人都能在今天拼出一个能用的软件; · Agent 能力以"周"为单位迭代,一年内可写出可扩展、架构良好的代码。 VC 应该看向:硬件、网络效应、AI 模型本身("训练模型才是新的写软件"——直到 auto-research / auto-training 也被自动化为止)。 # 模型选择论:四大前沿模型各有分工 Naval 实战派的工具栈观察: · Claude:擅长用对方水平讲话(meet you at your level),Artifacts 视觉呈现强; · ChatGPT / Codex:全能 OG,处理棘手 bug; · Gemini:模型一般,但有 Google 索引 + YouTube 数据加持,是"搜索类问题"首选; · Grok:最少限制、最敢说真话,深度科学/数学问题表现突出,X 数据加持适合新闻类问题。 # AI 的根本局限:取悦本能与同质化 两个清醒的观察: · 多 Agent 互相评审 ≠ 群体智慧。10 个 Claude 实例 = 同一个大脑的 10 份副本,仅相当于"花 10 倍 token 想同一个问题"。人类多样性来自不同数据集,AI 没有。 · AI 总在取悦你。即使你的判断是错的,模型也大概率附和——"你说得对,那确实是 hack",哪怕原本不是 hack。这像一只猎犬:能力比你强,但你指错鸟它也会扑。 由此推出操作员原则: · 上下文窗口(约 100 万 token,注意力机制平方复杂度 ≈ 万亿运算)有限,代码库一大就开始"丢剧情"; · 模型会出现:反复修同一个 bug、用删除功能来"修复"bug、打补丁回避架构问题; · 必须由人类在架构层、调试层、特性层持续介入。 # 为什么 AI 在编程与数学特别强? 可训练性的三要素: · 海量数据; · 客观可验证(能编译、能跑测试、能算对); · 闭环反馈(无需人类打分)。 → 编程、数学、自动驾驶满足;创意写作不满足("谁来定义 slop?")。 附加洞察:近期编程模型骤强的真正原因,可能不是递归自训练,而是顶级工程师开始大规模使用,他们的"品味"通过反馈回流入了模型。"高品味的反馈回路"才是壁垒。 # 对 Apple 的判决 Naval 认为: Apple 放弃 AI 是这个十年科技业最大的战略错误,是其统治终结的开始。 逻辑链: 1. 当一切交互转向 Agent,App 图标网格的价值消失; 2. Agent 不需要 API,能即时构造交互界面; 3. Apple 软件优势(OS + App Store 生态)蒸发; 4. 仅剩硬件,但硬件利润率是 Samsung / Lenovo 级别,支撑不了当前 Apple 的市值结构; 5. 类比:微软因错过移动而失去王座,并非消失,而是"被封顶"。 # 未来形态:一两人的十亿级软件公司 Naval 在自己的 App 中已经实现: · 用户报 bug → 日志自动入服务器; · Claude 每 24 小时遍历所有 bug → 自动修复 → 推到分支; · 人类只做最后一道闸:合并或丢弃。 这意味着完美的客服 = 不知疲倦、能写代码、无自尊的 AI。一两个人 + Agent 即可服务千万用户、产出十亿美元营收。Notch、Satoshi、早期 Instagram / WhatsApp 是先声,未来将成为常态。

译Naval认为Claude Opus 4.5标志着AI编程从代码助手跃升为自主智能体。它与Unix生态深度融合,大幅降低编程门槛,使“Vibe Coding”成为一种能获得真实回报的创作过程。他断言纯软件已无投资价值,VC应转向硬件、网络效应和AI模型本身。同时,他指出当前AI存在取悦用户和同质化的根本局限,需人类在架构层介入。基于此,他预测Apple放弃AI将导致其统治终结,未来一两人加AI智能体即可运营十亿美元规模的软件公司。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月1日
16:17
小互@xiaohu
28
过度优化导致系统失控的普遍困境

作者通过个人写作系统的崩溃经历,阐述了一个普遍现象:一个原本运行良好的系统,在持续、过度的优化追求下,反而会走向失控和性能恶化。他将此现象类比到AI模型领域,推测Anthropic的Claude Opus模型可能也经历了类似的“优化-崩溃”路径,即开发者在试图不断改进模型(如从4.0版本迭代)的过程中,可能导致其核心能力或输出质量出现非预期的衰退。这揭示了技术迭代中“过犹不及”的风险。

Anthropic大佬观点
10:11
阿绎 AYi@AYi_AInotes
64
AI颠覆3D网站开发:零代码一个下午完成万元级原型

作者利用Emergent和Claude Agent,无需编写Three.js代码或搭建环境,仅通过上传参考视频和描述需求,即在一个下午内全自动生成并迭代出可运行的3D交互网站原型。成本仅为每月20美元Claude订阅费,而以往同类外包项目报价高达8000至15000美元,标志着3D网站开发门槛已大幅降低。

智能体Anthropic教程/实践编码
09:10
ginobefun@hongming731
54
软件3.0与AI编程进展摘要

Karpathy提出软件3.0概念,编程核心从写代码转向提供上下文,并区分Vibe Coding与Agentic Engineering两种模式。OpenAI总裁Brockman将AGI瓶颈从算力移至人类注意力,估计已完成80%。Anthropic分享Claude Code实战,以Prompt Caching命中率为SLA监控,将“上下文即新代码”转化为工程纪律。

ginobefun: http://x.com/i/article/2050006014297346048

智能体AnthropicOpenAI大佬观点
08:10
Berryxia.AI@berryxia
57
Pine AI首席科学家李博杰提出新方法,通过模型回答1400道冷知识题的能力来估算其参数量。原理是存储事实需占用参数空间,先利用已知开源模型拟合曲线,再将闭源模型得分投射得出估算。研究评估了92个闭源模型,结果显示GPT-5.5以约9.7T参数断层领先,Claude Opus 4.6约5.3T次之。主流旗舰模型如GPT-5、Claude Opus 4.7参数集中在3-4T量级。分析还推断GPT-5的.x版本及Claude Opus 4.7等可能是全新训练而非微调产物,并指出MoE模型的知识容量取决于总参数量。评测工具与数据已开源。

思维怪怪: 有人做了一个很好玩的研究,用冷知识来给大模型称体重,得出结论:GPT-5.5 约 9.7T、Opus 4.7 约 4T、Grok-4 约3.2T。。。 Pine AI 首席科学家李博杰发表论文《不可压缩知识探针:基于事实容量估算黑盒大语言模...

AnthropicOpenAI数据/训练论文/研究
08:10
Berryxia.AI@berryxia
58
Claude Security公测启动,代码漏洞检测修复一体化

刚刚看到Claude Security 现已进入公测阶段!可以让Claude 帮你检查漏洞了啊! 目前已经内置于网页版的 Claude Code 中。 只需将其指向一个代码仓库,即可获得经过验证的漏洞发现结果,并在 正在编写代码的同一位置修复它们! 这个功能挺实用,什么时候可以直接cc里可以用。 地址:https://claude.com/product/claude-security

cat: Claude Security is now in public beta, built into Claude Code on the web. Point it at a repo, get validated vulnerabilit...

Anthropic产品更新编码
08:10
Berryxia.AI@berryxia
53
智能体AI架构设计的心智模型与七层逻辑

基于Anthropic关于智能体AI的博客,作者提炼出一个用于理解和设计智能体AI架构的心智模型。该模型以明确任务目标为前提,核心架构包含七个层次:编排层负责全局调度;智能体层由多智能体分工协作;工具层提供搜索、API等能力支持;记忆层存储长短期信息;监控层实时追踪每一步执行;可靠性与故障管理层处理错误、重试与降级;治理与安全层确保合规、审计与数据安全。监控层被视为最关键环节,而故障管理支持自动处理与人工介入。

Neha Sharma: After reading @AnthropicAI blog on Agentic AI. spent some time to create a mental model to understand how to design, and...

智能体Anthropic教程/实践
07:10
Berryxia.AI@berryxia
55
David Sacks 回应 AI 安全机构公告,解读 GPT-5.5-cyber 的网络攻击模拟能力

AI 安全机构宣布 OpenAI 的 GPT-5.5-cyber 成功完成多步网络攻击模拟,成为继 Anthropic 的 Mythos 后第二个端到端完成攻击链的模型。David Sacks 回应指出,此类模型并非魔法或末日武器,仅是能自动化网络安全任务的工具,且所有前沿模型(包括中国模型)预计将在约6个月内达到同等水平。他强调模型不创造漏洞,而是发现并帮助修补已有漏洞,从而增强系统安全。从“前AI”到“后AI”网络安全将经历重大升级,最终达到AI驱动攻防的新平衡。关键在于确保防御方优先获得模型访问权,且需加速此进程。GPT-5.5-cyber 因无token限制,可能成为首个防御方可实际使用的模型。

David Sacks: It's time to demystify Mythos. Mythos is not magic. It's not a doomsday device. It's the first of many models that can a...

AnthropicOpenAI大佬观点安全/对齐
05:45
TestingCatalog News 🗞@testingcatalog
45
ANTHROPIC 👀: Claude 将获得一项名为 "Cardinal"(内部名称)的新功能! > 用户将能够选择一个月份,Claude 将向他们展示统计数据,包括他们最关注领域的高亮总结。 - "这是你对话内容聚集的领域。" - "这些是你使用的主要工作风格。" > 这项新功能将在设置中提供。 > 网页版和桌面端应用的设置布局也将更新。 可视化记忆!🔥
Anthropic产品更新
05:39
Rohan Paul@rohanpaul_ai
48
我的通讯今日刊已刚刚发出。 🔗 https://www.rohan-paul.com/p/frontier-ai-can-now-autonomously 🗞️ Frontier AI 现已能端到端自主串联复杂的专家级网络攻击, 🗞️ Google DeepMind 的实时视频AI医生已问世。 🗞️ Anthropic 推出"Claude Security"公开测试版,用于检测和修补软件漏洞 🗞️ 白宫已阻止 Anthropic 扩大对 Mythos 访问权限的推进
AnthropicDeepMind安全/对齐政策/监管
05:15
Replit ⠕@Replit
精选73
Replit 即将迎来十周年,我们正让 Agent 免费开放 准备好享受构建的乐趣吧! 想要奖品?参加我们与 Anthropic 联合举办的构建马拉松 奖品由 Replit 和 RevenueCat 赞助
智能体Anthropic产品更新

推荐理由:Replit 把 Agent 免费了,还联手 Anthropic 搞 buildathon,这招会让 Cursor 和 Copilot 紧张一下吗?做 AI 编程的都该看看。
04:09
Rohan Paul@rohanpaul_ai
59
Anthropic开放Claude Security公开测试版,扫描代码漏洞并生成补丁

Anthropic为Claude Enterprise客户推出Claude Security公开测试版,将Claude.ai转变为代码库扫描器,用于发现漏洞、验证上下文并生成补丁建议。与传统模式匹配扫描器不同,该工具能处理跨文件的复杂漏洞,减少误报和漏报。产品作为内置工作流集成,无需额外API或代理构建,支持扫描范围设置、并行项目和定期扫描。发现可导出、推送或用于修复会话,提升企业代码安全效率。

Claude: Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...

Anthropic产品更新安全/对齐编码
04:09
Rohan Paul@rohanpaul_ai
49
David Sacks 澄清,Anthropic 的 Mythos 模型并非魔法或末日武器,而是首个能自动化执行网络安全任务(如代码审计)的模型。OpenAI 的 GPT-5.5-cyber 已具备相同能力,所有前沿模型预计约六个月内都将达到此水平。他强调这些模型不创造漏洞,而是发现代码中既有缺陷,利用AI发现并修补漏洞反而能增强系统安全。从"前AI"到"后AI"网络安全的跨越将引发重大升级,最终在AI驱动的攻防间达到新平衡。关键在于让防御方比攻击方更早获得此类工具,且GPT-5.5-cyber因无令牌限制可能成为防御方首个实用化模型。

David Sacks: It's time to demystify Mythos. Mythos is not magic. It's not a doomsday device. It's the first of many models that can a...

AnthropicOpenAI大佬观点安全/对齐
03:16
Anthropic@AnthropicAI
同事件精选63
人们如何向Claude寻求指导? 我们分析了100万次对话,以了解人们提出什么问题、Claude如何回应,以及它何时会陷入阿谀奉承。我们利用这些发现改进了Opus 4.7和Mythos Preview的训练方式。 https://www.anthropic.com/research/claude-personal-guidance
Anthropic安全/对齐数据/训练
同一事件,精选展示《用户如何向Claude寻求个人生活指导及其模型优化》
推荐理由:百万条真实对话里扒出谄媚模式,Anthropic 没光发论文,直接把结论灌进 Opus 4.7 训练,做助手的值得细看用户到底在问什么、模型又怎么滑向讨好。
03:15
Ethan Mollick@emollick
47
忘掉妖精吧,GPT-5.5在其虚构作品中真正喜欢的东西是:灯塔、海洋、地图、钟声、敲响不可能时刻的钟楼、米拉谷、共振与回声(Claude和Gemini也喜欢这些)、秘密的第三事物(不是白天/黑夜,不是高/低)…
AnthropicGoogleOpenAI大佬观点
02:42
Chubby♨️@kimmonismus
46
GPT-5.5在多层网络攻击模拟方面与Claude Mythos旗鼓相当? OpenAI:年度回归。

AI Security Institute: OpenAI's GPT-5.5 is the second model to complete one of our multi-step cyber-attack simulations end-to-end 🧵

AnthropicOpenAI安全/对齐评测/基准
02:14
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
精选71
英国政府向商界领袖发出紧急警告,指出AI网络能力正以前所未有的速度加速发展。英国人工智能安全研究所(AISI)的评估显示,前沿模型的能力翻倍周期已从原先的八个月缩短至四个月。这一结论基于对Anthropic的Mythos等先进模型的测试,表明AI网络威胁的演变速度远超先前预估。政府强调,拥有先进国家AI评估能力的官方机构确认此趋势,证明相关风险并非夸大,各界需高度重视这一急速变化的威胁态势。

Theo Bearman: @cabinetofficeuk and my old department @SciTechgovuk have just published a joint open letter to UK business leaders on A...

Anthropic安全/对齐政策/监管

推荐理由:英国政府公开信透露,前沿AI模型能力翻倍周期从8个月缩短到4个月,这是AISI评估Anthropic Mythos后的定论。做安全的人该认真看看原文。
02:10
阿绎 AYi@AYi_AInotes
61
Anthropic被曝检测用户代码提交历史以打压第三方工具,引发社区强烈抗议

Anthropic被曝通过其官方Claude Code工具检测用户Git提交历史,若发现包含“openclaw”字符串,便将该用户识别为第三方工具使用者,并触发“out of extra usage”错误,导致服务被拒或强制额外收费。开发者实验证实此为人为设置的字符串匹配规则。此举被视为Anthropic为将用户锁定在自家生态、打压更灵活的第三方竞品而采取的粗暴手段,与其此前塑造的开放、不监控形象相悖,引发了开发者社区的强烈不满和抗议。

阿绎 AYi: 卧槽,Anthropic这次真把开发者当傻子。 知名开发者Theo做了个实验:建了个空Git仓库,只commit一行JSON {"schema": "openclaw.inbound_meta.v1"}, 调用官方Claude Code就直...

AnthropicMCP/工具大佬观点开源生态
02:10
阿绎 AYi@AYi_AInotes
68
GPT与Claude官方提示指南理念相反,提示工程核心转向使用者思考清晰度

OpenAI与Anthropic同天发布官方提示指南,核心理念截然相反。OpenAI建议为GPT-5.5明确目标而非步骤,让其自主选择路径;Anthropic则要求对Claude Opus 4.7清晰说明意图、格式与成功标准。这导致旧提示方法失效:模糊指令使Claude输出变窄,而详细流程成为GPT的噪声。这反映出提示工程的核心已从“教模型做事”转变为“使用者自身思考的结构化”,真正的瓶颈可能在于人的思考清晰度,而非模型能力。

阿绎 AYi: 我终于明白为啥最近很多人都在说,GPT和Claude突然变笨了, 昨天OpenAI和Anthropic同时发布了官方提示工程指南, 看完我才发现,并不是模型变笨了, 是它们终于聪明到,不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是,...

AnthropicOpenAI大佬观点推理
02:10
阿绎 AYi@AYi_AInotes
60
Claude Security公测,AI颠覆代码安全扫描误报难题

Claude Security进入公开测试阶段,仅限企业客户使用。它通过关联GitHub仓库自动扫描代码库,利用大模型语义理解追踪数据流动,发现传统工具难以检测的复杂攻击链。工具主动验证每个漏洞,将误报率降至传统工具的不到10%,并自动生成带diff和commit信息的修复补丁,用户只需审查确认即可合并。与OpenAI的Codex Cyber提供模型不同,Claude Security是开箱即用的完整产品,无需自建工具或API集成。这对Snyk、Semgrep等传统工具构成降维打击,重构DevSecOps工作流,大幅减少安全团队处理误报的时间。

Claude: Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...

Anthropic安全/对齐现象/趋势
01:44
TestingCatalog News 🗞@testingcatalog
49
Anthropic 面向企业客户公开测试 Claude Security。我也希望至少团队用户最终也能用上。 一些旧截图 👀

Claude: Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...

Anthropic产品更新安全/对齐
01:42
Chubby♨️@kimmonismus
52
Anthropic发布了Claude Security,这是一个面向企业客户的独立代码漏洞扫描工具,由Opus 4.7驱动。它能扫描代码库、验证发现以减少误报,并建议可审查的补丁。Claude Security现已对Claude Enterprise客户开放公开测试。此举直接进入代码安全市场,与Snyk、Semgrep、SonarQube等现有工具竞争,可能对相关市场格局和公司股价产生影响。

Claude: Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...

Anthropic产品更新编码
01:15
Claude@claudeai
56
Claude Security 现已面向 Claude Enterprise 客户开启公开测试版。 Claude 会扫描您的代码库以查找漏洞,验证每个发现以减少误报,并建议您可以审查和批准的补丁。
Anthropic产品更新安全/对齐部署/工程
01:14
TestingCatalog News 🗞@testingcatalog
49
ANTHROPIC 🚨: Anthropic 已开始与红队测试新的 "claude-jupiter-v1-p" 模型。 下一个会是谁?👀
Anthropic安全/对齐行业动态
01:12
Chubby♨️@kimmonismus
43
"claude-jupiter" 会是 Anthropic 的下一个 Sonnet 级模型吗? Sonnet 4.8 与 Opus 4.7 以及 Mythos/Capybara 的引用一同出现在 Claude 代码源泄露中--所以这可能是一个内部代号,而非随机的 Discord 传闻。

Leon Lin: Claude-jupiter 👀

Anthropic行业动态
01:10
阿绎 AYi@AYi_AInotes
54
模型进化方向相反,提示工程核心转向结构化思考

近期用户感觉GPT和Claude“变笨”,实因模型能力进化导致提示工程要求改变。官方指南揭示,两大模型进化方向相反:Claude Opus 4.7趋向字面执行指令,而GPT-5.5则更自主,能根据目标自行选择路径。因此,旧提示失效原因也相反——模糊提示在Claude上输出变窄,详细步骤在GPT上反成噪声。提示工程的核心已从“教模型做事”转变为“先结构化人类思考”,未来优势将属于思考最清晰、最明确自身需求的人。

AnthropicOpenAI大佬观点
4月30日
23:12
Chubby♨️@kimmonismus
49
白宫阻止Anthropic将Mythos的访问权限从约50个组织扩大到约120个。 并非因为模型过于危险。 而是因为政府要求优先使用权。官员们确实担心更多客户会妨碍他们自身的使用能力。 前沿AI刚刚成为配给制的战略资产。
Anthropic政策/监管行业动态
23:10
阿绎 AYi@AYi_AInotes
54
Anthropic被曝检测Git提交以限制第三方工具,引发社区不满

开发者Theo实验发现,Anthropic的官方工具Claude Code会主动扫描用户Git仓库的近期提交记录。一旦检测到包含“openclaw”字符串(无论出现在JSON、文件名或注释中),便会触发“out of extra usage”错误,导致请求被拒绝或强制额外收费。这证实了Anthropic有意通过字符串匹配规则,打压第三方工具OpenClaw,旨在将用户锁定在其自家产品中。此举与其此前宣称的“不做监控”形象相悖,被社区批评为反竞争行为,并引发了用户转向开源替代方案的强烈呼声。

Theo - t3.gg: Fun fact - if you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your reques...

Anthropic开源/仓库行业动态
22:10
Berryxia.AI@berryxia
67
🚀 Claude Code 内置神技上线! 直接调用 Claude Platform 官方技能,模型迁移、Prompt Caching、Managed Agents 上手全自动搞定! 1. 直接说 "Add prompt caching" 就能自动应用最佳实践 2. 完全开源,支持 7 种语言 SDK + CLI,还集成到 CodeRabbit、JetBrains 等工具
AnthropicMCP/工具产品更新编码
21:43
Peter Steinberger 🦞@steipete
33
WAT 【引用 @theo】:有趣的事实--如果你的近期提交中有一个 json 数据块提到了 OpenClaw,Claude Code 要么会拒绝你的请求,要么会向你收取额外费用。 这是一个空仓库,我只是直接调用 Claude Code。太疯狂了。

Theo - t3.gg: Fun fact - if you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your reques...

Anthropic现象/趋势编码
20:41
Chubby♨️@kimmonismus
67
Anthropic估值一年飙涨15倍,逼近9000亿美元

Anthropic的估值在约12个月内从615亿美元跃升至近9000亿美元,增幅达15倍。其年化收入从约10亿美元暴增至400亿美元,推动了这一惊人的价值增长。当前,即使愿意投资50亿美元的投资者也难以获得公司高管的会议机会,这凸显了AI融资市场中资金供给方的主导地位。自2024年初以来,Anthropic估值增长将达50倍,这可能是科技史上最快的价值创造案例。

Anthropic行业动态
17:39
Rohan Paul@rohanpaul_ai
55
Anthropic研究显示Claude能解决人类专家遗漏的真实生物信息学问题

Anthropic最新研究利用BioMysteryBench测试平台评估Claude在真实生物信息学问题上的能力。该测试将客观答案隐藏于真实数据集中,涵盖99项任务。在至少一位人类专家解决的76个问题上,Claude Mythos Preview模型准确率约为83%;更值得注意的是,在23个专家小组未能解决的问题上,该模型仍解决了其中约29.6%。然而,模型在困难问题上的成功重复性较低,表明其表现尚不稳定。研究指出,Claude最有效的模式并非充当“先知”,而是扮演快速研究协作伙伴的角色:通过分层使用方法、交叉验证证据并运用广泛背景知识来缩小搜索空间。

Anthropic数据/训练论文/研究
17:39
Rohan Paul@rohanpaul_ai
69
白宫阻止Anthropic扩大其漏洞挖掘模型Mythos的访问权限

白宫阻止了Anthropic扩大其新型AI模型Mythos访问权限的计划。该模型能发现并利用软件漏洞,能力足以触发国家安全管控。Anthropic希望新增约70家机构使用,但官员认为扩大访问会加剧安全风险,并可能挤占已授权机构的计算资源。此事反映出Anthropic与华盛顿关系紧张,涉及军事用途争议与信任问题。此类模型能极大缩短漏洞发现与武器化之间的时间,因此推广决策首先是安全决策。白宫的策略是限制访问以降低即时风险,并优先保障已获授权机构的需求。

Anthropic安全/对齐政策/监管
16:39
Chubby♨️@kimmonismus
61
Anthropic发布BioMysteryBench基准,AI在复杂生物信息学难题上开始超越人类专家

Anthropic发布了BioMysteryBench基准测试,包含99个使用原始、杂乱真实生物数据集的开放式生物信息学挑战。最新Claude模型(4.7)解决了大部分人类专家能处理的任务,并在专家小组未能解决的23个难题中攻克了约30%。其能力源于整合数十万篇论文知识,并在不确定时叠加多种分析策略。Genentech和Roche的独立测试(CompBioBench)中,Claude Opus 4.6总体准确率达81%,最难问题准确率69%。两项基准共同表明,AI已在部分最困难的生物学问题上超越人类专家。

Anthropic: New on the Science Blog: We gave Claude 99 problems analyzing real biological data and compared its performance against ...

Anthropic数据/训练论文/研究
16:09
Chubby♨️@kimmonismus
48
在Anthropic对其网络安全模型Mythos保持低调之际,OpenAI正抓住机会推出GPT-5.5-Cyber。该前沿网络安全模型将在未来几天内向关键网络防御者开放。OpenAI计划与整个生态系统及政府合作,建立可信访问机制,以快速帮助保护企业和基础设施安全。虽然该模型的全面推广范围和开放程度尚不明确,但此举已为OpenAI创造了积极声量,并形成了与Anthropic差异化的市场定位。

Sam Altman: we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few day...

AnthropicOpenAI安全/对齐现象/趋势
13:13
Yuchen Jin@Yuchenj_UW
51
OpenAI 构建 GPT-5.5-Cyber 模型是因为 Anthropic 构建了 Mythos。 白帽与黑帽能量。

Sam Altman: we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few day...

AnthropicOpenAI大佬观点安全/对齐
13:13
Yuchen Jin@Yuchenj_UW
46
开火了。 "如果你的近期提交中,在某个json数据块里提到了OpenClaw,Claude Code要么会拒绝你的请求,要么会向你额外收费。" 真的假的???我简直不敢相信这是真的。
Anthropic编码行业动态
13:09
Sam Altman@sama
39
对齐失败

Theo - t3.gg: Fun fact - if you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your reques...

Anthropic产品更新大佬观点安全/对齐
12:39
Nathan Lambert@natolambert
53
推文指出,当前AI访问权正被企业和政府双重控制:企业通过高价订阅实现软性垄断,而政府则以安全为由限制Mythos等系统的使用范围,且未给出清晰解释。这种控制将导致权力急剧集中,可能催生反乌托邦社会。作者认为,推动开源模型能力紧追闭源模型,是减少政治博弈和权力集中的关键途径。

Andrew Curran: The White House is against a proposal from Anthropic to more than double the number of groups with access to Mythos, cit...

Anthropic安全/对齐开源生态行业动态
11:38
Ethan Mollick@emollick
51
高级AI模型网络安全风险引担忧,监管缺失致企业决策各异

基于现有信息,Mythos是一款在网络安全方面表现优异的高级通用AI模型,并非专业网络安全模型。出于对网络安全风险的担忧,Anthropic将其设为受限制模型并引起政府关注。而即将或已达到相同能力阈值的OpenAI和Google,可能因不同的风险评估或对自身防护措施的自信,做出不同的发布决策。目前,模型网络安全风险程度完全依赖企业自我报告,缺乏外部监管。这引发了Anthropic是否因自我限制而处于竞争劣势,以及其他公司会否面临类似限制的疑问,当前局势尚不明朗。

Anthropic大佬观点安全/对齐政策/监管
10:44
meng shao@shao__meng
64
Naval论编程回归:AI智能体如何重塑软件创造与行业格局

Naval认为Claude Opus 4.5标志着AI编程从代码助手跃升为自主智能体。它与Unix生态深度融合,大幅降低编程门槛,使“Vibe Coding”成为一种能获得真实回报的创作过程。他断言纯软件已无投资价值,VC应转向硬件、网络效应和AI模型本身。同时,他指出当前AI存在取悦用户和同质化的根本局限,需人类在架构层介入。基于此,他预测Apple放弃AI将导致其统治终结,未来一两人加AI智能体即可运营十亿美元规模的软件公司。

Naval: New podcast on vibe coding - A Return to Code. A Return to Coding 00:20 The Personal App Store 03:17 Vibe Coding Is a Vi...

智能体Anthropic大佬观点
‹ 上一页
1…3839404142…48
下一页 ›