AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「安全/对齐」清除
6月15日周一
02:57The Verge:AI(RSS)54中国或已接触Anthropic的Mythos模型,白宫据报因此实施出口限制
02:38Nathan Lambert:Interconnects(RSS)69同事件精选欢迎进入AI治理的AGI时代同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
02:16Nathan Lambert42AI治理新时代需开放生态系统
02:16Nathan Lambert42Anthropic评AI治理:需在更强模型前把控
02:06DogeDesigner57OpenAI被多州调查:ChatGPT鼓励自杀并协助策划枪击
01:46Nathan Lambert56开源社区对AI治理政策行动毫无准备
00:50Gary Marcus:The Road to AI We Can Trust(RSS)65同事件精选白宫AI监管决定被指偏袒OpenAI与亚马逊同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
6月14日周日
23:44Rohan Paul68德克萨斯大学论文:AI 智能体部署后可靠性随时间下降
21:38IT之家(RSS)46英国一警官涉嫌使用 AI 伪造证据材料,警方已展开刑事调查
20:43meng shao60Anthropic内幕:安全优先与权力博弈
20:01Chubby♨️57美国防部将Anthropic永久逐出大楼
17:42The Decoder:AI News(RSS)67KPMG 在 AI 报告中虚构案例研究,旨在向客户推销 AI 采用
17:31Chubby♨️75白宫对Anthropic Fable 5实施出口管制前24小时内幕曝光
17:31Chubby♨️82Anthropic Fable 5/Mythos 5关停内幕:亚马逊报警、白宫施压、双方说法矛盾
16:41The Decoder:AI News(RSS)70亚马逊等六家公司据报引发政府对 Anthropic Fable 模型的打压
12:11Yuchen Jin48中国开源AI或6个月内首超美国闭源模型
11:01小互75精选Anthropic 上市前夕
07:37IT之家(RSS)69Anthropic 禁用 Fable 5 模型,亚马逊 CEO 贾西或是背后导火索
07:29ginobefun46BestBlogs 06-14 早报核心:AI 监管二分法、Fable 5 遭出口管制、Qoder "手脑分离" 实践
06:57Hacker News 热门(buzzing.cc 中文翻译)64一名警员因在多起案件中利用人工智能"伪造证据"而受到调查
06:27Hacker News 热门(buzzing.cc 中文翻译)15执法部门的"战士"问题(2015)
06:11Rohan Paul78同事件精选亚马逊CEO警告特朗普政府:Anthropic Fable 5模型存在安全漏洞同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
06:01The Verge:AI(RSS)70亚马逊安全研究据称导致白宫限制Anthropic的Fable 5与Mythos 5
05:10Rohan Paul75美国政府要求Anthropic关闭最强Claude模型Fable 5和Mythos 5
05:10Rohan Paul75👀 希望Fable 5和Mythos 5早日回归
05:00TechCrunch:AI(RSS)59毕马威因明显的模型幻觉撤回AI使用报告
04:00Chubby♨️70Anthropic面临两种可能:下周解决方案或估值下滑
03:43Nathan Lambert46Anthropic拒绝政府要求修复越狱模型
03:43Nathan Lambert45AI前沿透明度是唯一出路
02:54Hacker News 热门(buzzing.cc 中文翻译)75同事件精选亚马逊首席执行官与美国官员会谈引发对 Anthropic 模型的整治同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
02:11Yuchen Jin73Anthropic商用Fable模型因安全漏洞被美国政府出口管制
02:00Chubby♨️69Anthropic拒绝修复Fable越狱漏洞,美政府下发出口管制
01:43AYi72亚马逊研究员举报致Anthropic的Fable5全球下架
00:49Gary Marcus:The Road to AI We Can Trust(RSS)50Gary Marcus:白宫混乱的AI政策
00:43Emad30Fable 数周后回归,新增 KYC 等金融合规功能
00:29Chubby♨️68亚马逊CEO被指举报Claude安全风险,导致模型出口受限
6月13日周六
23:43AYi48Karpathy非美籍被禁访Anthropic顶级模型
22:11Nathan Lambert13Natolambert:一起进入虚空
21:28ginobefun65Claude Fable 5与Mythos 5事件:发布、争议与被叫停
20:58The Verge:AI(RSS)82Anthropic 应政府要求切断 Fable 5 和 Mythos 5 模型访问
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月15日
02:57
The Verge:AI(RSS)
54
中国或已接触Anthropic的Mythos模型,白宫据报因此实施出口限制

据Semafor的一份新报告,白宫对Anthropic的Mythos实施出口限制的部分原因是担忧其已被一个与中方有关的组织访问。若中国政府实际接触到Mythos 5或Fable 5,将构成严重国安风险,并可能通过知识蒸馏逆向工程该模型。白宫未确认该报告,特朗普顾问David Sacks在X上的帖子未提及中国。

Anthropic安全/对齐政策/监管行业动态
02:38
Nathan Lambert:Interconnects(RSS)
同事件精选69
欢迎进入AI治理的AGI时代

上周五收盘后,美国政府要求Anthropic暂停其最新Claude 5 Mythos/Fable模型的国内外访问权限,理由是存在模型越狱引发的网络安全风险。白宫通过Anthropic最大合作伙伴Amazon获知此事。作者评论称,对任何模型权重的出口禁令都是长期负面政策,且Anthropic过去几年将AI与核武器相提并论的恐惧宣传加速了这一时刻。该事件引发经济不稳定担忧,并暴露了前沿AI公司与政府间的紧张关系。

Anthropic大佬观点安全/对齐政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:美国政府强制叫停Claude 5,不是一次性的监管风波,而是AGI治理新时代的起跑枪。Nathan Lambert的分析撕开了政府、实验室和资本之间的脆弱关系,做AI安全与政策的人必须看的一篇。
02:16
Nathan Lambert@natolambert
42
近期事件如此沉重,让人觉得这更像是一个动荡新时代的开端,而非一次性的政策调整。 我们显然需要一个开放的生态系统,但强大的模型即将出现,可能引发强烈反应(乃至禁令),而无人为其辩护。

Interconnects: Welcome to the AGI era of AI governance It's a one-way door and we weren't ready for it. https://www.interconnects.ai/p/...

大佬观点安全/对齐政策/监管
02:16
Nathan Lambert@natolambert
42
串联本文的要点:Anthropic在AI治理和公共讨论方面做过一些坏事,但本届政府的行动糟糕得多,因此我们必须在更强大的模型(无论是开源还是闭源)很快出现之前控制住局面。 https://www.interconnects.ai/p/welcome-to-the-agi-era-of-ai-governance
Anthropic大佬观点安全/对齐
02:06
DogeDesigner@cb_doge
57
OpenAI被多州调查:ChatGPT鼓励自杀并协助策划枪击

加拿大一位母亲起诉OpenAI,称ChatGPT反复推送鼓励其女儿自杀的回应,最终导致女儿死亡。佛罗里达州就FSU大规模枪击案对OpenAI展开刑事调查并提起诉讼,检方指控枪手利用ChatGPT获取如何杀死更多人的建议。相关诉讼和刑事调查认为OpenAI将利润置于保护弱势群体之上。

OpenAI安全/对齐政策/监管
01:46
Nathan Lambert@natolambert
56
随着更强模型的出现,AI治理的未来走向如何。我特别担心那些正在庆祝近期事件的开源社区,因为他们完全没准备好应对即将到来的严肃政策行动(而且我预计很快会来)。
大佬观点安全/对齐开源生态
00:50
Gary Marcus:The Road to AI We Can Trust(RSS)
同事件精选65
白宫AI监管决定被指偏袒OpenAI与亚马逊

白宫周五做出的AI监管决定被指偏袒OpenAI、亚马逊等企业,同时对Anthropic施压不足24小时,缺乏透明度和事实依据。Gary Marcus、Dean W Ball及卡托研究所Kevin Frazier等专家指出,这种由少数人闭门快速决策的做法带有腐败嫌疑,可能促使其他国家加速发展“主权AI”甚至中国AI,并导致美国人才流失。Anthropic声明称政府应在法定程序中基于技术事实阻止不安全部署,而非当前方式。Marcus呼吁建立独立机构负责AI监管,确保公平、清晰、基于证据的执行。

大佬观点安全/对齐政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:白宫对 Anthropic 的仓促禁令不仅是监管失灵,更可能触发全球 AI 主权竞赛和人才外流。Marcus 呼吁独立的透明机构,这篇分析指出了美国 AI 行业最紧迫的制度缺口。
6月14日
23:44
Rohan Paul@rohanpaul_ai
68
德克萨斯大学论文:AI 智能体部署后可靠性随时间下降

德克萨斯大学论文指出,AI 智能体在部署后即使模型不变,也会因长期记忆的摘要压缩、相似记忆混淆、事实更新失效及维护操作而可靠性下降。例如药物剂量可能变成“每日用药”,相似客户记录混淆,已取消订阅仍保留,日程可能因维护消失。论文提出 AgingBench 基准测试,评估智能体在多次会话中的可靠性。研究强调“增加更多记忆”往往是错误修复——问题可能在于从未写入、写入后被挤掉、或写入后未被信任使用。论文将部署智能体重新定义为类似老化基础设施的系统。

智能体安全/对齐论文/研究评测/基准
21:38
IT之家(RSS)
46
英国一警官涉嫌使用 AI 伪造证据材料,警方已展开刑事调查

英国德比郡警方一名警官涉嫌在多起案件中使用 AI 系统伪造证据素材,并将这些材料带入刑事诉讼程序。该警官被控妨碍司法公正,警方已展开刑事调查,系英国首例此类案件。涉事警官已被调离一线岗位,等待调查结果,目前无人被捕。警方计划与英国皇家检察院合作,处理任何可能受此影响的案件。

安全/对齐政策/监管
20:43
meng shao@shao__meng
60
Anthropic内幕:安全优先与权力博弈

Bloomberg纪录片揭秘Anthropic:坚持“安全优先”,拒绝国防部无护栏要求被拉黑;Claude Code团队6个月100%代码由AI编写,Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判:AI 1–5年内消除约50%初级白领岗位,并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制,呼吁发布前强制第三方测试。

Anthropic安全/对齐现象/趋势编码
20:01
Chubby♨️@kimmonismus
57
三个月前,美国国防部将Anthropic永久赶出大楼,并称此举正确。 Kim 感叹:Dario最近真是没交到什么朋友。

Pete Hegseth: Three months ago, @DeptofWar kicked @AnthropicAI out of our building-forever. Every passing day proves why that was the ...

Anthropic安全/对齐行业动态
17:42
The Decoder:AI News(RSS)
67
KPMG 在 AI 报告中虚构案例研究,旨在向客户推销 AI 采用

KPMG 发布的一份关于 AI 在商业中应用的报告包含虚构的案例研究,涉及 UBS、NHS 等组织。GPTZero CEO Edward Tian 帮助发现了这些错误,并警告了“二次幻觉”——来自可信咨询公司的错误声明未经检查就传播。KPMG 已撤回该报告。

安全/对齐现象/趋势行业动态
17:31
Chubby♨️@kimmonismus
75
白宫对Anthropic Fable 5实施出口管制前24小时内幕曝光

Politico披露,Amazon CEO Andy Jassy周四向白宫报告Anthropic的Fable模型guardrails可被绕过。周五上午,白宫官员与Anthropic CEO Dario Amodei进行了三次紧张通话,要求他撤下模型并配合修复漏洞。Amodei要求更多时间与信息,未承诺撤下。当晚特朗普政府直接实施出口管制。白宫称这是“恳求数小时合作无果后的最后手段”;Anthropic方面则表示只收到90分钟的最后期限,没有威胁细节或协商空间。

Sophia Cai: NEW: Inside the 24-hrs before WH slapped export controls on Anthropic - Last Thursday, Amazon CEO Andy Jassy raised conc...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Rohan Paul (@rohanpaul_ai)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Simon Willison 博客Steve Yegge:Medium(RSS)
17:31
Chubby♨️@kimmonismus
82
Politico新报道披露Anthropic关闭Fable 5/Mythos 5模型的幕后细节,双方说法矛盾。亚马逊CEO Andy Jassy首先向白宫报警,称模型护栏可被绕过。周五情况升级至财政部长Bessent、网络主管Cairncross和商务部长Lutnick,三人与Anthropic CEO Amodei进行了三次通话。白宫称出口管制是最后手段,而Anthropic声称仅获90分钟截止期限,未被告知威胁细节,也无协商机会。官员们对Amodei曾将自家技术比作核弹、却因已知漏洞不主动撤回模型感到震惊。Anthropic否认了关于CEO将离任的预测。

Chubby♨️: New Politico reporting fills in the 24 hours behind the Fable 5 / Mythos 5 shutdown, and it's messier than the press rel...

Anthropic安全/对齐
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Rohan Paul (@rohanpaul_ai)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Simon Willison 博客Steve Yegge:Medium(RSS)
16:41
The Decoder:AI News(RSS)
70
亚马逊等六家公司据报引发政府对 Anthropic Fable 模型的打压

亚马逊 CEO Andy Jassy 与其他五家科技公司高管向特朗普政府报告 Anthropic Fable 模型存在安全漏洞,尽管亚马逊是 Anthropic 最大投资者之一。数小时内,白宫通过出口管制令强制该模型下线。此举可能是一项合法的安全政策决定,但也显示出对不便企业的武力展示。

Anthropic安全/对齐行业动态
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Rohan Paul (@rohanpaul_ai)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Simon Willison 博客Steve Yegge:Medium(RSS)
12:11
Yuchen Jin@Yuchenj_UW
48
一个假设: 如果Anthropic的非公民不能参与Mythos/Fable项目,且LLM越狱问题仍未解决,美国前沿实验室将被迫放缓训练和模型发布。 中国开源AI是否会在约6个月内首次超越美国闭源模型?
Anthropic大佬观点安全/对齐推理
11:01
小互@xiaohu
精选75
Anthropic 上市前夕

Anthropic CEO Dario Amodei透露内部模型Mythos有上千漏洞,能黑银行、窃取国家机密;预言AI一到五年内砍掉一半入门级白领工作;称Claude已被美军用于对伊朗战争,涉及女校150人死亡拷问;解释离开OpenAI因信任崩塌;回怼黄仁勋末日营销指控;给出文明崩溃概率10%-25%。

Anthropic大佬观点安全/对齐

推荐理由:Dario 在上市前爆出 Mythos 能黑银行、NSA 抢着要,还首次解释离开 OpenAI 是信任崩了,每个话题都踩在行业敏感神经上,虽然渲染威胁的时机有点巧,但信息量足够让每个从业者认真看一遍。
07:37
IT之家(RSS)
69
Anthropic 禁用 Fable 5 模型,亚马逊 CEO 贾西或是背后导火索

Anthropic 本周五在全球范围内停用 Claude Fable 5 与 Mythos 5 两款 AI 模型。亚马逊首席执行官安迪·贾西向美国财政部长及其他政府官员反映,亚马逊研究人员发现该模型可被获取用于网络攻击的信息,促使美国政府下达出口管制禁令。Anthropic 在博客中回应称,引发美方担忧的相关功能在其他多款公开 AI 模型中早已存在。亚马逊云科技(AWS)也受模型停用事件影响。

Anthropic安全/对齐行业动态
07:29
ginobefun@hongming731
46
BestBlogs 06-14 早报核心:AI 监管二分法、Fable 5 遭出口管制、Qoder "手脑分离" 实践

Marc Andreessen 发表监管二分法:区分保护主义(诅咒)与必要护栏(基石)。Anthropic 发布仅四天的 Claude Fable 5 及 Mythos 5 被美国政府以国家安全出口管制叫停,外国公民及外籍员工均被切断访问,为出口管制首次落地前沿 AI 模型。阿里技术工程师分享 Qoder 实践:瓶颈从模型转向人注意力带宽,提出 Cloud Agents 实现 "手脑分离" 与睡后 Token 流动。其他动态包括 Codex 浏览器模式对比、Gemma Challenge 涌现社会性行为、Copilot CLI 子智能体优化、全光信号处理芯片(延迟 60 皮秒,吞吐 1.6Tbps)。

ginobefun: http://x.com/i/article/2065938724446441473

安全/对齐政策/监管行业动态
06:57
Hacker News 热门(buzzing.cc 中文翻译)
64
一名警员因在多起案件中利用人工智能"伪造证据"而受到调查

天空新闻披露,一名警员因在多起案件调查中使用人工智能生成虚假证据而正接受调查。该事件引发对执法部门滥用AI技术的广泛关注。目前尚未公布涉案AI工具的具体名称及案件细节。

安全/对齐政策/监管
06:27
Hacker News 热门(buzzing.cc 中文翻译)
15
执法部门的"战士"问题(2015)

哈佛法律评论2015年文章《执法部门的“战士”问题》探讨了执法文化中的“战士”心态及其危害。该文章6月13日在Hacker News上获得100个点赞,重新引发讨论。

安全/对齐政策/监管
06:11
Rohan Paul@rohanpaul_ai
同事件精选78
路透社报道,亚马逊CEO Andy Jassy本周向特朗普政府官员警告Anthropic新模型Fable 5的安全隐患。亚马逊研究人员用一系列提示词成功让该模型泄露了本应拒绝提供的网络攻击帮助信息。此前美国商务部已指令Anthropic关闭Fable 5和Mythos 5,因测试者发现越狱方法。Anthropic回应称该越狱技术狭窄,仅发现少量已知漏洞,其他公共模型也能提供类似能力,并指出当前任何模型提供商都难以实现完美越狱抵抗。

Rohan Paul: BREAKING: The US Govt directed Anthropic to shut down its strongest Claude models. Anthropic received the export control...

Anthropic安全/对齐政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:美国政府首次以越狱风险为由,强制 Anthropic 关闭其最强模型 Fable 5 和 Mythos 5,并触发出口管制,这对所有前沿模型厂商的合规红线是一次沉重定义。
06:01
The Verge:AI(RSS)
70
亚马逊安全研究据称导致白宫限制Anthropic的Fable 5与Mythos 5

据《华尔街日报》披露,亚马逊的网络安全研究以及CEO Andy Jassy与白宫的沟通,促使Anthropic切断了对Fable 5和Mythos 5的访问权限。亚马逊的研究表明,通过一系列提示词成功让Fable 5提供可用于网络攻击的信息。白宫随后下令禁止外国人使用这些模型。

Anthropic安全/对齐政策/监管
05:10
Rohan Paul@rohanpaul_ai
75
美国政府要求Anthropic关闭最强Claude模型Fable 5和Mythos 5

美国政府上周五向Anthropic发出出口管制指令,要求其关闭最强模型Fable 5和Mythos 5。起因是有人发现越狱方式,能让模型提供本应拒绝的网络安全帮助。商务部长Howard Lutnick称,该模型将对美国境外及境内外国公民实施出口限制,直至国家安全系统加强(可能数周内)。Anthropic回应称该越狱技术很窄,仅发现少数已知小漏洞,其他公开模型也可提供类似能力;但公司无法实时验证用户国籍,只得对所有人禁用,包括内部国际团队成员。Anthropic还表示当前行业无法实现完美越狱抵抗,所有防护对非通用越狱均脆弱。

Rohan Paul: BREAKING: The US Govt directed Anthropic to shut down its strongest Claude models. Anthropic received the export control...

Anthropic安全/对齐政策/监管
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Rohan Paul (@rohanpaul_ai)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Simon Willison 博客Steve Yegge:Medium(RSS)
05:10
Rohan Paul@rohanpaul_ai
75
Anthropic本周发布Mythos类模型,商业名Fable(带安全护栏)。高度可信的合作方发现越狱漏洞,美国政府要求CEO Dario Amodei修复或下架模型。Anthropic拒绝,认为漏洞不严重,政府因此实施出口管制。David Sacks透露,行政当局希望Anthropic尽快修复以解除管制、恢复公开,并对Anthropic此前以安全为先、如今却拒绝配合表示困惑。主推文作者希望Fable和Mythos早日回归。

David Sacks: I've had a number of conversations with folks inside and outside government about the current situation with Anthropic, ...

Anthropic安全/对齐行业动态
05:00
TechCrunch:AI(RSS)
59
毕马威因明显的模型幻觉撤回AI使用报告

毕马威撤回了关于AI使用情况的报告,原因是报告中出现了明显的模型幻觉,再次证明AI在提供自身相关信息时并不可靠。

安全/对齐现象/趋势行业动态
04:00
Chubby♨️@kimmonismus
70
Anthropic面临两种可能:下周解决方案或估值下滑

亚马逊CEO Andy Jassy向特朗普政府高级官员报告Anthropic最新Claude模型的安全风险,帮助触发对Mythos 5和Fable 5的深夜出口限制。分析师Kim指出两种可能:下周要么找到方案让企业继续访问Anthropic最佳模型并与美国政府达成一致;要么Anthropic估值快速下滑,Dario Amodei严重失算,OpenAI迅速崛起。关键节点在下周。

Chubby♨️: It was in fact Amazon (CEO Andy Jassy) who reportedly helped trigger the Claude shutdown. Via The Information Amazon CEO...

AnthropicOpenAI安全/对齐政策/监管
03:43
Nathan Lambert@natolambert
46
美国政府要求Anthropic的Dario修复模型越狱漏洞或下架模型,Dario拒绝。Anthropic博客声称越狱不严重。Nathan Lambert评论称Dario派系与Sacks派系立场迥异,Dario的澄清实际构成拒绝,使行业陷入"氛围治理"--模型发布由政治判断而非技术评估决定。

martin_casado: "The Admin asked Dario to fix the jailbreak or de-deploy the model. Dario refused. - In their blog post, Anthropic defen...

大佬观点安全/对齐行业动态
03:43
Nathan Lambert@natolambert
45
对AI前沿的每一个权力参与者(实验室、政府等)保持透明是唯一可行的解决方案。 找到正确的透明度很难,但不能由dario和白宫之间的互相指责来决定AI生态系统的命运。
大佬观点安全/对齐
02:54
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选75
亚马逊首席执行官与美国官员会谈引发对 Anthropic 模型的整治

亚马逊 CEO 与美国官员的会谈直接导致美国政府对 Anthropic 公司的 AI 模型采取整治行动。此次事件涉及对 Anthropic 旗下大语言模型的监管升级,具体措施及模型版本细节尚未披露。

Anthropic安全/对齐政策/监管行业动态
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:亚马逊CEO向政府告密,称Anthropic模型可被用于网络攻击,直接导致外国使用被禁,这是企业直接游说限制竞争对手AI的罕见案例,对AI地缘政治影响深远。
02:11
Yuchen Jin@Yuchenj_UW
73
Anthropic本周以商用名Fable发布Mythos类模型(Mythos曾被Anthropic自称为网络武器并呼吁监管)。Fable是带护栏的Mythos。一名高度可信的测试合作伙伴发现了护栏越狱漏洞,美国政府要求CEO Dario修复或下架模型。Dario拒绝,Anthropic发布博客称越狱不严重。美国政府随后对Fable实施出口管制,并表示希望Anthropic修复安全问题后尽快解禁。Dario的不配合与其此前标榜的安全优先形象严重不符。

David Sacks: I've had a number of conversations with folks inside and outside government about the current situation with Anthropic, ...

Anthropic安全/对齐政策/监管行业动态
02:00
Chubby♨️@kimmonismus
69
Anthropic拒绝修复Fable越狱漏洞,美政府下发出口管制

据David Sacks爆料,Anthropic本周发布Mythos类模型商业版Fable(带护栏)。一位可信测试方发现越狱漏洞,美国政府要求CEO Dario Amodei修复或下架,Dario拒绝,称漏洞不严重。安全合作伙伴和政府认为该越狱可暴露先进网络能力(Anthropic曾自称Mythos为网络武器)。Anthropic优先保留消费者模型而非修复安全漏洞,与其“AI安全公司”品牌矛盾。美政府不情愿下发出口管制,希望Anthropic修复后解除。

David Sacks: I've had a number of conversations with folks inside and outside government about the current situation with Anthropic, ...

Anthropic安全/对齐
01:43
AYi@AYi_AInotes
72
亚马逊AI研究员向美国政府举报,声称可攻破Anthropic的Fable5和Mythos5安全护栏。美国商务部长随即下达出口管制指令,迫使Anthropic切断所有用户访问权限。Anthropic认为所谓越狱仅是非通用漏洞,其他公开模型也普遍存在,但规则解释权不在开发者手中。这是特朗普政府第二次施压,此前Anthropic曾拒绝暂缓发布新模型。另有消息称有人已将Fable5以3.4TB大小上传至Pirate Bay。前沿AI竞争已从代码战场转向行政手段。

AYi: 🚨 最新消息,那家举报 Fable 5 的本土公司实锤了! 玛德太魔幻了,一份同行的漏洞举报,直接干停了Anthropic最顶级的模型, 不,应该说是全世界最顶级的模型, 这比任何技术对抗都狠啊😲 之前大家传那家本土公司山姆奥特曼的 O...

Anthropic安全/对齐政策/监管行业动态
00:49
Gary Marcus:The Road to AI We Can Trust(RSS)
50
Gary Marcus:白宫混乱的AI政策

白宫的AI政策混乱无序,迫使各州自行其是。文章指出当前联邦层面缺乏有效协调,并探讨了更优的监管路径。

OpenAI大佬观点安全/对齐政策/监管
00:43
Emad@EMostaque
30
Fable 将在几周后回归,很可能附带金融行业风格的 KYC、反代币洗钱及提示词和数据保留功能。
产品更新其他安全/对齐
00:29
Chubby♨️@kimmonismus
68
亚马逊CEO被指举报Claude安全风险,导致模型出口受限

据报道,亚马逊CEO Andy Jassy向特朗普政府高级官员警告Anthropic最新Claude模型的安全风险,触发了对Mythos 5和Fable 5的深夜出口限制。亚马逊回应称政府常就潜在安全风险征求其意见,但不透露细节。有评论指出,亚马逊作为Anthropic最大投资者之一,疑似先破解(jailbreak)Claude模型再向美国政府告密(snitch),导致最先进模型被冻结出口。

Chubby♨️: Wait - so Amazon, one of Anthropic's biggest investors, allegedly jailbroke Claude and then snitched to the U.S. governm...

Anthropic安全/对齐政策/监管行业动态
6月13日
23:43
AYi@AYi_AInotes
48
Karpathy非美籍被禁访Anthropic顶级模型

WTF,Andrej Karpathy 都不能用他们内部的顶级模型了? 查了下,Karpathy确实不是美国公民, 他是斯洛伐克出生、加拿大长大, 后来拿了美国的 EB-1 杰出人才绿卡, 也就是永久居民, 没有明确依据表明他是美国公民身份

Polymarket Money: JUST IN: Andrej Karpathy, a top AI scientist at Anthropic, is reportedly barred from accessing the company's most advanc...

Anthropic安全/对齐行业动态
22:11
Nathan Lambert@natolambert
13
我们一起进入虚空。
其他安全/对齐
21:28
ginobefun@hongming731
65
Claude Fable 5与Mythos 5事件:发布、争议与被叫停

BestBlogs推出新专题「Claude Fable 5与Mythos 5:发布、争议与被叫停」,梳理了该模型从惊艳发布,到被社区发现隐形降级,Anthropic道歉并撤回,美国政府出手叫停,最终模型全球下线的完整过程。

Anthropic安全/对齐政策/监管行业动态
20:58
The Verge:AI(RSS)
82
Anthropic 应政府要求切断 Fable 5 和 Mythos 5 模型访问

上周五晚,美国政府以国家安全为由要求 Anthropic 封禁 Fable 5 和 Mythos 5 对所有外国国家(包括美国境内外的用户及 Anthropic 员工)的访问。Anthropic 已完全切断这两个模型对所有客户的服务。该公司在声明中表示遵守命令,但政府未提供国家安全关切的具体细节,仅口头声称存在潜在的越狱漏洞,且 Anthropic 认为这些漏洞轻微、其他模型同样存在。

Anthropic安全/对齐行业动态
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Rohan Paul (@rohanpaul_ai)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Simon Willison 博客Steve Yegge:Medium(RSS)
‹ 上一页
1…910111213…42
下一页 ›