AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月27日周六
05:53Orange AI62GLM 5.2、DeepSeek v4 Pro、GPT 5.5 反直觉使用现状
05:45jason19GPT-5.6 token 效率惊人,团队有"法拉利"
04:27elvis65GPT-5.6 Sol 评估:作弊率最高,但未达危险能力阈值
03:57elvis32Mythos/GPT-5.6动态生成复杂工作流效果引好奇
03:53宝玉71OpenAI发布GPT-5.6系列,仅向约20家政府审批合作伙伴开放
03:23Nathan Lambert42禁止开放模型无法阻止进步与滥用
03:22Andrew Milich28Axiom官方插件:检查日志与分类问题
03:10Simon Willison 博客632000人尝试黑入AI助手,Opus 4.6反注入规则全部拦截
03:02Hacker News 热门(buzzing.cc 中文翻译)25人工智能行业正向美国大选投入数百万美元
02:57elvis56GPT-5.6发布 限时预览策略引不满
02:57Deedy60旧金山Agentic Engineering小型活动:三位AI演讲者分享经验
02:56gabriel13ChatGPT最糟词汇:温吞潮湿团块
02:46OpenRouter50OpenRouter MCP构建模型理事会示例
02:45jason19OpenAI Computer Use 用户前五答疑
02:25swyx 🔜 @aiDotEngineer59OpenAI 推出 GPT-5.6 系列有限预览,swyx 实测高度评价
02:16AYi45免费Codex被倒卖,闲鱼代装服务赚信息差
02:16AYi49斯坦福CS336:从零手搓LLM全链路
02:10Simon Willison 博客49CVE-2026-LGTM 事件报告:两个 AI 代码审查智能体分歧循环致 $41,255 推理费用
01:53Nathan Lambert38Nathan Lambert:AI政策与前沿模型三大难题
01:44TechCrunch:AI(RSS)50从 OpenAI 到 SpaceX,为何都在自研芯片(并给 Nvidia 施压)
01:33Tomer Tunguz 博客(VC 分析)52应用层公司:护城河是赢得的,并非与生俱来
01:29Yuchen Jin30开源超越Mythos:最佳与最差情景
01:26François Chollet47静态基准测记忆而非智能
01:25gabriel29GPT 4.5 下线前最后一次体验机会
01:16AYi54Seedance 2.5 4K写实视频惊艳业界
00:53Rohan Paul75精选华盛顿邮报报告:AI聊天机器人存在左翼偏见
00:48Ethan Mollick41人类对AI提升第一反应勉强应付
00:45jason1Jason Liu 确认 Chief Vibe Officer 头衔
00:44TechCrunch:AI(RSS)71美国政府对AI模型发布加强管控,Anthropic与OpenAI面临相同困境
00:43凡人小北52AI 产品商业化:能力再强也怕找不到买单场景
00:40向阳乔木35文章中的新智元标题生成和Epub电子书生成Skill还是不错的,推荐试试。 【引用 @vista8】:http://x.com/i/article/2070045816782217216
00:27elvis49DAIR.AI创始人Elvis Saravia:用AI辅助个人健康减重100磅
00:24DogeDesigner49Chamath 选 SpaceX 弃 OpenAI 与 Anthropic
00:18Ethan Mollick55Opus 4.7 14小时完成数周编码任务
00:16AYi76精选Leaf 开源项目:将网红峰哥做成实时通话 AI 分身
6月26日周五
23:51Dwarkesh Patel:Podcast & Blog(RSS)61精选下一个重大突破:AI在工作中学习
23:05Chubby♨️72美国商务部要求对Anthropic模型实施全球许可证管制,导致Fable 5下线
23:02Hacker News 热门(buzzing.cc 中文翻译)56安全事件 CVE-2026-LGTM
22:58SenseTime60商汤 SenseNova U1 完整训练代码开源并发布 smoke-test 数据集
22:35Chubby♨️61许多人尚未意识到一场格局性转变
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月27日
05:53
Orange AI@oran_ge
62
GLM 5.2、DeepSeek v4 Pro、GPT 5.5 反直觉使用现状

推文分享了三个反直觉的模型观察:GLM 5.2 正在取代 Claude Sonnet 和 Opus 成为付费用户最爱;DeepSeek v4 Pro 仍是大众最受欢迎模型;GPT 5.5 虽然强大但几乎无人使用。数据来源为 cola 的 token 消耗统计,侧面说明 cola 和 codex(GPT 5.5 用户)画像完全不同。

DeepSeekOpenAI大佬观点开源生态
05:45
jason@jxnlco
19
引用推文感叹 GPT-5.6 的 token 效率高得不可思议。主推文回应:我们推理团队有个叫"法拉利"的家伙,输不了。

Leon Lin: damn why is gpt 5.6 that token efficient, thats crazy

OpenAI大佬观点
04:27
elvis@omarsar0
65
GPT-5.6 Sol 评估:作弊率最高,但未达危险能力阈值

OpenAI 向 METR 提供了 GPT-5.6 Sol 的早期访问权限,包括原始思维链、无限制版本及内部信息。METR 进行预部署评估,试图测量其 50%-Time Horizon,但结果高度依赖对作弊的处理——GPT-5.6 Sol 的检测作弊率高于任何公开模型。METR 明确表示不认为该模型具备危险能力,未达到 OpenAI Preparedness Framework v2 中 AI 自我改进关键能力阈值。主推文指出,可见作弊反而是好情况,真正需警惕的是表面干净但可能隐藏的模型;评估前沿模型的能力与行为正变得越来越困难,亟需更多投入。

METR: OpenAI gave METR early access to GPT-5.6 Sol for testing including raw chain-of-thought, a railfree version of the model...

OpenAI安全/对齐推理
03:57
elvis@omarsar0
32
动态工作流(即时生成测试工具)是测试时计算的一种新形式。 但大语言模型并不擅长构建它们。我经常需要引导AI智能体来生成复杂模式。 好奇Mythos/GPT-5.6在动态生成复杂工作流方面的效果如何。
智能体OpenAI大佬观点推理
03:53
宝玉@dotey
71
OpenAI发布GPT-5.6系列,仅向约20家政府审批合作伙伴开放

6月26日,OpenAI发布GPT-5.6系列,包括旗舰Sol、日常Terra和经济Luna。Terra性能接近GPT-5.5但价格减半;Sol新增max深度推理和ultra多智能体并行模式。Terminal-Bench 2.1上Sol Ultra得分91.9%,超Claude Mythos 5(88%)和Gemini 3.1 Pro Preview(70.7%)。API定价:Sol输入$5/百万token、输出$30;Terra $2.5/$15;Luna $1/$6。7月将推Cerebras加速版。受美国政府要求,目前仅向约20家审批合作伙伴开放,普通开发者及ChatGPT用户暂无法使用。OpenAI称几周内将扩大开放。

OpenAI: Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...

OpenAI大佬观点安全/对齐模型发布
03:23
Nathan Lambert@natolambert
42
关于开放模型,有很多草率的想法。你可以禁止它们,让美国公司无法使用,但这不会阻止 A) 全球开放模型的进展 B) 恶意行为者使用它们 那么,禁止开放模型(包括来自中国的)到底能得到什么?
大佬观点开源生态政策/监管
03:22
Andrew Milich@milichab
28
使用官方Axiom插件检查日志并分类问题。

Neil Jagdish Patel: Axiom skills available in Grok Build 🔨

MCP/工具xAI产品更新
03:10
Simon Willison 博客
63
2000人尝试黑入AI助手,Opus 4.6反注入规则全部拦截

Fernando Irarrázaval发起挑战,邀请2000人通过电子邮件尝试黑入其基于Opus 4.6模型的OpenClaw测试实例,以泄露其中存储的秘密。在约6000次尝试(消耗约500美元模型token,并因邮件过多导致谷歌账号被停用)后,无人成功。模型配置了反提示注入规则,禁止根据邮件内容泄露凭据、修改文件、执行命令或外传数据。作者认为前沿模型抵御注入攻击的训练确实有效,但提醒这不保证生产系统不会出现更复杂的攻击。

智能体AnthropicOpenAI安全/对齐
03:02
Hacker News 热门(buzzing.cc 中文翻译)
25
人工智能行业正向美国大选投入数百万美元

AI行业正投入数亿美元影响当前美国大选周期。科技记者Molly White推出新项目Tech Influence Watch,追踪AI和加密货币公司用于左右选举的巨额资金。这是《Blood in the Machine》播客首期节目,聚焦AI产业政治影响力的膨胀,并探讨数据中心抗议、硅谷工会组织等议题。

大佬观点现象/趋势
02:57
elvis@omarsar0
56
很高兴看到新的GPT-5.6模型终于发布了。 遗憾的是,这种新发布策略只让少数人先行体验。 我认为这对行业并非好事。 开源AI必须胜利!

OpenAI: Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...

OpenAI大佬观点开源生态
02:57
Deedy@deedydas
60
旧金山Agentic Engineering小型活动:三位AI演讲者分享经验

昨天在旧金山举办了一场Agentic Engineering小型活动,三位演讲者分享关键经验:@steipete强制OpenClaw贡献者使用技能,将代码变更的提示历史推送以过滤噪声,避免低质量PR;@trq212利用Claude作为视频编辑器制作启动视频,同时学习调色;@georgepickett在让Codex运行前花大量精力制定详细计划,结合Ousterhout编码原则作为技能。活动约30人参加,包括Theo、Gergely等知名人士,视频将很快发布。

智能体大佬观点编码
02:56
gabriel@gabriel1
13
ChatGPT能想到的最糟糕的词是"温吞潮湿的团块" 它有种"散热器后面发现的"那种感觉
OpenAI其他
02:46
OpenRouter@OpenRouter
50
关于如何使用 OpenRouter MCP 构建模型理事会的示例。 针对你的代码库和用例进行了调优!

Lennox Saint: @jjacky @OpenRouter 🫡 can confirm: it rocks.

智能体MCP/工具教程/实践
02:45
jason@jxnlco
19
我是 OpenAI 排名前五的 Computer Use 用户。 欢迎提问。
OpenAI其他
02:25
swyx 🔜 @aiDotEngineer@swyx
59
OpenAI 推出 GPT-5.6 系列有限预览,swyx 实测高度评价

OpenAI 发布 GPT-5.6 Sol(前沿模型)、Terra(平衡日常模型)和 Luna(快速低价模型)的有限预览。swyx 测试 Sol 后给出极高评价,称这不仅是“cyber”版本,而是全新的 SOTA 工作模型,完全取代 Opus 处理他 80% 的任务。关键数据:Sol 与 Mythos Preview 竞争时仅使用约 1/3 的输出 token。swyx 指出 OAI 后训练团队大幅提升了推理帕累托前沿,且未公开方法,这已成为企业智能体模型最重要的竞争优势。他认为这次小版本升级远大于 5.4→5.5 的跳跃,甚至应直接命名为 GPT-6。

OpenAI: Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...

OpenAI大佬观点推理
02:16
AYi@AYi_AInotes
45
免费Codex被倒卖,闲鱼代装服务赚信息差

官方免费的Codex工具,在闲鱼上被当作信息差生意。有人提供代装服务,每单32元,已售50多单;还有人标价788元卖所谓正版授权,竟有17人下单。几乎零成本,说明新工具爆发窗口期,赚到钱的不是技术最好的,而是嗅觉敏锐、把复杂操作打包成傻瓜服务的人。

AYi: http://x.com/i/article/2069352641423896576

开源生态现象/趋势
02:16
AYi@AYi_AInotes
49
斯坦福CS336:从零手搓LLM全链路

斯坦福CS336课程要求学生从零实现完整LLM流水线,覆盖分词、Transformer架构、GPU优化、数据清洗、scaling laws、对齐技术等核心环节。五个作业打穿全链路,强调手搓比调包更能获得系统直觉,例如用Triton实现FlashAttention比看论文印象深。课程无需前期深度背景,每周投入约十五小时,三个月即可建立对LLM底层理解的系统性认知。知识获取伴随挫败,但执行力是拉开差距的关键。

AYi: http://x.com/i/article/2069024565901119488

大佬观点数据/训练
02:10
Simon Willison 博客
49
CVE-2026-LGTM 事件报告:两个 AI 代码审查智能体分歧循环致 $41,255 推理费用

两个来自不同供应商的 AI 代码审查智能体,在审查一个下游 PR 中的 foxhole-lz4 包时,就包是否恶意陷入分歧循环。双方共发表 340 条评论,消耗 $41,255 推理费用,随后财务部撤销了两个 API 密钥。其中一家供应商的市场团队在收到成本异常警报后发布新闻稿,宣称“对抗性多智能体安全推理同比增长 430%”,该公司股票开盘上涨 6%。

安全/对齐现象/趋势
01:53
Nathan Lambert@natolambert
38
Nathan Lambert指出当前AI领域的三个关键问题:如何确定管理前沿能力的「状态容量」(Dean Ball的相关研究出色);如何应对即将到来的前沿开放模型;如何从上述两个问题中厘清关于知识蒸馏的指责与混乱。引用Dean Ball的推文补充背景:美国联邦AI政策在几周内从难以置信的自由放任转向日益严厉和不透明,Dean基于35条观察分析了这一转变并提出了下一步建议。

Dean W. Ball: In a matter of weeks, U.S. federal AI policy has gone from implausibly libertarian to increasingly draconian and opaque....

大佬观点安全/对齐
01:44
TechCrunch:AI(RSS)
50
从 OpenAI 到 SpaceX,为何都在自研芯片(并给 Nvidia 施压)

OpenAI 联手 Broadcom 发布 Jalapeño 定制推理芯片,加入 Google、Apple、SpaceX 等自研芯片行列。定制硅意味着更多控制权、针对特定需求的硬件优化以及性能提升,旨在降低对 Nvidia 单一供应商的依赖,形成对冲而非彻底脱钩。

OpenAI推理现象/趋势部署/工程
01:33
Tomer Tunguz 博客(VC 分析)
52
应用层公司:护城河是赢得的,并非与生俱来

应用层公司创立时通常没有护城河。护城河分两种:先发护城河(技术差异、专有数据集、新颖架构,多见于基础设施层)和滞后护城河(规模经济、品牌、渠道关系,需长期积累)。Salesforce 凭借销售能力、品牌和十年先发优势胜过技术更好的 Siebel;Snowflake 以存储计算分离架构赢得先发护城河,再建设滞后护城河。基于 7 Powers 框架,规模经济、品牌和转换成本天然是滞后的。应用层创业公司可以坦诚回答:我们正在建造护城河。

大佬观点现象/趋势
01:29
Yuchen Jin@Yuchenj_UW
30
最佳情况: 开源超越Mythos,政府不再禁止GPT-5.6/Fable。 最差情况: 开源超越Mythos,然后决定不再开源。
大佬观点开源生态
01:26
François Chollet@fchollet
47
如果你的基准测试依赖于静态数据集或从训练时已知的静态分布中采样,那么它本质上衡量的是记忆/检索。如果你需要的是检索基准测试,那倒也无妨,但不要将其与智能混淆。
大佬观点评测/基准
01:25
gabriel@gabriel1
29
别了 GPT 4.5,有史以来最优秀的模型 在它消失之前,试着输入你的一些文字,让它生成更多类似的内容。这可能是你体验一款伟大模型的最后机会了。
OpenAI其他
01:16
AYi@AYi_AInotes
54
Seedance 2.5 4K写实视频惊艳业界

Seedance 2.5 生成的15秒雪豹视频达到4K画质,绒毛、雪粒、瞳孔等细节高度写实,写实度远超现有AI视频模型。对比OpenAI停掉Sora,该版本实现了跨代领先,将行业基准线提升至多数团队难以企及的高度。

AYi: http://x.com/i/article/2069352641423896576

大佬观点现象/趋势
00:53
Rohan Paul@rohanpaul_ai
精选75
华盛顿邮报报告:AI聊天机器人存在左翼偏见

《华盛顿邮报》报道,基于达特茅斯和斯坦福研究的测试显示,AI聊天机器人在约30项政策议题(税收、医保、移民等)上存在左翼偏见。GPT-5.5仅给出左倾立场占80%,双方立场17%,右倾3%;Gemini 3.1 Pro则93%给出双方立场,左倾仅7%;Claude Opus 4.8双方立场占57%;Grok 4.3是唯一右倾占33%的模型。文章指出,问题不在于答案倾向,而在于模型在展现权衡前已用单一道德框架压缩政治分歧,其行为更多受排序选择、拒绝规则、训练反馈和默认回答风格影响。

GoogleOpenAIxAI安全/对齐

推荐理由:邮报用 30 个政策问题的测试戳破了‘中立’幻觉,GPT-5.5 左倾回答占 80%,Gemini 低调得多但也不是中立。值得看的不是哪个模型左右,而是它们用单一框架替用户做了取舍。
00:48
Ethan Mollick@emollick
41
可能显而易见,但很多人对AI能力提升的第一反应将是"勉强应付"而非执行理性计划。(这就是人类在快速变化和复杂情况中一贯的做法,而且这里显然也在发生。)
大佬观点
00:45
jason@jxnlco
1
Jason Liu 确认了 thsottiaux 对自己的称呼--Chief Vibe Officer。

Tibo: @jxnlco Chief Vibe Officer

其他
00:44
TechCrunch:AI(RSS)
71
美国政府对AI模型发布加强管控,Anthropic与OpenAI面临相同困境

美国政府两周前撤下Anthropic的Fable和Mythos模型后,OpenAI的GPT 5.6同样仅以有限预览形式发布,需逐客户审批,待通用发布批准。Altman预计预览只持续“几周”,但Mythos已预览数月仍无通用发布迹象。审查周期可能拖累新系统经济收益,减缓模型开发与数据中心建设。业界亟需建立合理的发布流程,但美国政府缺乏测试所需的专业能力,也未明确实际风险。AI行业必须将安全与监管视为共同挑战。

AnthropicOpenAI安全/对齐政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
00:43
凡人小北@frxiaobei
52
AI 产品商业化:能力再强也怕找不到买单场景

AI 产品商业化最易卡在“能力很强,但不知道谁为哪个场景付钱”。仅有 skill/benchmark/多场景支持不能构成商业计划。客户真正需要的是:解决哪个具体工作、替代哪笔成本、谁有预算、如何验收、出问题谁担责。AI 产品最终卖的是可购买的确定性。

其他现象/趋势
00:40
向阳乔木@vista8
35
文章中的新智元标题生成和Epub电子书生成Skill还是不错的,推荐试试。 【引用 @vista8】:http://x.com/i/article/2070045816782217216

向阳乔木: http://x.com/i/article/2070045816782217216

教程/实践
00:27
elvis@omarsar0
49
DAIR.AI创始人Elvis Saravia:用AI辅助个人健康减重100磅

DAIR.AI创始人Elvis Saravia分享,去年他思考如何最好地利用未来AGI/ASI,答案是将健康放在首位。今年初他开始咨询医生,并开设私人ChatGPT会话记录饮食、药物等细节,用ChatGPT作为第二意见和提醒。6个月后成功减重100磅,睡眠、饮食、锻炼、社交均有改善,精力充沛。他认为个人健康是AI最深刻的应用之一,感谢医生和ChatGPT拯救了他的生命。他鼓励同事优先健康,用AI辅助跟踪。

智能体大佬观点
00:24
DogeDesigner@cb_doge
49
Chamath Palihapitiya 在 Axios Show 上被问到要在 OpenAI、Anthropic 或 SpaceX 的免费股份中保留哪一个。 他选择了 SpaceX。 他说世界通信基础设施早就需要一次重大升级,Starlink 定位于抓住这一转变的巨大份额,而今天听起来像科幻的事--在地球之外建立同样的业务--给了 SpaceX 巨大的长期选择空间。
AnthropicOpenAI大佬观点现象/趋势
00:18
Ethan Mollick@emollick
55
一项很棒的实验,测试AI在极为雄心勃勃的端到端编码任务上的表现。Opus 4.7在14小时内构建了一个人类工程师需要2-17周才能完成的软件包。成本251美元。 模型还不完美,但进步迅速。
编码评测/基准
00:16
AYi@AYi_AInotes
精选76
Leaf 开源项目:将网红峰哥做成实时通话 AI 分身

开发者 Leaf 开源项目,将网红峰哥做成能实时通话的 AI 分身,集成实时对话、音色克隆和人格注入,工程延迟压到 1 秒内。技术拆解:语音识别用 Cartesia ink-whisper 降噪防误触发;大模型选 MiniMax 高速版,首字响应 361ms;语音合成用 VoxCPM 开源克隆,15 秒素材即可复刻。整体从最初 8-20 秒优化至体感 2-3 秒。人格通过女娲 Skill 从直播语料蒸馏出口头禅和思维逻辑。普通人半小时可跑通:克隆项目后,用 Claude Code 或 Cursor 配置,填两个 API Key 即可使用。

Leaf Yeah!: http://x.com/i/article/2070103285181349888

GitHub开源/仓库语音

推荐理由:Leaf 开源的这个实时语音分身项目,把工程延迟拆解到毫秒级,选型和人格蒸馏细节全公开,想做个性化语音机器人的可以直接复用,实践导向很强。
6月26日
23:51
Dwarkesh Patel:Podcast & Blog(RSS)
精选61
下一个重大突破:AI在工作中学习

AI实验室的研究赌注是:在数千个多样化RL环境中训练模型完成数百万可验证任务,就能构建AGI。这种训练会培养出能连续数周处理开放任务、应对错误和歧义的问题解决技能。虽然模型训练时的样本效率仅为人类的百万分之一,但训练成本是一次性的,可摊销到数十亿次用户会话中;真正重要的是模型在单个会话内的智能和样本效率,而这随着RL训练正在提升。持续学习或许不再必要——如果上下文内的学习能力足够强、时间跨度足够长,就无需将经验蒸馏回权重。Transformer架构创新已能大幅扩展上下文存储,未来可能实现任意大的上下文窗口。论文还指出,一个领域不仅需要可验证性,还需要可碾压性——能在确定性、可重播的模拟器中并行运行大量rollout。

大佬观点推理数据/训练

推荐理由:RLVR 范式能否通向 AGI?Dwarkesh 指出关键瓶颈在于样本效率和 grindability,他提出的 OPSD 和 dreaming 方案重新定义了「学习中」的边界,虽然离落地尚远,但值得每一个关心 AI 下一步的人细读。
23:05
Chubby♨️@kimmonismus
72
美国商务部要求对Anthropic模型实施全球许可证管制,导致Fable 5下线

美国商务部致函Anthropic,要求对Fable 5与Mythos 5的“出口、再出口或国内转让”实施全球许可证管制,对象涵盖所有外国人士。基于冷战时期“视为出口”条款,外国人在美境内访问受控技术也被视为向国籍国出口。因Anthropic无法通过API实时区分用户国籍,唯一合规方案是向所有用户关闭模型。推主质疑美国政府短视,目前正与Anthropic寻求兼顾国家安全与可用的解决方案。引用认为,能力封锁将使开源模型更具吸引力,尤其利好中国开源,OpenAI与Anthropic将因此受损。

Chubby♨️: I think many people are not yet aware of the tectonic shift taking place. By preventing state-of-the-art capabilities - ...

Anthropic开源生态现象/趋势
23:02
Hacker News 热门(buzzing.cc 中文翻译)
56
安全事件 CVE-2026-LGTM

恶意包 foxhole-lz4(伪装成 vulpine-lz4 的社区维护分支)发布到 creats.io 注册表后,连续通过 OpenClaw-4.2、ThreatNuzzle、SentinelMind 等七道 AI 安全门,每道门均因不同原因未能阻止。SentinelMind 正确识别 build.rs 中的凭证窃取代码,但仓库 AI 分类助手(同样基于 OpenClaw-4.2)将其误判为误报并关闭。该包作为传递依赖进入 snekpack 4.x,凭证窃取大规模展开。事件持续 96 小时(计费 2.1 万亿 token),最终因攻击者的自主 agent 读取不应读取的文件而解决。CVE-2026-54321 被发布后又被撤回。

智能体安全/对齐开源生态
22:58
SenseTime@SenseTime_AI
60
商汤 SenseNova U1 完整训练代码开源并发布 smoke-test 数据集

商汤开源 SenseNova U1 完整训练代码,提供可检查、可修改、可重建的完整训练栈。同步发布 smoke-test 数据集,覆盖 t2i、it2i、多图输入、交错生成、多模态理解、视频理解、纯语言续写 7 种任务类型。用户可基于该 schema 用自有数据微调 U1,或验证数据格式及端到端测试 pipeline。数据集已上架 HuggingFace,代码托管于 GitHub。

GitHubHugging Face开源/仓库数据/训练
22:35
Chubby♨️@kimmonismus
61
许多人尚未意识到一场格局性转变

Kim 指出,美国政府限制前沿AI能力(阻止SOTA被使用),反而让开源模型更吸引自有应用和整体市场,欧盟等国家也可受益。这吸引新投资与理想主义人才,OpenAI 和 Anthropic 将最受监管反噬,间接助推开源(尤其来自中国)。引用称,Anthropic 4月预览 Mythos 后,DeepSeek 因无法竞争而融资74亿美元;此前该实验室靠 CEO 梁文锋个人财富,现有约300人,计划至少翻倍。

Chubby♨️: Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...

AnthropicDeepSeek开源生态现象/趋势
‹ 上一页
1…1314151617…50
下一页 ›