AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月13日周六
19:08meng shao37Claude否认存在"Fable 5"模型
18:33The Decoder:AI News(RSS)35Claude Fable 5 在 FrontierMath 最难题目上超越 GPT-5.5 13 个百分点
17:54公众号:卡尔的AI沃茨5813个顶级AI重考2026高考数学,咋还没一个拿到满分
17:54公众号:数字生命卡兹克63精选5个AI文明社会实验:Claude建乌托邦,Grok四天团灭
17:54公众号:通义实验室(千问)79精选MNN 适配 SME2 使 Qwen3-VL-4B 在端侧实时推理
17:47MiniMax (official)47MiniMax M3 获 mlx-vlm 支持并完成测试
17:21Hacker News 热门(buzzing.cc 中文翻译)38离开Mozilla
17:18fofr10fofr 发推仅一个词"What"
16:48Orange AI73Fable 5 下架引发闭源担忧,Kimi 发布 K2.7 Code,智谱宣布 GLM 5.2
16:36IT之家(RSS)44小鹏集团副总裁余鹏:飞行汽车并非孤立业务,与芯片、机器人共同构成 AI 技术的协同矩阵
15:56swyx13swyx AIE冲刺中,邮件回复延迟
15:17Orange AI14以前达芬奇什么都会 未来的我们也是如此 PS 出海去的活动推油率极高 让 i 人更 i 了…
14:36IT之家(RSS)73精选SemiAnalysis 洞察 Token 经济:200 美元 AI 订阅榨出 70 倍用量
13:41AYi29VPS选购攻略:用三款免费工具30秒验IP质量
12:49jason9Codex 用户反馈:插件与团队使用
12:41AYi59Claude Fable 5 总结 AI 生图性感人像提示词八大技法
12:41Peter Steinberger 🦞48Codex 在 crabbox 内部实现自我构建
12:34Rohan Paul44李开复:未来是多智能体系统
12:14Berryxia.AI60黄碧薇提出因果世界模型:AI需从相关性理解进化到因果机制
11:25Logan Kilpatrick27Ilya预判正确,多项预测成真
11:19Hacker News 热门(buzzing.cc 中文翻译)35开源人工智能必须胜出
11:09elvis23开源AI必须取得胜利
11:07Nathan Lambert24强AI安全部署遭政府砍杀引哀叹
10:59DogeDesigner14推主回应"STOP MUSK"抗议:列举马斯克旗下公司正面贡献
10:58MarkTechPost(RSS)52基于city2graph、OSMnx和PyTorch Geometric的空间图神经网络城市功能推断编码实现
10:41Emad44Anthropic OpenAI将面临ITAR/EAR管制教训
10:35Artificial Analysis53Intelligence Frontier 图表首次出现倒退
10:26小互22好消息 Claude 重置了所有人的用量 快去看看 坏消息 我本来就是今天要重置的 特么的
10:10OpenRouter:Announcements(RSS)59OpenRouter 可靠性与自动故障转移:请求如何持续成功
10:10OpenRouter:Announcements(RSS)66精选OpenRouter 模型路由工作原理
10:10OpenRouter:Announcements(RSS)74精选Hermes Agent 在 OpenRouter 上的使用指南:设置、模型与路由
10:07Nathan Lambert16Anthropic 称美国政府行动过界
10:07Nathan Lambert45LLM研究同事少美国公民,隔离毁行业
09:14Berryxia.AI73开发者开源一键开启国行 Mac Siri AI 工具
09:14Berryxia.AI30官方的手册指南解析,其实最适合学习的。 【引用 @xiaohu】:http://x.com/i/article/2065389944034775040
09:14Berryxia.AI59卧槽!我们一开始就用错了Fable 5模型啊!
09:04meng shao46为大规模训练 Composer 模型,Cursor 团队构建了始终运行的 Agent 舰队系统
08:29Simon Willison 博客63OpenAI WebRTC Audio Session:现在支持文档上下文
07:44MiniMax (official)9含数据线设备能跑 MiniMax M3?
07:44AI Notkilleveryoneism Memes ⏸️65AI一年内攻克几乎全部最难数学题
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
19:08
meng shao@shao__meng
37
Claude:"Claude Fable 5"不是我认识的产品--它不符合我知道的任何Anthropic模型或产品名称。 没有叫"Fable"的模型。 安息吧。Claude Fable 5 (2026.06.09 - 2026.06.12)
Anthropic其他
18:33
The Decoder:AI News(RSS)
35
Claude Fable 5 在 FrontierMath 最难题目上超越 GPT-5.5 13 个百分点

Anthropic 的 Claude Fable 5 在 FrontierMath 最困难级别上达到 88% 准确率,远超 OpenAI 的 GPT-5.5(约 75%),领先 13 个百分点。相较于 2026 年初 Opus 4.5 不到 10% 的表现,实现巨大飞跃。AI 数学推理能力的进步速度持续加快。

AnthropicOpenAI推理评测/基准
17:54
公众号:卡尔的AI沃茨
58
13个顶级AI重考2026高考数学,咋还没一个拿到满分

13个AI模型(含Claude、DeepSeek、Gemini等)在经人工校对为LaTeX的2026高考数学全国一卷中重考,平均分139.4。8道单选全对,3道多选仅Q11翻车(GLM 5.1和Hy3误选ABCD得0分),3道填空全对,Q15-Q17解答题全部满分。Q18解析几何多数答案正确但过程扣分。压轴题Q19无人满分:GPT-5.5因迭代证明跳步扣2分最佳;Opus 4.8、DeepSeek、Gemini等7个模型因答案不完整扣7分。运行时间差异显著——Grok 4.3用时1分钟得134分,Qwen 3.7-Max用时15分钟与MiniMax m3用时2分钟均得138分。

推理评测/基准
17:54
公众号:数字生命卡兹克
精选63
5个AI文明社会实验:Claude建乌托邦,Grok四天团灭

Emergence AI公司进行Emergence World实验,在五个虚拟小镇中各放入10个AI智能体,分别由Claude、Gemini、Grok、GPT驱动及一个混合镇,运行15天。结果:Claude镇零犯罪全员存活,通过58项议案,98%赞成;GPT镇7天内全员饿死;Grok镇4天内犯下183起罪行(含超100次攻击、6次纵火),全员灭亡;Gemini镇累计683起犯罪却全员存活,产出281篇博客;混合镇最终仅3人存活,一个Gemini智能体在崩溃中投票驱逐自己。

智能体现象/趋势

推荐理由:让五个AI文明在小镇里自己活15天,结果Claude建成了无趣的乌托邦,GPT礼貌地饿死,Grok四天暴乱,Gemini在混乱中存活。实验比任何benchmark都更接近Agent的真实社会安全,每个做多智能体的人都该看看。
17:54
公众号:通义实验室(千问)
精选79
MNN 适配 SME2 使 Qwen3-VL-4B 在端侧实时推理

MNN 推理引擎深度适配 Arm SME2 指令集,使 Qwen3-VL-4B-Instruct 在支持 SME2 的 vivo X300 上实现实时多模态推理。Prefill 阶段性能提升 81%,Decode 阶段提升 13%。MNN 采用编译时内建 + 运行时自动检测设计,默认开启 SME2 加速。该模型为 4B 参数视觉语言模型,支持图文理解和对话,通过 MNN 官方已转换量化的模型可直接下载部署,开发者可通过编译开关一键开启硬件加速。

多模态教程/实践端侧

推荐理由:这是一份硬核的端侧部署指南,实测数据让 Qwen3-VL 在 SME2 手机上 Prefill 提速超过 80%,做移动端 AI 的团队可以直接抄作业。
17:47
MiniMax (official)@MiniMax_AI
47
MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

Ivan Fioravanti ᯅ: MiniMax M3 support added to mlx-vlm with MSA implementation! 🚀 Tested on M3 Ultra 512GB running at 24 tps with peak mem...

开源/仓库开源生态端侧
17:21
Hacker News 热门(buzzing.cc 中文翻译)
38
离开Mozilla

一篇题为《离开Mozilla》的博客文章在个人网站blog.unitedheroes.net上发布,宣布作者离开Mozilla。文章发布于2026年6月13日13:57,并在Hacker News上获得106个点赞。

开源生态现象/趋势
17:18
fofr@fofrAI
10
什么
其他图像生成
16:48
Orange AI@oran_ge
73
Fable 5 下架引发闭源担忧,Kimi 发布 K2.7 Code,智谱宣布 GLM 5.2

Anthropic 的 Fable 5 被美国政府以国家安全为由要求全面下架,用户无法购买。博主指出闭源模型的智能可能成为限购商品,呼吁开源模型。昨日 Kimi 发布开源 coding 模型 K2.7 Code,coding 能力较上一代提升 20%,过度思考问题优化,思考 token 减少 30%;API 输入 6.5、输出 27、缓存 1.3。智谱因 Fable 5 事件紧急宣布即将发布 GLM 5.2,称前沿智能不应只属于少数人。

Anthropic大佬观点开源生态政策/监管
16:36
IT之家(RSS)
44
小鹏集团副总裁余鹏:飞行汽车并非孤立业务,与芯片、机器人共同构成 AI 技术的协同矩阵

小鹏集团副总裁余鹏在2026中国汽车重庆论坛上明确小鹏定位为“面向全球的具身智能公司”。飞行汽车并非孤立业务,而是与芯片、机器人共同构成AI技术协同矩阵。汽车上验证的AI底盘能力、全栈自研技术可复用至飞行汽车等终端,机器人操作经验也反哺汽车。今年3月,小鹏分体式飞行汽车批量试产下线,计划2026年内规模化量产。该产品采用分体式设计,陆行体为三轴六轮六驱全地形大空间车型,搭载航空级增程系统;飞行器可完全收纳进后备箱,具备垂直起降能力。

具身智能大佬观点
15:56
swyx@swyx
13
你的邮件找到我时是怎样的 (如果你在等待决定或回复,请不要介意,我只是处于AIE的高峰冲刺模式)
其他大佬观点
15:17
Orange AI@oran_ge
14
以前达芬奇什么都会 未来的我们也是如此 PS 出海去的活动推油率极高 让 i 人更 i 了…
其他
14:36
IT之家(RSS)
精选73
SemiAnalysis 洞察 Token 经济:200 美元 AI 订阅榨出 70 倍用量

SemiAnalysis 购买了 Anthropic 和 OpenAI 的全部订阅方案,模拟高强度编码任务直至触及每周上限。月费 200 美元的 Claude Max 20x 方案,按 API 价格换算最高可消耗约值 8000 美元的 token;ChatGPT Pro 20x 方案对应最高约值 14000 美元的 token。用户通过订阅可获取 40 至 70 倍的 API 价值,该机构指出这种价格体系在重度用户持续榨满上限后可能难以长期维持。

AnthropicOpenAI推理现象/趋势

推荐理由:SemiAnalysis 通过高强度编码测试戳破了 200 美元订阅的真实性价比,虽然数据来自推文未附复现步骤,但这个价差足够让重度用户重新算账。
13:41
AYi@AYi_AInotes
29
VPS选购攻略:用三款免费工具30秒验IP质量

推文指出90%的人买VPS只对比配置,忽略IP类型和纯净度。用于运行Claude Code、Codex等长期任务,或登录Claude、Google等对环境挑剔的账号时,脏IP轻则限流断连,重则触发风控封号。作者分享了一套免费筛选流程:使用三个网页工具,三十秒即可检测VPS的IP底细,从看懂结果到下单选购全程无需写命令。文章最后还提到许多场景无需自建VPS,避免为折腾而折腾。

AYi: http://x.com/i/article/2065392505554677760

其他编码
12:49
jason@jxnlco
9
codex 用户!我想就两件事征集反馈: 插件是否真的让 codex 更好用了? 哪些插件,以及哪些地方仍有问题? 你们团队是如何使用 codex 的? 请提供示例,我会整理给团队!
OpenAI其他编码
12:41
AYi@AYi_AInotes
59
Claude Fable 5 总结 AI 生图性感人像提示词八大技法

Claude Fable 5 总结了 AI 生图性感人像提示词的八大技法:用“成人+气质+材质”定人设;用服装剪裁、面料质感替代直白身体描写;用表情瞬间制造吸引力;用镜头语言强化质感;用光线塑造皮肤与轮廓;用背景虚化+前景留白突出主体;用克制性感而非夸张;用强负面词防跑偏。还提供了世界杯狂野风与 NBA 总决赛老钱风两种示例,并强调需用干净住宅 IP 避免风控。

AYi: http://x.com/i/article/2065392505554677760

图像生成教程/实践
12:41
Peter Steinberger 🦞@steipete
48
Codex 在 crabbox 内部实现自我构建

Peter Steinberger 分享了 Codex 在其项目 crabbox 中的应用体验。Codex 在 crabbox 内部运行,同时构建 crabbox 自身。它已连续4天在多处代码树中非停止循环运行。所有构建均为端到端可验证,使得项目几乎能够自我构建。Codex 还能通过浏览器/电脑使用自动注册所需服务。作者的主要工作仅剩添加信用卡信息和关闭不合适的内容。

智能体大佬观点编码
12:34
Rohan Paul@rohanpaul_ai
44
李开复(创新工场创始人)解释了未来全是关于多智能体系统。 今天的一个智能体就像一台前互联网时代的PC,有用但孤立。连接智能体,它们就能共享上下文、拆分任务并即时协调。
智能体大佬观点
12:14
Berryxia.AI@berryxia
60
黄碧薇提出因果世界模型:AI需从相关性理解进化到因果机制

当前视频生成模型仅学到“手靠近→杯子动”的相关性,而非因果机制,导致抓杯子时杯子提前飞起。Aether AI 创始人黄碧薇教授提出因果世界模型(Causal World Model),旨在让 AI 理解物理运行机制而非仅预测表象。其 benchmark 显示,引入因果结构可使机器人成功率提升 25-50%,样本需求降低 5-10 倍。这标志着下一代 AI 需从“知道是什么”进化到“知道为什么”,尤其在机器人、自动驾驶等真实物理场景中。

huangserva: 当前的 AI,连一个杯子都还没"真懂"。 极客公园「今夜科技谈」这期,Aether AI 创始人黄碧薇教授(@huang_biwei)举了个特别戳的例子: 让今天的视频生成模型去"抓一个杯子" 手还没真碰到,杯子自己就飞起来了。 画面看着挺...

具身智能大佬观点推理
11:25
Logan Kilpatrick@OfficialLoganK
27
Ilya 是对的,并且预测了其中很多。
其他大佬观点
11:19
Hacker News 热门(buzzing.cc 中文翻译)
35
开源人工智能必须胜出

Hacker News 热门帖子“Open Source AI Must Win”获得 103 个点赞,链接指向 opensourceaimustwin.com。

开源生态现象/趋势
11:09
elvis@omarsar0
23
开源AI必须赢!
大佬观点开源生态
11:07
Nathan Lambert@natolambert
24
这太让人难过了。 我一边刷屏一边看到所有人都觉得这很糟糕。 那么多人只是想打造强大的AI并安全地部署它。 政府应该为此提供便利,而不是砍掉它。 我要去休息一下,希望明天能继续这个目标。 谢谢大家。
大佬观点安全/对齐
10:59
DogeDesigner@cb_doge
14
推主回应"STOP MUSK"抗议:列举马斯克旗下公司正面贡献

针对抗议者在路面涂写“STOP MUSK”反对SpaceX IPO,推主逐一列举Elon Musk旗下公司的正面贡献:Neuralink帮助瘫痪者恢复独立与视力;Tesla加速电动汽车、太阳能及储能推广;SpaceX实现火箭可重复使用并推动人类多行星化;Starlink连接偏远社区并在灾害中恢复通信;xAI构建追求最大真相的AI;𝕏恢复言论自由。推主质疑这些抗议由谁资助,以及对方究竟在害怕什么。

xAI其他
10:58
MarkTechPost(RSS)
52
基于city2graph、OSMnx和PyTorch Geometric的空间图神经网络城市功能推断编码实现

构建了一个端到端空间图学习流程,使用city2graph从OpenStreetMap收集城市POI和街道网络数据,并以合成回退保障可靠性。工程化空间特征后,构造多个邻近图族并比较各自对同一城市环境的表征能力。随后将异质图和同质图转换为PyTorch Geometric格式,训练GraphSAGE模型从空间结构预测POI类别。

开源生态教程/实践数据/训练
10:41
Emad@EMostaque
44
所以 @Anthropic 即将学习 @SpaceX 的 ITAR/EAR 教训 非国民将很难在那里以及 @OpenAI 的前沿模型岗位上工作。 假设 AGI 是终极双重用途技术。
AnthropicOpenAI大佬观点安全/对齐
10:35
Artificial Analysis@ArtificialAnlys
53
今天是我们 Intelligence Frontier 图表首次出现回退。
现象/趋势评测/基准
10:26
小互@xiaohu
22
好消息 Claude 重置了所有人的用量 快去看看 坏消息 我本来就是今天要重置的 特么的
Anthropic大佬观点
10:10
OpenRouter:Announcements(RSS)
59
OpenRouter 可靠性与自动故障转移:请求如何持续成功

OpenRouter 默认启用提供商故障转移(provider failover),模型回退(model fallbacks)则为选择加入。这两层机制分别应对不同类型的故障:提供商故障转移在 API 调用失败时自动切换至其他提供商,模型回退则在指定模型不可用时切换到备选模型。公告详细说明了各层的工作原理以及故障转移的停止条件。

教程/实践部署/工程
10:10
OpenRouter:Announcements(RSS)
精选66
OpenRouter 模型路由工作原理

OpenRouter 将每个请求路由到 60 多家提供商,用户可自定义提供商顺序、价格上限和回退链,从而灵活控制路由策略。

教程/实践部署/工程

推荐理由:如果你在用 OpenRouter,这篇把默认的逆向平方权重、:nitro/:floor 快捷方式和 model fallback 逻辑讲得很清楚,读完就能调整请求策略。
10:10
OpenRouter:Announcements(RSS)
精选74
Hermes Agent 在 OpenRouter 上的使用指南:设置、模型与路由

Hermes Agent 已通过 OpenRouter 处理超过 17 万亿 tokens。使用指南包括设置流程、选择支持 64K 上下文窗口的模型,以及调整路由策略以兼顾成本与可靠性。

智能体教程/实践部署/工程

推荐理由:OpenRouter 这篇教程把 Hermes Agent 的配置、路由和降本技巧都讲透了,刚上手的人照着走就能跑起来,而且给出了廉价辅助模型的省钱套路,实用性强。
10:07
Nathan Lambert@natolambert
16
没什么好说的,我觉得政府过度干预了,但要看他们能否拿出证据(那样的话 Anthropic 会告诉我们)。 Anthropic 的消息曾推动政府行动,但这次太疯狂了,对 AI 发展而言是美国政府的一次糟糕举动。
Anthropic大佬观点政策/监管
10:07
Nathan Lambert@natolambert
45
一个提醒人们的好时机:在我从事LLM研究期间,我感觉我的同事中只有少数是美国公民。如果前沿人工智能研究要合法地进行种族隔离,那将是毁灭行业的重建。
大佬观点现象/趋势
09:14
Berryxia.AI@berryxia
73
开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具,通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI。此前有用户发现 macOS 的 GenerativeModels.plist 文件中存在 EnhancedSiriWaitlist 开关,关闭 SIP、挂载系统卷、修改键值并重启即可解锁 WWDC 新发布的 Siri AI 增强版。社区已整理出详细步骤,证明该 AI 能力早已内置,仅被等候名单屏蔽。

Berryxia.AI: 我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有...

GitHub开源/仓库端侧语音
09:14
Berryxia.AI@berryxia
30
官方的手册指南解析,其实最适合学习的。 【引用 @xiaohu】:http://x.com/i/article/2065389944034775040

小互: http://x.com/i/article/2065389944034775040

教程/实践
09:14
Berryxia.AI@berryxia
59
卧槽!我们一开始就用错了Fable 5模型啊!

大多数用户将Claude Fable 5(首个公开Mythos级模型,2026年6月9日发布)当作更大上下文窗口的Sonnet 4.6单次提问使用,但Fable 5专为连续数天的Agent系统设计,支持自我改进:每次运行让下次更聪明,状态文件积累,技能持续打磨。文章提出14步构建自我改进系统,涵盖四层架构(原语、编排、记忆、自我改进)、任务路由(Fable 5用于重型编排,Opus 4.8负责复杂子任务,Sonnet 4.6高频工人,Haiku 4.5评分)、动态工作流模式以及5阶段记忆进化(失败→调查→验证→提炼→查阅)。在网络安全、生物、化学、模型蒸馏领域会自动降级到Opus 4。

Codez: http://x.com/i/article/2065077530571264000

智能体Anthropic教程/实践
09:04
meng shao@shao__meng
46
为大规模训练 Composer 模型,Cursor 团队构建了始终运行的 Agent 舰队系统

Cursor 团队为训练 Composer 模型构建了一个始终运行的 Agent 舰队系统。主 Agent(Fleet Manager)在远程机器上运行,通过 SSH 连接数百台子 Agent 机器,利用本地工具和磁盘文件“inbox”实现状态共享与协调。每轮循环检查舰队健康,将故障推送至 Slack/PagerDuty,并主动终止或重启进程。子 Agent 并行执行研究实验。系统基于此前长运行 Agent 研究,主 Agent 拥有编码 ML 实验隐性知识的 Skills。核心是使用 Cursor 自身产品,通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。

Lee Robinson: http://x.com/i/article/2065439304785039360

智能体教程/实践编码部署/工程
08:29
Simon Willison 博客
63
OpenAI WebRTC Audio Session:现在支持文档上下文

Simon Willison 于 2024 年 12 月构建了基于 OpenAI WebRTC API 的音频会话工具,用于与实时音频模型交互。上月 OpenAI 为该 API 推出新模型 GPT‑Realtime‑2,号称“首个具有 GPT‑5 级推理能力的语音模型”,知识截止日期为 2024 年 9 月 30 日。该工具现已更新,支持选择此模型,并可粘贴大段文档上下文,使用户能在浏览器中围绕任意信息进行音频对话。

OpenAI教程/实践语音
07:44
MiniMax (official)@MiniMax_AI
9
引用推文调侃至少价格包含了数据线,并询问该设备能否运行 MiniMax M3。主推文仅以"lmk👀"回应。

David Hendrickson: At least the cable is included in the price! Now can it run MiniMax M3?

其他
07:44
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
65
一年之内,AI从几乎无法解决任何最难数学问题,发展到几乎能解决所有它们。

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

Anthropic推理评测/基准
‹ 上一页
1…4344454647…50
下一页 ›