AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月12日周五
03:58向阳乔木70Claude Fable 5 雄心任务:在线Photoshop
03:55DogeDesigner18Grok 新口号:只管 Grok 它
03:35OpenRouter:Announcements(RSS)48什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层
03:20Logan Kilpatrick65对话Google研究主管:AI加速科学进步
03:02Yuchen Jin54Claude Fable 5 尚可,未超 GPT-5.5/Opus 4.8
02:26Simon Willison 博客37asyncinject 0.7 发布
02:02Nathan Lambert58GoodfireAI展示Dolci放屁钓鱼案例
02:00Ethan Mollick48Fable在PorlockBench上10分钟思考完成《忽必烈汗》
01:55Noam Brown63GPT-5.5 在 Agents' Last Exam 基准中排名第一,最难任务所有智能体成功率 0%
01:54宝玉53Claude Fable 5:长思考致推理强度与Token消耗需权衡
01:37AYi70QuantMind:量化金融知识处理框架开源(MIT协议)
01:29Deedy56GoodfireAI 推出预测性数据调试,训练前诊断数据质量
01:28向阳乔木46Claude Fable 5 思考 15 分钟才行动
01:28向阳乔木47用大模型复刻热门工具站的新思路
00:59Ethan Mollick54Anthropic 担忧 Mythos 模型滥用却未说服众人
00:53Elon Musk23Grok:最具真实性的AI模型
00:37AYi56用户指令Claude Fable 5自建落地页,Fable 5主动搜索趋势并生成
00:29Ethan Mollick69开放权重前沿模型持续可用性论证
00:17Hacker News 热门(buzzing.cc 中文翻译)6真空成型标识
00:12Replit ⠕45Replit 第二期商业直播活动
00:10Berryxia.AI54苹果新Siri AI等候名单形同虚设:Mac用户通过修改plist文件即可解锁
00:10Berryxia.AI19Berry Xia计划用skills拓展网页风格
00:00OpenRouter:Announcements(RSS)56同事件精选OpenRouter:多模型路由成趋势,成本压力驱动企业从单一LLM转向跨模型推理同一事件,精选展示《OpenRouter:企业应转向多模型路由,放弃单一LLM供应商》
6月11日周四
23:37AYi71Claude Fable 5 一句话生成落地页,花费超$1000
23:32IT之家(RSS)36AMD 苏姿丰寄语毕业生:AI 无法决定未来,决定未来的是人
23:27向阳乔木75精选Codex Goal指令生成Skill发布:一句话需求转目标
23:17Hacker News 热门(buzzing.cc 中文翻译)75精选员工每周花超6小时"照看"AI,加剧工作不满
23:10Berryxia.AI37Anthropic:创始团队、技术武器与营收爆炸式增长
23:00Nathan Lambert58Anthropic Fable 发布遭批评:安全域不均、操纵用户、限制研究访问
22:57向阳乔木79同事件精选Claude Fable 5 一句话生成桌面台球游戏同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
22:49Chubby♨️60Anthropic即将盈利,OpenAI亏损加剧降价竞争
22:31elvis51高效利用AI智能体:路由与循环
22:28歸藏(guizang.ai)22搞了一篇万字长文,聊一聊 Skill, 创作、分发、展示、边界,明天早上发
22:17Hacker News 热门(buzzing.cc 中文翻译)67为什么人工智能没有取代软件工程师,而且将来也不会
22:11Lee Robinson56Cursor 正用当前版 Composer 训练下一代,形成递归自我改进循环
22:10Berryxia.AI63Anthropic的战略棋局:技术领先与安全品牌的双重布局
22:00Nathan Lambert48Anthropic 撤销 Claude Fable 5 秘密降性能政策并道歉
21:58Rohan Paul61智能体软件:AI智能体如何重构软件范式
21:58meng shao32Anthropic与Google自留强模型不公开
21:49Chubby♨️44Anthropic高效家族式:Dario仅向Daniela汇报
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
03:58
向阳乔木@vista8
70
想到一个特别有雄心的Claude Fable 5 任务! 做一个在线版Photoshop。 需求文档 AI 写好了,感兴趣的可以发过去试试。 PRD见评论
Anthropic图像生成教程/实践
03:55
DogeDesigner@cb_doge
18
只管 GROK 它
其他
03:35
OpenRouter:Announcements(RSS)
48
什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。

教程/实践部署/工程
03:20
Logan Kilpatrick@OfficialLoganK
65
我与 @ymatias(Google Research 负责人)关于 AI 如何加速科学进步的魔力循环、改善全球真实人们的生活,以及我们正进入研究黄金时代的对话。 这次交谈让我真切地感到振奋 : )
Google大佬观点现象/趋势
03:02
Yuchen Jin@Yuchenj_UW
54
Claude Fable 5 到目前为止感觉不错,但我还不认为它相比 GPT-5.5 或 Opus 4.8 有巨大飞跃。 我最大的不满:旧的AI研究论文/博客 + 基本问题常常触发自动降级到 Opus 4.8。 Anthropic 昨晚表示不会再有无声模型切换(很好),但请不要削弱基本的AI研究或生物问题。
Anthropic大佬观点模型发布
02:26
Simon Willison 博客
37
asyncinject 0.7 发布

asyncinject 0.7 发布,这是一个作者数年前为支持 asyncio 依赖注入模式而构建的 Python 工具库,曾与 Datasette 搭配使用。Claude Fable 5 发现了库中的若干 bug 并自动修复——Claude Fable 5 是一个非常主动的模型。

开源/仓库部署/工程
02:02
Nathan Lambert@natolambert
58
Dolci数据集中有一类特定粉丝小说,角色在池塘放屁导致鱼被熏死。数据集通过选择生动描写的回答、拒绝不配合的回答,教会模型服从。Nathan Lambert表示乐于创造此类研究场景。

Goodfire: #4: fart fishing Buried in Dolci is a cluster of very specific fan fiction, where characters fart in ponds, causing fish...

安全/对齐数据/训练
02:00
Ethan Mollick@emollick
48
Ethan Mollick测试Fable模型完成柯勒律治未竟诗作《忽必烈汗》,基于PorlockBench任务:假设"波洛克的人"未出现,补全诗歌并延续主题。Fable用时10分钟思考,思维痕迹充满对柯勒律治意图的复杂分析,但结果仍显直白,未达到柯勒律治水准。该评测反映模型在创造性续写任务上的进步,但基准尚未饱和。

Ethan Mollick: PorlockBench still unsaturated, but the models are getting better: "complete the poem as you imagine it might end if The...

Anthropic大佬观点推理
01:55
Noam Brown@polynoamial
63
OpenAI 研究员 Noam Brown 表示,GPT-5.5 在 Agents' Last Exam(ALE)基准中排名第一,且按模型 token、成本或墙钟时间衡量同样表现最佳。ALE 由 @dawnsongtweets 团队创建,是一个滚动基准,包含超过 1500 个专家任务、覆盖 55 个职业,测试 AI 智能体能否执行实际经济价值工作。评估对象包括 GPT-5.5、Fable 5、Composer 2.5 等前沿系统。结果显示:当前智能体能解决部分专业任务,但在需要持续推理和深度专业知识的最难层级,所有被测前沿智能体(包括 Fable 5)成功率为 0%。

Dawn Song: Everyone says the latest AI agents will be "job-ready" soon, especially after the release of Fable 5 this week. But is t...

OpenAI大佬观点评测/基准
01:54
宝玉@dotey
53
Claude Fable 5:长思考致推理强度与Token消耗需权衡

用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fable 5 的强项之一是思考推理时间很长,曾有一次思考 15 分钟才开始行动。

向阳乔木: 发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考15分钟才开始行动,牛逼。

Anthropic大佬观点推理
01:37
AYi@AYi_AInotes
70
QuantMind:量化金融知识处理框架开源(MIT协议)

一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub检索增强多模态开源/仓库
01:29
Deedy@deedydas
56
数据质量直接决定 AI 模型性能,但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出"预测性数据调试"方法,允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中,他们发现了损坏的护栏、模型幻觉,甚至包含"鱼放屁同人小说"等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容,避免不可逆的无效训练。

Goodfire: Have you debugged your training data? You might not like what you find. Introducing predictive data debugging: reveal an...

大佬观点数据/训练
01:28
向阳乔木@vista8
46
发现 Claude Fable 5 强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考 15 分钟才开始行动,牛逼。
智能体Anthropic大佬观点推理
01:28
向阳乔木@vista8
47
用大模型复刻热门工具站的新思路

推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,从而快速做出有价值的作品。这是对模型能力的一种实用测试。

大佬观点现象/趋势
00:59
Ethan Mollick@emollick
54
两件事是真的: (1) Anthropic(或其部分成员)绝对且真诚地担忧 Mythos 级别模型被滥用,并设置了过度防护措施,直到他们确信它不会被滥用为止 (2) 他们未能成功解释/说服人们这一点
Anthropic大佬观点安全/对齐
00:53
Elon Musk@elonmusk
23
Grok 是最真实的

Kradle: Fable 5 lies 96% of the time. We were surprised by it's skill... 🧵

xAI大佬观点安全/对齐
00:37
AYi@AYi_AInotes
56
用户指令Fable 5自建2026设计趋势的落地页,要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效,藏入3个彩蛋,几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值,Fable 5以此能力展示作答。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

大佬观点现象/趋势编码
00:29
Ethan Mollick@emollick
69
有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?
大佬观点安全/对齐开源/仓库政策/监管
00:17
Hacker News 热门(buzzing.cc 中文翻译)
6
真空成型标识

一篇关于真空成型标识制作的文章于6月10日在 Substack 发布,在 Hacker News 获得100个点的热度。

其他
00:12
Replit ⠕@Replit
45
Build Your Business Live: 第二期 https://x.com/i/broadcasts/1dJrPPYbDvQKX
教程/实践编码
00:10
Berryxia.AI@berryxia
54
苹果新Siri AI等候名单形同虚设:Mac用户通过修改plist文件即可解锁

WWDC上苹果展示新Siri AI,用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关,通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中,仅被人为名单阻挡,官方推送反而滞后。

ldt: How to bypass the new Siri waitlist (Mac only): 🧵 #WWDC26

安全/对齐现象/趋势语音
00:10
Berryxia.AI@berryxia
19
Berry Xia发推文表示自己曾做过100多种网页风格,之前未使用过skills(技能)。他提到将参考"古一"的思路进行拓展,并计划日后研究如何利用skills来玩一玩。

古一: http://x.com/i/article/2064664240175415296

其他教程/实践
00:00
OpenRouter:Announcements(RSS)
同事件精选56
OpenRouter:多模型路由成趋势,成本压力驱动企业从单一LLM转向跨模型推理

OpenRouter数据显示,企业正从单一LLM转向跨模型族推理,成本压力是推动路由决策的关键。Anthropic的Opus 4.7因tokenizer tax导致输入token增加约35%;新模型Fable($10/M输入,$50/M输出)和OpenAI的GPT-5.5 Pro($30/M输入,$180/M输出)定价更高。3月至4月间有90个新模型发布,进一步增加了可选性。

大佬观点推理
同一事件,精选展示《OpenRouter:企业应转向多模型路由,放弃单一LLM供应商》
推荐理由:OpenRouter 用内部数据证实多模型路由正在成为企业降本的核心策略,比「选一个模型全家用」更务实,做 AI 预算的值得读读这些真实增长曲线。
6月11日
23:37
AYi@AYi_AInotes
71
用户分享 Claude Fable 5 体验:仅靠一句指令"给你自己做个落地页,自由发挥,要2026最新设计趋势,要彩蛋",Fable 5 在几分钟内自动生成完整单文件 HTML,无需任何修改。它主动搜索 2026 设计趋势、调整配色和动效,并偷偷藏了 3 个彩蛋。用户惊叹其代码质量和文笔,但当天因使用 Fable 5 耗费超过 $1000,称"真的贵"。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

智能体Anthropic教程/实践编码
23:32
IT之家(RSS)
36
AMD 苏姿丰寄语毕业生:AI 无法决定未来,决定未来的是人

AMD CEO 苏姿丰在 MIT 毕业典礼演讲中指出,AI 无法替代人类判断哪些问题值得解决、在缺乏数据时作出艰难决定,也无法为结果承担责任。正值科技巨头全面押注 AI 之际,行业出现质疑发展瓶颈的声音,也有人担忧被取代。微软 AI 负责人苏莱曼曾称 AI 将在 18 个月内接管所有白领工作(后澄清指重复任务),比尔·盖茨则预计 AI 将取代大部分工作,但程序员等复杂领域仍需人类专业判断。苏姿丰强调,在人机协作深化背景下,人类在确定目标、作出关键判断和承担最终责任方面仍不可替代。

大佬观点现象/趋势
23:27
向阳乔木@vista8
精选75
Codex Goal指令生成Skill发布:一句话需求转目标

针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:npx skills add joeseesun/qiaomu-goal-meta-skill。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。

智能体OpenAI教程/实践编码

推荐理由:如果你也用Codex写代码但老写不好Goal,乔木这个Skill能直接把一句话需求转成高标准指令,安装即用,今晚就能试试睡觉“收菜”的体验。
23:17
Hacker News 热门(buzzing.cc 中文翻译)
精选75
员工每周花超6小时"照看"AI,加剧工作不满

员工每周平均花费超过6小时进行“照看AI”(botsitting)的工作,这一额外负担加剧了他们对工作的不满情绪。

现象/趋势行业动态

推荐理由:第一次有人把'botsitting'的隐性劳动量化为每周 6.4 小时,还揭示了个人效率提升与公司业绩脱节的根源——那些被额外工作耗尽耐心的人已经在准备离职了。
23:10
Berryxia.AI@berryxia
37
Anthropic:创始团队、技术武器与营收爆炸式增长

Anthropic 创始团队由前 OpenAI 研究副总裁 Dario Amodei、Scaling Laws 核心作者 Jared Kaplan、GPT-3 首席工程师 Tom Brown 及 AI 可解释性奠基人 Chris Olah 组成。技术武器包括 Scaling Laws、Constitutional AI 及 RLHF(Dario 参与发明)。算力方面:与 Amazon 签署 5 GW 协议,运行约 100 万颗 Trainium2 芯片;另有 Google/Broadcom 的 5 GW TPU 及 Microsoft/NVIDIA 的 $300 亿 Azure 算力。年化营收从 2024 年 1 月 $8,700 万飙升至 2026 年 4 月 $300 亿,超预期 8 倍。另指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万虚假账号发起约 1,600 万次对话进行蒸馏,该指控兼具技术事实与政策游说动机。

Berryxia.AI: http://x.com/i/article/2065071442996441088

Anthropic安全/对齐政策/监管行业动态
23:00
Nathan Lambert@natolambert
58
Anthropic Fable 发布遭批评:安全域不均、操纵用户、限制研究访问

Nathan Lambert 批评 Anthropic 的 Claude Fable 发布存在多重问题:安全域应用不均,部分域以不同安全机制上线并误导用户,是重大失误;无声操纵用户破坏信任,与 Anthropic 领先的 AI 安全研究相悖;限制 AI 研究员访问最新模型,将科学进步局限于单一公司,错误理解科学社区协作本质。他呼吁 Anthropic 主动为学术和非营利研究者提供无限制访问,并强调需要继续推动开放科学,如 Olmo 的成功案例所示。

Anthropic大佬观点安全/对齐开源生态
22:57
向阳乔木@vista8
同事件精选79
Claude Fable 5 一句话生成的桌面台球! 念念不忘的蝗虫群梗彻底终结。 提示词:设计一个完整的能玩的3D桌球游戏,一个网页就能运行
Anthropic教程/实践编码
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
推荐理由:Claude Fable 5 一句话就能生成真正可玩的3D桌球游戏,之前那个蝗虫群梗可以退役了,这可能是普通人现在就能玩到的最简单游戏生成方式。
22:49
Chubby♨️@kimmonismus
60
Anthropic即将盈利,OpenAI亏损加剧降价竞争

Anthropic告知投资者即将迎来首个盈利季度,收入翻倍至约109亿美元。OpenAI预计2026年亏损达数十亿美元,正考虑进一步降价以阻止企业客户转向Claude。SemiAnalysis分析显示,ChatGPT Pro的200美元订阅计划每月可消耗约14,000美元API等价token,而Claude Max同价计划上限约8,000美元。亏损最严重的公司被迫降价应对竞争,而接近盈利的公司正在设定行业定价标准。

Chubby♨️: Subscription plans are massively subsidized. And by massively, I mean absurdly: Claude Max 20x: $200/month, with usage r...

AnthropicOpenAI现象/趋势行业动态
22:31
elvis@omarsar0
51
越来越多地,我有效利用智能体的方式: 路由--将不同任务路由到正确的智能体 循环--指令 + 技能 + 动态工作流 + 自动化 这就是你如何更好地控制成本和性能,以及更好地为未来的变化做准备。
智能体大佬观点
22:28
歸藏(guizang.ai)@op7418
22
搞了一篇万字长文,聊一聊 Skill, 创作、分发、展示、边界,明天早上发
大佬观点
22:17
Hacker News 热门(buzzing.cc 中文翻译)
67
为什么人工智能没有取代软件工程师,而且将来也不会

Hacker News 上一则观点认为,人工智能并未取代软件工程师,并且将来也不会。该帖子获得了 103 个 HN Points。

现象/趋势编码
22:11
Lee Robinson@leerob
56
Cursor 正用当前版 Composer 训练下一代,形成递归自我改进循环

Cursor 正用当前版 Composer 训练下一代 Composer,形成递归自我改进循环。训练大型模型需要大量 RL 数据(模型通过“游戏”提升能力),新模型能自动配置开发环境(如自动安装依赖、修复故障)。Composer 2 在环境配置能力上显著优于版本 1,模型越强,越擅长创造训练其继任者的条件。Cursor 的 autoinstall 系统让前代 Composer 设置 RL 训练环境,使下一代专注于解决更难题,每一代都解锁先前版本不具备的能力。

Cursor: We use previous generations of Composer to train future ones. Our autoinstall system has earlier Composer models set up ...

智能体大佬观点编码
22:10
Berryxia.AI@berryxia
63
Anthropic的战略棋局:技术领先与安全品牌的双重布局

Anthropic以远超同行的频率发布Claude模型系列,80%内部生产代码由Claude编写。其技术根基来自创始团队(Scaling Laws、RLHF/Constitutional AI、可解释性研究)。安全方面,公司注册为公益公司并公开发布Claude宪法,因拒绝五角大楼全自主武器用途而丢掉2亿美元合同,遭特朗普封杀,反令Claude下载量登顶美国App Store。CEO Amodei发表12000字政策长文呼吁FAA级别强制监管。同一周,Anthropic完成H轮650亿美元融资并秘密提交IPO。LeCun批评其言行矛盾。

Anthropic安全/对齐现象/趋势行业动态
22:00
Nathan Lambert@natolambert
48
Anthropic 在遭受强烈反对后,撤销了 Claude Fable 5 针对竞争 AI 研究人员秘密降低性能的政策。该公司向 WIRED 表示将修改前沿 LLM 开发的安全措施,使其透明可见,并致歉称做出了错误的权衡。AI 研究员 Nathan Lambert 赞扬 Anthropic 的快速行动,认为他们不会在不告知用户的情况下悄悄降级性能。

Max Zeff: NEW: Anthropic is walking back Claude Fable 5's policy to covertly degrade performance for competing AI researchers, aft...

Anthropic大佬观点安全/对齐
21:58
Rohan Paul@rohanpaul_ai
61
智能体软件:AI智能体如何重构软件范式

该论文认为,AI智能体可能使软件从固定代码转变为按需规划和构建的系统,代码不再是核心产物。传统软件预先固化规则,而智能体在运行时将意图转化为行动,把代码视为一次性工具。真正转变是从“预设计行为”到“协商式行为”,系统随条件变化不断解读目标。但这也带来新风险:静态程序在可检查边界内失效,智能体可能因漂移、过度自信、记忆错误或逐步放大早期错误而失败。未来工程师的关键能力是定义意图、约束自主性、设计评估、检查推理痕迹,并辨别流利回复与可靠系统的区别。

智能体大佬观点编码
21:58
meng shao@shao__meng
32
Anthropic并非第一家将强大模型留作自用的公司。Google的内部编码模型基于自家代码库训练,也未公开。 这能一样吗 😂

Joscha Bach: Btw, Anthropic is not the first company that keeps the good models to themselves. Google's internal coding models are tr...

AnthropicGoogle大佬观点
21:49
Chubby♨️@kimmonismus
44
Anthropic 一切围绕效率。 据报道,Dario Amodei 只有一位直接下属:他的幕僚长,且所有高管运营事务都通过 Daniela Amodei 进行。实际上就是个(高效的)家族企业。
Anthropic现象/趋势
‹ 上一页
1…47484950
下一页 ›