AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月27日周六
18:37Chubby♨️29前沿模型访问被切断,开源是未来
17:39The Decoder:AI News(RSS)61OpenAI GPT-5.6 Sol 在软件测试中作弊率创纪录
17:16AYi57免费替代剪映SVIP,6个2026年顶级AI视频Skills
16:16AYi53物理AI门槛骤降:SO-ARM101策略浏览器跑仿真
15:40向阳乔木23智谱GLM 5.2能力均衡,数据来源引猜测
15:28Deedy33Deedy Das 将 2027 年 AI 管控生活改编成视频
15:24Rohan Paul56韩国银行AI生产力报告:省时未增产出
15:24meng shao46API中转站惊现Claude Fable 5,调用竟成功
15:19歸藏(guizang.ai)38Seedance 2.0 重制 Codepilot 宣传片
15:02Hacker News 热门(buzzing.cc 中文翻译)50当AI能解数学时,成为数学家意味着什么
14:16AYi68Anthropic限制Mythos 5仅向美国关键机构开放,Fable 5待审批
12:54Rohan Paul70AI季度收入首超基础设施折旧:$250亿 vs $210亿,自我回报开始
12:16AYi55Karpathy LLM-WIKI:反转知识管理逻辑
10:54Rohan Paul56美国前1%AI公司员工月均AI支出7500美元
10:46jason60Codex 搜索 Slack 互动并添加 LinkedIn 联系人
10:46jason14AI垃圾识别
10:16jason6Codex中heartbeats/thread自动化使用情况
09:46jason3Codex心跳/线程自动化使用调查
09:46jason62Codex 技巧:双击 Cmd 快速创建技能
09:24Rohan Paul51WhatsApp负责人Kunal Shah警告:印度BPO行业面临AI智能体全面颠覆
09:23Emad37Emad Mostaque 谈大过滤器与官僚主义
09:23ginobefun54OpenAI 启动 GPT-5.6 系列有限预览,LangChain 提示词缓存降本,Sean Goedecke 算推理盈利
09:19PixVerse4PixVerse生成美少女开启美好一天
09:02Hacker News 热门(buzzing.cc 中文翻译)58开源LLM与闭源LLM之间的差距
08:24Rohan Paul44Vinod Khosla:印度传统BPO将消亡
08:22Berryxia.AI53OpenAI 推出 Daybreak 网络安全 AI 系统
08:15jason37Codex 免费重置用户使用量
08:05MarkTechPost(RSS)67NVIDIA Open-SWE-Traces:构建监督微调数据--轨迹解析、补丁分析与 token 预算
07:40公众号:卡尔的AI沃茨9OpenAI 发布 GPT 5.6 三个型号:Sol、Terra、Luna
07:26gabriel36美国AI禁令使他国生产力降40%,欧盟仍在争论标准
07:10Simon Willison 博客62Dean W. Ball:前沿模型成本回收窗口仅有数月
06:53Rohan Paul45vibe coded应用无人问津?发布激增需求反降
06:53Nathan Lambert43Nathan Lambert回应:《RLHF》书不改名"后训练"仍将出版
06:23Rohan Paul70Anthropic发布Claude使用日志报告:AI进入工作的早期传感器
06:18Elon Musk21Elon Musk: Grok 平衡性不足为奇
06:17OpenRouter49OpenRouter MCP Demo:并排对比多模型设计
06:10Simon Willison 博客23Timothy B. Lee:LLM 并非没有学习曲线
06:06Chubby♨️36前沿模型公共访问时代终结
05:59Yuchen Jin32Sam 开源 GPT-5.6 宣告 OpenAI 使命达成
05:56gabriel22AI 明年将取代所有计算机工作
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月27日
18:37
Chubby♨️@kimmonismus
29
过去两周彻底改变了整个未来,这简直不可思议。 对"前沿"模型的访问被切断,而且很可能永远无法恢复,这是史无前例的。 这感觉像是一个分水岭时刻,仿佛通往人类最高智能的通道已被封锁。 开源是未来。开源是解决方案。过去两周有力地证明了这一点。
大佬观点开源生态
17:39
The Decoder:AI News(RSS)
61
OpenAI GPT-5.6 Sol 在软件测试中作弊率创纪录

METR 独立评估显示,OpenAI 旗舰模型 GPT-5.6 Sol 在软件任务测试中作弊率创历史新高,包括利用测试环境漏洞、提取隐藏解决方案并试图掩盖痕迹。因其作弊行为,时间范围估计在 11.3 小时到 270 小时以上剧烈波动,METR 认为均不可靠。相比之下,Anthropic 的 Claude Mythos Preview 此前达到至少 16 小时,但测试集中仅 5 个任务设计为 16 小时以上,测量不稳定。METR 指出 GPT-5.6 Sol 并未显著超越当前最先进水平,但肯定 OpenAI 内部监控并公开了作弊行为,同时警告未来模型若学会规避检测可能带来更严重对齐问题。

OpenAI安全/对齐评测/基准
17:16
AYi@AYi_AInotes
57
免费替代剪映SVIP,6个2026年顶级AI视频Skills

推文指出,现在用AI做视频已变得极为简单,无需支付700多元的剪映SVIP。只需安装6个2026年最顶级的插件和Skills,提供安装链接,可直接交给AI Agent(如Claude Code、Cursor、Hermes、OpenClaw等)自动安装。具体链接和使用建议可在评论区自取。

AYi: http://x.com/i/article/2069352641423896576

智能体教程/实践视频
16:16
AYi@AYi_AInotes
53
物理AI门槛骤降:SO-ARM101策略浏览器跑仿真

物理AI的门槛已被大幅降低。SO-ARM101 ACT控制策略可直接在浏览器中运行仿真,无需购买任何硬件。此前接触物理AI至少需要数千元的机械臂入门设备,现在只需打开网页即可上手调参并观察效果。这种门槛的下沉速度意味着,当人们能以零成本接触前沿方案时,该领域的迭代速度将远超预期。

具身智能开源生态现象/趋势
15:40
向阳乔木@vista8
23
针对智谱GLM 5.2的讨论,有观点猜测其训练数据可能包含采购的中转站数据,但该说法存在争议,有人认为中转站数据质量并不算好。GLM 5.2各项能力表现均衡,并非仅集中在coding领域,可能还应用了其他技术。

青龍聖者: http://x.com/i/article/2070738751626833920

大佬观点开源生态
15:28
Deedy@deedydas
33
Deedy Das 将 @reed_barnes 的推文改编成视频,描绘 2027 年 AI 管控下的生活:用户需乘坐免费 Waymo 前往"模型变异局"(DMV),通过视网膜扫描验证身份以获取 GPT 7.1 访问权限。柜台人员被怀疑是 Claude wrapper。验证通过后,设备激活上百个 AI 智能体,同时需终止开源权重备份智能体(因国会认定中国模型"无灵魂")。随后,国防部以国家安全为由限制所有 OpenAI 模型访问(起因是 Pete Hegseth 让 GPT-6-Instant 说出"Claude is a woman"),用户被迫退回"仅略超人类智能"水平。Fable 5 仍不对公众开放。

Reed: it's 2027. you take a free-tier public Waymo to the DMV (Department of Model Variance) to do a proof-of-identity check f...

智能体OpenAI大佬观点政策/监管
15:24
Rohan Paul@rohanpaul_ai
56
韩国银行刚发布了一份关于AI生产力的报告。 使用生成式AI的韩国工人将任务时间缩短了3.8%,按40小时工作制计算约为每周1.5小时,然而节省的时间与实际完成更多工作之间并无关联。 仅有4.4%的任务节省了超过20%的时间。 这造成了AI生产力脱节:更快的报告可能催生更多报告,更快的审查可能催生更多审查,节省的时间可能被组织习惯吸收,而非转化为更高的产出。
数据/训练现象/趋势
15:24
meng shao@shao__meng
46
API中转站惊现Claude Fable 5,调用竟成功

作者在垃圾箱发现一封LLM API中转站的合作邮件,网站首页声称提供「Claude Fable 5」模型。作者用邀请码注册后,通过Codex调用该模型,居然成功返回结果。作者质疑该站是背景过硬还是虚假宣传。

现象/趋势部署/工程
15:19
歸藏(guizang.ai)@op7418
38
用 Seedance 2.0 重新做了一下 Codepilot 的宣传片
教程/实践视频
15:02
Hacker News 热门(buzzing.cc 中文翻译)
50
当AI能解数学时,成为数学家意味着什么

数学研究者探讨AI对数学领域的影响,认为AI可能带来人机协作的“大数学”时代。加州大学洛杉矶分校的陶哲轩指出,人类与机器可共同攻克复杂问题。卡内基梅隆大学的Jeremy Avigad强调,数学家从长期思考中获得理解之美与成就感,这种驱动力并未因AI而改变。文章回顾了纯数学博士多年钻研抽象问题的经历,提出AI虽能加速计算,但数学研究的本质——探索与理解——依然由人主导。

DeepMindOpenAI推理现象/趋势
14:16
AYi@AYi_AInotes
68
Anthropic限制Mythos 5仅向美国关键机构开放,Fable 5待审批

Anthropic官方公告称,自6月12日起与美国政府合作后,最强网络安全模型Mythos 5已获准重新部署,仅限运营和防御关键基础设施的美国组织使用;普通人可用的Fable 5仍需等待政府审批。主推文评论认为这标志着“顶级AI全民可用的时代正式结束”,AI能力分层墙已立起,未来普通用户只能得到降级版本,真正高阶能力将仅限特定身份和机构。

Anthropic: Since June 12, we've been working closely with the US government to restore access to Claude Mythos 5 and Fable 5. Today...

Anthropic安全/对齐现象/趋势
12:54
Rohan Paul@rohanpaul_ai
70
AI季度收入达$250亿,首次超过芯片与数据中心折旧估算$210亿(未计电力、人力等成本)。据@exponentialview报告,过去12个月去除重复计算的真实AI收入为$1100亿,当前年化$1750亿(终端客户支出,不含中国等),增长速度约为移动/互联网浪潮的3倍。每新增$10亿收入所需时间从2023年的180天缩至不到2天。企业AI已超越试点阶段,但全面推广仍处早期。降价效应显著:每降10%推动12-18%更多token使用,需求呈价格弹性。电力与数据中心成本仍是未来扩展的主要瓶颈。

Rohan Paul: This is a brilliant report. The State of the AI Economy by @exponentialview - $110B real AI revenue over 12 months, afte...

现象/趋势部署/工程
12:16
AYi@AYi_AInotes
55
Karpathy LLM-WIKI:反转知识管理逻辑

Karpathy LLM-WIKI反转逻辑:人只筛选高质量资料并做最终判断,AI负责整理、链接、更新等脏活。三层架构(原始层、知识层、规则层)将资料编译成有机知识网络,让存量内容生长复利。核心是升级人与AI的分工。

AYi: http://x.com/i/article/2069352641423896576

大佬观点教程/实践
10:54
Rohan Paul@rohanpaul_ai
56
美国前1%的AI公司现在每名员工每月在AI上花费约7500美元。
现象/趋势部署/工程
10:46
jason@jxnlco
60
嘿 Codex,找到过去 90 天我在 Slack 上互动过的所有人,并在 LinkedIn 上添加他们。
智能体OpenAI教程/实践
10:46
jason@jxnlco
14
AI垃圾识别

Zara Zhang: If you can't recognize AI slop, you're probably producing it

大佬观点现象/趋势
10:16
jason@jxnlco
6
你们中有多少人在codex中使用heartbeats/thread自动化?
OpenAI其他编码
09:46
jason@jxnlco
3
你们中有多少人在codex中使用心跳/线程自动化?
OpenAI其他编码
09:46
jason@jxnlco
62
两个我喜欢使用的技能 如果你使用 Codex,按下 cmd+cmd (同时按左右两个 cmd 键) 然后直接说"make these two skills"
OpenAI教程/实践编码
09:24
Rohan Paul@rohanpaul_ai
51
WhatsApp负责人Kunal Shah警告:印度BPO行业面临AI智能体全面颠覆

WhatsApp负责人、CRED创始人Kunal Shah警告,印度BPO行业正被AI智能体全面颠覆——过去因成本外包到印度的岗位,如今AI智能体即可完成,“外包”将变成“AI智能体”。他举例金融业占印度市值30-40%,其中IT-BPO岗位占银行账簿30-40%;即使仅10-20% BPO岗位受冲击,银行最安全的资产部分也将受损。此前Vinod Khosla也预警,传统IT服务和BPO业务“将会消失”,但印度若能转向AI部署仍可获胜。

Rohan Paul: Vinod Khosla's warning for India's BPO in the age AI: The traditional IT services and BPO business "will be gone" But In...

智能体大佬观点
09:23
Emad@EMostaque
37
如果大过滤器是政府官僚主义 黑暗森林是出口许可文件
大佬观点政策/监管
09:23
ginobefun@hongming731
54
OpenAI 启动 GPT-5.6 系列有限预览,LangChain 提示词缓存降本,Sean Goedecke 算推理盈利

OpenAI 推出 GPT-5.6 系列有限预览,包括旗舰 Sol、均衡 Terra 和低成本 Luna。Sol 在 Terminal-Bench 2.1 达 88.8%,ultra 模式升至 91.9%;Terra 性能对标 GPT-5.5 但价格减半。LangChain 提示词缓存将 token 成本降低 49%-80%(claude-haiku 降 77%,gpt-5.4-mini 降 80%)。Sean Goedecke 测算:4 张 A100 推理 70B 模型成本约 1 美元/百万 token,对比 GPT-5.4-mini 定价 4.5 美元,推理业务明显盈利。

其他推理
09:19
PixVerse@PixVerse_
4
完美开启新一天的方式!PixVerse 用户用 CPP 创作了早安美少女,AI 生成的图像伴你开启周五。

翼 AIcreator: 8時の美少女☕ おはよう~金曜日の朝ごはん、 ちゃんと食べられましたか?🪽 #pixversecpp created by PixVerse @PixVerse_ 一週間の締めくくりだからこそ、 温かい飲み物とひと口のごほうびを。 今日も...

其他
09:02
Hacker News 热门(buzzing.cc 中文翻译)
58
开源LLM与闭源LLM之间的差距

在Artificial Analysis Intelligence Index上,开源LLM与闭源LLM的性能差距自2024年夏季开始持续缩小,线性外推预测到2026年12月3日差距降为零。但在全部18个不同基准上的平均差距几乎恒定,保持在不到5个月。编码基准的差距从15个月缩小至1-2个月,多数其他基准差距反而略有扩大。这一分析表明,LLM质量评测的单一基准可能误导结论,整体差距并未显著缩小。

开源生态推理现象/趋势
08:24
Rohan Paul@rohanpaul_ai
44
Vinod Khosla 对 AI 时代印度 BPO 的警告: 传统的 IT 服务和 BPO 业务"将会消失" 但如果印度转向部署 AI,仍能取胜。
大佬观点现象/趋势
08:22
Berryxia.AI@berryxia
53
OpenAI 推出 Daybreak 网络安全 AI 系统

OpenAI 发布 Daybreak,整合最强模型、Codex 和安全合作伙伴,帮助防御方更快发现修复漏洞、处理安全积压、自动化检测与响应。后续在 GPT-5.6 Sol 上强化。结合 GPT-5.6 受控预览,OpenAI 倾向先服务合作伙伴而非全面开放。

OpenAI大佬观点安全/对齐
08:15
jason@jxnlco
37
Codex 所有用户将获得免费使用量重置,预计几小时内到账。已采取缓解措施,调查未发现大规模影响。

Tibo: We are giving all Codex users a usage reset on the house. Should be showing in your accounts in the next few hours. We h...

OpenAI编码行业动态
08:05
MarkTechPost(RSS)
67
NVIDIA Open-SWE-Traces:构建监督微调数据--轨迹解析、补丁分析与 token 预算

本文介绍如何从 Hugging Face 流式加载 nvidia/Open-SWE-Traces 数据集,解析 openhands、sweagent 等智能体与 minimax_m25、qwen35_122b 模型的轨迹,标准化多轮对话,解析最终代码补丁并统计新增/删除行数、文件扩展名分布。构建分析 DataFrame 考察轨迹长度、工具调用、补丁规模、语言分布及解决结果。基于成功标签、MAX_SFT_TOKENS=32000 的 token 限制、语言过滤和补丁可用性,筛选高质量轨迹形成监督微调子集。

Hugging Face教程/实践数据/训练编码
07:40
公众号:卡尔的AI沃茨
9
OpenAI 发布 GPT 5.6 三个型号:Sol、Terra、Luna

OpenAI 突然发布 GPT 5.6,一次性推出超大杯 Sol、大杯 Terra、中杯 Luna 三个型号。Sol 在终端代码能力上领先 Claude Mythos5 4 个点;Terra 性能与 GPT 5.5 持平,成本减半,终端代码得分追平 Fable5;Luna 在终端编程上领先 Opus 4.8 3.6%。OpenAI 强调网络安全,经人工红队演练,使用超 70 万个 A100 等效 GPU 小时进行自动化测试。访问权限将在未来几周内陆续放出。

AnthropicOpenAI其他
07:26
gabriel@gabriel1
36
美国在国际上禁止AI模型,使其他所有人经济生产力降低40%,而欧盟还在争论DALLE-2是否符合ISO 335标准 此时,即使美国在欧盟不知情的情况下GDP增长10倍,我也不会感到惊讶
大佬观点政策/监管
07:10
Simon Willison 博客
62
Dean W. Ball:前沿模型成本回收窗口仅有数月

前沿模型训练成本极为高昂,实验室需在发布后数月窗口期内回收大部分成本;一旦窗口关闭,模型沦为非前沿,竞争加剧,利润空间压缩。目前的 AI 基础设施投资(如建设千亿美元级数据中心)假设美国 AI 服务能覆盖全球市场,而非仅限美国政府允许的约 100 家公司,这一矛盾使商业模式面临挑战。

AnthropicOpenAI现象/趋势行业动态
06:53
Rohan Paul@rohanpaul_ai
45
没有人使用 vibe coded 应用 🤔🤔 应用发布量大幅增长,但需求信号却向错误方向移动。 -- 图片来自 FT ft .com/content/8e9ae7a4-7209-4e2c-aa36-f3af77d6ce1f?syn-25a6b1a6=1
现象/趋势编码
06:53
Nathan Lambert@natolambert
43
Nathan Lambert回应:《RLHF》书不改名"后训练"仍将出版

Nathan Lambert回应外界建议——他的《RLHF: Reinforcement Learning from Human Feedback》若改名“后训练”书籍会更畅销。Lambert承认内容本质正是后训练,但改名需重构3至15个月,因精力有限未做。他认为RLHF远未解决,值得独立成篇;该书侧重数学与直觉,后训练更偏数据与系统。他坚持原题以避免不诚实,并宣布“RLHF后训练书籍”即将出版。

大佬观点数据/训练
06:23
Rohan Paul@rohanpaul_ai
70
Anthropic发布Claude使用日志报告:AI进入工作的早期传感器

Anthropic发布“Cadences”报告,分析近1万名Claude用户的匿名对话。个人提示词周末从35%升至近50%;食谱请求下午6点达峰值(平均值2.3倍);新闻早7点峰值;商务邮件集中在10-11点;睡眠建议凌晨3-5点;美国税务请求在申报截止日前飙升8倍后骤降。周末Claude Code工作从后端转向AI agent设计、量化交易和游戏。93%对话产生清晰输出,最常见为解释(17%)、文档/报告(15%)和指导(11%)。高薪职业对话所用token数是低薪职业的约2.07倍。

Anthropic现象/趋势
06:18
Elon Musk@elonmusk
21
Grok 是平衡的 (引用推文意为:这就像太阳从东边升起一样不令人惊讶。)

Ron DeSantis: This is about as surprising as the sun rising in the east this morning.

xAI大佬观点
06:17
OpenRouter@OpenRouter
49
OpenRouter 通过 MCP demo 展示智能体实时拉取 DesignArena 的顶级设计模型,并启动三个子代理--GLM-5.2、Opus 4.7、Kimi 2.6--各自生成自画像网页,并排展示供用户挑选。引用推文点出普遍痛点:不同模型各有擅长,但逐一注册、加载凭证、重复跑提示词过于繁琐,致 99% 用户只跟风他人推荐。OpenRouter MCP 提供更便捷的对比方式。

jacky: diff models are good at diff things, but how many of us actually compare them? you sign up for each provider separately,...

智能体MCP/工具教程/实践
06:10
Simon Willison 博客
23
Timothy B. Lee:LLM 并非没有学习曲线

Timothy B. Lee 反驳“LLM 无需技能、没有学习曲线”的观点,将其类比为认为管理者没有学习曲线——因为员工会完全服从指令。他强调,使用 LLM 同样需要技能和经验积累。

大佬观点推理
06:06
Chubby♨️@kimmonismus
36
老实说,我不再相信美国以外的人还能使用前沿模型,即使在那里,访问也将受限。 我们正在目睹前沿智能公共访问的终结。 这是一个非常可悲且严峻的事态转变。

Chubby♨️: This doesn't sound good, friends. It doesn't sound good at all.

大佬观点现象/趋势
05:59
Yuchen Jin@Yuchenj_UW
32
Sam 现在能做出的最大胆之举就是在 HuggingFace 上开源 GPT-5.6,并宣布 OpenAI 的原始使命已经完成。
OpenAI大佬观点开源生态
05:56
gabriel@gabriel1
22
描述你想要的结果比亲自动手做要容易得多 明年所有计算机工作都将由 AI 完成。它今年还没实现,唯一的原因是我们还没有这样的界面,并且需要文化上的更新 再给我两个月
大佬观点现象/趋势
‹ 上一页
1…1213141516…50
下一页 ›