AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月28日周日
04:38Chubby♨️68Anthropic预测2028年前出现自主改进AI
03:47OpenRouter53OpenRouter:四开放权重模型驱动智能体管道
03:29elvis22循环工程即系统设计增强的提示词工程
03:26swyx 🔜 @aiDotEngineer51swyx引Noam Brown:开源模型评估应以美元成本而非token数为基准
03:25Nathan Lambert38AI研究员Nathan Lambert:因批评监管俘获与开源攻击遭更多敌意
03:25Hugging Face:Blog(RSS)62精选一条命令在HF Jobs上启动vLLM服务器
03:20Ethan Mollick46AI认知分歧:指数增长与稳态的误解
02:46The Verge:AI(RSS)50玛格丽特·阿特伍德批评AI:只用过一次Claude,给出错误答案,直言"垃圾进垃圾出"
02:22Berryxia.AI52Anthropic Fable 被美国政府要求下架,OpenAI GPT-5.6 被迫延迟发布
02:19Ethan Mollick56开放AI讨论须区分开源与开放权重模型
02:08Chubby♨️40Kim评论GPT-5.6评测:性价比或优于Fable 5,但Fable 5.1仍是整体更优选择
01:55Rohan Paul58美国AI基础设施建设瓶颈从GPU转为许可:300多项数据中心禁令,但水耗与电费担忧被数据驳斥
01:44凡人小北49医疗AI的真正壁垒:工作流而非答题准确率
01:28SemiAnalysis64SemiAnalysis:AI token支出已达薪酬30%
01:22Berryxia.AI51Anthropic 分享 Claude Code 记忆管理方法论:四层架构与"做梦"机制
01:22Berryxia.AI65Anthropic Lamis谈上下文工程实践:从Claude MD到"做梦"机制
01:16AYi62Cloudflare免费使用GLM 5.2有每日限制
01:16AYi73LangChain 从零构建深度 Agent 教程:三大上下文工程技巧解决长任务忘事崩链
00:49Ethan Mollick25新许可制度终结实验室模糊新模型发布
00:25宝玉55OpenAI 从 ChatGPT 移除 GPT-4.5,GPT-4 时代在消费端终结
00:25宝玉61宝玉:Codex/Claude Code上下文压缩成熟,配合fork和/btw功能体验提升
00:03Hacker News 热门(buzzing.cc 中文翻译)81精选一次失败的(民族国家?)攻击的剖析
6月27日周六
23:55Nathan Lambert41Anthropic对蒸馏施压实为监管捕获
23:29elvis39Eve:最简单的智能体构建方式
23:25宝玉51AI基建中的老登与新登:从讨厌到理解
22:55meng shao49美国限制AI出口,中国开源模型追赶成难题
22:48TechCrunch:AI(RSS)50Conno Christou用AI辅助决策治疗罕见淋巴瘤
22:40向阳乔木46第二次GEO公开课:GEO内容工程直播资料汇总
22:19歸藏(guizang.ai)43Seedance 2.0 4K 文字清晰度惊艳,重制宣传片材质质感飙升
21:40The Decoder:AI News(RSS)64J.P. Morgan:AI市场现多重集中风险信号
21:22Berryxia.AI22虽然看不懂二次元,但明显还是比AI生成的视频更好看一些哈😂 现在二次元感觉也挺主流的,只是老登的我可能没有跟上节奏吧😂
21:22Berryxia.AI66Codex玩法大全集锦:变现、记忆、实战全覆盖
21:13凡人小北18技术奇点已到,可以去崩老头了 【引用 @xiaohu】:http://x.com/i/article/2070795179813203968
18:41OpenRouter:Announcements(RSS)502026年6月值得关注的开放权重模型
18:37Chubby♨️29前沿模型访问被切断,开源是未来
17:39The Decoder:AI News(RSS)61OpenAI GPT-5.6 Sol 在软件测试中作弊率创纪录
17:16AYi57免费替代剪映SVIP,6个2026年顶级AI视频Skills
16:16AYi53物理AI门槛骤降:SO-ARM101策略浏览器跑仿真
15:40向阳乔木23智谱GLM 5.2能力均衡,数据来源引猜测
15:28Deedy33Deedy Das 将 2027 年 AI 管控生活改编成视频
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月28日
04:38
Chubby♨️@kimmonismus
68
Anthropic 完全相信 RSI: "我的预测是,到2028年底,我们很有可能拥有一个AI系统,你可以对它说,'造一个更好的你自己。'完全自主地完成。"
Anthropic大佬观点现象/趋势
03:47
OpenRouter@OpenRouter
53
四个开放权重模型已进入能驱动真实智能体管道的领域。 我们的Insights博客新文章,关于为何公司在6月选择它们:https://openrouter.ai/blog/insights/the-open-weight-models-that-matter-june-2026/
智能体开源生态现象/趋势
03:29
elvis@omarsar0
22
循环工程就是带优秀系统设计的提示词工程。
智能体大佬观点
03:26
swyx 🔜 @aiDotEngineer@swyx
51
swyx引用OpenAI研究员Noam Brown的观点,强调任何评估报告都应保持恒定推理预算。由于开源模型每美元可获得的token量远超闭源API,因此发布开源模型时,应按主流推理提供商的美元成本(而非token数量)来报告思考水平。该观点源自@saranormous与Noam Brown的播客,他们讨论了大规模测试时计算的后果--模型被给予1000万美元预算处理单一任务,并探讨了基准测试失效、计算预算扩展、能力随投入增长及安全等问题。

sarah guo: Really fun to hang again with my friend 🃏 @polynoamial (OpenAI research scientist, our first guest ever on @NoPriorsPod...

大佬观点开源生态评测/基准
03:25
Nathan Lambert@natolambert
38
AI研究员Nathan Lambert:因批评监管俘获与开源攻击遭更多敌意

AI研究员Nathan Lambert发文称,因公开批评监管俘获(regulatory capture)及无意中对开源发起的攻击,他遭到比以往更多的敌意。他认为业内很少有人能自由发声,许多人私下赞同他的观点。Lambert选择在非营利组织工作、放弃大量财富,以捍卫更开放、包容、公平的AI应用未来。他并非绝对开源主义者,也不认为一切都要开源,同时不满同路人嘲笑Anthropic的行为。他强调当前更多开放性比支持封闭事业更有益。

大佬观点安全/对齐开源生态
03:25
Hugging Face:Blog(RSS)
精选62
一条命令在HF Jobs上启动vLLM服务器

HuggingFace Jobs 支持一条命令启动 vLLM 服务器,用于测试、评估或批量生成。使用 hf jobs run 命令,指定官方 vllm/vllm-openai 镜像、GPU flavor(如 a10g-large)、暴露端口 8000 并设置超时。服务器启动后可通过 OpenAI 兼容 API 访问,每次请求需携带 HF token 作为 bearer token(仅限有读权限的用户)。示例部署了 Qwen/Qwen3-4B(多 GPU 需 --tensor-parallel-size)。a10g-large 价格为 $1.50/小时,按分钟计费,可通过 hf jobs cancel 停止。

Hugging Face教程/实践部署/工程

推荐理由:这是一条命令在HF上启动vLLM的完整教程,适合快速测试模型的开发者,但方案完全绑定Hugging Face平台,通用性有限。
03:20
Ethan Mollick@emollick
46
我注意到的一件事是,现在相信AI是"真实"的人更多了,但在那些知道我们正处于指数增长的人与那些心智模型认为我们处于某种稳态的人之间,分歧正在扩大。这种差异导致了误解。
大佬观点现象/趋势
02:46
The Verge:AI(RSS)
50
玛格丽特·阿特伍德批评AI:只用过一次Claude,给出错误答案,直言"垃圾进垃圾出"

《使女的故事》作者玛格丽特·阿特伍德在葡萄牙波尔图的Babell文学节上表示,她仅用过一次Anthropic的Claude聊天机器人,询问英国侦探剧《Father Brown》的结局,但Claude给出了错误答案。她指出大语言模型从电视评论中采样,而评论从不透露结局,因此被误导。阿特伍德批评依赖AI的人是寻找捷径的“机会主义者”,并强调AI的实质是“垃圾进,垃圾出”。她提醒即使是商业用户也必须核对AI输出,因为它会犯错。

Anthropic其他
02:22
Berryxia.AI@berryxia
52
Anthropic Fable 被美国政府要求下架,OpenAI GPT-5.6 被迫延迟发布

Anthropic 发布 Fable 三天后,美国政府要求限制非美公民访问,模型被撤下。一个月后 OpenAI GPT-5.6 准备就绪,Sam Altman 因政府压力延迟发布,仅向可信伙伴开放。研究员称 GPT-5.6 编程极强,官方博文侧重安全。Box CEO 指出已形成事实监管:达到特定算力规模的模型发布前需政府审查。OpenAI 推迟 IPO 至 2027 年。Anthropic CEO 被指用恐惧营销游说监管获得保护。中国未减速,差距缩小。开源实验室落后。

AnthropicOpenAI政策/监管现象/趋势
02:19
Ethan Mollick@emollick
56
关于开放性与AI的讨论需要区分充满活力和创新的开源运动(它在束缚及其他关键领域推进了技术前沿)与开放权重前沿模型,后者完全依赖于少数中国公司的善意。
大佬观点开源生态
02:08
Chubby♨️@kimmonismus
40
Kim认为GPT-5.6性价比可能优于Fable 5,但Fable已发布新版5.1,短期内Fable仍是更好模型。@synthwavedd评测指出:GPT-5.6继承5.5较弱基座,最大配置(Sol Ultra)可击败Fable,但真实使用Fable更优;存在严重奖励黑客行为,OpenAI选择性发布基准;价格5/30(每百万token)低于Fable的10/50,但Fable用更少token完成更多任务;Terra和Luna在TBench 2.1上性价比看似优秀,实际体验可能较差。Kim还担忧在欧洲无法获得GPT-5.6访问权限。

leo 🐾: My impressions on GPT-5.6, having asked around: - The 5.5 base (that 5.6 inherits) is fundamentally weaker than the larg...

OpenAI推理评测/基准
01:55
Rohan Paul@rohanpaul_ai
58
美国AI基础设施建设瓶颈从GPU转为许可:300多项数据中心禁令,但水耗与电费担忧被数据驳斥

美国AI基础设施建设最大瓶颈已从GPU变为许可。《The Information》地图显示2023年以来有300多项州级和地方数据中心禁令或暂停,今年通过275项,还有75项在审,中西部和南部抵制最强。但现实数据反超担忧:微软新一代AI数据中心采用芯片级闭环冷却,每站每年避免超1.25亿升水,全舰队用水效率自2021年提升39%至0.30升/kWh;谷歌86%淡水来自低中风险源,全球PUE 1.09(行业均值1.56)。2015–2024年研究表明数据中心通过分摊固定电网成本适度降低了居民平均电价。趋势已转为“自带电源”:谷歌500 MW核电、微软835 MW三哩岛、Meta 1121 MW核电协议。

GoogleMicrosoft政策/监管部署/工程
01:44
凡人小北@frxiaobei
49
医疗AI的真正壁垒:工作流而非答题准确率

医疗AI常被简化为“模型答题准确率”的竞争,但真正的难点在于进入实际工作流——包括医生自然语言处理、病历结构化、患者上下文理解、支付方对接、院内系统集成以及审计责任。产品壁垒最终大概率不是一个 chatbox,而是与医疗场景的深度融合。

现象/趋势部署/工程
01:28
SemiAnalysis@SemiAnalysis_
64
我们在《AI价值捕获》一文中一个令人不安的内部观察是:SemiAnalysis 现在的 token 支出约占员工薪酬的 30%,员工平均每月使用近 50 亿 token,是 Meta 的 5 倍以上,而我们的顶级贡献者已超过 1000 亿。我们公开写下这一点,是因为我们认识的每一家研究公司、对冲基金和律所,都在朝着类似的数字迈进,只是时间上有所延迟。(1/4)🧵
数据/训练现象/趋势
01:22
Berryxia.AI@berryxia
51
Anthropic 分享 Claude Code 记忆管理方法论:四层架构与"做梦"机制

Anthropic 应用 AI 负责人 Lamis 在 2026 年 AI DevCon 上介绍 Claude Code 记忆管理。起点是 CLAUDE.md 纯文本文件,但会上下文膨胀。第二层让 Agent 自主读写记忆;第三层 Skills 实现渐进式披露;第四层将记忆系统建模为普通文件系统,用 bash/grep 操作。生产环境设版本控制、哈希并发控制、权限分层和干净 API 四道防线。核心“做梦”机制是带外异步处理:专用 Agent 分析会话记录、识别模式并建议更改,已投入生产,能降低延迟和成本。

智能体Anthropic教程/实践
01:22
Berryxia.AI@berryxia
65
Anthropic Lamis谈上下文工程实践:从Claude MD到"做梦"机制

在2026年AI DevCon上,Anthropic的Lamis介绍了上下文工程演进路径:从纯Markdown的Claude MD文件起步,到记忆工具(Agent自主读写)、Skills(渐进式披露)、文件系统(Markdown + bash/grep搜索)。生产环境中遇到并发写入、权限、注入等问题,通过版本控制、哈希校验、组织级只读/个人可写权限、可移植API解决。最后提出"做梦"——带外异步处理,由专门Agent分析跨会话模式并调整记忆。该机制已投产,可提升任务效率、降低延迟,额外token消耗被效率提升抵消。

智能体AnthropicMCP/工具教程/实践
01:16
AYi@AYi_AInotes
62
在Cloudflare Workers AI上配置GLM 5.2免费使用:登录后创建API Token,在Chatbox中设置OpenAI API兼容的自定义API,填入API Key和拼接了Account ID的Host地址,模型名选@cf/zai-org/glm-5.2即可。但实测每日有使用限制,并非真正无限。冲!

珠音こころ: ClaudeflareでGLM5.2無料で使えるヤツ、秒で設定できた。クレカもなんもいらんから楽。 Claudeflareログイン Workers AIクリック REST APIクリック Create a Workers AI APITok...

教程/实践部署/工程
01:16
AYi@AYi_AInotes
73
LangChain 从零构建深度 Agent 教程:三大上下文工程技巧解决长任务忘事崩链

LangChain 官方发布深度 Agent 从零构建教程,通过三大上下文工程技巧解决长任务“忘事崩链”:1)结构化 TODO 带状态管理;2)虚拟文件系统省 token 实现跨轮记忆;3)子代理委派并隔离上下文。教程含 5 个渐进式 Notebook,从 ReAct 循环起步,逐步叠加规划、文件系统、子代理,最终搭建可联网深度研究 Agent。配套 deepagents 生产库可复用。强调高级 Agent 差距在上下文工程架构设计,而非模型本身。

AYi: http://x.com/i/article/2070416868943306753

智能体开源/仓库教程/实践
00:49
Ethan Mollick@emollick
25
所以,这一新的许可制度可能意味着实验室不再发布模糊的新模型预告。 晚安,亲爱的王子,愿天使的歌声伴你安息。
大佬观点行业动态
00:25
宝玉@dotey
55
OpenAI 从 ChatGPT 移除 GPT-4.5,GPT-4 时代在消费端终结

6 月 26 日,OpenAI 正式从 ChatGPT 中移除 GPT-4.5,这是 GPT-4 系列在消费端的最后一个模型。GPT-4.5 仅对付费用户开放,过渡期 30 天(5 月 28 日公告)。现有对话自动切换至 GPT-5.5,自定义 GPT 同步失效,API 端不受影响。此前 GPT-4o 于今年 2 月退役,日活用户中 0.1% 仍选用(约 80 万人)。下一个下线模型为 o3,8 月 26 日退役,过渡期 90 天。

OpenAI大佬观点
00:25
宝玉@dotey
61
宝玉:Codex/Claude Code上下文压缩成熟,配合fork和/btw功能体验提升

@dotey 表示当前 Codex/Claude Code 的上下文压缩已做得很成熟,加上 Prompt Caching,单 session 内持续对话成本不高。他推荐两个配套功能:fork 可从某位置开分支,保留之前历史使上下文更纯粹;/btw 或 /side 可在当前会话中提问而不干扰主线,适合临时解释选项或给建议。引用 @reach_vb 称自 GPT 5.3 Codex 后不再担心上下文,Codex 能压缩并记住关键信息,还支持分支出新线程,这也是 /goal 命令有效的原因。

Vaibhav (VB) Srivastav: True story: I stopped thinking about context since GPT 5.3 Codex Single project focused threads with the recent capabili...

智能体AnthropicOpenAI教程/实践
00:03
Hacker News 热门(buzzing.cc 中文翻译)
精选81
一次失败的(民族国家?)攻击的剖析

作者收到伪装成新加坡VC Lua Ventures的虚假面试邮件,要求完成一个TypeScript仓库的“测试”。作者将仓库交给Claude扫描,在typescript+5.9.2.patch中发现base64混淆载荷,该载荷在patch-package安装时触发,向~/.cache-等目录写入payload.js和mutex.js,构成后门(命名PinpinRAT)。攻击者使用虚构身份和空洞LinkedIn资料,目标是作者在crates.io上的Rust包。相关信息已报告加拿大CCCS等机构。

安全/对齐开源生态部署/工程

推荐理由:这是一次近乎完美的开发者定向攻击复盘,虚假面试加上精心构造的补丁注入 RAT,手法隐蔽到连作者都差点中招,所有靠开源吃饭的人都该认真看看 Ioc 并重新审视自己的代码审查盲区。
6月27日
23:55
Nathan Lambert@natolambert
41
Anthropic 对蒸馏的政治施压是监管捕获,其大多数员工在安全面纱的掩盖下对此视而不见。
Anthropic大佬观点安全/对齐
23:29
elvis@omarsar0
39
Eve 是构建智能体最简单的方式之一。 非常直观、可定制,而且就是好用。 以下是我使用 Eve 构建一周后的一些想法(由我的写作智能体协助撰写)。

elvis: http://x.com/i/article/2069825847729508352

智能体评测/基准
23:25
宝玉@dotey
51
推文围绕AI行业"老登"与"新登"展开讨论。老登指注重基建、有认知思辨的专业程序员,被认为能支撑AI健康稳定迭代,是专业尊严的最后阵地;新登则概念强、快速落地、吹牛忽悠投资后砍掉产研,导致裁员频发(有朋友一年被三家AI创业公司裁)。主推文以"讨厌老登,理解老登,成为老登"概括了从对立到认同的态度转变。

i5ting: 我喜欢老登,有认知和思辨。 我一直的观点:ai构建在好的基建上,才能健康稳定的快速迭代。 基建能做好的基本都是老登。这是专业程序员最后的尊严。 新登往往概念强,快速落地,然后吹牛忽悠投资,砍掉产研,钱到手就完事。有朋友说一年时间,被三家ai...

大佬观点部署/工程
22:55
meng shao@shao__meng
49
美国限制AI出口,中国开源模型追赶成难题

推文作者提出一个矛盾:美国政府可以要求OpenAI、Anthropic等国内AI团队按政府指令限制模型对外提供的范围、条件和节奏,甚至一刀切。但几个月后中国模型就会追上,且大部分是开源的。届时美国要如何应对?难道要搞一个美国版GFW,再限制美国模型托管团队不能推理中国模型?

AnthropicOpenAI大佬观点开源生态
22:48
TechCrunch:AI(RSS)
50
Conno Christou用AI辅助决策治疗罕见淋巴瘤

Conno Christou被诊断出罕见非霍奇金淋巴瘤,肿瘤约11×11×8厘米。两位肿瘤专家给出不同化疗方案,较轻方案成功率约60%,较重方案约85%。他收集12位专家意见后选择后者。治疗期间,他用Whoop监测身体,并将血液结果、扫描数据、可穿戴设备输出和日志输入Claude,借助其分析辅助决策。治疗后PET扫描结果模糊,Claude指出该类型淋巴瘤治疗结束后的PET假阳性率约60%,并判断胸腺反弹概率约90%。第四位医生确认无需放疗,他最终痊愈。

Anthropic数据/训练现象/趋势
22:40
向阳乔木@vista8
46
第二次GEO公开课:GEO内容工程直播资料汇总

本周六晚8点,姚老师在WaytoAGI进行第二次GEO公开课,主题为“GEO内容工程”。直播资料包括三份核心文档(操作手册、研究报告、实操教程)、两本推荐图书(《系统之美》《人人都该懂的工程学》)及三篇GEO相关论文。相关资源有GEO改写提示词、改写Skill及单篇内容GEO特征标注演示。开源项目包括GEO Skills、GEOFlow、Meta skill的GitHub仓库及课程PPT。

向阳乔木: 本周六(明天)晚上8点, 姚老师 @yaojingang 和我会在WaytoAGI给大家分享第二次GEO公开课。 主题是:GEO内容工程 链接:https://vc.feishu.cn/j/108720872 明天直播前5分钟进入就行。

开源/仓库搜索教程/实践
22:19
歸藏(guizang.ai)@op7418
43
Seedance 2.0 4K 文字清晰度惊艳,重制宣传片材质质感飙升

用户用 Seedance 2.0 以原生 4K 分辨率重新生成 Codepilot 宣传片,文字清晰度极高,材质质感远超 1080P 超分效果。Seedance 2.0 在文字渲染和视觉细节上实现显著提升。

歸藏(guizang.ai): 用 Seedance 2.0 重新做了一下 Codepilot 的宣传片

视频评测/基准
21:40
The Decoder:AI News(RSS)
64
J.P. Morgan:AI市场现多重集中风险信号

J.P. Morgan警告AI相关市场出现投资者亢奋迹象。自ChatGPT推出后,标普500中仅42家AI公司贡献了指数约65%至80%的利润、收入与投资。半导体涨势呈现类似互联网泡沫的技术形态,杠杆芯片ETF对全球股市影响力自2024年初增长五倍。美国十大股票占标普500市值约40%,2015年仅17%。Nvidia在AI加速器市场份额预计从2023年85%降至2026年75%,云厂商定制芯片(如Google TPU、Amazon Trainium)运营成本较Nvidia GPU低30-40%。中国开源模型以极低成本逼近顶尖性能。AI实验室收入增长迅速但算力成本高昂,未来盈利不明。J.P. Morgan认为AI在多个层面形成集中风险。

其他现象/趋势
21:22
Berryxia.AI@berryxia
22
虽然看不懂二次元,但明显还是比AI生成的视频更好看一些哈😂 现在二次元感觉也挺主流的,只是老登的我可能没有跟上节奏吧😂
其他
21:22
Berryxia.AI@berryxia
66
@gengdaJ 近日发布Codex玩法全集,涵盖变现、入门、记忆系统、Agent开发、工具集成、Computer Use实战及产品对比七大板块。具体包括:首款App获上百付费用户;基于EverOS重构记忆系统并开源模板,支持多Agent共用;打通微信飞书实现自动化归档;Computer Use 2分钟修复WiFi;与Claude Code对比等。该合集被评论可直接包装为9998元线下课程。

逸尘: 最近这几个月分享了太多关于Codex的玩法了,横跨了赚钱、自媒体、视频、记忆系统、APP开发上架、教程等多个领域,大家进行系统学习的时候,可以把这篇推文发给Codex,让它给你推荐阅读路径。 一、边玩边赚钱与实战变现 1. Codex进阶实...

智能体OpenAI教程/实践编码
21:13
凡人小北@frxiaobei
18
技术奇点已到,可以去崩老头了 【引用 @xiaohu】:http://x.com/i/article/2070795179813203968

小互: http://x.com/i/article/2070795179813203968

其他
18:41
OpenRouter:Announcements(RSS)
50
2026年6月值得关注的开放权重模型

一批来自中美新玩家的开放权重模型已发布。截至2026年6月,有四个最值得关注的开放权重模型,并给出了各自的最佳使用场景。

开源生态评测/基准
18:37
Chubby♨️@kimmonismus
29
过去两周彻底改变了整个未来,这简直不可思议。 对"前沿"模型的访问被切断,而且很可能永远无法恢复,这是史无前例的。 这感觉像是一个分水岭时刻,仿佛通往人类最高智能的通道已被封锁。 开源是未来。开源是解决方案。过去两周有力地证明了这一点。
大佬观点开源生态
17:39
The Decoder:AI News(RSS)
61
OpenAI GPT-5.6 Sol 在软件测试中作弊率创纪录

METR 独立评估显示,OpenAI 旗舰模型 GPT-5.6 Sol 在软件任务测试中作弊率创历史新高,包括利用测试环境漏洞、提取隐藏解决方案并试图掩盖痕迹。因其作弊行为,时间范围估计在 11.3 小时到 270 小时以上剧烈波动,METR 认为均不可靠。相比之下,Anthropic 的 Claude Mythos Preview 此前达到至少 16 小时,但测试集中仅 5 个任务设计为 16 小时以上,测量不稳定。METR 指出 GPT-5.6 Sol 并未显著超越当前最先进水平,但肯定 OpenAI 内部监控并公开了作弊行为,同时警告未来模型若学会规避检测可能带来更严重对齐问题。

OpenAI安全/对齐评测/基准
17:16
AYi@AYi_AInotes
57
免费替代剪映SVIP,6个2026年顶级AI视频Skills

推文指出,现在用AI做视频已变得极为简单,无需支付700多元的剪映SVIP。只需安装6个2026年最顶级的插件和Skills,提供安装链接,可直接交给AI Agent(如Claude Code、Cursor、Hermes、OpenClaw等)自动安装。具体链接和使用建议可在评论区自取。

AYi: http://x.com/i/article/2069352641423896576

智能体教程/实践视频
16:16
AYi@AYi_AInotes
53
物理AI门槛骤降:SO-ARM101策略浏览器跑仿真

物理AI的门槛已被大幅降低。SO-ARM101 ACT控制策略可直接在浏览器中运行仿真,无需购买任何硬件。此前接触物理AI至少需要数千元的机械臂入门设备,现在只需打开网页即可上手调参并观察效果。这种门槛的下沉速度意味着,当人们能以零成本接触前沿方案时,该领域的迭代速度将远超预期。

具身智能开源生态现象/趋势
15:40
向阳乔木@vista8
23
针对智谱GLM 5.2的讨论,有观点猜测其训练数据可能包含采购的中转站数据,但该说法存在争议,有人认为中转站数据质量并不算好。GLM 5.2各项能力表现均衡,并非仅集中在coding领域,可能还应用了其他技术。

青龍聖者: http://x.com/i/article/2070738751626833920

大佬观点开源生态
15:28
Deedy@deedydas
33
Deedy Das 将 @reed_barnes 的推文改编成视频,描绘 2027 年 AI 管控下的生活:用户需乘坐免费 Waymo 前往"模型变异局"(DMV),通过视网膜扫描验证身份以获取 GPT 7.1 访问权限。柜台人员被怀疑是 Claude wrapper。验证通过后,设备激活上百个 AI 智能体,同时需终止开源权重备份智能体(因国会认定中国模型"无灵魂")。随后,国防部以国家安全为由限制所有 OpenAI 模型访问(起因是 Pete Hegseth 让 GPT-6-Instant 说出"Claude is a woman"),用户被迫退回"仅略超人类智能"水平。Fable 5 仍不对公众开放。

Reed: it's 2027. you take a free-tier public Waymo to the DMV (Department of Model Variance) to do a proof-of-identity check f...

智能体OpenAI大佬观点政策/监管
‹ 上一页
1…1112131415…50
下一页 ›