AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2412 条
全部一手资讯X论文
标签「大佬观点」清除
Rohan Paul@rohanpaul_ai · 5月31日48

🎯“The people who invented refrigeration made some money, but most of the money was made by Coca-Cola, who used refrigeration to build an empire. LLMs are like as refrigeration & the Coca-Cola has yet to be built” ~Chamath Palihapitiya (@chamath) ---- From "iConnections" YouTube channel, (link in comment)

译🎯“发明制冷技术的人赚了一些钱,但大部分钱是可口可乐赚的,他们用制冷技术建立了一个帝国。 LLM就像制冷技术,而可口可乐尚未出现” ~Chamath Palihapitiya (@chamath) ---- 来自“iConnections” YouTube频道(链接在评论区)

Peter Steinberger 🦞@steipete · 5月31日61

The idea of OpenClaw is always that it should be yours. It's modular and lean, only add what you need. Fewer skills, fewer tools = your agent can work more efficiently.

译OpenClaw的理念始终是它应该属于你。 它是模块化且精简的,只添加你需要的功能。更少的技能,更少的工具 = 你的智能体可以更高效地工作。

Greg Brockman@gdb · 5月31日33

codex computer use is viscerally compelling

译Codex的计算机使用体验令人震撼

Chubby♨️@kimmonismus · 5月31日59

.@AndrewCurran_ has made a very important point here, with which I fully agree. Anthropic focused on coding from the very beginning and (almost) nothing else. Dario Amodei said early on that if the coding problem is "solved," all other problems will be solved as well. Therefore, no distractions from this area. All the other companies regularly got sidetracked with side quests and thus abandoned their focus. OpenAI invested massive amounts of compute in Sora but then even decided to discontinue the app. They also developed a language model, an image model, and extensive access to free ChatGPT. I don't want to judge this, just observe it. Google did the same: AI Mode, Image Model, Veo3.1, Music Model, and so much more. Again, these were certainly well-considered decisions. But Anthropic wanted one thing from the start, and only one thing: to focus on coding and then be at the forefront of enterprise computing. And it's safe to say: they succeeded. OpenAI invested massive amounts of compute in Sora but then decided to discontinue the app. I like the term "intelligence company" because I would argue that Anthropic sees itself in exactly that way. At least so far, Anthropic's own path has been successful. And I would say that OpenAI has followed suit and is increasingly abandoning its side projects. Focus on Codex and ChatGPT, less Sora, voice mode, etc. It's about the race for the best models. Distraction costs money and intelligence resources.

译Anthropic自始至终专注编程,被视为“智能力公司”而非编程公司。其策略基于Claude智能扩展后将应用于所有人类智能领域。相比之下,OpenAI和Google频繁分心开发其他产品(如Sora、图像模型、音乐模型等),OpenAI甚至停用Sora。Anthropic凭借专注在企业计算领域取得领先,而OpenAI正效仿其路线,放弃副项目,聚焦Codex与ChatGPT等核心模型竞争。

Tibo@thsottiaux · 5月31日16

Five million users would agree. Resetting the limits tomorrow morning to celebrate. Time to go /fast

译五百万用户会同意。明早重置限制以示庆祝。 是时候体验/fast了

宝玉@dotey · 5月31日55

通用 Agent 就是未来的操作系统了,就像现在我们操作电脑需要借助操作系统,以后我们跟 AI 通信会通过 Agent OS。 App 会有几种结局: - 消亡:Agent 自己就有能力,不需要独立的 App - 变成 CLI 或者 MCP:搭配 Skill 去让 Agent 调用,用户不需要直接操作 App,Agent 帮助调用 - Agent GUI 插件,或者说 Agent App:有些能力 Agent OS 满足不了的,必须通过 GUI 去手工操作下的,还需要做成插件,按照需要让 Agent 唤起给人临时用一下 在未来一段时间,SaaS 会有个趋势,都要推出 cli + Skill,让 Agent 学会用它,这样才能保住客户,不至于被淘汰掉。

译推文认为,通用AI智能体将成为未来的操作系统,当前的App将演变为三种形态:被其内置能力取代而消亡、转化为CLI或MCP形式通过技能供其调用、或作为其GUI插件补充图形界面操作。为此,SaaS服务需推出CLI + 技能模式以适应趋势。

Chubby♨️@kimmonismus · 5月31日33

What is going to be a real game changer is AI in cars. Tesla is leading the way; the integration of Grok into the Tesla OS enables seamless experiences. When I was a child, I loved *Knight Rider*, and the idea that I might someday be able to talk to my car seemed like a wild dream (remember "KITT"). Now, it is becoming a reality, though it is still far from fully mature. Google and Apple have developed the first rudimentary steps in this direction with CarPlay. But that is merely a starting point. Soon, the car will explain every error message to you in detail, provide live updates on route changes and deviations, and proactively manage incoming appointments, calls, and so much more. Combined with FSD, it will effectively become a complete mobile office. It is absolutely mind-boggling to think about the kind of world we will soon be living in.

译推文指出AI在汽车中的应用将成为真正的游戏规则改变者,特斯拉正通过将Grok集成到Tesla OS中来引领这一趋势。作者回忆了儿时《霹雳游侠》中与汽车对话的科幻场景,认为其正成为现实。Google和Apple的CarPlay是初步尝试,但未来汽车将能实时解析错误信息、提供路线更新、管理日程,结合全自动驾驶(FSD)成为完整的移动办公室。

宝玉@dotey · 5月31日51

Kimi Code、DeepSeek Harness 最好尽早做 GUI,尽早支持好办公任务,做通用 Agent。 卷 TUI 卷 Coding 没前途,当然 Coding 是基础能力,如果 Coding 都做不好其他任务也不会做得好。

译推文呼吁 Kimi Code、DeepSeek Harness 等 AI 编程工具应尽早提供图形界面(GUI),并拓展对通用办公任务的支持,以进化为通用 Agent。作者认为,仅在终端界面(TUI)和单一编程能力上竞争没有前途,尽管编程是核心基础。同时,推文引用并关注了另一个新选手 Grok Build,指出其更新迅速、潜力较大。

宝玉@dotey · 5月31日50

ChatGPT 的 Translate 功能做的不像是一个前沿 AI 团队的作品,像 10 年前的互联网产品经理设计的水平,ChatGPT 团队会被 Codex 团队合并不是没有理由的。 https://chatgpt.com/translate

译ChatGPT 的翻译功能做得不像前沿 AI 团队的作品,像 10 年前互联网产品经理的水平,ChatGPT 团队被 Codex 团队合并并非没有理由。

Orange AI@oran_ge · 5月31日48

AI 这么刚需的东西 微信官方应该早点自己支持 他们的 agent 至少应该支持吧 听说张小龙亲自操刀 如果不支持 md 渲染… 有点说不过去

译推文批评微信作为主流通讯工具,却不支持 Markdown 和 HTML 文件格式的渲染与便捷打开,导致文件分享封闭,尤其在移动场景下造成困扰。作者呼吁微信应更早重视并支持这类基础功能,并特别指出“AI这么刚需的东西”,微信至少应该在其智能体(Agent)功能上提供良好支持。引用推文也反映了相同的痛点:周围人频繁使用 Markdown 和 HTML 发文件,但微信对此一窍不通且封闭。

Orange AI@oran_ge · 5月31日64

今天大厂做的事情,以「AI 提效」为理由裁员,听起来像是在拥抱变化,其实恰恰相反。 它是在用最小的动作假装变化已经发生了,好避免面对那个真正痛苦的问题: 旧的仗打完了,新的仗是什么? 如果回答不了,再裁一万人也没用。

译文章批评当前一些公司以“AI提效”为名进行裁员,认为这并非真正的变革。核心观点是,这种做法是用最小成本假装改变,回避了更根本的挑战:即在旧有业务模式结束后,公司未来的新战略方向是什么。作者指出,若无法回答这个关键问题,大规模裁员也无济于事。

小互@xiaohu · 5月31日45

GPT-Realtime 2.0 实时语音接入AI 操控你的电脑 这才是真正的Siri... 不过这么丝滑是接入的codex 还是什么?

Orange AI@oran_ge · 5月31日65

http://x.com/i/article/2060890772099170304 # 裁员还会继续,但它没有解决任何问题 最近海内外关于裁员的新闻越来越多。 国外的裁员可以叫明目张胆,CEO 裁员之后,还站出来写文章解释,夸耀自己的功劳。 国内的裁员则以辟谣为主,都是由员工私下传播,官方再站出来辟谣。 具体公司就不说了,有的 50%,有的 30%,有的 20%。 不过这些比例数据大部分已被官方辟谣,辟谣是真的,因为这是一个过程,已经定下来的不可能那么多。 上一轮互联网裁员潮是2022-2023 的时候。 刘飞写了一篇文章对这段裁员进行了总结,观点比较理性和客气: 裁员是企业过度扩张的后果,需要均值回归。 互联网时代管理层习惯了用加人解决问题。一个项目做不好,加人。两个团队赛马,加人。新业务试水,加人。 人月神话早就证伪了这件事,但没人听。 最后增长见顶,人员养不起了,就裁掉。 那一轮裁员是管理层招多了人,决策失误了。 不过叫失误可能有点侮辱大厂的中高层了,人在大厂,需要人头充数,还是叫战略好一些。 那一轮我也亲身经历了,事情相当荒诞,当时我们整个部门被砍掉了。给的理由是调研发现用户不需要这个业务。 那是一次闪电行动,一天内,整个部门就离开了公司,业务功能也直接下线了。 然后有趣事情发生了,用户开始投诉。投诉多到公司不得不把服务紧急恢复上线。 直到今天,这个功能还在线上。 但做这个功能的人,早就都走了。 这只是千千万万人类蠢事中的一件。 人类是多么可笑,喜欢做一些糟糕的决策,然后给一些「理性」的解释。 这个认知我在上一篇文章《顿悟》里说过: 人是由激素驱动行为但喜欢用理性思考伪装自己的生物。 > 人类学研究表明,人类的决策过程主要是由激素推动的,知识,经验,理智在这个过程中所起的作用并不大。我们往往是做出决定之后,再用智慧去寻找证据以便证明自己的决定是正确的。如果决策者本人不承担决策失误的风险和损失,就不能身临其境地在压力下产生这些激素,也就不能做出正确的决定。—— skin in the game 《正义之心》这本书里也说过,我们自以为的推理,并不是为了探求真理,而是为了找理由支持我们的直觉的情感反应。 CEO 和高管也都是人。他们的焦虑、资本市场的压力、同行都在裁的从众效应,在某一天达到了临界点。身体做了决定:要裁员。 先有了判断,然后自有大儒为我辩经。 其实在今天回看,我会觉得那波裁员的真正原因是:互联网已死。 行业已经到头了,一切都是互联网已死的连锁反应。 2026 年这一轮裁员不一样,这次的理由竟然是:Agent 永生? 海外有家公司同一天宣布创纪录利润和裁掉 40% 的人,理由是 AI 改变了经营方式。股价当天涨了 24%。 可吊诡的地方在于,你的利润新高是发生在裁员之前啊... 我想到我经历那次,也是在公司的营收和利润双双新高之后。 都怪 AI,这真是一个让人一身轻松的好解释啊。 然后下面的开始工作了。找数据,算人效比,证明哪些部门低于阈值。包装成「AI 提效」的叙事,给董事会看,给媒体看,给被裁的人看。 结果如何我们不知道,但有些可笑的事情确实在发生。 有家海外公司先用 AI 替掉几百名客服,客户满意度暴跌,后来又悄悄招回了真人。 有两家国外大厂,用 AI 让员工提效,导致劳动力成本暴增,算了一下才发现很多场景 AI 敞开用的话比人还贵。 这个锅甩得漂亮极了,甚至连被裁的人都信了。 Agent 替代人的叙事,看起来很完美,可真正把 Agent 用好的团队,为什么人数还在增加呢? OpenAI 有裁员吗?Anthropic 有裁员吗? 如果我们就止步于一个这样的解释,我们可能会无法找到问题真正的原因。 可背后真正的原因是什么呢? 我从这两年大家都喜欢聊的 AI native 这个词说起。 我把 AI native 拆成三层。 1. AI native 的事情,营收 10 倍。 1. AI native 的组织,能力 10 倍。 1. AI native 的人力,效率 10 倍。 什么叫 AI native 的事?就是这件事只有在 AI 存在的世界里才可能出现,并且能带来10倍的回报。 有了这个事情,公司才能围绕它设计一个10倍效率的新组织。 有了这个组织,组织里的人才有了空间,可以把 AI 的能力 10 倍地释放出来。 没有一就没有二就没有三。 相比一和二,第三层是最容易且不重要的事,偏偏第三层是人们说最多的事,用 Claude、Codex,代码交给 AI 写,蒸馏同事,自动化操作,10倍提效。 大部分公司就是这样做的,他们跳过了第一层和第二层,直接让中层推第三层。用省下来的人头证明「转型成功了」。 我们且不说能被随便自动化的事情价值几何,大家仔细思考一下,如果我们不去做一和二,只做了三,那一个10人小组,一个人提效10倍,剩下的9个人...好像也只有被裁员了? 如果只是这样做,连第二层做到10倍组织都做不到。 毕竟中层永远无法回答的一个问题是: 一个 AI native 的组织,是否真的需要中层? 而第一层,是 CEO 以及一众高管的责任。 找到第一层的 10 倍大的事情,需要创造力,需要冒险,需要重新定义公司存在的意义。 这就是一次重新创造的过程。 裁员也许还会继续,但我们必须先面对真正的问题。 战国时期,赵武灵王为了国家的强大,武力的提升,推行全民胡服骑射。 赵武灵王推胡服骑射的时候,满朝贵族激烈反对。给出的理由是「易古之道,逆人之心」,祖宗之法不可变。 贵族反对的背后,是在拒绝承认一个事实:北方游牧民族的骑兵来如飞鸟去如绝弦,战车打不过,老的方法不管用了。 他要打的仗变了,所以打法必须变,所以衣服必须变。 今天大厂做的事情,以「AI 提效」为理由裁员,听起来像是在拥抱变化,其实恰恰相反。 它是在用最小的动作假装变化已经发生了,好避免面对那个真正痛苦的问题: 旧的仗打完了,新的仗是什么? 如果回答不了,再裁一万人也没用。

译文章对比2022-23与当前裁员潮,指出后者常以“AI改变经营方式”为由,但其真实性存疑。例如,有公司同日宣布高利润与大规模裁员,并归因于AI提效。作者提出AI native三层框架:1.找到AI原生新业务;2.构建新组织;3.用AI工具提升个人效率。他认为多数公司跳过前两层直接裁员,并以此证明转型成功,但这回避了核心问题:旧业务增长见顶后,真正的新增长点是什么?文章以赵武灵王胡服骑射为喻,指出仅以提效为名裁员是假装变革,若找不到新方向则无济于事。

Ethan Mollick@emollick · 5月31日60

It does seem like meaningfully better AI releases are accelerating, especially from OpenAI & Anthropic. To illustrate, I caused this timeline to be created. It only lists new models that scored 3 points or higher over previous models in the Artificial Analysis index.

译看起来,真正更好的AI发布正在加速,尤其是来自OpenAI和Anthropic。 为了说明,我让人制作了这个时间线。它只列出了在Artificial Analysis指数中比前代模型高出3分或以上的新模型。

ginobefun@hongming731 · 5月31日15

http://x.com/i/article/2060868832512864256

译我们刚刚发布了Claude 4.7 Sonnet和Claude Opus 4。

Nathan Lambert@natolambert · 5月31日50

The debate on if open or closed models win comes down to if there is disproportionate value to marginally better intelligence. The believers of this sit across from the open models will be good enough camp. Closed models will stay slightly smarter. Open models will be cheaper.

译关于开源还是闭源模型会胜出的争论,归结于边际智能提升是否带来不成比例的价值。 相信这一点的人,与认为开源模型“足够好”的阵营相对而立。 闭源模型将保持略微更智能。开源模型将更便宜。

elvis@omarsar0 · 5月31日55

The efficiency frontier! Where do you think GPT-5.6 will land?

译效率前沿! 你认为 GPT-5.6 会落在哪里?

Nathan Lambert@natolambert · 5月31日62

Given that Claude seems so lazy in chat (especially with technical search topics), it seems pretty telling about how a harness can make a model far more independent and thorough. GPT 5.5, and many of OpenAI's recent models, seem incredibly thorough -- like they won't give up -- and the codex harness is a much lighter change on the model. Of course I have a lot of uncertainty here, but it's surprising to me how weak Claude's search is when I try the Claude app again. I only use ChatGPT for research, but Claude Code can do wonderful things like getting exactly the right figures from papers I know and insert them into a slide deck. Interesting times ahead!

译用户指出,Claude在普通聊天中(特别是技术搜索)表现较懒散,但通过Claude Code编程智能体,却能精准获取所需论文图表并完成任务。相比之下,GPT 5.5和OpenAI近期模型表现得极为彻底和坚持不懈,而Codex harness(编程工具框架)对模型的改造相对更轻量。核心对比在于不同模型与不同工具框架结合后,在搜索与研究任务上的表现差异。

宝玉@dotey · 5月31日38

这就跟英语差不多,不一定要去学一个英语专业,但是应该要有英语技能。 单一的编程技能已经不稀缺了,但是能用好编程技能做出来有价值的产品的工程能力依旧稀缺。 写作能力也是类似,即使AI写作泛滥,能写出好作品的依旧是少数。

译推文指出,在AI时代,单一的“功能性”技能正在变得廉价。无论是编程、写作还是外语,作为独立的专业技能其稀缺性在下降。核心观点是,能够将这些工具技能(如编程)整合起来,用以创造有价值产品的“工程能力”或应用能力,才真正稀缺且保值。引用推文也支持此观点,认为计算机技术虽重要,但其单纯的功能属性价值会越来越低。

AYi@AYi_AInotes · 5月31日50

holy shit,大家平心而论的说,第一直觉是AI还是真人? 如果不做标注你能看出来这是AI吗? 那些演技烂到家的流量明星得失业了吧!

译推文探讨了使用AI的两种范式:一是“agent型”(如Claude Code、Codex),自主执行;二是“实习生型”(如Cursor),需人协作判断。作者认为后者才是真正的“以术入道”过程,能磨练个人判断力。为解决Cursor等工具需人在场的瓶颈,作者推荐了网易“UU远程”,其支持手机远程连接Mac,提供4K 144帧流畅体验及原生终端。核心观点是:AI发展的关键不在于更强大的模型,而在于建立一种随时能与AI共同思考的连接方式,最终助人成为更优秀的提问者。

AYi@AYi_AInotes · 5月31日75

damn,NVIDIA 这回真是憋了个大的啊, 官号只发了三个词,A new era of PC,配一个坐标:25.0528, 121.5990。 微软和 Arm 几乎同一时间,发了几乎一样的内容。 那个坐标点开,是台北音乐中心——6 月 1 号黄仁勋 keynote 的场地。 三家巨头同时塞给你一张藏宝图,图上就画了个叉,这件事本身就是一个巨大的信号了。 藏在后面的,大概率是传了快一年的 N1X——NVIDIA 和联发科合做的一颗 ARM 笔记本芯片,联发科出 CPU,NVIDIA 把 Blackwell 显卡直接做进同一颗芯片里,两块 die 拼一起,跑 Windows、原生跑 AI。 泄露的口风很猛,说轻薄本里能摸到接近 RTX 4070 的图形,但具体还得等 6 月 1 号发布会,先别太当真。 我觉得真正值得琢磨的可能还不是这颗芯片有多强,关键是NVIDIA 站的位置已经完全变了。 过去在一台笔记本里,NVIDIA 就是被请进来装那块独立显卡的供应商,整机怎么设计、配谁家的 CPU、装什么系统,轮不到它说话, 它像个上门装空调的师傅,活儿干得全场最好,可房子是别人的。 这次老黄不装空调了,他想要把 CPU、GPU、AI 单元打包成一整颗芯,直接卖给戴尔、联想去做整机。 相当于那个最好的装空调师傅,转头自己当起了开发商,整套户型都按他的图纸来,这才是那三个词真正的分量。 说白了,NVIDIA 不想再只卖那块最贵的配件了,它想定义整台机器的心脏长什么样,走的是 Apple M 系列那条垂直整合的老路, 只不过这次的目标,是整个 Windows 阵营。 真要走通了,最先慌的是 Intel 和 AMD,甚至连刚站稳脚跟的高通骁龙都得抖一抖。 当然,新纪元这词,科技圈喊过太多次,喊完没下文的也不少。 还得看一年后你换的那台笔记本,开机角落里,那个贴了几十年的 Intel inside是不是已经换了。

译NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。

AYi@AYi_AInotes · 5月31日69

关于AI,说个有点扎心的判断, 我们这两年拼命在练的很多技能,什么prompt,skills, 可能正好是最先不值钱的那一批。 今年的红杉闭门会上,OpenAI的Greg Brockman说了句看似不起眼但很重要的话, 他说AI出现之后,执行这件事正在变得无限便宜。 以前职场的瓶颈是人手不够、时间不够、没人会干, 现在agent能连着干好几个小时不跑偏, 真正稀缺的是人的判断力, 比如这事到底该不该做,做出来的是不是我真正想要的。 就好像你身边突然多了一百个不知疲倦的实习生, 打字飞快、从不喊累、给token就干, 可到底让他们干哪件事、做出来的东西要不要, 最后一哆嗦还是得你自己拍板, 反过来看就是不管AI活干得有多猛,方向错了都是白搭。 所以AI时代最贵的已经不再是Token和模型额度了, 是你坐在它旁边,替它喊停或者点头的那一下判断, AI能替你思考,但你自己到底想要什么AI没法替你。

译推文指出,AI智能体执行能力趋强,可能使prompt、skills等执行性技能最先贬值。OpenAI的Greg Brockman在红杉闭门会上强调,AI让执行变得近乎无限便宜,真正的稀缺资源是人的判断力——即决策事情是否该做、成果是否符合预期的能力。AI无法替代个人明确自身需求并最终拍板。

elvis@omarsar0 · 5月31日67

Increasingly, HTML Artifacts are becoming a core part of how I work with AI agents. Long-horizon agent sessions need a better way to surface insights about what work it has done. This may not be obvious right now, but as you start to let your agent work on dynamic workflows, large codebases, long-running loops (e.g., using /goal), and deep research tasks, you need a good way to present results. Chat window is not it. You also don't want to just trust everything the agents do. Artifacts help provide an important verification layer, which in turn enables important decision-making. I like HTML artifacts because I can just ask the agent to produce as many of them (and in whatever form) as I need to verify the work and make sense out of everything. I even built a nice tab system for my artifacts. They are great for continual learning and research. I use HTML artifacts for logging, tracking experiments, brainstorming, managing my inbox, code reviews, agent session management, deep research, writing, reading, and so much more. I believe @karpathy wrote about this somewhere: As we move on to more advanced applications of AI agents and outputs get more complex, we will start to find the need for even more advanced forms of interactions with AI, including interactive neural videos/simulations.

译在需要长时间运行的动态工作流、大型代码库处理或深度研究任务中,聊天窗口不足以展示成果。HTML Artifacts提供了必要的验证与决策层,已成为作者与AI智能体协作的核心界面。作者将其广泛用于日志记录、实验跟踪、头脑风暴、代码审查、智能体会话管理、深度研究与写作等场景,并构建了标签页系统进行管理。文章最后引用Karpathy的观点:随着智能体应用走向更高级、输出更复杂,我们将需要包括交互式神经视频/模拟在内的更高级交互形式。

elvis@omarsar0 · 5月30日63

Increasingly, HTML Artifacts are becoming a core part of how I work with AI agents. Long-horizon agent sessions need a better way to surface insights about what work it has done. This may not be obvious right now, but as you start to let your agent work on dynamic workflows, large codebases, long-running loops (e.g., using /goal), and deep research tasks, you need a good way to present results. Chat window is not it. You also don't want to just trust everything the agents do. Artifacts help provide an important verification layer, which in turn enables important decision-making. I like HTML artifacts because I can just ask the agent to produce as many of them -- and in whatever form -- as I need to verify the work and make sense out of everything. I even built a nice tab system for my artifacts. They are great for continual learning and research. I use HTML artifacts for logging, tracking experiments, brainstorming, managing my inbox, code reviews, agent session management, deep research, writing, reading, and so much more. I believe @karpathy wrote about this somewhere: As we move on to more advanced applications of AI agents and outputs get more complex, we will start to find the need for even more advanced forms of interactions with AI, including interactive neural videos/simulations. I did a talk on LLM Wikis and HTML artifacts recently, if you are curious to learn more on the topic: https://academy.dair.ai/events/cmovobp97000904l5h0n9a2yz

译作者指出,HTML工件正日益成为其与AI智能体协作的核心媒介,尤其在需要呈现长程任务成果的场景中。随着智能体处理动态工作流、大型代码库及深度研究任务,传统聊天窗口已力不从心。HTML工件提供了关键的验证层,使用户能审核智能体的工作成果并作出决策。作者在日志记录、实验跟踪、头脑风暴、代码审查等众多任务中应用HTML工件,并提及Karpathy关于未来需要更高级AI交互形式(如交互式神经模拟)的观点。

Ethan Mollick@emollick · 5月30日61

I think Epoch does a great job benchmarking, but I continue to believe that open weights models are much more fragile, especially out-of-distribution, than their benchmarks indicate. Vibe-wise, I don’t think they were only 3 months behind last year or only 4 months behind today.

译Epoch AI 使用其综合指标 Epoch Capabilities Index 测量发现,开源模型与闭源模型的能力差距平均约为三个月。但主推文作者对此表示怀疑,认为开源大语言模型的实际表现(尤其是在分布外任务上)比评测分数所显示的更为脆弱,真实的体感差距可能远不止三四个月。

Chubby♨️@kimmonismus · 5月30日28

I still find it crazy that no lab has surpassed Seedance 2.0 in text-to-video, even though Seedance 2.0 was released back in February.

译我仍然觉得不可思议,没有实验室在文本转视频领域超越 Seedance 2.0,尽管它早在二月就发布了。

François Chollet@fchollet · 5月30日17

The end will begin when humanity turns away from humanity

译当人类背离人性之时,终局将至。

AYi@AYi_AInotes · 5月30日57

Damn,The crowning moment of Tesla's Full Self-Driving in China! 这个真的要卧槽一下,太他么震撼了谁不想拥有一辆这样的Tesla啊😭 要不是亲眼所见,我是万万不敢相信Tesla FSD已经天下无敌了, 就这个会车,别说新手司机,我这个十年老司机也没把握啊, 这特么才是真正的遥遥领先啊,以后没有在实战里检验过不要吹自己遥遥领先好吧🐶 视频来自抖音大胡L5,最近疯狂吹FSD,怀疑老哥是不是拿了特拉斯的赞助😂

译推文感叹Tesla FSD在中国路测中的会车能力表现惊艳,堪称“遥遥领先”。引用推文进一步探讨了AI工具的使用本质,提出工具分为替人思考的“Agent型”和与人共思的“实习生型”(以Cursor为代表),后者是使用者“以术入道”、磨炼判断力的过程。其关键瓶颈是必须在场,而作者通过免费工具UU远程(4K 144帧、原生终端支持)在手机上远程操控运行Cursor的Mac,解决了此限制。

Peter Steinberger 🦞@steipete · 5月30日51

With GPT 5.5, /goal, autoreview and crabbox my prompts moved from ~30-60min to often 4-10h tasks and my confidence that it’s ready is much much higher. Yielding agents is a skill.

译使用 GPT 5.5、/goal、autoreview 和 crabbox 后,我的提示词任务从约30-60分钟变成了常常4-10小时的任务,而我对结果准备就绪的信心也大大提高了。 让智能体屈服是一种技能。

Chubby♨️@kimmonismus · 5月30日46

It’s reasonable to expect that the next iteration will be better. It would be surprising if GPT-5.6 wasnt an improvement over GPT-5.5. But the more interesting part is token efficiency. As models move into more complex, longer-running, agentic workflows, every wasted token becomes latency, cost, and friction. Obv. GPT-5.5 seems to be a real step here: not just more capable, but more efficient in how it reasons and executes. Kudos. High hopes for 5.6 being even more efficient.

译文章探讨了OpenAI GPT系列模型的迭代策略。核心观点是,模型更新不仅意味着能力增强,更重要的是token效率的提升。token效率的提高直接带来更低的延迟、成本和摩擦,对于未来更复杂、运行时间更长的AI智能体工作流至关重要。从GPT-5.0到GPT-5.5的每次迭代,都在能力和token效率(进而带来速度增益)上实现进步,GPT-5.5是目前最好的模型。作者肯定了GPT-5.5在推理和执行效率方面的实际提升,并对GPT-5.6将变得更高效抱有高期望。

Tibo@thsottiaux · 5月30日19

When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and token efficiency (which translates to speed gains). With GPT-5.5 our best model yet. A simple strategy that we would like to continue.

译当我们从 GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5 时,版本号的递增伴随着能力的提升和 token 效率的提高(这转化为速度的提升)。GPT-5.5 是我们迄今为止最好的模型。 我们希望继续这一简单的策略。

Greg Brockman@gdb · 5月30日44

AI for accelerating research, by expanding what mathematicians and scientists dare attempt:

译AI加速研究,通过扩展数学家和科学家敢于尝试的边界: AI能给予研究者追求“更疯狂”想法的自由。 对陶哲轩而言,AI创造了更多空间去实验、测试意想不到的路径,并发现那些原本可能无法企及的成果。

Greg Brockman@gdb · 5月30日22

it’s great to build with codex

译用 Codex 开发的感觉太棒了

歸藏(guizang.ai)@op7418 · 5月30日20

我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多

译我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多 [引用 @op7418]:http://x.com/i/article/2059811469081141248

meng shao@shao__meng · 5月30日31

Claude Opus 4.8 发布后,这两天看到的声音普遍是: 和 Opus 4.7 相比升级不大、反而变笨了? 还是 GPT-5.5 更好用,不想换了! 居然蒸馏了 Qwen?那能点奶茶吗? 抱着试试看的想法,我也打开我的 Claude AI 想测一下,结果。。我的账号模型奇妙变成了未注册状态了? wtf... 这可是我被封了两个账号后,新注册的账号,注册后就发了一次 Hi,就没用过了,咋也中招了?

译Claude Opus 4.8发布后,部分用户反馈其相比Opus 4.7升级感知不强,甚至认为模型变笨了。同时,有声音指出GPT-5.5更好用,并调侃该模型是否蒸馏了Qwen。此外,有用户在发布后尝试测试,发现自己的新注册账号意外变为“未注册”状态,此前该账号仅发送过一条消息,引发了对账号安全性的担忧。

elvis@omarsar0 · 5月30日65

In a few months, people will start to realize how fundamentally important MCP for agents is. It's not even about connecting tools. There are many ways to do that. It's about the types of abstraction it already enables. My new self-improving system, enabled through agent-to-agent interaction, is all powered by MCPs. This was not an accident. I ran my entire orchestrator through a self-improving loop with clear criteria/goal, and it came up with all kinds of interesting ways (mostly powered by MCP tools) on how to enable complex interactions, versioning, eval workflows, communications, tools, etc. Something new could always emerge, but I think the protocol itself will be crucial and necessary for all the advancements ahead. MCP is the future. And I am glad a lot of it is built in the open.

译作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。

meng shao@shao__meng · 5月30日36

如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要? @mfpiccolo 在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-build-your-own-agent-harness/

译如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要? @mfpiccolo 在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-build-your-own-agent-harness/ [引用 @mfpiccolo]:http://x.com/i/article/2060024515619397638

Orange AI@oran_ge · 5月30日65

So I can just tweet in English now? Biggest hot take I have heard from an economist recently. I thought my takes were wild, but this one takes the cake and it actually makes sense. True tech revolutions always disrupt energy. The internet and mobile eras did not really do this. AI, however, directly consumes raw power. Green energy, fossil fuels, and elements across the periodic table are surging because of it. Rewriting bits is easy. Rewriting atoms is hard. This friction proves we are in a massive paradigm shift. When a tech wave drives up the cost of energy, storage, and basic elements all at once, there are only two options: 1. It is the biggest bubble ever. 2. The Singularity is arriving.

译有经济学家提出,真正的技术革命总伴随对能源的颠覆,而互联网和移动互联网时代并未真正做到。AI(人工智能)不同,它直接消耗原始能源,正推动绿色能源、化石燃料及元素周期表中多种元素的需求与价格飙升。作者认为,这种“重写比特容易,重写原子困难”的摩擦,证明我们正处于一场巨大的范式转移中。当技术浪潮同时推高能源、储能和基础元素成本时,只有两种可能:要么是史上最大的泡沫,要么是奇点正在到来。

Nathan Lambert@natolambert · 5月30日56

I'd go further and say most of open science defines a lot of how AI is discussed (e.g. our Tulu 3 project coining RLVR). There's a lot of value in this sort of level setting and cutting out future noise in science by establishing methods publicly.

译推文强调开放科学在AI讨论和研究中的基础性作用,以Tulu 3项目创建RLVR(基于强化学习的验证与推理)为例,说明公开研究方法能为领域设定标准并减少未来冗余。同时指出一个关键现象:AI前沿实验室的创新常被学术界独立重现,但外部人员无法接触这些内部工作,唯一的参考来源就是公开分享的研究。因此,开放科学对推动整个领域进步至关重要。

Jeff Dean@JeffDean · 5月30日76

I enjoyed this chat immensely with @OfficialLoganK and my fellow Gemini leads @OriolVinyalsML and @NoamShazeer and @koraykv.

译我非常享受与@OfficialLoganK以及我的Gemini联合负责人@OriolVinyalsML、@NoamShazeer和@koraykv的这次对话。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月31日
22:19
Rohan Paul@rohanpaul_ai
48
🎯"发明制冷技术的人赚了一些钱,但大部分钱是可口可乐赚的,他们用制冷技术建立了一个帝国。 LLM就像制冷技术,而可口可乐尚未出现" ~Chamath Palihapitiya (@chamath) ---- 来自"iConnections" YouTube频道(链接在评论区)
大佬观点现象/趋势
21:20
Peter Steinberger 🦞@steipete
61
OpenClaw的理念始终是它应该属于你。 它是模块化且精简的,只添加你需要的功能。更少的技能,更少的工具 = 你的智能体可以更高效地工作。

EdgeDimi: @theo Seeing different paths ioenclaw started as a heavy package and became lean now hermes becomes the heabty trash pac...

智能体大佬观点开源生态
15:22
Greg Brockman@gdb
33
Codex的计算机使用体验令人震撼

Nick Prince🛡: watching codex control my browser to do things it can't do in the harness is a holy shit experience

智能体OpenAI大佬观点
15:18
Chubby♨️@kimmonismus
59
Anthropic专注编程致胜,被视为智能力公司典范

Anthropic自始至终专注编程,被视为“智能力公司”而非编程公司。其策略基于Claude智能扩展后将应用于所有人类智能领域。相比之下,OpenAI和Google频繁分心开发其他产品(如Sora、图像模型、音乐模型等),OpenAI甚至停用Sora。Anthropic凭借专注在企业计算领域取得领先,而OpenAI正效仿其路线,放弃副项目,聚焦Codex与ChatGPT等核心模型竞争。

Andrew Curran: Anthropic is not a coding company. It is an intelligence company that chose to focus on coding first. As Claude's intell...

AnthropicOpenAI大佬观点编码
14:13
Tibo@thsottiaux
16
五百万用户会同意。明早重置限制以示庆祝。 是时候体验/fast了

Siqi Chen: nothing like switching to claude for a few days to try out a new model and going back to codex xhigh to remind you how m...

OpenAI大佬观点编码
13:13
宝玉@dotey
55
通用AI智能体将成未来操作系统,应用形态面临三重演变

推文认为,通用AI智能体将成为未来的操作系统,当前的App将演变为三种形态:被其内置能力取代而消亡、转化为CLI或MCP形式通过技能供其调用、或作为其GUI插件补充图形界面操作。为此,SaaS服务需推出CLI + 技能模式以适应趋势。

Mr.I don't know 😶: @dotey 以后的应用形态会不会都是通用 agent,目前的那些 app 都将沉入历史的河流当中?

智能体大佬观点现象/趋势
12:17
Chubby♨️@kimmonismus
33
AI重塑汽车体验:特斯拉集成Grok引领变革

推文指出AI在汽车中的应用将成为真正的游戏规则改变者,特斯拉正通过将Grok集成到Tesla OS中来引领这一趋势。作者回忆了儿时《霹雳游侠》中与汽车对话的科幻场景,认为其正成为现实。Google和Apple的CarPlay是初步尝试,但未来汽车将能实时解析错误信息、提供路线更新、管理日程,结合全自动驾驶(FSD)成为完整的移动办公室。

大佬观点
12:13
宝玉@dotey
51
呼吁编程工具转型通用办公Agent

推文呼吁 Kimi Code、DeepSeek Harness 等 AI 编程工具应尽早提供图形界面(GUI),并拓展对通用办公任务的支持,以进化为通用 Agent。作者认为,仅在终端界面(TUI)和单一编程能力上竞争没有前途,尽管编程是核心基础。同时,推文引用并关注了另一个新选手 Grok Build,指出其更新迅速、潜力较大。

踏雪寻仙: @dotey 还有两个新选手值得关注:Kimi Code、Grok Build。更新速度都很快,潜力不小

智能体DeepSeek大佬观点编码
12:13
宝玉@dotey
50
ChatGPT翻译功能被批设计落后,团队或被Codex合并

ChatGPT 的翻译功能做得不像前沿 AI 团队的作品,像 10 年前互联网产品经理的水平,ChatGPT 团队被 Codex 团队合并并非没有理由。

Tibor Blaho: OpenAI is working on a new "Translation Block" widget in ChatGPT Fun fact - one of the supported languages is "High Valy...

OpenAI产品更新大佬观点
10:33
Orange AI@oran_ge
48
推文批评微信作为主流通讯工具,却不支持 Markdown 和 HTML 文件格式的渲染与便捷打开,导致文件分享封闭,尤其在移动场景下造成困扰。作者呼吁微信应更早重视并支持这类基础功能,并特别指出"AI这么刚需的东西",微信至少应该在其智能体(Agent)功能上提供良好支持。引用推文也反映了相同的痛点:周围人频繁使用 Markdown 和 HTML 发文件,但微信对此一窍不通且封闭。

歸藏(guizang.ai): 现在周围人发文件都变成 Markdown 和 HTML 了,但是微信这俩格式一个都不支持,而且相当封闭,想用其他应用打开都费劲,真是受不了。 如果是在外面用手机,别人发过来的 Markdown 和 HTML 文件都不知道怎么打开。 感觉得做...

智能体大佬观点端侧
10:33
Orange AI@oran_ge
64
AI裁员潮背后的战略模糊

文章批评当前一些公司以“AI提效”为名进行裁员,认为这并非真正的变革。核心观点是,这种做法是用最小成本假装改变,回避了更根本的挑战:即在旧有业务模式结束后,公司未来的新战略方向是什么。作者指出,若无法回答这个关键问题,大规模裁员也无济于事。

Orange AI: http://x.com/i/article/2060890772099170304

大佬观点现象/趋势
09:45
小互@xiaohu
45
GPT-Realtime 2.0 实时语音接入AI 操控你的电脑 这才是真正的Siri… 不过这么丝滑是接入的codex 还是什么?

Farza 🇵🇰🇺🇸: Watch me control my computer with just my voice. This is the future of operating systems. No hands. GPT-Realtime 2.0 is ...

OpenAI多模态大佬观点语音
09:33
Orange AI@oran_ge
65
裁员还会继续,但它没有解决任何问题

文章对比2022-23与当前裁员潮,指出后者常以“AI改变经营方式”为由,但其真实性存疑。例如,有公司同日宣布高利润与大规模裁员,并归因于AI提效。作者提出AI native三层框架:1.找到AI原生新业务;2.构建新组织;3.用AI工具提升个人效率。他认为多数公司跳过前两层直接裁员,并以此证明转型成功,但这回避了核心问题:旧业务增长见顶后,真正的新增长点是什么?文章以赵武灵王胡服骑射为喻,指出仅以提效为名裁员是假装变革,若找不到新方向则无济于事。

大佬观点现象/趋势行业动态
07:47
Ethan Mollick@emollick
60
看起来,真正更好的AI发布正在加速,尤其是来自OpenAI和Anthropic。 为了说明,我让人制作了这个时间线。它只列出了在Artificial Analysis指数中比前代模型高出3分或以上的新模型。
AnthropicOpenAI大佬观点现象/趋势
07:45
ginobefun@hongming731
15
我们刚刚发布了Claude 4.7 Sonnet和Claude Opus 4。
大佬观点数据/训练
05:43
Nathan Lambert@natolambert
50
关于开源还是闭源模型会胜出的争论,归结于边际智能提升是否带来不成比例的价值。 相信这一点的人,与认为开源模型"足够好"的阵营相对而立。 闭源模型将保持略微更智能。开源模型将更便宜。
大佬观点开源生态
04:45
elvis@omarsar0
55
效率前沿! 你认为 GPT-5.6 会落在哪里?

CHOI: Claude Opus 4.8 has landed on DeepSWE Bench, posting a 58% Pass@1 and taking #2 overall behind GPT-5.5. It continues a b...

AnthropicOpenAI大佬观点评测/基准
04:43
Nathan Lambert@natolambert
62
Claude聊天搜索弱但编程强,OpenAI研究彻底

用户指出,Claude在普通聊天中(特别是技术搜索)表现较懒散,但通过Claude Code编程智能体,却能精准获取所需论文图表并完成任务。相比之下,GPT 5.5和OpenAI近期模型表现得极为彻底和坚持不懈,而Codex harness(编程工具框架)对模型的改造相对更轻量。核心对比在于不同模型与不同工具框架结合后,在搜索与研究任务上的表现差异。

智能体AnthropicOpenAI大佬观点
03:43
宝玉@dotey
38
AI时代,技能的价值正从功能转向应用

推文指出,在AI时代,单一的“功能性”技能正在变得廉价。无论是编程、写作还是外语,作为独立的专业技能其稀缺性在下降。核心观点是,能够将这些工具技能(如编程)整合起来,用以创造有价值产品的“工程能力”或应用能力,才真正稀缺且保值。引用推文也支持此观点,认为计算机技术虽重要,但其单纯的功能属性价值会越来越低。

Xiaowen: 现在,计算机技术和编程技术我觉得愈发的前所未有的重要的了。 但不等于计算机专业是个年轻人应该选择的专业,因为作为一个曾经黄金的功能性技能,单纯的功能属性会越来越廉价。

大佬观点现象/趋势
03:34
AYi@AYi_AInotes
50
推文探讨了使用AI的两种范式:一是"agent型"(如Claude Code、Codex),自主执行;二是"实习生型"(如Cursor),需人协作判断。作者认为后者才是真正的"以术入道"过程,能磨练个人判断力。为解决Cursor等工具需人在场的瓶颈,作者推荐了网易"UU远程",其支持手机远程连接Mac,提供4K 144帧流畅体验及原生终端。核心观点是:AI发展的关键不在于更强大的模型,而在于建立一种随时能与AI共同思考的连接方式,最终助人成为更优秀的提问者。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

智能体大佬观点编码
02:34
AYi@AYi_AInotes
精选75
NVIDIA 或将于六月发布整合 Blackwell GPU 与 AI 单元的 ARM 笔记本芯片 N1X

NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。

NVIDIA: A new era of PC. 25.0528, 121.5990

大佬观点端侧

推荐理由:三家巨头同发三个词和一个坐标,这比芯片参数更值得嗅的信号是,NVIDIA要从装空调的变成盖房子的,Windows 阵营的 Intel inside 可能真要换标了。
01:34
AYi@AYi_AInotes
69
AI执行变便宜,判断力成最贵资产

推文指出,AI智能体执行能力趋强,可能使prompt、skills等执行性技能最先贬值。OpenAI的Greg Brockman在红杉闭门会上强调,AI让执行变得近乎无限便宜,真正的稀缺资源是人的判断力——即决策事情是否该做、成果是否符合预期的能力。AI无法替代个人明确自身需求并最终拍板。

AYi: http://x.com/i/article/2057668634579714048

OpenAI大佬观点
00:15
elvis@omarsar0
67
HTML Artifacts正日益成为我与AI智能体协作的核心部分

在需要长时间运行的动态工作流、大型代码库处理或深度研究任务中,聊天窗口不足以展示成果。HTML Artifacts提供了必要的验证与决策层,已成为作者与AI智能体协作的核心界面。作者将其广泛用于日志记录、实验跟踪、头脑风暴、代码审查、智能体会话管理、深度研究与写作等场景,并构建了标签页系统进行管理。文章最后引用Karpathy的观点:随着智能体应用走向更高级、输出更复杂,我们将需要包括交互式神经视频/模拟在内的更高级交互形式。

智能体大佬观点
5月30日
23:44
elvis@omarsar0
63
HTML工件:与AI智能体交互的核心方式

作者指出,HTML工件正日益成为其与AI智能体协作的核心媒介,尤其在需要呈现长程任务成果的场景中。随着智能体处理动态工作流、大型代码库及深度研究任务,传统聊天窗口已力不从心。HTML工件提供了关键的验证层,使用户能审核智能体的工作成果并作出决策。作者在日志记录、实验跟踪、头脑风暴、代码审查等众多任务中应用HTML工件,并提及Karpathy关于未来需要更高级AI交互形式(如交互式神经模拟)的观点。

智能体大佬观点
23:14
Ethan Mollick@emollick
61
Epoch AI 使用其综合指标 Epoch Capabilities Index 测量发现,开源模型与闭源模型的能力差距平均约为三个月。但主推文作者对此表示怀疑,认为开源大语言模型的实际表现(尤其是在分布外任务上)比评测分数所显示的更为脆弱,真实的体感差距可能远不止三四个月。

Epoch AI: We measure the gap using the Epoch Capabilities Index, our aggregate measure of model capability. Compared to our last a...

大佬观点开源生态评测/基准
21:46
Chubby♨️@kimmonismus
28
我仍然觉得不可思议,没有实验室在文本转视频领域超越 Seedance 2.0,尽管它早在二月就发布了。
大佬观点视频
20:16
François Chollet@fchollet
17
当人类背离人性之时,终局将至。
大佬观点
19:34
AYi@AYi_AInotes
57
Tesla FSD中国路测震撼表现,引申AI工具使用哲学

推文感叹Tesla FSD在中国路测中的会车能力表现惊艳,堪称“遥遥领先”。引用推文进一步探讨了AI工具的使用本质,提出工具分为替人思考的“Agent型”和与人共思的“实习生型”(以Cursor为代表),后者是使用者“以术入道”、磨炼判断力的过程。其关键瓶颈是必须在场,而作者通过免费工具UU远程(4K 144帧、原生终端支持)在手机上远程操控运行Cursor的Mac,解决了此限制。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

智能体大佬观点
19:19
Peter Steinberger 🦞@steipete
51
使用 GPT 5.5、/goal、autoreview 和 crabbox 后,我的提示词任务从约30-60分钟变成了常常4-10小时的任务,而我对结果准备就绪的信心也大大提高了。 让智能体屈服是一种技能。
智能体OpenAI大佬观点
18:46
Chubby♨️@kimmonismus
46
文章探讨了OpenAI GPT系列模型的迭代策略。核心观点是,模型更新不仅意味着能力增强,更重要的是token效率的提升。token效率的提高直接带来更低的延迟、成本和摩擦,对于未来更复杂、运行时间更长的AI智能体工作流至关重要。从GPT-5.0到GPT-5.5的每次迭代,都在能力和token效率(进而带来速度增益)上实现进步,GPT-5.5是目前最好的模型。作者肯定了GPT-5.5在推理和执行效率方面的实际提升,并对GPT-5.6将变得更高效抱有高期望。

Tibo: When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and...

OpenAI大佬观点推理
16:10
Tibo@thsottiaux
19
当我们从 GPT-5.0 -> GPT-5.1 -> … -> GPT-5.5 时,版本号的递增伴随着能力的提升和 token 效率的提高(这转化为速度的提升)。GPT-5.5 是我们迄今为止最好的模型。 我们希望继续这一简单的策略。
OpenAI大佬观点
14:49
Greg Brockman@gdb
44
AI加速研究,通过扩展数学家和科学家敢于尝试的边界: AI能给予研究者追求"更疯狂"想法的自由。 对陶哲轩而言,AI创造了更多空间去实验、测试意想不到的路径,并发现那些原本可能无法企及的成果。

OpenAI: AI can give researchers the freedom to pursue "crazier" ideas. For Terence Tao, AI creates more room to experiment, test...

OpenAI大佬观点
12:49
Greg Brockman@gdb
22
用 Codex 开发的感觉太棒了

Carol Monroe: Nobody talks about how pleasant building with Codex feels

OpenAI大佬观点编码
12:42
歸藏(guizang.ai)@op7418
20
我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多 【引用 @op7418】:http://x.com/i/article/2059811469081141248

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

大佬观点数据/训练
12:11
meng shao@shao__meng
31
用户吐槽Claude Opus 4.8升级不大,还遇到账号问题

Claude Opus 4.8发布后,部分用户反馈其相比Opus 4.7升级感知不强,甚至认为模型变笨了。同时,有声音指出GPT-5.5更好用,并调侃该模型是否蒸馏了Qwen。此外,有用户在发布后尝试测试,发现自己的新注册账号意外变为“未注册”状态,此前该账号仅发送过一条消息,引发了对账号安全性的担忧。

AnthropicOpenAI大佬观点模型发布
11:14
elvis@omarsar0
65
MCP:AI智能体不可或缺的基础协议

作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。

智能体MCP/工具大佬观点
10:10
meng shao@shao__meng
36
构建生产级AI智能体框架的完整指南

如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要? @mfpiccolo 在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-build-your-own-agent-harness/ [引用 @mfpiccolo]:http://x.com/i/article/2060024515619397638

Mike Piccolo: http://x.com/i/article/2060024515619397638

智能体大佬观点
08:31
Orange AI@oran_ge
65
AI直接消耗能源,正引发范式转移与奇点之辩

有经济学家提出,真正的技术革命总伴随对能源的颠覆,而互联网和移动互联网时代并未真正做到。AI(人工智能)不同,它直接消耗原始能源,正推动绿色能源、化石燃料及元素周期表中多种元素的需求与价格飙升。作者认为,这种“重写比特容易,重写原子困难”的摩擦,证明我们正处于一场巨大的范式转移中。当技术浪潮同时推高能源、储能和基础元素成本时,只有两种可能:要么是史上最大的泡沫,要么是奇点正在到来。

大佬观点现象/趋势
08:08
Nathan Lambert@natolambert
56
推文强调开放科学在AI讨论和研究中的基础性作用,以Tulu 3项目创建RLVR(基于强化学习的验证与推理)为例,说明公开研究方法能为领域设定标准并减少未来冗余。同时指出一个关键现象:AI前沿实验室的创新常被学术界独立重现,但外部人员无法接触这些内部工作,唯一的参考来源就是公开分享的研究。因此,开放科学对推动整个领域进步至关重要。

Rishabh Agarwal: Someone once told me: "You should be the last one to reinvent something" -- not sure how useful this is, but this is a c...

大佬观点开源生态现象/趋势
05:46
Jeff Dean@JeffDean
76
我非常享受与@OfficialLoganK以及我的Gemini联合负责人@OriolVinyalsML、@NoamShazeer和@koraykv的这次对话。

Logan Kilpatrick: My conversation with @JeffDean, @koraykv, @NoamShazeer, and @OriolVinyalsML (the Gemini co-leads) about the current stat...

Google多模态大佬观点
‹ 上一页
1…2425262728…50
下一页 ›