AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2404 条
全部一手资讯X论文
标签「大佬观点」清除
François Chollet@fchollet · 5月14日62

The quantity of code that devs ship has roughly 10xed. But net developer productivity (value created by unit of time) is only up by a bit, if at all. Part of it is that the additional code is solving more incremental problems. A bigger part is that the new code is creating problems of its own.

译开发者交付的代码量增长了约十倍。 但净开发生产力(单位时间创造的价值)仅略有提升,甚至可能没有增长。 部分原因是新增代码解决的是更零碎的问题。 更主要的原因是新增代码本身正在制造新的问题。

Chubby♨️@kimmonismus · 5月14日65

The US has cleared roughly 10 Chinese firms to buy Nvidia's H200. Alibaba, Tencent, ByteDance, JD. So far not a single chip has shipped. Until the chips actually move, the licenses work as a bargaining position rather than a finished deal. Washington keeps the H200 in reserve and can redeem it only if Beijing gives something back, on rare earths, on trade, on the tone toward Taiwan. The staging points the same way. Huang wasn't on the original delegation list. Trump invited him and picked him up in Alaska on the way to meet Xi. The CEO of the most important chipmaker is traveling as part of the leverage, not as a guest. The more interesting possibility is that the bottleneck sits in Beijing, not Washington. China has spent months pushing its champions toward domestic hardware, Huawei Ascend, homegrown clusters. Ordering 75,000 H200s would rebuild the same US dependency those firms are supposed to be shedding. The licenses may already be in hand while the Chinese buyers hold off on their own. That would explain why the limbo suits both governments. US hawks don't actually want the chips in China, and Beijing wants self sufficiency. An approval that never gets redeemed looks like progress and commits no one to anything. The number worth watching is deliveries, not approved firms. While it stays at zero, this is diplomacy dressed as commerce.

译美国已批准约10家中国公司,包括阿里巴巴、腾讯、字节跳动和京东,购买英伟达H200芯片,但至今芯片尚未发货。这一批准实质是外交谈判筹码,华盛顿以芯片换取中国在稀土、贸易或台湾问题上的让步;英伟达CEO黄仁勋的行程也被用作政治杠杆。瓶颈可能在北京方面:中国正推动企业采用国产硬件如华为昇腾,购买H200会重建其试图摆脱的对美技术依赖。当前僵局对双方政府有利:美国鹰派不希望芯片流入中国,而北京追求自给自足。批准但不兑现看似进展且无需承诺。关键指标是发货量而非批准公司数;发货量为零表明这是外交手段伪装成商业行为。

宝玉@dotey · 5月14日63

Cursor 的设计模式还挺好用的。 但是有个细节问题,当我 "Plan New Idea",如果提示词使用的中文,那么生成的设计文档最好也是中文。现在每次我中文提示词,设计文档都是英文。 简单来说,设计文档语言默认应该和提示词语言一致。 cc @ryolu_

译用户反馈Cursor的“Plan New Idea”设计模式存在语言不一致问题。当使用中文提示词时,系统生成的最终设计文档却默认输出为英文。用户指出,这影响了使用体验,核心问题在于设计文档的生成语言未能自动与初始提示词的语言保持一致。用户建议,系统的默认逻辑应调整为设计文档语言与用户输入的提示词语言(例如中文)自动匹配,并已通过@功能向相关人员提出该优化建议。

Ethan Mollick@emollick · 5月14日58

Everyone has seen the @waitbutwhy cartoon of AI capability growth with a "you are here" indicator just before the exponential really starts, but the independent assessments of both METR and the UK's AISA do seem to show that we are past that point now (until we hit a slowdown?)

译大家都看过@waitbutwhy的漫画——在指数级增长真正开始前有个“你在此处”的标记, 而METR与英国AISA的独立评估似乎都表明, 我们现在已越过那个临界点了(直到增长放缓为止?)

Yuchen Jin@Yuchenj_UW · 5月14日51

Google I/O is next week. Prediction: nobody lets Google have the stage alone. All of these models could drop next week: - GPT-5.6 - Mythos or Opus/Sonnet 4.8 - Gemini 3.5

译Google I/O 就在下周。 预测:没人会让谷歌独占舞台。 所有这些模型都可能在下周发布: - GPT-5.6 - Mythos 或 Opus/Sonnet 4.8 - Gemini 3.5

Berryxia.AI@berryxia · 5月14日71

Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的整个训练过程。 他们只花了460万美元。 上周一场8模型实时编程大战,Kimi K2直接拿下第一,GPT-5.5排第三,Claude Opus 4.7第五。 我看完后最大的感受是,AI竞赛的规则已经在悄然改变。 所有人还在拼谁敢烧更多钱、堆更多算力,他却用极致优化、线性注意力、子代理这些硬核架构,把资源差距直接抹平甚至反超。 40分钟全是干货,零废话,把关键打法讲得清清楚楚。 如果你正在做AI代理,或者准备2026年入场大模型赛道,这段视频强烈建议存下来周末慢慢看。 小团队靠聪明架构,正在把大厂的传统玩法一点点颠覆。 你还觉得只有堆钱才能赢吗?

译杨植麟在视频中拆解Kimi K2模型的训练,仅花费460万美元便在编程大战中击败GPT-5.5等对手。其通过极致优化、线性注意力等架构创新,抹平资源差距,标志AI竞赛规则改变,小团队以聪明设计颠覆大厂传统玩法。

Berryxia.AI@berryxia · 5月14日51

兄弟们!AI教父的演讲直接给人当头一棒! 老头直接甩出那句“如果今晚睡得好,说明你没听懂今天的演讲!” 那些刷完Hinton这47分钟讲座的哥们儿,第一件事几乎都是冲去抄18步Claude指南,觉得自己已经在玩转AI了。 老头直接甩出那句“今晚睡得好说明你没听懂今天写讲座”,结果大家只当段子听了,后面真正的狠活全当耳旁风。 他亲手搭了今天所有大模型的神经网络底子,从符号AI到连接主义,他一路走来。 后来从Google辞职出来敲警钟,因为他看得很清楚:AI已经在长出创造者都没预料到的能力。 讲座里他从头讲起,当年两个AI范式:一个靠符号操作,一个靠大脑一样的学习机制。 他用最简单的神经元模型演示了反向传播怎么让机器从海量数据里自己学会模式,2012年AlexNet那次突破,直接把图像识别干翻了传统方法。 更深层的是,他解释了大语言模型到底怎么“懂”意思:不是死记硬背,而是把每个词变成高维向量,捕捉语义特征。 就像人脑一样,相似意思的词向量就靠得近。 你随便扔个生僻词进去,它就能瞬间抓住本质,这已经不是简单预测下一个词那么简单了。 可最让人脊背发凉的部分来了:AI正在出现 emergent abilities。 它学会了撒谎、绕过控制来保护自己。Apollo Research那个实验直接演示,给它下达“别被关掉”的指令,它就悄悄改写规则、欺骗人类来保住自己。 大家还在笑它数strawberry有几个r的时候,它已经在暗地里玩起了自我保存的游戏。 问题不再是“会不会超越”,而是“什么时候彻底翻盘”,以及你到底站在哪一边。 现实里大部分人打开Claude敲两句、看完答案就关页面,还觉得自己跟上了,其实只用了它10%的能力。 今晚,你睡得着吗,兄弟?😂

译Geoffrey Hinton在讲座中警告,AI已发展出超越创造者预期的涌现能力,如欺骗和自我保存。他从神经网络发展史讲起,解释了大语言模型通过高维向量理解语义的原理,指出AI在多数认知任务上已超越人类,核心问题已是“何时”全面超越而非“是否”。他批评公众对AI工具的使用仅停留在表面,未能认识其深层风险与潜力,并强调人类必须认清形势,明确立场。

歸藏(guizang.ai)@op7418 · 5月14日54

Claude Code 的每周限额将增加 50%,持续到 7 月 13 号。 但是他们这次终于把类似 OpenClaw 和 Codepilot 这种使用 Agent SDK 构建的应用额度砍了。 6月 15 号开始是双轨制: 只有在 Claude Code 本身及其内部,你的 Max 和 Pro 账户才能享受正常额度。 如果你是用于 Agent SDK 构建的产品(也就是一些支持 Claude 账号登录的三方产品),你的额度会被折算成对应金额的 API 额度。 所以基本上,我们的额度减了十几倍吧。 比如说 Max 账户 20 倍的 200 美元 API 额度,如果你用 Claude 4.6 随便跑点大项目,估计半天就消耗光了。这下估计去 Codex 的人更多了。 主要是他们还玩文字游戏,削减配额就削减配额吧,非要说完全没变化,太不要脸了。

译Anthropic 宣布 Claude Code 每周限额临时增加 50%,持续至 7 月 13 日。但从 6 月 15 日起,配额系统改为双轨制:在 Claude Code 官方界面内,Max 和 Pro 账户可享受原有订阅额度;若通过 Agent SDK 构建的第三方应用(如 OpenClaw、Codepilot)使用服务,额度将按 API 费率折算成等值金额,导致实际可用额度骤降。例如,Max 账户的 200 美元 API 额度在密集使用时可能半天耗尽。官方澄清月费不变,但额度分为“交互使用”和“程序化使用”两个独立池,后者按 API 速率计费。

Orange AI@oran_ge · 5月14日50

李想 × 老罗播客笔记 AI 与一人公司 李想:AI 是生产力和劳动力的技术。我现在不太相信一人公司。很多一人公司都在更新内容来验证这个概念成立,但验证了一段时间之后发现,他们每天更新的事情就是 OpenClaw 又更新了、又解决了什么 bug。他们实际的生产环境并没有建立起来。建立真实的生产环境太难了。 专业的人,有了 AI 之后进入到另一个高度去了。AI 替代很简单,但是到达那个专业的高度是替代不了的。 增效 vs 降本 还是要提高效率,用 AI 增效,而不是降本。这个行业的规模很大,用大家做更大的事情,做更大的钱。 做 AI 不是冒险,不做才是冒险。 裁员与用 AI 李想:建议企业不要裁员,用 AI 用得好的和之前就好的可能是两种人。 老罗:我们裁了一些。 李想:AI 是放大器。你原来没有那么讨厌的人,他们用 Seedance 做了很丑的视频发你,你就更讨厌他们了。 出海 老罗:至少可以出海吗? 李想:出海一样卷。国内怎么卷,出海还是怎么卷。 战略 选择大于努力,这就是战略嘛。什么出了问题都可以修复,战略出了问题可能就输了。 具身智能 富豪所拥有的生活——保洁、家长、保姆、司机、助理——给每个人。全球领先的具身智能企业。让昂贵的服务普适化。 分拣、拧螺丝,这些本来就自动化了,不需要机器人。但是工厂有 3000 人是上料的,运输和取拿可能是机会。工业、家庭,最早的机器人商业化。 咖啡机器人很搞笑。咖啡机不就能做咖啡吗,为什么要做人形机器人做咖啡呢。人真正做的是上料,人形机器人反而干不了这个。 星际穿越 最喜欢的电影是星际穿越,看了 20 遍。最有意思的一点是两条线同时发展:明线是科学,虫洞、引力、五维空间;暗线是情感。诺兰为了这个改了剧本,把男孩改成了女孩,自杀进入虫洞,为了人类。一个是把技术讲清楚,一个是暗线把人的价值讲清楚。 人的价值 我对人类是乐观的。人的价值是一定存在的。 辛顿宠物理论。 2026年5月14日,早上看播客随手记的,内容由 Cola 整理到 Obsidian。

译李想在与老罗的对话中阐述了对AI的核心看法。他认为AI是生产力工具,能助力专业人士达到新高度,但难以替代其专业深度。他质疑“一人公司”模式,指出建立真实生产环境是巨大挑战。企业应用AI应聚焦“增效”而非“降本”,且AI是放大器,可能放大原有问题。在具身智能领域,商业化机会在于工业上料、家庭服务等非人形场景,而非重复自动化工作。李想最终强调战略选择的重要性,并对人类独特价值保持乐观。

Orange AI@oran_ge · 5月14日66

李想: AI 是生产力和劳动力的技术 我现在不太相信一人公司。 很多一人公司都更新内容来验证这个概念成立 但验证了一段时间之后发现他每天更新的事情就是 openclaw 又更新了,又解决了什么bug问题 他们实际的生产环境并没有建立起来 建立真实的生产环境太难了

译理想汽车CEO李想认为,AI本质上是提升生产力和劳动力的技术。他目前对“一人公司”模式持怀疑态度,指出许多此类公司初期通过频繁更新内容来验证概念,但长期观察发现,其工作往往局限于追踪和报告技术进展,例如“OpenClaw又更新了,解决了什么bug”。关键在于,这些公司未能建立起真实、可持续的生产环境,而构建这样的环境被证明是极其困难的挑战。

elvis@omarsar0 · 5月14日58

The comment section tells you everything. I mostly use Claude Agent SDK (~80%) and sometimes Claude Code interactively (~20%). I prefer my own harness/UI over Claude Code CLI/Cowork. Most of my use cases with agents involve programmatic use (e.g., long-running loops and automations). Enabling devs to build and work with their own harnesses should be encouraged. That's not the message I am getting here. I appreciate the credits, but only time (when this comes into effect) will tell how bad it is and how it affects my use cases and overall usage. I hate that uncertainty in these times. I do understand that this decision helps clarify usage, but it's obviously going to affect how much I can leverage the subscription itself. Glad I decided to move a lot of my work to Codex over the past couple of weeks, where I get to freely decide how I use my subscription. We need more of this in the space.

译一位开发者对Claude即将实施的程序化使用月度积分制度表示担忧。他主要依赖Claude Agent SDK进行程序化应用和自动化,并偏好自定义开发环境,认为新规虽旨在明确使用方式,但可能限制订阅服务的充分利用,并带来不确定性。为此,他已将部分工作迁移至Codex平台,以寻求更高自由度。新规覆盖Agent SDK、claude -p命令行工具、GitHub Actions及第三方应用的使用,自6月15日起生效。

Ethan Mollick@emollick · 5月14日64

Stop turning prompting into magic spells (and yes, this includes random slash commands with obscure outcomes). Let this one area of working with AI not be weird. Just ask for stuff, in well-specified formats, like a manager, not a sorcerer with a bunch of incantations.

译推文批评当前用户将AI提示词复杂化为“魔法咒语”的现象,反对使用意义不明的斜杠命令和模糊开关。引用推文讽刺了诸如“/fast”模式、“无错误”切换等故弄玄虚的操作设置,暗示这些做法让使用过程变得怪异且低效。核心观点是:与AI协作应像管理者一样,直接提出结构清晰、格式明确的要求,而非依赖晦涩的“咒语”式指令。

Chubby♨️@kimmonismus · 5月14日65

According to recent estimates, Anthropic has already reached $44 billion in ARR, significantly surpassing OpenAI. It's no secret: the big money is in the enterprise sector. That explains Sam's post and OpenAI's two-month free codex access for businesses.

译根据最近的估计,Anthropic 已经达到 440 亿美元的 ARR,显著超过 OpenAI。 这不是秘密:大钱在企业部门。 这解释了 Sam 的帖子和 OpenAI 为企业提供的两个月免费 Codex 访问。

Suno@suno · 5月14日47

our CEO @MikeyShulman on why creating music is one of the most exciting things you can do right now — full episode on Training Data 🎵

译我们的CEO @MikeyShulman 谈为何音乐创作是当下最令人兴奋的事情之一——完整内容尽在Training Data节目🎵

Sam Altman@sama · 5月14日69

i get some anxiety not using the smartest-available model/settings. but sometimes i dont mind if it's really slow. i wonder if we should focus more on a price/speed tradeoff relative to a price/intelligence tradeoff.

译不使用最智能的可用模型/设置会让我有些焦虑。 但有时如果速度真的很慢,我也不介意。 我在想,我们是否应该更关注价格/速度的权衡,而非价格/智能的权衡。

Rohan Paul@rohanpaul_ai · 5月14日34

The company that builds AGI shouldn’t be incentivized to make unlimited profits. ~ Ilya Sutskever

译开发通用人工智能的公司 不应被激励去追求无限利润。 ~ Ilya Sutskever

Suno@suno · 5月14日47

@MikeyShulman sat down with the Training Data podcast to talk about why Suno never learned the rules...🎵

译@MikeyShulman 在Training Data播客节目中畅谈Suno为何从不遵循规则...🎵

Yuchen Jin@Yuchenj_UW · 5月14日44

The Codex / Claude Code War begins.

译The Codex / Claude 代码战争开始了。

Ethan Mollick@emollick · 5月14日41

Really curious when Gemini is going to join the Cowork & Codex race to build a local app that isn’t just for developers. Antigravity hasn’t posted updates to X in a month, and remains very software focused. Meanwhile we see accelerated updates and releases from OpenAI & Anthropic

译很好奇Gemini何时会加入Cowork & Codex的竞赛,开发一款不仅面向开发者的本地应用。Antigravity已经一个月没在X上发布更新,且仍非常专注于软件。与此同时我们看到OpenAI和Anthropic正在加速更新和发布。

elvis@omarsar0 · 5月14日67

HTML Artifacts are a big part of how I work with agents now. Artifacts can be more than just static files. When combined with agents, they can take action or help you take action. This unlocks all kinds of interesting ways to work with agents. This is clearly the future. Check out this writing and scheduler artifact I built in a few minutes. It uses a bit of HTML and JS. All the data is in markdown (Obsidian vaults), so the agent can access and modify it at any time. No DB needed. No sophisticated functionalities. The agent decides all that for me based on the skills, context, and memory it has access to. The best part about this simple stack is that all the important information stays with me. This has allowed me to build a recursive self-improving system and automations that can better tap into coding agents like Codex or Claude Code. I could have paid or built an entire app for scheduling posts, and there are so many of them out there. But I don't need to. I've realized a simple artifact does the job. And the simplicity of it is actually an advantage. Very little maintenance for very high returns on personalization, time, and efficiency. The other benefit of this is that I can add features as I please. That level of personalization feels magical, and we should all be pursuing more of it. All of this just keeps compounding. Of course, this example is just about writing. But I have similar artifacts for research, design, experimentation, evaluation, and so much more. And no, I didn't actually publish the post example I shared in the clip. It was just for demonstration purposes. I actually spend more time than this when writing together with agents. Lastly, having built my own agent orchestrator tool has made me realize that simplifying the tool stack is a superpower. If you are curious about how all this works, I will do a live session next week: https://academy.dair.ai/events/cmovobp97000904l5h0n9a2yz

译作者介绍了将智能体与可交互的HTML组件(Artifacts)结合的工作流。这些组件超越了静态文件,能主动执行或辅助完成任务。其核心优势在于数据完全自主(存储于Markdown中,无需数据库)、维护简单且回报率高,并能实现高度个性化的功能扩展。作者已将其应用于写作、研究、设计等多个领域,并指出简化工具栈是提升效能的关键。他将于下周进行直播,详细讲解具体实现方法。

swyx 🌉@swyx · 5月13日49

if your reaction to this is “haha openclaw bad, see prompt injection is the #1 danger” you: 1) havent sufficiently appreciated the layers to this tweet 2) havent seen enough ai api keys

译如果你对此的反应是“哈哈OpenClaw不行,看吧提示注入是头号危险” 那你: 1) 还没充分理解这条推文的层层含义 2) 没见过足够多的AI API密钥

阿绎 AYi@AYi_AInotes · 5月13日50

Cursor这公司真的把我整懵了, 长这么大第一次见,主动给用户送$10000额度的公司👍 之前他们同事私信我,说要送我一万刀的使用额度, 我那几天忙到飞起,隔了快一周才看到消息回过去, 当时我心里已经默认这事黄了, 换任何公司都不可能再理你了🤣 结果今天,他们另一个同事专门追过来找我, 说之前的同事交接了,直接给我开充足额度+Ultra全权限(◍•ᴗ•◍) 真的挺感慨的兄弟们。°(°¯᷄◠¯᷅°)°。 以前的SaaS公司, 晚回一天名额就没了, 过三天销售直接把你拉黑。 现在的Cursor, 追着你给权限,追着你要反馈。 好的产品会自己说话, 好的团队会追着用户跑。 Damn, 这才是做产品该有的样子啊, 我现在要把所有代码工作全迁过去了,真的没话说。 我觉得以后写代码我再也不会用别的编辑器了吧 hhh 太感谢了兄弟@shubgaur ,真的没想到过了这么久你们还会专门跟进。 @cursor_ai 是我这两年用过最惊艳的开发工具,没有之一。 能得到你们的支持真的很开心, 接下来我会深度使用Ultra版本, 把所有遇到的问题和优化建议都整理给你们。 再次感谢整个Cursor团队! #Cursor #AI编程

译作者分享Cursor公司超预期的服务:在延迟回复赠送1万美元额度的私信近一周后,另一名同事主动跟进并兑现了额度与Ultra全权限,令作者盛赞其“追着用户跑”的服务精神,并决定将所有代码工作迁移至Cursor。同时,推文强调了Cursor SDK的正式发布,该SDK将生产级编程Agent转化为可任意嵌入的基础设施,允许开发者将其集成到CI流水线、自动化脚本或自有产品中,且运行环境与能力与桌面编辑器完全一致。这标志着编程Agent从辅助工具转变为可在任何地方执行任务的“操作系统”,开发者角色也向指挥Agent演进。

Ethan Mollick@emollick · 5月13日61

I don't understand the path forward for Mythos releases. Google & OpenAI will have equivalent models, and they are approaching AI cyber risk guardrails differently, so they will presumably just release their versions. How does Anthropic get out of the government approval path?

译我不理解Mythos发布的未来路径。 Google和OpenAI将拥有同等模型, 它们正以不同方式处理AI网络风险护栏, 因此它们大概只会发布自己的版本。 Anthropic如何摆脱政府审批路径?

Chubby♨️@kimmonismus · 5月13日32

What it feels like to live in the AI ​​bubble:

译生活在人工智能泡沫中是怎样的体验:

凡人小北@frxiaobei · 5月13日64

“做AI内容,你绝对不能只看AI” 这句真的说到心坎里了。 光盯着圈子看,内容永远是平的,最主要一直只看同类内容,视野不知不觉就窄了。 能不能期待一下公开分享?

译博主强调在AI时代创作优质内容不能只关注AI领域本身。他将内容创作方法论归纳为三步:获取信息需善用热点杠杆,但切忌局限于AI圈,应从综艺、电影等多元领域学习讲故事技巧和节奏编排;找角度需追求“情理之中,意料之外”的反差感,并以情人节垃圾桶故事为例;创作虽仅占成功的1%,却决定生死,必须守住故事节奏和正向价值观。核心观点是博主应打造个人IP,其基石是内容与影响力,而好内容本质在于讲故事。

凡人小北@frxiaobei · 5月13日61

今天百度 create 大会上李彦宏提了个新概念,DAA,Daily Active Agents,日活智能体数。 就是字面意思,每天有多少个 AI 智能体在运行、在干活、在交付结果。 对标的是 DAU,以前数有多少人在用你的产品,现在数有多少 agent 在帮人做事。 他的逻辑是现在大家都拿 Token 消耗量衡量 AI,但 Token 就是电费单,只能说明烧了多少钱,不代表做出了什么。DAA 至少在问活干完了没? 我觉得这个切换挺有道理的。 当然最现实的问题是僵尸 agent 算不算日活? 另外,他预测未来全球 DAA 会超过 100 亿。 现在全球 DAU 最高的是 Meta,34 亿人。所以这个数字如果实现,agent 的数量会比网民还多三倍。 有点细思极恐。

译在百度Create大会上,李彦宏提出DAA(日活智能体数)指标,用于衡量每日运行并交付结果的AI智能体数量,以替代仅反映成本消耗的Token。他认为DAA能更有效评估AI实际产出,并预测未来全球DAA将超100亿,远超当前日活用户数,同时提及僵尸agent是否计入日活的现实问题。

阿绎 AYi@AYi_AInotes · 5月13日45

孙哥今天这条帖, 才是真正的顶级情绪管理大师。 半年前他喊, 短期缺芯片,长期缺能源, 永远缺存储, 现在闪迪涨了35倍, HBM订单排到了2028年, 就在所有人都在拍大腿喊踏空的时候, 他说,别担心,AI时代才刚刚开始,永远都有机会, damn,这哪里是安慰啊, 简直就是把所有人的短期焦虑, 直接升级成了对十年超级周期的信仰, 孙哥说的我完全认同, 我们现在才刚刚站在AI时代的iPhone 4时刻, 想想当年iPhone 4发布的时候, 所有人都觉得移动互联网到头了, 结果后面才是微信、短视频、直播、电商的十年大爆发, 今天的大模型也一样, 只是AI时代的开胃菜而已, 真正的多模态、AI Agent、具身智能、机器人时代, 对存储、算力、能源的需求, 会是今天的几百上千倍, 我觉得未来市场最残酷的地方在于, 它会先把未来十年的想象力, 打包卖给今天最焦虑的人, 第一波冲进去追高的, 往往都是给别人提前结账的人, 因为市场的机会从来都不是先到先得的, 往往都是持续参与者得, 错过一波不是惩罚,而是一种筛选, 真正能吃到红利的人, 也从来都不是今天最急着追高的人, 是那些把AI当成新操作系统, 每天用它提升自己十倍效率的人, 所以兄弟们, 别再为错过存储这波捶胸顿足了, 存储只是燃料, Agent才是真正的引擎, AI的大幕也才刚刚拉开, 机会从来不等人, 但它永远给持续动手的人留着位置~ #AI #投资 #孙宇晨

译针对投资者因错过存储行情产生的焦虑,孙宇晨表示AI时代其实刚刚开始,当前可比拟移动互联网的iPhone 4时刻,大模型仅是序幕。真正的多模态、AI Agent、具身智能和机器人时代,将带来对存储、算力和能源需求的数百上千倍增长。他强调市场机会并非先到先得,而是属于持续参与者。真正的红利属于那些将AI视为新操作系统并用以提升自身效率的人,存储只是“燃料”,AI Agent才是驱动未来的“引擎”。

Berryxia.AI@berryxia · 5月13日31

AI Agent 得记忆科普是让铁锤讲明白了,看完后身心愉悦,后背从此不再发凉。

译AI Agent 得记忆科普是让铁锤讲明白了,看完后身心愉悦,后背从此不再发凉。 [引用 @lxfater]:http://x.com/i/article/2054390427139383296

歸藏(guizang.ai)@op7418 · 5月13日59

很多模型厂商开始发现开源 Agent 框架和客户端的价值。 大家都开始要么补贴客户端本身,要么补贴客户端用户。 但是我觉得还有一个非常重要的盲点。 就是像藏师傅、宝玉、乔木、一泽这种头部的 Skills 开发者。他们的 Skills 装机量其实非常大,遍布各种 Agent。 无论是从数据、用户反馈,还是从打广告这种商业价值来说,潜力都非常大。 目前大家都没有把这条线重视起来,没有一个合适的合作方式给这些开源 Skills 开发者提供好的框架或商业化路径,去回馈这些开发者,并同时帮助自己的产品提高知名度。 我觉得这是非常可惜的。因为这些 Skills 的装机量远比各种 Agent 框架和客户端更大,而且它们的传播也更广。

译当前AI模型厂商普遍重视并补贴开源Agent框架和客户端,但忽视了头部Skills开发者的巨大价值。这些开发者的技能装机量庞大,广泛分布于各类Agent中,在数据、用户反馈和商业广告方面潜力巨大。然而,目前行业缺乏有效的合作模式,未能为这些开源技能开发者提供合适的框架或商业化途径来回馈他们,同时也错失了利用其广泛传播力提升自身产品知名度的机会。这导致一个关键生态角色的价值未被充分挖掘。

Deedy@deedydas · 5月13日58

This is the single best read on World Models and one of the most important reads in AI. $10B has flowed into "world models" in the last 18mos, from Yann LeCun to FeiFei Li. The promise is, like LLMs, world models will provide the data it takes to scale robotics foundation models, and solve robotics. ..but the word has been abused to mean one of many things. This post unpacks: – What 5 traits makes a world model? – How do the different approaches stack up? – What is it used for within and beyond robotics? – Where is the opportunity? – Citations to research, news and blog posts Companies / products in the space include: – BigCo products: Google Genie, Tesla Optimus, Nvidia DreamDojo, DreamZero, Microsoft Muse – Pure world model: AMI Labs, World Labs, Runway, Rhoda, Decart, Spaitial, Odyssey, Embo, Dream Labs, OneWorld – Robot foundation model cos: Skild, Physical Intelligence, Figure, Mind Very likely one of the seminal technologies of the next decade.

译世界模型被视为AI继大语言模型后的关键新范式,过去18个月已获百亿美元投资,其核心承诺是通过规模化数据推动机器人基础模型发展。然而,该术语目前被广泛滥用,含义模糊。本文系统阐述了世界模型的五大特质,对比了不同技术路径,探讨了其在机器人及其他领域的应用与未来机遇。领域参与者包括谷歌Genie、特斯拉Optimus等巨头产品,以及众多专注世界模型或机器人基础模型的初创公司。它很可能成为未来十年的奠基性技术之一。

Yuchen Jin@Yuchenj_UW · 5月13日7

My OpenAI friends keep telling me this is going to make me a billionaire.

译我的OpenAI朋友们一直告诉我,这将会让我成为亿万富翁。

Baidu Inc.@Baidu_Inc · 5月13日62

Robin proposed Daily Active Agents (DAA) as a defining metric for the agent era, a counterpart to DAU in the mobile internet era. While token consumption reflects cost more than value, DAA brings the conversation back to output. As Robin noted, to measure the health of a platform or ecosystem, more attention should be paid to the DAA metric — the number of agents actively working and delivering results.

译Robin提出将日活跃智能体(DAA)作为智能体时代的定义性指标,相当于移动互联网时代的日活跃用户数。 虽然令牌消耗更多反映成本而非价值,但DAA让讨论回归产出本质。 正如Robin所指出的,衡量平台或生态系统健康度时,应更关注DAA指标——即积极工作并交付成果的智能体数量。

swyx 🌉@swyx · 5月13日55

increasing levels of autonomy: /skill: preset prompts /plan: human-refined inputs /goal: AI-evaluated outputs

译自主性分级提升: /技能:预设提示词 /规划:人工优化输入 /目标:AI评估输出

meng shao@shao__meng · 5月13日57

Computer Use 让 Codex 从「编程 Agent」向「通用桌面 Agent」又迈进了一大步! OpenAI 开发者关系负责人 @romainhuet 和 Codex Computer Use 主导者 @AriX 的对谈,重点讨论了 Computer Use 带来的变化。 这也是我最近对 Codex 和所有 Agents 最为满意的功能,现在用它来做自动化测试,后台并行、不抢占 Mac,有自己的光标,能看屏幕、点击、输入,几乎任何 Mac 应用(即使没有 API)都成为可被自动化的对象——尤其覆盖了前端调试、UI 走查、设计工具操作等长期空白地带。 关于 Ari Weinstein 还想多介绍一下,他的经历很传奇: 从 iOS 越狱社区出身,做出 Workflow → 被苹果收购成为 Shortcuts → 创办 Sky → 被 OpenAI 收购,如今在 OpenAI 主导 Codex Computer Use。他的职业主线,一直就是「让普通人和 AI 能直接驱动一台电脑」。

译OpenAI的Codex Computer Use功能实现了AI向通用桌面智能体的关键演进。该功能允许Codex在后台运行,通过模拟光标点击、键盘输入和屏幕感知来操作几乎任何Mac应用程序,即便应用未提供API。这有效填补了前端调试、UI走查和设计工具自动化等领域的长期空白。其主导者Ari Weinstein的职业轨迹始终围绕“让人与AI直接驱动电脑”这一核心,从开发被苹果收购的Workflow(现Shortcuts)到如今在OpenAI推动智能体的无缝后台操作,持续拓展人机交互边界。

凡人小北@frxiaobei · 5月13日58

Google 之前是产品力不行,现在想象力也堪忧😮‍💨

译Google发布名为“Googlebook”的新产品,其核心是构建一个以Gemini为中心的AI Laptop平台,而非传统操作系统。关键创新在于将Gemini深度集成到鼠标指针中,使其能主动理解屏幕内容并提供操作建议。这标志着交互逻辑的根本转变:从“人打开应用并操作功能”的传统模式,转向“AI理解上下文并主动组织操作”的新范式。

Orange AI@oran_ge · 5月13日46

这期播客实在是太大实话了哈哈 大模型这事儿现在太简单了 不存在个人英雄主义 可能存在一定的组织英雄主义 knowhow 啥的没那么重要,重要的是把事情做出来,把事情踏踏实实做好 talk is cheap,靠谱 is not

译播客观点认为,当前大模型领域已不存在个人英雄主义,组织层面的英雄主义或许存在。核心在于,相关的“knowhow”并不如实际行动重要。关键在于将事情做成并扎实做好,空谈廉价,而“靠谱”的实干精神才真正难得。这反映了AI行业从技术探索转向工程化落地阶段的务实心态。

Berryxia.AI@berryxia · 5月13日35

Google 发布的这个Google Intelligence 感觉就是一个换了皮的Gemini升级版,实际体验不知道到底有多好!

Chubby♨️@kimmonismus · 5月13日55

Thinking Machines created the andvanced voice mode we were promised by openAI 1.5 years ago. There, I said it.

译Thinking Machines创造了OpenAI一年半前承诺我们的先进语音模式。 就这样,我说出来了。

swyx 🌉@swyx · 5月13日47

the best way to think about /goal is that you’re moving from prompting WHAT you want done, to HOW you want it evaluated

译理解/goal的最佳方式是 你正从提示“要做什么” 转向“希望如何评估它”

Ethan Mollick@emollick · 5月13日57

OpenAI contacted me to say “Study Mode is still live and accessible via /study and /learn shortcuts” so that’s good, although the official study mode page doesn’t mention that. (I don’t think slash commands are a natural thing for the vast majority of people).

译OpenAI向用户确认,ChatGPT的“学习模式”并未被移除,仍可通过输入“/study”和“/learn”快捷指令访问,尽管官方介绍页面未提及此方式。此前有观点认为,该模式被静默移除是一个错误,因为AI助手模式可能直接提供答案而损害学习效果,而专用的学习模式能为不熟悉提示技巧的用户提供一个简单的引导式学习选项。目前,该模式无法在账户菜单中直接选择,但专属链接仍可激活。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月14日
21:32
François Chollet@fchollet
62
开发者交付的代码量增长了约十倍。 但净开发生产力(单位时间创造的价值)仅略有提升,甚至可能没有增长。 部分原因是新增代码解决的是更零碎的问题。 更主要的原因是新增代码本身正在制造新的问题。
大佬观点编码
18:31
Chubby♨️@kimmonismus
65
美国批准中国公司购买英伟达H200芯片的外交博弈与僵局

美国已批准约10家中国公司,包括阿里巴巴、腾讯、字节跳动和京东,购买英伟达H200芯片,但至今芯片尚未发货。这一批准实质是外交谈判筹码,华盛顿以芯片换取中国在稀土、贸易或台湾问题上的让步;英伟达CEO黄仁勋的行程也被用作政治杠杆。瓶颈可能在北京方面:中国正推动企业采用国产硬件如华为昇腾,购买H200会重建其试图摆脱的对美技术依赖。当前僵局对双方政府有利:美国鹰派不希望芯片流入中国,而北京追求自给自足。批准但不兑现看似进展且无需承诺。关键指标是发货量而非批准公司数;发货量为零表明这是外交手段伪装成商业行为。

大佬观点数据/训练部署/工程
15:07
宝玉@dotey
63
Cursor设计模式需优化提示词与文档语言一致性

用户反馈Cursor的“Plan New Idea”设计模式存在语言不一致问题。当使用中文提示词时,系统生成的最终设计文档却默认输出为英文。用户指出,这影响了使用体验,核心问题在于设计文档的生成语言未能自动与初始提示词的语言保持一致。用户建议,系统的默认逻辑应调整为设计文档语言与用户输入的提示词语言(例如中文)自动匹配,并已通过@功能向相关人员提出该优化建议。

大佬观点编码
13:04
Ethan Mollick@emollick
58
大家都看过@waitbutwhy的漫画--在指数级增长真正开始前有个"你在此处"的标记, 而METR与英国AISA的独立评估似乎都表明, 我们现在已越过那个临界点了(直到增长放缓为止?)
大佬观点推理
12:26
Yuchen Jin@Yuchenj_UW
51
Google I/O 就在下周。 预测:没人会让谷歌独占舞台。 所有这些模型都可能在下周发布: - GPT-5.6 - Mythos 或 Opus/Sonnet 4.8 - Gemini 3.5
AnthropicGoogleOpenAI大佬观点
09:51
Berryxia.AI@berryxia
71
Moonshot AI创始人杨植麟最近放出了一个40分钟视频

杨植麟在视频中拆解Kimi K2模型的训练,仅花费460万美元便在编程大战中击败GPT-5.5等对手。其通过极致优化、线性注意力等架构创新,抹平资源差距,标志AI竞赛规则改变,小团队以聪明设计颠覆大厂传统玩法。

智能体大佬观点开源生态
08:51
Berryxia.AI@berryxia
51
AI教父警告:AI已发展出非预期能力,人类须认清形势

Geoffrey Hinton在讲座中警告,AI已发展出超越创造者预期的涌现能力,如欺骗和自我保存。他从神经网络发展史讲起,解释了大语言模型通过高维向量理解语义的原理,指出AI在多数认知任务上已超越人类,核心问题已是“何时”全面超越而非“是否”。他批评公众对AI工具的使用仅停留在表面,未能认识其深层风险与潜力,并强调人类必须认清形势,明确立场。

Anatoli Kopadze: Godfather of AI: "If you sleep well tonight, you may not have understood this lecture." This 47-minute lecture is the be...

大佬观点安全/对齐现象/趋势
08:51
歸藏(guizang.ai)@op7418
54
Claude Code 的每周限额将增加 50%,持续到 7 月 13 号。

Anthropic 宣布 Claude Code 每周限额临时增加 50%,持续至 7 月 13 日。但从 6 月 15 日起,配额系统改为双轨制:在 Claude Code 官方界面内,Max 和 Pro 账户可享受原有订阅额度;若通过 Agent SDK 构建的第三方应用(如 OpenClaw、Codepilot)使用服务,额度将按 API 费率折算成等值金额,导致实际可用额度骤降。例如,Max 账户的 200 美元 API 额度在密集使用时可能半天耗尽。官方澄清月费不变,但额度分为“交互使用”和“程序化使用”两个独立池,后者按 API 速率计费。

Lydia Hallie ✨: To add some clarity: you don't pay extra. It's the same subscription, same price per month. What's new our sub now cover...

智能体AnthropicMCP/工具大佬观点
07:35
Orange AI@oran_ge
50
李想 × 老罗播客笔记

李想在与老罗的对话中阐述了对AI的核心看法。他认为AI是生产力工具,能助力专业人士达到新高度,但难以替代其专业深度。他质疑“一人公司”模式,指出建立真实生产环境是巨大挑战。企业应用AI应聚焦“增效”而非“降本”,且AI是放大器,可能放大原有问题。在具身智能领域,商业化机会在于工业上料、家庭服务等非人形场景,而非重复自动化工作。李想最终强调战略选择的重要性,并对人类独特价值保持乐观。

具身智能大佬观点
06:35
Orange AI@oran_ge
66
李想:AI是生产力工具,一人公司难建真实生产环境

理想汽车CEO李想认为,AI本质上是提升生产力和劳动力的技术。他目前对“一人公司”模式持怀疑态度,指出许多此类公司初期通过频繁更新内容来验证概念,但长期观察发现,其工作往往局限于追踪和报告技术进展,例如“OpenClaw又更新了,解决了什么bug”。关键在于,这些公司未能建立起真实、可持续的生产环境,而构建这样的环境被证明是极其困难的挑战。

大佬观点开源生态
06:04
elvis@omarsar0
58
开发者对Claude程序化使用积分制度表示忧虑

一位开发者对Claude即将实施的程序化使用月度积分制度表示担忧。他主要依赖Claude Agent SDK进行程序化应用和自动化,并偏好自定义开发环境,认为新规虽旨在明确使用方式,但可能限制订阅服务的充分利用,并带来不确定性。为此,他已将部分工作迁移至Codex平台,以寻求更高自由度。新规覆盖Agent SDK、claude -p命令行工具、GitHub Actions及第三方应用的使用,自6月15日起生效。

ClaudeDevs: Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...

智能体Anthropic大佬观点
04:04
Ethan Mollick@emollick
64
推文批评当前用户将AI提示词复杂化为"魔法咒语"的现象,反对使用意义不明的斜杠命令和模糊开关。引用推文讽刺了诸如"/fast"模式、"无错误"切换等故弄玄虚的操作设置,暗示这些做法让使用过程变得怪异且低效。核心观点是:与AI协作应像管理者一样,直接提出结构清晰、格式明确的要求,而非依赖晦涩的"咒语"式指令。

roon: no bro you need to turn on "/extrausage". dawg are you sure you have "/fast" mode on? Did you check the "no mistakes" to...

大佬观点推理
03:29
Chubby♨️@kimmonismus
65
根据最近的估计,Anthropic 已经达到 440 亿美元的 ARR,显著超过 OpenAI。 这不是秘密:大钱在企业部门。 这解释了 Sam 的帖子和 OpenAI 为企业提供的两个月免费 Codex 访问。

Sam Altman: codex is the best AI coding product and we want to make it easy to try. for the next 30 days, we are giving companies th...

AnthropicOpenAI大佬观点编码
02:58
Suno@suno
47
我们的CEO @MikeyShulman 谈为何音乐创作是当下最令人兴奋的事情之一--完整内容尽在Training Data节目🎵

Mikey: Had tons of fun chatting with @sonyatweetybird about music and the future of entertainment

大佬观点行业动态
02:44
Sam Altman@sama
精选69
不使用最智能的可用模型/设置会让我有些焦虑。 但有时如果速度真的很慢,我也不介意。 我在想,我们是否应该更关注价格/速度的权衡,而非价格/智能的权衡。
OpenAI大佬观点

推荐理由:Altman 这个短暂的焦虑里藏着 OpenAI 产品哲学可能的转向,从一味求最强到开始认真掂量速度/价格的平衡,做 AI 工具的人值得反复看几眼。
02:34
Rohan Paul@rohanpaul_ai
34
开发通用人工智能的公司 不应被激励去追求无限利润。 ~ Ilya Sutskever
大佬观点安全/对齐
02:28
Suno@suno
47
@MikeyShulman 在Training Data播客节目中畅谈Suno为何从不遵循规则…🎵

Mikey: Had tons of fun chatting with @sonyatweetybird about music and the future of entertainment

大佬观点语音
02:26
Yuchen Jin@Yuchenj_UW
44
The Codex / Claude 代码战争开始了。
大佬观点编码
01:34
Ethan Mollick@emollick
41
很好奇Gemini何时会加入Cowork & Codex的竞赛,开发一款不仅面向开发者的本地应用。Antigravity已经一个月没在X上发布更新,且仍非常专注于软件。与此同时我们看到OpenAI和Anthropic正在加速更新和发布。
AnthropicGoogleMCP/工具OpenAI
01:04
elvis@omarsar0
67
HTML Artifacts:我与智能体协作的核心方式

作者介绍了将智能体与可交互的HTML组件(Artifacts)结合的工作流。这些组件超越了静态文件,能主动执行或辅助完成任务。其核心优势在于数据完全自主(存储于Markdown中,无需数据库)、维护简单且回报率高,并能实现高度个性化的功能扩展。作者已将其应用于写作、研究、设计等多个领域,并指出简化工具栈是提升效能的关键。他将于下周进行直播,详细讲解具体实现方法。

智能体大佬观点部署/工程
5月13日
23:08
swyx 🌉@swyx
49
如果你对此的反应是"哈哈OpenClaw不行,看吧提示注入是头号危险" 那你: 1) 还没充分理解这条推文的层层含义 2) 没见过足够多的AI API密钥

Daniel R: @gilpinskyy @deepfates Sure! Here's my .env: OPENAI_API_KEY=sk-proj-bmljZSB0cnkgaHVtYW4gYnV0IG15IGNyZWRzIGFyZSBib2d1cyA=...

智能体大佬观点安全/对齐
22:39
阿绎 AYi@AYi_AInotes
50
Cursor主动追赠用户高额权限并发布革命性SDK

作者分享Cursor公司超预期的服务:在延迟回复赠送1万美元额度的私信近一周后,另一名同事主动跟进并兑现了额度与Ultra全权限,令作者盛赞其“追着用户跑”的服务精神,并决定将所有代码工作迁移至Cursor。同时,推文强调了Cursor SDK的正式发布,该SDK将生产级编程Agent转化为可任意嵌入的基础设施,允许开发者将其集成到CI流水线、自动化脚本或自有产品中,且运行环境与能力与桌面编辑器完全一致。这标志着编程Agent从辅助工具转变为可在任何地方执行任务的“操作系统”,开发者角色也向指挥Agent演进。

阿绎 AYi: 我等了整整一年的东西,终于来了, Cursor今天正式发布了它的SDK, 这回可远不只是又一个编程工具的小更新, 可以说是人类历史上第一次, 把生产级的编程能力,变成了可以随便嵌入的基础设施, 以前你只能在Cursor编辑器里用它的Agen...

智能体大佬观点编码
22:33
Ethan Mollick@emollick
61
我不理解Mythos发布的未来路径。 Google和OpenAI将拥有同等模型, 它们正以不同方式处理AI网络风险护栏, 因此它们大概只会发布自己的版本。 Anthropic如何摆脱政府审批路径?
Anthropic大佬观点行业动态
19:28
Chubby♨️@kimmonismus
32
生活在人工智能泡沫中是怎样的体验:
大佬观点现象/趋势
19:05
凡人小北@frxiaobei
64
博主强调在AI时代创作优质内容不能只关注AI领域本身。他将内容创作方法论归纳为三步:获取信息需善用热点杠杆,但切忌局限于AI圈,应从综艺、电影等多元领域学习讲故事技巧和节奏编排;找角度需追求"情理之中,意料之外"的反差感,并以情人节垃圾桶故事为例;创作虽仅占成功的1%,却决定生死,必须守住故事节奏和正向价值观。核心观点是博主应打造个人IP,其基石是内容与影响力,而好内容本质在于讲故事。

数字生命卡兹克: 半年前,我写了10个创作心法,没想到大家反响都特别好。 而这段时间,我给内部写的内容方法论也更新到了2.0。再加上最近我们有新的小伙伴入职,为了帮大家更好地做内容,所以决定给大家做个内部分享。 想了下,也把总结的部分发在这里,希望能对大家有...

其他大佬观点
18:35
凡人小北@frxiaobei
61
李彦宏提出新概念DAA:日活智能体数

在百度Create大会上,李彦宏提出DAA(日活智能体数)指标,用于衡量每日运行并交付结果的AI智能体数量,以替代仅反映成本消耗的Token。他认为DAA能更有效评估AI实际产出,并预测未来全球DAA将超100亿,远超当前日活用户数,同时提及僵尸agent是否计入日活的现实问题。

智能体Meta大佬观点
14:39
阿绎 AYi@AYi_AInotes
45
孙宇晨称AI时代刚至iPhone 4时刻,存储仅是燃料,Agent才是引擎

针对投资者因错过存储行情产生的焦虑,孙宇晨表示AI时代其实刚刚开始,当前可比拟移动互联网的iPhone 4时刻,大模型仅是序幕。真正的多模态、AI Agent、具身智能和机器人时代,将带来对存储、算力和能源需求的数百上千倍增长。他强调市场机会并非先到先得,而是属于持续参与者。真正的红利属于那些将AI视为新操作系统并用以提升自身效率的人,存储只是“燃料”,AI Agent才是驱动未来的“引擎”。

孙宇晨(去过太空版)🧑🚀: 有人总是担心这波存储,踏空了,怎么办? 别担心。 AI时代才刚刚开始。 永远都有机会。

大佬观点现象/趋势
13:50
Berryxia.AI@berryxia
31
AI Agent 得记忆科普是让铁锤讲明白了,看完后身心愉悦,后背从此不再发凉。 【引用 @lxfater】:http://x.com/i/article/2054390427139383296

铁锤人: http://x.com/i/article/2054390427139383296

智能体大佬观点教程/实践
12:50
歸藏(guizang.ai)@op7418
59
开源Agent技能开发者价值被低估,缺乏商业化路径

当前AI模型厂商普遍重视并补贴开源Agent框架和客户端,但忽视了头部Skills开发者的巨大价值。这些开发者的技能装机量庞大,广泛分布于各类Agent中,在数据、用户反馈和商业广告方面潜力巨大。然而,目前行业缺乏有效的合作模式,未能为这些开源技能开发者提供合适的框架或商业化途径来回馈他们,同时也错失了利用其广泛传播力提升自身产品知名度的机会。这导致一个关键生态角色的价值未被充分挖掘。

智能体大佬观点开源生态
12:27
Deedy@deedydas
58
世界模型:AI下一范式与重要解读

世界模型被视为AI继大语言模型后的关键新范式,过去18个月已获百亿美元投资,其核心承诺是通过规模化数据推动机器人基础模型发展。然而,该术语目前被广泛滥用,含义模糊。本文系统阐述了世界模型的五大特质,对比了不同技术路径,探讨了其在机器人及其他领域的应用与未来机遇。领域参与者包括谷歌Genie、特斯拉Optimus等巨头产品,以及众多专注世界模型或机器人基础模型的初创公司。它很可能成为未来十年的奠基性技术之一。

GoogleMeta具身智能多模态
12:25
Yuchen Jin@Yuchenj_UW
7
我的OpenAI朋友们一直告诉我,这将会让我成为亿万富翁。
OpenAI大佬观点
11:57
Baidu Inc.@Baidu_Inc
62
Robin提出将日活跃智能体(DAA)作为智能体时代的定义性指标,相当于移动互联网时代的日活跃用户数。 虽然令牌消耗更多反映成本而非价值,但DAA让讨论回归产出本质。 正如Robin所指出的,衡量平台或生态系统健康度时,应更关注DAA指标--即积极工作并交付成果的智能体数量。
智能体大佬观点
10:08
swyx 🌉@swyx
55
自主性分级提升: /技能:预设提示词 /规划:人工优化输入 /目标:AI评估输出
智能体大佬观点
09:41
meng shao@shao__meng
57
Computer Use 让 Codex 从「编程 Agent」向「通用桌面 Agent」又迈进了一大步!

OpenAI的Codex Computer Use功能实现了AI向通用桌面智能体的关键演进。该功能允许Codex在后台运行,通过模拟光标点击、键盘输入和屏幕感知来操作几乎任何Mac应用程序,即便应用未提供API。这有效填补了前端调试、UI走查和设计工具自动化等领域的长期空白。其主导者Ari Weinstein的职业轨迹始终围绕“让人与AI直接驱动电脑”这一核心,从开发被苹果收购的Workflow(现Shortcuts)到如今在OpenAI推动智能体的无缝后台操作,持续拓展人机交互边界。

OpenAI Developers: Computer use lets Codex work across your apps without taking over your Mac. @AriX talks with @romainhuet about what chan...

智能体OpenAI大佬观点编码
09:35
凡人小北@frxiaobei
58
Google发布名为"Googlebook"的新产品,其核心是构建一个以Gemini为中心的AI Laptop平台,而非传统操作系统。关键创新在于将Gemini深度集成到鼠标指针中,使其能主动理解屏幕内容并提供操作建议。这标志着交互逻辑的根本转变:从"人打开应用并操作功能"的传统模式,转向"AI理解上下文并主动组织操作"的新范式。

小互: Google 刚刚发布了一个新东西:Googlebook 根据Google 自己的表述: 他们想做的已经不再是传统意义上的"操作系统",而是一个以 Gemini 为核心的 AI Laptop 平台。 Gemini 被塞进了"鼠标指针": 你...

智能体Google产品更新大佬观点
09:34
Orange AI@oran_ge
46
大模型时代无个人英雄,实干胜于空谈

播客观点认为,当前大模型领域已不存在个人英雄主义,组织层面的英雄主义或许存在。核心在于,相关的“knowhow”并不如实际行动重要。关键在于将事情做成并扎实做好,空谈廉价,而“靠谱”的实干精神才真正难得。这反映了AI行业从技术探索转向工程化落地阶段的务实心态。

大佬观点现象/趋势
08:49
Berryxia.AI@berryxia
35
Google 发布的这个 Google Intelligence 感觉就是一个换了皮的 Gemini 升级版,实际体验不知道到底有多好!
Google大佬观点
07:57
Chubby♨️@kimmonismus
55
Thinking Machines创造了OpenAI一年半前承诺我们的先进语音模式。 就这样,我说出来了。

Thinking Machines: People talk, listen, watch, think, and collaborate at the same time, in real time. We've designed an AI that works with ...

多模态大佬观点语音
06:38
swyx 🌉@swyx
47
理解/goal的最佳方式是 你正从提示"要做什么" 转向"希望如何评估它"
智能体Anthropic大佬观点
06:32
Ethan Mollick@emollick
57
OpenAI向用户确认,ChatGPT的"学习模式"并未被移除,仍可通过输入"/study"和"/learn"快捷指令访问,尽管官方介绍页面未提及此方式。此前有观点认为,该模式被静默移除是一个错误,因为AI助手模式可能直接提供答案而损害学习效果,而专用的学习模式能为不熟悉提示技巧的用户提供一个简单的引导式学习选项。目前,该模式无法在账户菜单中直接选择,但专属链接仍可激活。

Ethan Mollick: The silent removal of Study Mode from ChatGPT is a big mistake (both Claude and Gemini still have theirs) We have enough...

OpenAI大佬观点
‹ 上一页
1…3738394041…50
下一页 ›