AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1473 条
全部一手资讯X论文
标签「现象/趋势」清除
Berryxia.AI@berryxia · 6月3日63

OpenAI刚刚官方发出的最新数据,这一波直接把Claude按在地上摩擦了! Codex现在每周活跃用户已经超过500万,比二月份桌面App刚上线时增长了6倍多。 更值得注意的不是这个数字,是这些人到底在用它干什么。 一开始大家以为Codex只是程序员的代码助手,结果现在知识工作者采用它的速度是开发者的3倍以上,占了用户总数的20%。 他们不再只写代码,而是用它做研究、数据分析、内容创作、合同起草、运营协调,甚至一次同时跑多个任务。 72%的知识工作者每周都会用它产出文档、备忘录、图像、音频或者视频。 最快的增长领域是数据分析(周环比110%)、研究(37%)和知识产物制作(36%)。 一个加州州立大学的数学教授用它处理Canvas LMS的行政工作,每周省下4到5小时,把时间重新投到和学生的深度讨论上。 另一家叫GroundVue的公司,用Codex把9万个政府机构的公开会议全部抓取成可搜索的知识库,以前需要一大队研究员,现在3个人就搞定。 以前我们总觉得AI会先把程序员的工作吃掉,结果真实数据把这个预期彻底反转了。知识工作者才是最早把AI当成日常生产力操作系统的那批人。 这其实就是Brynjolfsson说的“工厂重构时刻”:当年电力出现后,大家先把蒸汽机换成电动机,结果效率没怎么提升。 后来他们把整个工厂布局重新设计,把电机装到每台机器旁边,才真正爆发生产力。 Codex正在对知识工作做同样的事。 它把搜索信息、跨团队协调、审批流程这些过去占掉知识工作者将近一半时间的隐形成本,直接压到最低。

译OpenAI最新数据显示,其AI编程工具Codex周活跃用户已超500万,较二月份增长超6倍。关键趋势是用户群体变化:知识工作者采用速度是开发者的3倍以上,占总用户数的20%。他们不再局限于编程,而是广泛用于研究、数据分析、内容创作和运营协调,其中72%每周用其产出文档、图像等内容。增长最快的领域是数据分析(周环比110%)、研究(37%)和知识产物制作(36%)。案例包括教授节省行政时间、公司高效构建知识库。这反映了AI正像“工厂重构时刻”一样,重构知识工作流程,大幅压缩其隐性成本。

Chubby♨️@kimmonismus · 6月3日30

It is interesting how much focus is being placed on data centers and the community. Recently, there were numerous reports regarding resistance to data center expansion; now comes the promise from Microsoft: no increase in electricity costs due to data centers, along with resource conservation.

译有趣的是,数据中心和社区受到了如此多的关注。最近有大量关于数据中心扩张阻力的报道;现在微软承诺:数据中心不会导致电费上涨,同时节约资源。

AYi@AYi_AInotes · 6月3日73

Damn,一个独立开发者用 23.5 小时 + Codex, 把 Whoop 5.0 的订阅墙拆了。 没有破解,没有越狱, 就是一个开源 App,连上你的 Whoop, 心率、血氧、恢复数据直接看, zero 订阅费。 这大概是订阅制硬件今年最不想看到的故事。 这个 App 叫 Goose, GitHub 上完全开源。 作者Bennett晒了时间线, 从 0 到能连上 Whoop 5.0 并读出 HR、SpO2、皮肤温度、恢复分数, 总共 23.5 小时, 而且大比例代码是 Codex 写的。 能做到这件事,不是因为 Whoop 太弱, 是因为它的 BLE 广播协议本身没封死。 Judes Club 之前就有过完整的 Whoop BLE 分析, Goose 本质上是在这个公开协议底子上, 用 Rust 搭了座桥,SwiftUI 做了层皮, 把原本必须走 Whoop 服务器的数据, 直接留在了本地。 很多人以为 Whoop 的护城河是硬件精度, 其实不是。 Whoop 真正的护城河,是你一旦戴了半年, 历史数据、恢复曲线、睡眠趋势全锁在服务器里, 你根本懒得走。 Goose 撕开的不是技术缺口, 是订阅制硬件最脆弱的那层窗户纸: 用户惯性。 这就好比住高级酒店和买房的区别。 Whoop 让你交年费,给你一张房卡, 房间里确实打扫得挺干净, 但你的所有行李、照片、生活习惯, 退房那天全得留在房间里。 Goose 不是另盖了一家酒店, 是告诉你:这房子本来就有扇后门, 你自己拿钥匙进去,东西全带走, 不用看前台脸色。 过去两年 AI 写代码的故事, 大家都在比谁写得更快。 但 Bennett 这件事真正的信号是, AI 把一人挑战封闭硬件生态的成本, 压到了一天之内。 以前逆向硬件需要团队、需要数月、需要固件提取, 现在一个开发者 + Codex, 23.5 小时就能让订阅墙看起来像个笑话。 当然,我非律师,这只是我作为开发者的技术观察。 硬件公司的护城河不会明天消失, 但定义已经在变。 过去的护城河是传感器精度和 App 封闭, 未来的护城河,可能是你愿不愿意把数据主权交出去。 当一个人的周末就能拆一扇墙, 订阅制硬件的终局可能不是被另一家硬件公司打败, 是被一群不想交月租的开发者,一人一天,逐个拆光。 所以说,Whoop 真正的对手不是 Apple Watch, 是每一个周末有空、手边有 Codex、 还觉得 30 美金月费有点贵的开发者。 GitHub 仓库我放一楼了, 有用自取。

译独立开发者Bennett利用Codex AI编程工具,在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据,无需订阅。实现基于公开的BLE协议分析,使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性,并展示了AI工具如何降低个人挑战封闭生态的成本。

Berryxia.AI@berryxia · 6月3日50

今天这个视频又被很多人挖出来转发,是因为啥呢? 🤔 半个月之前发布的视频,开始动起来了…

译Moonshot AI创始人杨植麟的40分钟视频近日被广泛转发。他在视频中详细拆解了Kimi K2的训练过程,其核心突破在于仅以460万美元的极低成本完成训练。在近期一场8模型实时编程大赛中,Kimi K2获得第一名。杨植麟通过分享强调了极致优化与架构设计的重要性。

Chubby♨️@kimmonismus · 6月3日61

Holy moly, "Model release cadence from 15 months -> 6 weeks". The definition of exponentials!

译天啊,"模型发布周期从15个月缩短到6周"。 这就是指数级增长的定义!

Chubby♨️@kimmonismus · 6月3日38

We are witnessing a revolution in medicine driven by AI. Dreams are turning into reality right before our eyes. Obesity is becoming a problem of the past. Eli Lilly's triple agonist, retatrutide, melts fat away, and with it the many downstream consequences of obesity. Since the Industrial Revolution, obesity has grown into one of the most serious problems of modern civilization - and now it is being solved. Literally. Cancers that were once untreatable are becoming treatable thanks to new medicines: melanoma, pancreatic cancer, and many more. And that's before mentioning the other benefits of GLP-1 agonists, such as their anti-inflammatory effects. We are entering what Demis Hassabis calls the "golden age of science." Anyone willing to open their eyes can see it. Science is unfolding in all its potential right in front of us. I couldn't be happier, or more grateful - grateful to witness this.

译AI正在推动医学领域的革命性突破。Eli Lilly研发的三重激动剂retatrutide能有效溶解脂肪,解决肥胖及其下游后果问题。肥胖自工业革命以来已成为现代文明的严重挑战,如今正被攻克。新型药物使黑色素瘤、胰腺癌等曾无法治疗的癌症变得可治疗,同时GLP-1激动剂还具有抗炎等益处。我们正进入Demis Hassabis所说的“科学黄金时代”,见证科学潜力全面展现。

X.PIN@thexpin · 6月2日72

http://x.com/i/article/2061763779088797696 # Everyone in Robotics Is Burning Cash. Unitree Turned a Profit in China. Late 2017. The World Internet Conference is underway in Wuzhen, a canal town in Zhejiang province. Wang Xingxing—founder of a small Hangzhou robotics outfit called Unitree—doesn’t have a badge to get in. So he sets up outside the doors and demos his company’s first product: an early Laikago, a quadruped robot named for the Soviet space dog that flew on Sputnik 2. His audience: Lei Jun, CEO of Xiaomi, and Wang Xing, CEO of Meituan. Two of the most powerful tech founders in China. Then the robot crashed. Wang had to reboot it right there on the doorstep. By all accounts, it was a deeply awkward few minutes. He was convinced it would work anyway. Nine years later—on the day I was finishing this piece—Unitree’s IPO cleared the Shanghai Stock Exchange’s listing committee, targeting a raise of about 4.2 billion yuan, roughly $610 million. It’s set to become the first dedicated humanoid robotics company to list on China’s A-share market. Around the same time, Nvidia CEO Jensen Huang announced that the company’s Isaac GR00T reference design would integrate Unitree’s H2 Plus humanoid, paired with Nvidia’s Jetson Thor and the GR00T workflow. The H2 Plus is expected to ship by year’s end. If you’ve read about Unitree in the English-language press, you’ve probably gotten the broad-strokes version. How did the company actually go global? What is Wang Xingxing like? And how, in an industry where everyone is hemorrhaging cash, did Unitree start making money? I’ve been lucky enough to interview Wang in person more than once. What follows draws on his IPO prospectus, the company’s reply letter to the exchange, and several off-the-record conversations—an attempt at some real answers. ## A $5,600 Robot With a 40% Margin For the rest of the robotics industry, Unitree’s prospectus is a problem. The field has made enormous technical strides in the last few years, but most companies run on venture money. Losing money is the baseline. Unitree posted a net profit of 77.5 million yuan (about $11 million) in 2024, and by 2025 that had climbed to roughly 600 million yuan ($84 million)—a net margin around 35 percent. That isn’t supposed to be possible right now. Humanoids still aren’t shipping in real volume. Most makers count it a win just to keep build quality consistent. Training data is scarce, so the robots can’t do much that’s useful in the real world. And security is an afterthought—even basic backdoor protection is spotty. Wang isn’t chasing any of those frontiers. Spend time with him and you realize he’s fixated on one question: how do you ship a product that works, at a cost you can actually control? His robots may not be the most advanced on the market. But they’re reliable enough—and once you factor in the price, “reliable enough” starts to look like a steal. He’s been obsessed with cost since long before Unitree existed. As a student, he tried to build a bipedal robot for 200 yuan—about 28 bucks. He tinkered constantly; one experiment, electrolyzing tap water, accidentally released chlorine gas. In 2015, finishing his master’s at Shanghai University, he built a quadruped called XDog out of hobby-grade motors meant for model airplanes. All in, it cost under 20,000 yuan—about $2,800. Boston Dynamics’ Spot, for comparison, rented for more than $70,000. Where Boston Dynamics used hydraulic joints, Wang went electric—and not with industrial motors, but cheap brushless ones. His robot dogs used as few parts as he could get away with. He’s said he started the company with just 2 million yuan—around $280,000—and every yuan had to pull its weight. That same discipline shows up in the humanoids. This March, the Chinese brokerage China Post Securities took apart a base-model G1 (after-tax price: 85,000 yuan, about $12,000) to estimate what it cost to build. The motors, driver boards, and gearboxes—a humanoid’s most critical components—came out with no manufacturer logos at all, which usually means one of two things: Unitree makes them itself, or the supplier is staying very quiet. The memory and storage came from Biwin and Longsys, both Chinese. The main processor was a Rockchip RK3588 (there’s also a Qualcomm-based version, the G1Q). The default lidar came from DJI, with RoboSense or Hesai as options. Mixing in-house parts with cheap commodity components, the teardown pegged the base G1’s bill of materials at around 40,000 yuan (roughly $5,600)—a gross margin north of 40 percent. Upgrade the unit, and that margin sails past 60. This is the engine behind Unitree’s climbing margins: most humanoid buyers are universities and labs, and they tend to splurge on the pricier, modifiable EDU version. The more they buy, the better the math gets. Back in 2024, I interviewed a Unitree salesperson at a trade show. He told me, flatly, that the humanoid business could realistically clear a billion yuan—about $140 million—a year. He wasn’t wrong—2025 revenue came in around 1.71 billion yuan, roughly $240 million. (He later blocked me. Unitree, I gather, keeps its people on a short leash when it comes to reporters.) Please like and follow if you enjoyed our work! ## So Why Did the Money Show Up All at Once? The real puzzle in the prospectus isn’t the early losses. It’s how fast the profits arrived in 2025. Humanoid revenue jumped from 107 million yuan (about $15 million) in 2024 to 869 million ($122 million) in 2025—outearning, for the first time, the robot dogs that built the company. The Western press tends to credit one moment: the dancing robots on China’s CCTV Spring Festival Gala in early 2025, which kicked off a national humanoid craze. That’s not wrong, but it’s not the whole story. Having covered this beat from 2023 to 2025, I can tell you the fascination was building in China well before that broadcast. Unitree’s early H1, back when it could only shuffle, was already pulling millions of views on Douyin. Once a later H1 could fold itself up and walk like a person, Chinese social media lost it. Every product teaser Unitree dropped, ordinary users would re-cut into clips that racked up millions of views overnight—I was one of them, for a while. Other startups noticed and tried to copy the formula. None of it landed the way Unitree’s did. At the 2025 World Robot Conference in Beijing, I asked Wang whether he’d set out to build humanoids on purpose. His answer caught me off guard: “For a long time I was actually against making humanoids. I’d built a bipedal one back in 2009, and the business case was brutal. But by 2022, customers were placing orders—some were paying deposits before we even had a product. So we built one.” That’s it. No vision, no AGI, no sweeping story about automation. Customers wanted one, so he made one. The humanoid frenzy has, in a strange way, almost nothing to do with him—he’s watching it from the sidelines. My honest guess is that the 2025 revenue spike is just the 2023 and 2024 orders finally being fulfilled. This is what separates Wang from most humanoid founders: he’s more conservative. Zhang Peng, founder of the tech-media brand GeekPark and an early Unitree backer, has described him as the rare founder who’ll tell you plainly which problems are hard and how long each will really take. Worth remembering: when Wang was saying these things, he’d just left a three-month stint at DJI. Because he never learned to sell a vision, his path to profit was almost comically simple: build the thing, and the labs will buy it. So labs and universities became his market. Unitree’s gear performed roughly on par with Boston Dynamics’ at about 30 percent of the cost, sometimes less. The electric drivetrain was easy to hack on—grad students could tinker, publish papers, and spread the word at conferences. Marketing, in the usual sense, was a line item he could mostly skip. The Unitree social accounts everyone knows now? They didn’t roll out until 2021. The in-house video team didn’t exist until 2022. Wang barely posts. The prospectus puts Unitree’s 2025 ad spend at 60.53 million yuan—about $8.5 million — not much, for a brand this recognizable. Continue Reading

译中国人形机器人公司宇树科技(Unitree)于2024年实现净利润7750万元人民币,2025年利润增至约6亿元,净利润率约35%,在行业普遍亏损的背景下实现盈利。该公司已通过上海证券交易所上市委员会审核,拟融资约42亿人民币,目标成为首家在A股上市的专业人形机器人公司。其H2 Plus人形机器人预计年底出货,已被Nvidia纳入Isaac GR00T参考设计,将与Jetson Thor整合。宇树以低成本、高可靠性的产品路线实现商业化,基础版G1机器人售价约1200美元。

Orange AI@oran_ge · 6月2日57

「当软件编写成本趋近于零时,我发现自己对野心的追求已超越一切。那种不可理喻、不可阻挡的野心。」 这句话来自投资人 Mike Vernal(前 Facebook VP、前红杉合伙人)写的一篇文章,他的文章里说 软件的"三段式剧本"已经过时了,在剧变时代最重要的直接进入深水区的野心(Unreasonable, unrelenting ambition)。 旧剧本是这样的: 第一幕:找一个楔子(wedge),切一个细分市场,做到几千万 ARR,花 3-5 年 第二幕:从单品扩展成套件(suite),交叉销售,做到一亿 ARR,又花 3-5 年 第三幕:变成平台,替掉底层系统 他说这个剧本死了,因为: AI 让写软件的成本趋近于零。 以前你只能单线程推进,先搞定第一幕再想第二幕。现在 Cursor、Clay、Harvey、Lovable 这些公司两年就从 0 到一亿 ARR。 时间窗口压缩了,你没有慢慢来的余裕了。 他的新结论: 别找楔子了,直接跳到深水区。一开始就做整件事。 他举了 Cursor 的例子:当初种子轮的时候 Cursor 就说要直接替掉 VS Code,他觉得疯了(VS Code 刚统一了市场你就要替?)。 结果他错了。现在回头看,替掉 VS Code 反而都不够大胆。 「当软件编写成本趋近于零时,我发现自己对野心的追求已超越一切。那种不可理喻、不可阻挡的野心。 三段式剧本已经过时。在剧变时代依赖楔子策略未免过于保守。 要我说,既然决定放手一搏,不如直接赌上全部身家。」

译投资人Mike Vernal认为,AI让软件编写成本趋近于零,传统“找楔子→扩展套件→变平台”的三段式创业剧本已过时。他指出,Cursor等公司能在两年内从0做到一亿ARR,时间窗口被极大压缩。因此,他主张在创业初期就直接瞄准核心市场(即“深水区”),展现不可理喻、不可阻挡的野心。他以Cursor种子轮时就声称要替代VS Code为例,认为这个目标如今看来甚至还不够大胆。

SemiAnalysis@SemiAnalysis_ · 6月2日54

The recent Ornn H100 index drop to $2.63 (-7.72%) is confusing. But mostly because it's a misleading index. Our H100 hourly has been in a $2.70–$3.01 band for 146 straight days. Ornn's last month alone: $1.80 → $3.22 → $2.63. Why? OCPI is built only from printed transactions. But H100 on-demand has been sold out across our coverage for months. No continuous spot tape exists. What's left is a thin residual of bilateral trades from a narrow contributor set. Small N gets pushed around easily.

译近期Ornn H100指数跌至2.63美元(-7.72%)令人困惑。但这主要因为该指数具有误导性。我们的H100小时价格已连续146天在2.70–3.01美元区间内波动。仅上月Ornn指数就经历了1.80→3.22→2.63美元的剧烈波动。 原因在于OCPI仅基于已成交交易构建。但数月来我们覆盖范围内H100按需实例已售罄。不存在连续的现货交易记录。剩余数据仅来自少数贡献者的双边交易残余。小样本量极易被扭曲。

AYi@AYi_AInotes · 6月2日51

卧槽,赚钱还得是信息差啊, 闲鱼、小红书上已经有人在卖了😭 小红书客单价是真的高, 一个合同审核skills,半小时就能搞定, 卖69块一个,已经卖了5500块了, 看起来我这篇文章是真的值钱的,学会了怎么做 skills,稳赚不赔的副业不就来了吗!

译有用户发现“信息差”副业:在闲鱼、小红书上售卖AI合同审核skills。具体案例显示,一个skills定价69元,已售出超过5500元。主推文者认为,自己此前分享的一篇关于如何制作AI skills的文章提供了关键方法,使得这种“稳赚不赔的副业”成为可能。

小互@xiaohu · 6月2日61

AI 在医疗应用中不再只是“看片子找病灶”,而是能替医生提前模拟“这个治疗方案,三个月后病人会怎样”。 可以模拟多种治疗方案,直接告诉医生哪个最好。 真实世界里根本不允许你多试几次,而这,恰好是世界模型最值钱的地方,AI提供多种决策模拟,由人类来进行最终决策。 这个方向极具推广价值,比如可以应用到农业气候市场判断、城市规划设计、低空经济的线路策略设计,甚至各种真实世界的预测上。 Future Living Lab @FutureLab2025 分享的这个视角非常有洞见,他们长期专注把世界模型技术落地到高 stakes 真实场景。想持续看到这类前沿思考,强烈推荐关注! 你觉得世界模型下一个会颠覆哪个行业?👇

译世界模型(World Model)在医疗领域实现突破,从传统的静态病灶识别转向动态预测模拟。医学世界模型(MeWM)能基于患者当前CT影像,模拟数月疾病进展,并合成治疗后的肿瘤轨迹视觉表征。在肝癌TACE等临床应用中,其通过反事实推理量化不同方案对生存率的影响,将临床决策成功率(F1-score)提升13%。这一“先模拟再行动”的范式正从医疗拓展至农业气候、城市规划等更多高风险领域。

ginobefun@hongming731 · 6月2日71

http://x.com/i/article/2061582822029283328 # BestBlogs 早报 · 06-02|MiniMax M3、AI Coding 规范、视频 Agent 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-06-02 ## 导语 AI 能力边界在这个夏天被连续刷新。今天的早报围绕三条主线展开:MiniMax M3 作为国内首个集前沿 Coding、1M 超长上下文与原生多模态于一体的开源模型正式亮相,24 小时自主完成 CUDA 算子优化的实测让 benchmark 数字有了具体重量;Chromium 3500 万行代码库的 AI Coding 规范体系,展示了工程团队如何把 AI 工具真正制度化;xAI 的 Ethan He 则给出一个更深的判断——视频模型的智能上限跟着 LLM 走,下一个前沿不是更好的视频,而是视频 Agent。 速览部分覆盖了语音智能体工程化实践、AI Friendly 架构设计、英伟达 Agent 工厂全栈发布、RAG 工程化认知纠偏、Rippling 生产级多智能体落地,以及吴恩达对 AI 工程师角色演化的判断,还有 MiniMax 自身作为 AI Native 公司的组织实践分享。 ## 精讲一:MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你 MiniMax M3 于今日正式发布,是目前国内第一个同时具备前沿 Coding 能力、1M 超长上下文与原生多模态的开源模型。 三项能力的意义 在此之前,这三项能力是海外闭源前沿模型(如 GPT-5.5、Gemini 3.1 Pro、Claude Opus)的专属标配。M3 是国内首个将这三者同时开源的模型,也是目前全球唯一的开源实现。 Coding 能力方面,M3 在 SWE-Bench Pro 上得分 59.0%,超过 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7;在面向自主 Agent 的端到端评测框架 Claw-Eval 上取得最高分。值得关注的不只是数字本身,而是 M3 背后训练方式的转变:团队构建了交互式用户模拟器框架,让模型在训练阶段就接触到需求澄清、方案讨论、多轮迭代等真实开发场景,而非单轮任务假设。 MSA:把长上下文真正变成可 Scale 的维度 1M 上下文并非只是参数设置——它需要底层注意力机制的彻底重构。M3 自研的 MSA(MiniMax Sparse Attention)是一种全新稀疏注意力架构,通过精确的 KV 分块和 KV outer gather Q 算子优化,在 100 万上下文下每 token 计算量仅为上代模型的 1/20,prefill 阶段加速 9 倍,decoding 阶段加速超过 15 倍。与全注意力相比,MSA 在多个对照实验中能力基本打平,却拥有硬件友好、易实现、真正可 scale 的特点。 两个让人印象深刻的实测 CUDA 算子优化:给 M3 一份任务描述、一个 benchmark 脚本、一个不能直接运行的 Triton 骨架,没有任何参考实现,要求在 NVIDIA Hopper 架构 GPU 上优化 FP8 GEMM kernel。在约 24 小时的连续执行中,M3 完成了 147 次 benchmark 提交、1959 次工具调用,将 Hopper FP8 硬件峰值利用率从 7.6% 推进至 71.3%,实现 9.4× 加速。最优解出现在第 145 次提交——在多个性能平台期后模型仍未放弃,这种长程自主迭代能力是最直接的实证。 让 M3 「训」模型:给 M3 四个仅完成预训练的 Base 模型,在 12 小时内自主完成数据合成、训练、评测、迭代全流程,目标是让这些模型在数学推理、工具调用、代码生成等任务上具备基本能力。任务开放度远高于 CUDA 优化——没有明确的反馈结构,M3 需要自主判断研究方向。最终结果显示,M3 在 PostTrainBench 的表现显著优于对比模型,验证了其在开放研究任务中的长程规划能力。 原生多模态:从 Step 0 开始的混合训练 M3 从训练第一步就采用多模态混合训练,而非事后拼接。团队发现 Interleaved data(交错数据)对模型性能的提升远比通常认为的更关键,在数据管线重构后,训练数据 Token 规模已可提升至 100 万亿量级。在论文复现实测中,M3 通过多模态能力读懂论文图表、通过长上下文将论文+代码+实验日志一次性进窗口、通过编程+Agent 能力长线程完成复现——三项能力协同,体现了原生多模态路线的价值。 为什么值得关注 M3 的意义不只是 benchmark 上的数字超越,而是三项能力的同时开源——这意味着研究者和开发者现在可以基于一个真正具备长上下文、强 Coding、原生多模态的开源基座来构建应用。在 API 成本、可定制性、数据隐私等方面,开源的 M3 为从业者提供了此前不存在的选择。 延伸阅读:配合今天速览中的「MiniMax 的 AI Native 组织进化实践」,可以看到 M3 背后这家公司是如何从第一天就把 AI 作为组织运转基础来设计的。 ## 精讲二:深入解析 Chromium 的 AI Coding 开发体系 Chromium 的 AI Coding 开发体系 这篇文章来自 QQ 浏览器团队,对 Chromium(3500 万行代码)的 agents/ 目录做了深度解析,呈现了目前见到的最完整的大型工程团队 AI Coding 规范实践。 为什么 Chromium 的经验值得认真对待 3500 万行 C++ 代码库、全球数千名贡献者、同时支持 Gemini CLI、Claude Code、GitHub Copilot 三种 AI 工具——这个规模决定了 Chromium 团队不可能靠「提示词技巧」来管理 AI Coding。他们必须把 AI 工具系统化、制度化,构建可以跨工具复用、可以随项目规模扩展的基础设施。 四层分层提示词体系 Chromium 没有使用单体提示词,而是设计了四层架构: 第一层(common.minimal.md)是核心指令,定义构建规则、测试方式、编码规范(Stay on task,不修无关 TODO;注释只写「为什么」不写「做了什么」)和 JNI 识别规则;第二层(common.md)是 8 步标准编辑工作流,强制 AI 在写任何代码前先完整阅读相关文件并向开发者确认理解;第三层是平台模板(desktop/android/ios/rust),开发者按平台组合;第四层是一次性任务提示词。 开发者在本地创建 GEMINI.md,通过 @ 引用组合不同层级,脚本递归展开后形成完整 system instruction 注入 AI——用户不可见,每次对话隐式生效。 这种分层设计的核心价值在于:每一层关注点分离,底层约束稳定,上层可以灵活组合。新成员只需要遵循标准配置,无需理解整套体系就能获得符合项目规范的 AI 辅助。 18+ 个可复用技能系统 skills/ 目录下有超过 18 个按需激活的技能,涵盖代码审查、依赖分析、性能剖析、安全扫描、文档生成等场景。每个 skill 是独立的提示词模块,可以跨 AI 工具复用,开发者通过 /skill-name 命令按需激活。 技能系统的意义在于把「最佳实践」从个人经验转化为可分发的工具——任何开发者都可以用 /cr:review 触发符合 Chromium 标准的代码审查流程,不依赖个人对 AI 提示词的了解程度。 三层 Agentic 工作流编排 projects/ 目录记录了 AI 驱动的大型自动化项目,比如大规模代码迁移、自动化重构。这些项目通过三层编排:任务分解层(把大任务拆成可验证的子任务)、执行层(AI Agent 执行并提交 benchmark 反馈)、验证层(自动运行预提交检查,确保每步改动可追溯)。 AI 使用政策:制度化的责任边界 ai_policy.md 是整个体系的底层约束,核心规则清晰: - 自审义务:作者必须在发送 Review 前自行审查并理解所有代码;提交不理解的代码将被剥夺 Committer 权限,再犯封禁账号 - 原创声明:无论是否使用 AI,作者必须声明代码为自己的原创作品 - 人类回复人类:AI Agent 创建的 CL 或 Bug 收到人类反馈后,必须由人类操作者亲自回复 这套政策的核心判断是:AI 是辅助工具,不是责任主体。一旦「AI 写的,我没仔细看」成为推卸责任的理由,代码库的信任基础就会崩塌。Chromium 选择在制度层面封堵这个口子。 eval 评估体系与 knowledge base 除了提示词和技能系统,Chromium 还建立了评估体系(eval/ 目录下有 15+ 个测试场景)和知识库(knowledge_base.md,供 AI 引用 Chromium 项目规范和历史决策)。评估体系的存在意味着提示词的迭代是可量化的——修改 common.md 的某一步骤时,可以通过 eval 用例验证改动是否导致 AI 行为退化。这种「提示词也要有测试」的思路,是成熟工程团队 AI Coding 规范化的重要标志。 对工程团队的实践启示 Chromium 的体系提供了一个可以按规模裁剪的参考模板:小团队可以从 common.minimal.md 和 ai_policy.md 开始,建立最基础的责任边界和工作流规范;中大型团队可以逐步引入技能系统和平台模板;只有规模达到需要大规模自动化的团队,才需要考虑 projects/ 层的编排体系。 关键在于,Chromium 的每一层设计背后都有明确的「为什么」——不是为了用 AI 而用 AI,而是为了解决具体的工程问题(减少 AI 幻觉、保证代码可追溯、让最佳实践可分发)。这个「为什么」比具体的实现细节更有参考价值。对于正在推进团队 AI Coding 规范化的负责人,这篇文章是目前最值得精读的外部参考之一。 ## 精讲三:为什么视频智能体模型是下一个前沿——Ethan He,xAI Grok Imagine 负责人 这篇 Latent Space 访谈的核心是 xAI Grok Imagine 负责人 Ethan He 的一个反直觉判断:视频模型的智能主要来自 LLM,而非视频训练数据本身。 反直觉的核心论点 通常的直觉是:要让视频生成更好,就需要更多、更好的视频数据,以及更好的视频专用架构。Ethan He 的判断与此相反——视频模型的能力上限,实际上跟着底层 LLM 走。当 LLM 的推理、规划、语义理解能力提升时,视频生成质量会随之提升;反之,单纯增加视频数据的边际收益是递减的。 这个判断的实践意义:视频生成领域的下一个突破点,不在于更好的扩散模型或更大的视频数据集,而在于更强的语言模型基座。 从单次输出到视频 Agent Ethan He 把视频生成的演进类比 AI Coding 的演进路径:Coding 从「一次性输出代码」进化到了能规划、编辑、测试、调试、提 PR 的 Agent 系统,背后的关键不只是模型能力提升,而是编排系统的进化。视频生成正走向同样的路径——下一个 Sora 不会是「更好的视频模型」,而是「视频 Agent」:一个能规划、生成、编辑、批评、迭代,跨越完整创作任务的系统。 Grok Imagine 的 Agent 模式(Beta)已经在验证这条路径:用户输入创作意图,系统规划 → 生成 → 编辑 → 迭代,在同一个无限画布上自动完成。这与传统的「输入 prompt → 输出视频」范式有本质区别——用户在描述目标,而非描述过程。 构建前沿视频系统的工程现实 访谈中 Ethan He 分享了一些实际的工程经验,值得关注: 迭代速度是最关键的变量,超过几乎所有其他因素。xAI 团队在三个月内从零到一构建出 Grok Imagine 首个多模态视频模型,核心是极快的实验周期。许多最重要的改进来自修复数据和训练流水线中的小 bug,而非架构创新。 视频数据集的存储和移动成本是隐性的重大瓶颈。与文本数据不同,大规模视频数据集的 I/O 成本往往超过计算成本,这影响了迭代速度和实验设计。 VAE(变分自编码器)质量对最终视频质量的影响被严重低估。大多数关于视频生成的讨论集中在扩散模型架构,但 VAE 压缩引入的信息损失会贯穿整个生成过程,是难以在后期弥补的底层约束。 音视频对齐是目前最难的工程问题之一。人对音画同步的敏感度远高于对视频质量的敏感度——轻微的音画不同步会立即破坏沉浸感,而视觉质量的小幅下降用户往往感知不到。 更远的视野:生成式 UI 与世界模型 Ethan He 的判断不止于视频 Agent。他认为生成式 UI 最终可能替代 HTML/CSS——当 AI 能够实时生成符合语义的界面,而非渲染预定义的组件,应用的交互范式将发生根本性改变。 世界模型的真正价值需要三个要素同时具备:实时性(低延迟响应)、交互性(能够响应用户行为并持续更新状态)、长时域(在长达数小时或数天的任务周期内保持一致性)。目前的视频生成模型在这三点上都有明显缺口,但这也定义了未来几年值得投入的方向。 构建视频系统的数据与基础设施挑战 访谈中 Ethan He 特别强调了两个常被忽视的工程约束。其一是视频数据集的存储和移动成本——与文本数据集不同,大规模视频数据的 I/O 成本往往超过计算成本本身,这直接影响实验迭代速度。其二是 VAE(变分自编码器)的质量对最终视频质量的影响被严重低估。大多数讨论聚焦于扩散模型架构,但 VAE 压缩引入的信息损失会贯穿整个生成过程,是难以在后期弥补的底层约束。了解这些工程现实,有助于更准确地判断视频 AI 创业公司的技术路线和壁垒。 与今天其他文章的关联 Ethan He 关于「Coding AI Agent 路径」的类比,与精讲二中 Chromium 的三层 Agentic 工作流编排形成呼应——一个是理论判断,一个是已经在 3500 万行代码库上运行的实践。两者合起来,勾勒出 Agent 系统从 Coding 扩展到视频创作的共同演进逻辑。同时,精讲一中 MiniMax M3 原生多模态的发布,也印证了 Ethan He 「视频能力跟着语言模型走」的核心判断——当底层语言模型的能力跃升,多模态和视频生成的上限也随之抬升。 ## 速览 工程化语音智能体:低延迟、高质量与规模化生产实践(AI Engineer) Together AI 语音 AI 团队负责人 Rishabh Bhargava 系统讲解了生产级语音智能体的工程挑战。核心约束是亚秒级延迟预算——人类对话响应约 300ms,超过 500ms 就会感知到停顿,超过 1-2 秒用户参与度直接下降。实现低延迟需要 STT-LLM-TTS 级联流水线、基础设施共址、guardrails 等多项措施协同。文章还覆盖了向原生 speech-to-speech 系统的迁移路径,以及千路并发流时的规模化挑战。对正在构建语音交互产品的工程师极具参考价值。 面向 LLM 的架构设计:什么是真正的 AI Friendly 架构?(大淘宝技术) 来自淘宝营销业务的万字实战总结,系统阐述传统工程架构向 AI Friendly 架构演进的三范式:确定性→概率性(将输出收敛至安全区间)、结构化→语义化(基于意图而非格式响应)、静态→动态(从规则转向规划)。结合淘宝秒杀业务中 AI 审核与答疑系统的实战经验——AI 审核准确率 95.7%,AI 答疑系统问题解决准确率超 98%,效率提升 80% 以上。文章对 Multi-Agent 系统、Context Engineering、AI Friendly API 设计和 AI 可观测体系均有具体实现讲解,是目前国内最详尽的 AI 架构演进实战资料之一。 黄仁勋的「Agent 工厂」里,装了什么新故事?(腾讯科技) 英伟达在 COMPUTEX 2026 上宣布 Vera Rubin 平台正式量产,Vera CPU 开始全球交付。相比三个月前强调「算力全家桶」,这次黄仁勋把重点转向 Agent 工作负载:Vera Rubin 在同等规模数据中心内运行 Agent 任务的效率是上代 Grace Blackwell 的 10 倍;DSX 成为 AI 工厂的运营操作系统;Cosmos 3 重构物理 AI 感知框架;联合宇树发布 H2 Plus 人形机器人参考设计。英伟达正在从「卖算力」转向「卖完整的 Agent 基础设施」,这一战略转向值得持续跟踪。 RAG 不是机器学习,ML 工具包解决的是错误的问题(Towards Data Science) 一篇观点鲜明的认知纠偏文章。作者举了一个典型案例:一个团队花了六个月跑 Optuna 超参数搜索、加自定义 reranker、微调 embedding 模型,生产准确率始终不动——最终发现问题在 parser。RAG 系统的本质是搜索和工程问题,不是机器学习问题。把超参数优化、训练/测试评估等 ML 工具引入 RAG,会选错指标、雇错人、掩盖真正的失败模式(解析错误、分块问题、检索召回率低)。这个判断对正在构建企业知识库的团队有直接警示意义。 Rippling 如何在 6 个月内借助 Deep Agents 和 LangSmith 构建生产级 AI(LangChain Blog) Rippling 是覆盖 HR、IT、薪酬、财务、全球运营的工作力管理平台,数据模型跨数千张表、数十万字段,概念在不同领域间还会重名。他们用 LangChain Deep Agents 和 LangSmith 在 6 个月内构建了生产级多智能体 AI 系统:一个 supervisor agent 协调 read、RAG、action 三类专业子 agent,通过 traces、分层 eval 和半自动自愈循环来保证质量。这个案例展示了「大型本体上的跨域推理」这一典型企业 AI 难题的实际解法,对构建复杂 B2B AI 系统的团队有直接参考价值。 AI 现场部署工程师的崛起与 AI 工程角色的未来(Andrew Ng) 吴恩达分析了一个正在复兴的角色:AI 现场部署工程师(Field Deployment Engineer),深入客户组织内部为其定制 AI 解决方案(如 Agent 工作流)。这个角色在 Palantir 二十年前就有,因为定制化 LLM 的复杂性而再度走热。吴恩达的判断是:FDE 虽有价值,但通用 AI 工程师的岗位数量将远超前者,因为公司更倾向于让自有员工构建和维护 AI 系统(供应商绑定是风险)。他预测 AI 工程师角色最终会像软件工程一样分化出 LLMOps、评估工程师等专业方向,但目前通用型需求依然旺盛。 从 Token 无上限到全员 Agent:MiniMax 的 AI Native 组织进化实践(量子位) MiniMax ToB 中国区商业化负责人胡维琦在 2026 中国 AIGC 产业峰会的演讲整理。核心观点:AI Native 公司首先要在内部实现闭环,不要吝啬 Token 补贴,让员工自己用 Agent 搭建自动化工作流,这个使用过程会反哺模型研发。几个具体实践:从「人类最不愿意干的高价值场景」切入推进阻力最小;AI 的广泛使用会让组织更加扁平,Token 消耗量正在成为衡量效率的新指标;未来 2-3 年 AI 将深度改变商业模式甚至组织构成。配合精讲一的 M3 发布来看,可以理解 MiniMax 的「用 M3 训 M3」实验背后的组织逻辑。 ## 补充阅读 今日候选池中还有以下内容值得关注,按兴趣选读: - 打破「人月神话」,Agent 重塑风控场景产运研职能:快手风控技术负责人在 QCon 的演讲实录,系统讲解如何通过 Agent 和 AI 原生转型重塑产品、运营、研发三大职能的角色与协作模式。风控场景是 AI 落地难度较高的领域,实战参考价值高。适合风控、安全和大型平台工程师阅读。 - 扣子 3.0 正式上线:新一代 AI 团队,从扣子开始:扣子 3.0 通过项目空间、多端协同和技能商店,将 Agent 从单点工具升级为可协作的 AI 团队。值得观察产品形态的演进方向——从单 Agent 工具到 Agent 团队协作平台,这是当前市场的主流趋势之一。适合关注 Agent 产品形态演进的产品经理和开发者。 - 一个理想的组织,是 AI Agent 在组织人:ColaOS 创始人橘子的深度访谈,探讨 AI Agent 如何从产品、组织到商业模式重写创业逻辑。「理想组织是 Agent 在组织人」这个前瞻观点值得创业者和管理者深思。对 AI 时代组织设计感兴趣的读者推荐精读。 - 智能体引擎优化(AEO):当 AI 成为你文档的头号读者:系统阐述 AEO(Agent Engine Optimization)这一新兴学科,为开发者提供让文档对 AI 编程智能体可发现、可解析且 token 高效的分层实操框架。如果你在维护开源项目或 SDK 文档,这篇文章有直接实用价值,值得收藏备查。 - 材料版 AlphaFold 来了!40 个工业任务全方位 SOTA,AI4S 迎来行业大突破:深度原理发布材料基座模型 MPA,借鉴 LLM 三阶段训练方法并引入物理对齐机制,在 40 个真实工业任务上取得 SOTA。AI for Science 领域的进展值得持续关注,对材料科学、化学、生物等领域的从业者有直接参考意义。 - 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式:复旦与通义联合提出 ToolCUA 训练范式,通过分阶段训练解决 Computer Use Agent 在 GUI 与工具混合动作空间中的路径选择难题,在 OSWorld-MCP 上以 8B 模型超越 Claude-4-Sonnet。关注 Computer Use Agent 和 GUI 自动化的工程师推荐阅读。 ## 今日阅读路径 如果你只有 30 分钟,优先读这三篇: 第一篇:MiniMax M3 发布文章(链接) 了解国内首个同时开源三项前沿能力的模型。重点看 CUDA 算子优化和「让 M3 训模型」两个实测案例,比 benchmark 数字更能说明 M3 的实际能力边界。预计阅读时间 15 分钟。 第二篇:Chromium AI Coding 体系解析(链接) 即使你不用 Chromium,这篇文章提供了一个大型工程团队如何制度化 AI Coding 的完整参考。四层提示词体系和 AI 使用政策两节最值得精读。预计阅读时间 10 分钟。 第三篇:视频 Agent 前沿访谈(链接) Ethan He 关于「视频智能主要来自 LLM」的核心论点,以及视频 Agent vs 视频模型的演进类比,是理解下一阶段视频 AI 方向的重要参考。可以只读前三分之一。预计阅读时间 10 分钟。 如果你有更多时间,速览部分的「AI Friendly 架构」和「RAG 不是机器学习」两篇是工程实践质量最高的文章,适合做系统性阅读。

译本期早报聚焦三个主题。核心是 MiniMax 发布其开源模型 M3,这是国内首个同时具备前沿 Coding 能力、1M 超长上下文和原生多模态的模型。M3 在 SWE-Bench Pro 上得分 59.0%,其自研 MSA 稀疏注意力架构显著降低了长上下文计算开销。实测中,M3 可在 24 小时内自主完成 CUDA 算子优化。此外,早报还简述了 Chromium 项目对 AI Coding 的规范化实践,以及 xAI 工程师关于视频 Agent 发展前景的观点。

AYi@AYi_AInotes · 6月2日65

苹果、Intel、AMD、高通, 今晚大概率睡不好了。 统治了 PC 整整 30年的 Wintel 王朝,今天被一个卖显卡的,连桌子一起掀了。 NVIDIA 的 RTX Spark,一块 3nm 的 SoC, 把 ARM CPU、Blackwell GPU、128GB 统一内存焊进同一颗芯片, 塞进 14mm 的超薄本, 本地跑 120B 大模型, 1440p 满帧跑 3A, 拔了电源帧数硬是一格没掉。 但真正让那四家睡不着的,还不只是这些参数。 过去三十年的 PC, 像一群车厂在比谁的排量大, 所有人盯着 CPU 跑分, Intel Inside 就是品质保证,竞争全在同一套规则里打。 NVIDIA 今天开进来一辆电动车, 直接说规则换了, 以后比的是 AI 算力和谁的软件生态更深, 而它那张生态网,叫 CUDA,已经铺了二十年。 这一下,每一家被点到的,都得正面回应: Intel 和 AMD 还能追性能、追制程,追不上的是那二十年攒下的开发者。 苹果 2020 年就用 M 系列证明了 ARM 加统一内存能有多强, 可它把 CUDA 拦在门外, NVIDIA 干脆绕开,在 Windows 这边复刻了一遍, 还多带了苹果永远不肯给的东西, 完整 GPU 生态、3A 游戏、CUDA 全栈。 高通的 Snapdragon X 先跑了一年 Windows on ARM,没有 GPU 生态撑腰,整个故事还只讲了一半,没想到今天这个位置被人抢了 当然,发布会上说的,和真正用起来之间,向来隔着一段距离。 ARM 版 Windows 的兼容层跑老软件掉多少、满载久了降不降频、这套东西最后卖什么价,老黄一个都没交代。 但方向似乎已经钉死了, 过去你买电脑,Intel Inside 是贴在机身上的那张品质标签, 但是往后这张标签,得换人贴了。 NVIDIA 今天卖的不只是一颗芯片,还有下一个三十年 PC 行业的入场券。

译NVIDIA发布RTX Spark,一款3nm制程的SoC,整合了ARM CPU、Blackwell GPU及128GB统一内存。它被应用于超薄笔记本,可本地运行120B大模型,并在1440p分辨率下满帧运行3A游戏,拔电后性能不降。此举被视为PC行业竞争规则的转变,从比拼CPU性能转向比拼AI算力与CUDA软件生态,标志着NVIDIA对Wintel王朝的挑战。该方案绕开了苹果对CUDA的限制,并抢先在Windows平台复刻了ARM架构加完整GPU生态的路径,旨在争夺未来三十年的PC行业主导权。

Ethan Mollick@emollick · 6月2日64

I find debates over whether companies find AI useful to be odd at this point I talk to leadership teams at lots of big firms, and it is pretty universal that they are getting obvious and real value. The challenges now are going from individual uses to firm-level & how to scale.

译我发现现在争论企业是否觉得AI有用很奇怪 我与许多大公司的领导团队交流过,他们普遍获得了明显且真实的价值。现在的挑战是如何从个人应用扩展到公司层面,以及如何规模化。

Rohan Paul@rohanpaul_ai · 6月2日61

New video of Qualcomm CEO Cristiano Amon: AI will require “gazillions” of tokens. Because, Agentic AI will consume dramatically more tokens because it performs autonomous tasks, uses multiple systems, and interacts with tools. AI demand will grow hugely when software starts letting agents act, not just answer. A chatbot spends tokens on language; an agent spends tokens on deciding, checking, calling tools, reading outputs, revising plans, and coordinating with other software. Today a single human-AI exchange may be large, a reasoning task may be much larger, but we are already entering the agentic era, where an autonomous workflow can become exponentially larger still because the model is no longer producing one response. It is running a process. When a SaaS product redesigns itself around human-agent interaction, every task can become a chain of hidden micro-decisions, and each micro-decision consumes context, memory, tool calls, verification, and output tokens. Another point is people hear “more tokens” and think only of bigger data centers, when the deeper change is economic: software usage may stop being measured mainly by clicks, seats, or sessions. It will be measured by how much machine reasoning/tokens gets spent on behalf of each user. ---- From "Reuters" YouTube channel, (link in comment)

译高通CEO Cristiano Amon指出,AI智能体(Agentic AI)因其执行规划、工具调用、验证等自主任务,单次请求的token消耗可能达普通回答的10至50倍以上,因此AI将需要“海量”token。高盛预测,到2030年AI智能体的token使用量将增长24倍,每月可能达120千万亿。同时,推理成本预计年降60%-70%。这标志着软件计量方式可能从按席位/点击转向主要按机器推理/token消耗量计算,Uber和Microsoft等公司已在重新评估高昂的智能体使用成本。

Berryxia.AI@berryxia · 6月2日62

绝了!世界就是如此的有趣😄 一个128G 内存的笔记本领大奖都高潮了! 我今天刷到NVIDIA的发布会,老黄直接把ARM架构的RTX Spark SoC端了出来。 里面集成RTX 5070级GPU,核心卖点就一个:在笔记本拔掉电源后,性能几乎不衰,1440P游戏还能稳住高帧,电池续航也拉满。 我盯着这个参数表,突然觉得历史在开一个特别有味道的玩笑。 7年前苹果推M系列统一内存时,整个PC圈几乎一边倒地开喷。 焊死内存、不能扩容、价格死贵,大家一致认为这是封闭落后的设计,注定被市场教育。 结果现在老黄亲自带队,把高度集成的统一内存、高效共享、电池模式下的强性能,当成新一代SoC的核心竞争力来宣传。 当年被当成反面教材的架构,今天成了顶级玩家验证过的正确路径。 这不是简单的抄袭,而是整个行业在功耗墙和内存墙前,被迫走向同一条高效一体化路线。 苹果当年不是走偏了,而是早几年把未来看清楚了。 老黄用行动说明其实苹果的有些独到的远见。 兄弟们, 你现在回头看苹果统一内存的争议,是不是觉得当时的反共识其实才是共识? 未来高性能个人设备,传统分离式架构还会继续主导,还是统一内存这种一体化哲学会成为主流?

译NVIDIA发布了基于ARM架构的RTX Spark SoC,集成RTX 5070级GPU。其核心卖点在于拔掉电源后性能几乎不衰减,能在1440P分辨率下保持高帧率游戏体验,并大幅提升电池续航。该产品面向笔记本与桌面平台,AI算力亦高,预计2026年秋季上市。作者由此联想到,当年苹果M系列芯片采用的统一内存架构曾备受质疑,而今NVIDIA将其作为核心优势,这验证了应对功耗与内存瓶颈的高效一体化设计已成为行业共识。

Ethan Mollick@emollick · 6月2日65

Lots of companies are in the "encourage AI adoption" phase, whether teaching them ChatGPT/Claude or (sigh) tokenmaxxing. That dodges the harder problems of firm leadership: What do you want people to use AI for? What work should be reserved for people? What else needs to change?

译许多公司正处于“鼓励采用AI”的阶段,无论是教员工使用ChatGPT/Claude,还是(叹气)堆砌token。 这回避了企业领导层更棘手的问题:你希望人们用AI做什么?哪些工作应保留给人类?还需要改变什么?

meng shao@shao__meng · 6月2日50

淘宝不能搜 OpenAI ? 这又是踩到了哪个合规关键词了? 刚刚在淘宝找贴纸,手误打了 openai,发现居然搜不到结果,想半天也没想明白,哪个字母违规了吗?还是谐音?

AYi@AYi_AInotes · 6月1日31

保姆级把一本书变成skill的教程, 也是一个超棒的副业赚钱项目, 按我这个方法,把一本书做成 skills, 闲鱼一个卖个 19 块 9、29 块 9绝对能卖爆, 小红书的客单价更高,可以挂 99~199, 教程和思路方法都告诉大家了,能不能赚钱就看个人执行力了

译介绍了一个将书籍内容转换为AI技能,然后在电商平台出售获利的副业方法。该教程提供了具体思路,建议将制作好的技能在闲鱼以19.9元或29.9元定价出售,或在小红书以99至199元的价格出售,声称销量可观。最终收益取决于个人执行力。

meng shao@shao__meng · 6月1日62

多 Agent 工作流正在复制人类最大的认知瓶颈——知识困在各自的脑壳里,无法自动同步! 人类见面要反复自我介绍:兴趣、背景、目标。知识活在个体脑子里,脑壳不同步。我们习以为常,却在软件里把同一套隔离又建了一遍。 每个 Agent 像一个独立的新脑子:各自记忆、各自对你的局部画像。拉远看整套工具,「你」和「项目」都是碎的。 # @pejmanjohn 的真实工作流 · OpenClaw:用作个人助理、想法孵化,了解生活、日程、偏好、论证过程、被否决的分支 · Codex:用作写代码,了解仓库、计划,不知道诞生计划的那场对话 · Claude Code:用作设计、文案,了解同目录仓库,不知道受众、取舍、语气、被拒方案 现象:产出可以 competent,同时 context-blind——能干活,却不知道「为什么这样干」。 还有物理层:Mac Mini / MacBook / 云端,文件系统、本地状态不同。Git 能同步代码,项目记忆不能。 邻居 Agent 一小时前想通的事,这边仍要你再讲一遍。 # 常见反驳及其局限:「把东西写进 Repo」 对策:Markdown、计划、ADR、摘要,让每个 Agent 读同一套文件。 有用,但只保存「终点」,不保存「旅程」。 真正值钱的常在 session 里:争论、弯路、暂时搁置的分支。写成文档 = 压缩对话:留结论,丢路径。 几天后你说「还记得吗?其实走另一条路」——你在回到被剪掉的枝,而那枝从未进 markdown。 · Repo = 冰山尖(制品、结论) · Session = 冰山体(推理、取舍、情绪语境) 这不等于「全量灌 transcript」:有噪声、敏感、错误、应过期、应留在角色/项目本地的东西。关键是:值得保留的单元,不应锁死在「发生它的那个 Agent」里。 # 主张:Hive Mind,不是更好的笔记 人类传知识慢:口述、文档、会议、Slack、误解再澄清。公司里同一事实要像谣言一样爬成基础设施。 Agent 不必受此限:一个学到有用信息,其他可立刻共享——前提是有一层按你所有、可设计的 memory layer。 他用公司场景类比:同一领导「同时在十场会」——客户对定价困惑、产品在讨论定价清晰度、销售在解释丢单。人可能要几周才连点;Agent 版可在会还在开时就碰撞。 个人尺度更小、形状相同: · 编码时的设计决定 → 五分钟后改善 launch copy · 助理里纠正的偏好 → 改变 coding agent 默认 · 上周半成型想法 → 在合适项目出现时 resurfacing 系统从「一群助手」变成 「一个分布式心智 + 多只手」。 # 缺口与方向 真实工作不尊重工具边界:笔记 → 产品决策 → 代码 → 设计 → 发布文案 → 支持。多 Agent 因专精有用;瓶颈在 memory 仍碎片化,且随 App、机器、云、本地扩散而加剧。 作者认为这是未来一年重要开发面,并点名两个「信号项目」: · GBrain(@garrytan) — 共享知识图 + MCP:接多数据源,图增长,多 Agent 查询而非各囤私货。 · CASS(@doodlestein) — 补 Repo 补不了的:跨工具本地 session 可检索(Codex、Claude Code、OpenClaw、Cursor、Aider 等),因推理常在 session 里。 愿景一句话:许多 Agent,一层由你拥有的记忆在下面。

译当前多Agent工作流(如OpenClaw、Codex、Claude Code并行使用)普遍存在“知识孤岛”问题,每个智能体拥有独立的记忆和上下文,导致工作虽能完成但缺乏“为何如此”的整体背景。将知识写入Repo的常见做法只保留了决策结论,却丢失了推理路径和争议过程。作者主张构建一个由用户拥有的共享记忆层(Hive Mind),使一个智能体的发现能即时同步给其他智能体,从而将“一群助手”转变为“一个分布式心智”。GBrain(共享知识图+MCP)和CASS(跨工具本地session检索)被视为解决该问题的方向项目。

Baidu Inc.@Baidu_Inc · 6月1日62

ICYMI: Our latest AI Pulse looked at Daily Active Agents (DAA) — a metric for measuring value in the agent era — alongside our agent portfolio.

译ICYMI:我们最新的 AI Pulse 探讨了日活跃智能体(DAA)——一个衡量智能体时代价值的指标——以及我们的智能体组合。

Microsoft Research@MSFTResearch · 6月1日63

Evaluating agentic behaviors at scale, making the case for repositories over documents, and inviting researchers worldwide to tackle value alignment. Dive into the latest Research Focus. https://msft.it/6010vbyOi

译大规模评估智能体行为,论证代码库优于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。

Ethan Mollick@emollick · 6月1日57

The default wall of text is a flawed way to connect with AIs, partially because people don't want to read all that & partially because, if they do, it is full of too many distractions which cause excess cognitive load (as paper shows) & partially because AI writing is only okay.

译默认的长文本墙是与AI建立连接的一种有缺陷的方式,部分原因是人们不想阅读所有内容,部分原因是即使阅读,其中也充满了太多导致认知负荷过高的干扰(正如论文所示),还有部分原因是AI写作本身只是尚可。

小互@xiaohu · 6月1日53

OpenAI Voice Hack Night 上一个团队的现场 demo 为手机做的 "agentic 操作系统" 这个应该是我们大家都向往的AI助理形态,而且也是会颠覆手机商业模式的一种全新形态 因为演示的所有界面都是「即时生成」的,无需调用任何APP界面,也就是苹果的App Store商业模式要完蛋了... 核心思路是是「UI 即系统」:手机没有传统 app,界面由端侧本地模型实时生成(on the fly),重推理甩给云端 GPT。 开发者全程用语音指挥它订机票、删日历日程、查 AI 新闻、发邮件、列待办。中途还翻了车(发邮件因"登录没配置"失败)...

译OpenAI Voice Hack Night现场演示了为手机设计的“AI智能体操作系统”。其核心思路是“UI即系统”——手机没有传统App,界面由端侧本地模型实时生成,复杂推理任务由云端GPT处理。演示中开发者全程语音指挥完成订机票、删日历、查AI新闻、发邮件等操作,但中途因“登录未配置”导致发邮件失败。该演示展示了无需调用App界面的交互形式,可能颠覆传统移动应用生态和商业模式。

Rohan Paul@rohanpaul_ai · 6月1日57

Harvard graduation speaker attacks AI in an extremely sharply worded address, drawing student cheers: “I’m here to tell you the mission of your generation is to destroy AI.” --- "F*** AI. F*** it to death, all right? What’s the sign language sign for that? Good, good to know. It’s stupid. It’s so stupid. Have you tried using it? It’s always wrong. Like, I asked AI what’s the fastest way to get from New York City to Harvard, and it told me to take FlixBus. I’m a movie star. Hello, I don’t take the bus. Acela only. I mean, do you even know what AI is saying about Harvard? The garbage that AI is spouting about you guys? AI says that Harvard has a $56.9 billion endowment, and that the Harvard Graduate Students Union is on strike to try to get a livable wage increase to $25 an hour. There’s no way that’s true. I mean, that’s ridiculous. How bad are these AI hallucinations getting? Look, a lot of other respected graduation speakers and colleges around America are talking about you guys needing to master AI for the future. Okay? I’m here to tell you the mission of your generation is to destroy AI. Kill it. To accomplish this, you’ll have to capture and reprogram an AI to be on the side of humanity, then commandeer its own time-traveling technology, and send it back to the past to defeat the current AI before it gains sentience. This isn’t just graduation day. This is “Terminator 2.”" ---- From "Harvard University" YouTube channel, (link in comment)

译一位自称电影明星的哈佛毕业典礼演讲者在演讲中激烈抨击AI,称其“愚蠢且总是错误的”。他举例称AI曾建议他乘FlixBus往返纽约与哈佛,并质疑AI所称的哈佛569亿美元捐赠基金及研究生工会罢工信息的真实性,称之为“AI幻觉”。他号召学生,这一代人的使命是“摧毁AI”,并以电影《终结者2》作类比,提出需捕获、重编程AI并利用其时间旅行技术回到过去击败它。他的言论引发了现场学生的欢呼。

meng shao@shao__meng · 6月1日24

「AI 员工」这个词一出,AI「砖家」就没跑了。。

译推文吐槽了行业内一种普遍的认知错位现象。当有人宣称是“AI智能体专家”时,却将两款知名产品——Anthropic的Claude Code(CC)与OpenAI的Codex——混为一谈,甚至错误地认为它们是同一个“AI员工”产品。这反映了“AI员工”等概念被滥用后,部分从业者对基础工具的理解存在严重偏差。

meng shao@shao__meng · 6月1日55

Claude Opus 4.8 > 4.7 对,但没用 Opus 4.8 在各项 Benchmark 和诚实度、长任务等方面比 4.7 都有进步,这没错,但对于 LLM 的使用者们来说,这种进步不会产生真正的改变,只能算是 4.7 的升级而已 假设你原来就在用 Opus 4.7,那切换到 4.8 是正常的,调过提示词,benchmark 通过后就可以切。 假设你原来在用 GPT-5.5、DeepSeek 等,你会因为 Opus 4.8 的发布而切过来吗?我想是不会的,至少 4.8 不会,至于 Opus 5 会不会,不知道,也很难。

译推文指出,Claude Opus 4.8相比4.7确实在各项基准测试和诚实度、长任务等方面有所进步。但对于已使用GPT-5.5、DeepSeek等其他大语言模型的用户而言,这种改进被视为常规升级,不足以构成切换模型的动力。至于未来的Opus 5是否可能,目前未知且很难。

Berryxia.AI@berryxia · 6月1日40

这不是视频生成模型,是一个持久化、多人协作的世界模型。 核心突破是把「世界状态」与「视觉渲染」彻底解耦:世界不再是一帧帧画面,而是持续运行、可被用户修改、能从任意视角稳定观测的结构化环境。 这可能是目前最接近「可交互持久世界」的尝试。

译该推文介绍了一种新型“持久化、多人协作的世界模型”,明确强调其并非传统的视频生成模型。其核心突破在于将“世界状态”与“视觉渲染”彻底解耦。这使得世界不再是一系列连续画面,而是一个可持续运行、允许用户修改、并可从任意视角进行稳定观测的结构化环境。作者认为,这可能是目前最接近实现“可交互持久世界”的技术尝试。

swyx@swyx · 6月1日66

just a small zoom out on the vibe shift: in Feb 2025 @soumithchintala was talking about his dream of personal, local, private agents, most people didn't believe him. it's June 2026 and @pewdiepie has just released his vibecoded @opencode wrapper that is a complete personal AI productivity suite including email, docs, and calendar. top of HN, easily >1m views, >10k stars in a day. if your Knowledge Work Agents startup can't beat pewdiepie you might as well pack up and go home at this point, his is the benchmark for what you can DIY.

译2025年2月,soumithchintala关于个人、本地、私有AI智能体的愿景曾遭质疑。而至2026年6月,知名玩家PewDiePie已基于opencode封装发布了一款vibecoded的个人AI生产力套件,功能涵盖邮件、文档和日历。该产品在Hacker News上迅速获得超过1百万次浏览和超过10k星标。推文指出,这一成果为知识工作智能体初创公司设立了新的DIY基准。

Rohan Paul@rohanpaul_ai · 6月1日65

A study reveals how huge paychecks from tech giants are pulling top AI researchers away from universities. The top 1% of AI scientists in industry now earn around $2 mn a year. Researchers who move to these private companies stop writing public papers and instead file 530% more patents to keep their work secret. This study tracked 42,000 AI researchers --- nber. org/system/files/working_papers/w34964/w34964.pdf

译一项研究揭示,科技巨头的巨额薪酬正将顶尖AI研究人员从高校吸引走。 工业界前1%的AI科学家现在年薪约200万美元。 转投这些私营公司的研究人员不再发表公开论文,而是提交多530%的专利以保密其工作。 这项研究追踪了42,000名AI研究人员。

Berryxia.AI@berryxia · 6月1日54

兄弟们,这数据太离谱了! 智谱直接遥遥领先DeepSeek! 我们国内前5家纯LLM公司总估值已经高达2260亿美元,大概是Anthropic最新一轮估值的四分之一。 但它们的收入运行率,只有Anthropic的1/40。 国内开放权重模型一边拿大量VC资金,一边在真实产生收入。 这和海外主流的闭源高定价模式,走的是完全不同的路。 这个估值和收入之间的巨大差距,把AI行业当前最核心的矛盾摆在了桌面上:市场到底在为AI的什么部分支付溢价? 当模型能力被快速商品化、价格被大幅拉低之后,估值逻辑要怎么变? 是继续只盯短期收入,还是要认真评估它对整个行业价格体系的破坏力? 你们怎么看? 国内这种低价+开放权重的打法,只是短期现象,还是会成为未来全球AI竞争的主流模式?

译国内五家纯LLM公司的总估值已高达2260亿美元,约Anthropic最新一轮估值的四分之一,但其收入运行率仅为Anthropic的四十分之一。这一数据凸显了国内厂商普遍采用的“低价+开放权重”融资与商业模式,与海外主流的闭源高定价模式形成鲜明对比。该现象将AI行业的核心矛盾——市场究竟为何为模型支付溢价以及估值逻辑在模型能力商品化后如何演变——直接摆上台面。

StepFun@StepFun_ai · 6月1日58

A thoughtful take on Step 3.7 Flash and the new frontier of agent efficiency, from @FrankYouChill 👇

译关于 Step 3.7 Flash 与智能体效率新前沿的深度思考,来自 @FrankYouChill 👇 [引用 @FrankYouChill]:http://x.com/i/article/2060950736851316737

swyx@swyx · 6月1日39

every evals/analytics startup is going through a onetime generational upgrade into a continual learning platform in 2026 many will fail but as always the tasteful ones win

译每家评估/分析初创公司都将在2026年经历一次性的代际升级,转型为持续学习平台。许多公司会失败,但一如既往,有品味的公司会胜出。

Chubby♨️@kimmonismus · 6月1日51

Absolutely fantastic. This is how I imagine the future of computer use. I love it.

译绝对精彩。这就是我想象中计算机使用的未来。我爱死它了。 GPT-Realtime 2.0 被严重低估了。 演示:

swyx@swyx · 6月1日56

actually wild

译新加坡Vivian Bala博士提出“不能仅凭简报就治理技术”的倡议,成为全球集结号。日本领导人高弘安野在议会辩论中引用该理念,提及Bala部长亲身使用NanoClaw_ai的经历,并主动提出亲自教日本首相如何设置该工具,首相已同意。发推文者也正式自愿飞往日本协助首相部署,并幽默地将此邀请延伸至所有食物美味的国家元首。

Rohan Paul@rohanpaul_ai · 6月1日60

Terence Tao summarized how AI is massively accelerating math career and math research. "In math, you previously had to basically go through years and years of education to be a math PhD before you could contribute to the frontier of math research. But now it's quite possible at the high school level or whatever, that you could get involved in a math project and actually make a real contribution because of all these AI tools and lean and everything else." From @dwarkesh_sp podcast (link to full video in comment)

译陶哲轩指出,AI工具和Lean等技术正在改变数学研究的参与门槛。过去需要多年博士训练才能触及前沿,而现在高中生也有可能参与项目并做出实质贡献。他强调,研究时间大多消耗在核查、验证等重复性工作上,AI降低了这类循环的成本,使研究者更敢于尝试“更疯狂”的想法。许多非常规思路并非因错误被否,而是因验证成本过高而被放弃;AI让犹豫变得廉价,这往往是科学发现的起点。

SemiAnalysis@SemiAnalysis_ · 6月1日30

10x speed at a 20x to 50x price premium per token. We're about to find out exactly how much the enterprise market is willing to pay for ultra-low latency AI.

译速度提升10倍,但每token价格溢价20至50倍。我们即将确切了解企业市场愿意为超低延迟AI支付多少费用。

Rohan Paul@rohanpaul_ai · 5月31日64

Chamath: AI advantage may come less from models than from private inputs. "When labs can build similar models, the real win comes from one unique ingredient in order to monetize it well. Here is a basic thing about machine learning that is worth knowing: if you take 1,000 of the same inputs and give them to Facebook, Microsoft, Google, and Amazon, they will all come up with the same machine learning model. But if you have one extra thing, one little ingredient that all of those other companies do not have, your output can be markedly different. It is like giving two great chefs three ingredients, but giving the third chef one extra ingredient. That person has the ability to do something very special. Right now, we are in a world where everybody is crawling the open web. We are going to move to a world where, as everybody gets sophisticated enough and information is widely available, somebody is going to say, “You know what? This site, I am not going to allow anybody else to access. It is only for me, only for my models.” Those models will become better. So we have to let that play out a little bit. It is going to be a really interesting arms race. The next wave of M&A, for example, could be companies like Google, Microsoft, and Facebook looking at these companies and saying, “Can they be viable inputs to my large language models or to my other machine learning and AI models?” --- A company with unique workflows, transactions, medical records, industrial logs, legal archives, design files, or user behavior can turn boring private data into a compounding advantage. Some startups may never become great public companies on their own, yet still become valuable because they own a data stream that makes a larger AI system sharper, more differentiated, or harder to copy. That turns acquisition strategy upside down: the buyer may not be purchasing revenue, brand, or even software, but a private ingredient for intelligence. ---- From "iConnections" YouTube channel, (link in comment)

译Chamath认为,当各大实验室能构建相似模型时,真正的竞争优势将来自独特的“私有数据输入”。他以厨师比喻:若给三位厨师相同食材,其中一位若多一味独特食材,便能做出非凡菜品。当前大家都依赖公开网络数据,但未来数据所有者可能将独家数据用于训练自己的模型,从而建立优势。这将引发一场围绕私有数据的“军备竞赛”,并可能改变大型科技公司的收购逻辑——未来的并购可能旨在获取能提升其大语言模型性能的独特数据流,而非仅仅购买收入或品牌。

Baidu Inc.@Baidu_Inc · 5月31日59

http://x.com/i/article/2060155258350014464 # Meet DAA: A New Metric Built for Results in The Agent Era Dear friends, welcome to May edition of AI Pulse. A lot happened at Baidu Create 2026 (our annual developer conference) this month — new agents, new infrastructure, new product launches. But the idea we keep coming back to is one our CEO, Robin, put on the table during his keynote: DAA, Daily Active Agents. A new way of measuring the value AI is delivering. In this issue, we'll take a deep dive into what DAA is and why it matters to the industry. Token consumption is at record highs and climbing. According to Goldman Sachs Research, agentic AI is expected to drive a 24-fold increase in token consumption by 2030. It has become one of the industry's most-watched indicators of AI scale and adoption. But tokens only tell half the story. They measure input — how much the machine consumed, how hard it worked. The other half of the equation — what actually got produced, what tasks were completed — remains uncounted. At Baidu Create 2026, Robin gave his answer about that missing half: DAA, or Daily Active Agents. It shifts the question from "how much was consumed?" to "how many agents are actively working and delivering results?” The Agent Era Has Arrived — and It Needs a Different Scoreboard Something has shifted in the past year. AI is no longer sitting inside a chat window waiting to be asked questions. It is out in the world, completing tasks, making decisions, and running operations. Agents are handling customer inquiries, optimizing port logistics, generating marketing content, scheduling factory floors — autonomously, continuously, and at scale. This is a different kind of AI activity from anything we've measured before. And it requires a different kind of metric to capture it. There are two metrics commonly used in the AI industry measure success today: DAU and token consumption. Both offer a starting point, but they weren't built for what AI is becoming. DAU was built in the mobile internet era for the attention economy: whoever captures more of users' time wins. That logic worked for apps. It doesn't work for agents. An agent doesn't "open" anything. It either finishes the job or it doesn't. And the numbers bear this out. According to Counterpoint Research's Q1 2026 data, some of the world's most-used AI products — measured by DAU — are not necessarily the ones generating the most revenue. User scale and business value have been quietly decoupling. Token consumption gets closer, but it still isn't sufficient. Tokens measure input — how much compute was consumed, how hard the machine worked. Not what it produced. Gartner noted in a recent report that token consumption doesn't effectively reflect business value, efficiency, or sustainability. A system can burn through billions of tokens and deliver nothing of consequence. As the industry matures, the gap between "how much the AI consumed" and "how much the AI delivered" becomes impossible to ignore. DAA closes that gap. It counts completed task loops — agents that took on work and actually finished it. It measures output, not activity. Delivery, not consumption. Robin's prediction at Create 2026: global DAA could eventually exceed 10 billion. That number reflects something important about how agents scale differently from users. One person can run many agents simultaneously. Agents multiply capacity rather than compete for attention. The ceiling on what becomes countable is unlike anything DAU ever imagined. Three Things Are Evolving at Once To understand why DAA matters right now, it helps to look at what Robin described as an "AI evolution theory": three simultaneous shifts, all pointing in the same direction. The first shift is in the agents themselves. Early agents answered questions. Current agents complete tasks. The next wave does something more interesting — agents evolve, learning from every task they run without anyone intervening. In the mobile era, software improved on a schedule set by developers. In the agent era, improvement is continuous and self-directed. The second shift is at the individual level. Someone working alongside a team of agents can now accomplish what used to require a full team of people. Builder, founder, creator, all in one person. The productive capacity of a single individual is being fundamentally re-scaled. The third shift is organizational. The basic unit of a company is moving from "people coordinating with people" to what Robin calls "mixed human-agent formations." Agents are now embedded in the middle of a workflow instead of sitting at its edge, handling tasks that used to require dedicated headcount. None of this happens in isolation. Smarter agents make individuals more capable. More capable individuals change how organizations are built. And as organizations restructure, the appetite for better agents grows. DAA is the number that captures all of this in motion — how much of this new productive capacity is actually being used, every single day. The Agents Behind the Number: DuMate, Miaoda, Yijing, and Famou A metric is only as meaningful as what it measures. At Create 2026, Baidu introduced a new generation of agents that are already putting DAA to work. DuMate is Baidu's general-purpose agent. It doesn't answer questions one at a time — it runs tasks in parallel. Handle the inbox, analyze the sales data, draft the marketing copy. Simultaneously. In the international agent benchmark PinchBench, DuMate ranked first globally with a 93.3% task completion rate. It's also a single entry point: one prompt can route through Baidu Search, Miaoda coding agent, Famou agent, and many other capabilities, all at once. Miaoda and MeDo are the coding agents. Over a million applications built. More than 10 million users. 81% of them with no coding background. Robin's framing was blunt: development costs are collapsing toward zero. "Disposable software" — built for a single purpose, a single moment — is now a real idea. Global developers can already access MeDo, Miaoda's international version, at medo.dev. Baidu Yijing is a digital human platform integrated with live streaming, video production, and real-time interaction across 12 languages, with native-level lip-sync. As Robin put it: "A digital human is simply an agent you can see. Equipped with voice, facial expressions, and gestures, a digital human is more expressive and more trustworthy." This year, a Coca-Cola World Cup TVC was produced through Yijing — five characters, five city styles, all directed and edited by AI. Production time was cut by more than half. Famou Agent 2.0 is the self-evolving decision agent. It works in operations environments: manufacturing scheduling, logistics planning, and process optimization. At one of the world's most automated terminals, Famou delivered a 10.21% efficiency improvement on top of an already optimized baseline. That translates to roughly one million additional standard containers processed per year. Underneath all of this is Baidu's full-stack infrastructure — computing, cloud, models, and agents — rebuilt for the agent era. Robin was direct: "AI is not just a model. It is a system. It is a new generation of computing." Baidu AI Cloud has been repositioned as a full-stack AI cloud purpose-built for large-scale agent workloads. From Consumption to Delivery: What DAA Is Really Asking the Industry to Do As agents move from novelty to necessity — running in ports, factories, classrooms, and boardrooms — how we measure AI starts to matter a great deal. That's why DAA asks the harder questions: did the agent actually deliver? Was the task completed? Did something real happen as a result? Metrics shape behavior. If you measure token consumption, you build for scale. If you measure daily active agents, you build for outcomes. That is what DAA is really challenging the industry to do — to reorient around a different definition of what success looks like. Here's a quick look at what else has been happening at Baidu this month: > Q1 2026: AI Business Crosses a New Threshold - For the first time, Baidu Core AI-powered Business represented more than half of Baidu General Business revenue, bringing in over RMB 13.6 billion in Q1 2026, up 49% year-over-year. - Growth was broad-based across AI Cloud infrastructure, AI applications, and Apollo Go. Full report here. > Apollo Go: 3.2 Million Fully Driverless Rides Delivered in Q1 - Apollo Go had a strong start to the year. In Q1 alone, we delivered 3.2 million fully driverless rides, with total rides continuing to grow at a triple-digit rate year-over-year. Over 22 million cumulative rides are provided to the public as of April 2026. - It also continued expanding internationally, as the global footprint reached 27 cities as of May 2026. The driverless operations are now running across multiple zones in Dubai, with the Apollo Go App launched in March, while it is on track to commence open-road testing in Switzerland, and to begin testing in London with Uber and Lyft soon. > Baidu AI Cloud Ranked No. 1 in Autonomous Driving R&D Solutions in China - According to IDC China's H2 2025 report, Baidu AI Cloud captured over a third of China's autonomous driving R&D solutions market, ranking first. - It now serves the top 15 auto brands by sales and the top 10 NEV companies in China, helping automakers move autonomous driving from R&D into mass production. > ERNIE 5.1 Is Now Available - We launched our latest foundation model that builds on ERNIE 5.0, with upgrades across search, reasoning, knowledge Q&A, creative writing, and agentic capabilities at around 6% of the pre-training cost of comparable models. - On LMArena's Search Leaderboard, ERNIE 5.1 scored 1,223 to rank 4th globally and 1st among Chinese models. Try it at ernie.baidu.com. > MSCI ESG Rating Upgraded to AA - We released our annual ESG report. Our MSCI ESG rating was raised to AA, and we were included in S&P Global's Sustainability Yearbook 2026. - From accessible mobility to closing the AI skills gap, we're working to make sure more people can share in the progress AI brings. Full report here. Have a question about building with MeDo, or something you'd love us to cover next? Leave a comment or DM us! Until our next roundup, keep up with our latest AI developments and innovations by following us on LinkedIn and X.

译在百度Create 2026大会上,CEO李彦宏提出了DAA(每日活跃智能体)新指标,用于衡量AI智能体的实际任务完成情况。该指标旨在解决现有DAU(仅反映用户规模)和token消耗量(仅反映模型投入)的局限性。据Goldman Sachs Research预测,智能体AI将驱动token消耗量到2030年增长24倍,但投入不等于产出。DAA则直接计数成功完成工作循环的智能体,衡量的是交付成果而非活动量。李彦宏预测,全球DAA最终可能超过100亿。

Rohan Paul@rohanpaul_ai · 5月31日48

🎯“The people who invented refrigeration made some money, but most of the money was made by Coca-Cola, who used refrigeration to build an empire. LLMs are like as refrigeration & the Coca-Cola has yet to be built” ~Chamath Palihapitiya (@chamath) ---- From "iConnections" YouTube channel, (link in comment)

译🎯“发明制冷技术的人赚了一些钱,但大部分钱是可口可乐赚的,他们用制冷技术建立了一个帝国。 LLM就像制冷技术,而可口可乐尚未出现” ~Chamath Palihapitiya (@chamath) ---- 来自“iConnections” YouTube频道(链接在评论区)

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
01:48
Berryxia.AI@berryxia
63
OpenAI Codex周活跃用户破500万,知识工作者成增长主力

OpenAI最新数据显示,其AI编程工具Codex周活跃用户已超500万,较二月份增长超6倍。关键趋势是用户群体变化:知识工作者采用速度是开发者的3倍以上,占总用户数的20%。他们不再局限于编程,而是广泛用于研究、数据分析、内容创作和运营协调,其中72%每周用其产出文档、图像等内容。增长最快的领域是数据分析(周环比110%)、研究(37%)和知识产物制作(36%)。案例包括教授节省行政时间、公司高效构建知识库。这反映了AI正像“工厂重构时刻”一样,重构知识工作流程,大幅压缩其隐性成本。

OpenAI Newsroom: Codex now has more than 5M weekly active users. But the bigger story is what people are using it for: not just writing c...

OpenAI产品更新现象/趋势
01:17
Chubby♨️@kimmonismus
30
有趣的是,数据中心和社区受到了如此多的关注。最近有大量关于数据中心扩张阻力的报道;现在微软承诺:数据中心不会导致电费上涨,同时节约资源。

Chubby♨️: RTX spark running 120b parameter model locally. Ngl, pretty cool

现象/趋势
01:11
AYi@AYi_AInotes
73
独立开发者用Codex在23.5小时内开发开源App,绕过Whoop 5.0订阅限制

独立开发者Bennett利用Codex AI编程工具,在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据,无需订阅。实现基于公开的BLE协议分析,使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性,并展示了AI工具如何降低个人挑战封闭生态的成本。

开源/仓库现象/趋势端侧编码
00:48
Berryxia.AI@berryxia
50
Moonshot AI创始人杨植麟的40分钟视频近日被广泛转发。他在视频中详细拆解了Kimi K2的训练过程,其核心突破在于仅以460万美元的极低成本完成训练。在近期一场8模型实时编程大赛中,Kimi K2获得第一名。杨植麟通过分享强调了极致优化与架构设计的重要性。

Berryxia.AI: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的...

推理现象/趋势编码
00:47
Chubby♨️@kimmonismus
61
天啊,"模型发布周期从15个月缩短到6周"。 这就是指数级增长的定义!

🚨 AI News | TestingCatalog: Intelligence at Work keynote from OpenAI 🍿

OpenAI现象/趋势
00:47
Chubby♨️@kimmonismus
38
AI驱动医学革命:retatrutide攻克肥胖与癌症

AI正在推动医学领域的革命性突破。Eli Lilly研发的三重激动剂retatrutide能有效溶解脂肪,解决肥胖及其下游后果问题。肥胖自工业革命以来已成为现代文明的严重挑战,如今正被攻克。新型药物使黑色素瘤、胰腺癌等曾无法治疗的癌症变得可治疗,同时GLP-1激动剂还具有抗炎等益处。我们正进入Demis Hassabis所说的“科学黄金时代”,见证科学潜力全面展现。

DeepMind现象/趋势
6月2日
22:32
X.PIN@thexpin
72
人形机器人公司宇树科技(Unitree)在行业亏损中实现盈利

中国人形机器人公司宇树科技(Unitree)于2024年实现净利润7750万元人民币,2025年利润增至约6亿元,净利润率约35%,在行业普遍亏损的背景下实现盈利。该公司已通过上海证券交易所上市委员会审核,拟融资约42亿人民币,目标成为首家在A股上市的专业人形机器人公司。其H2 Plus人形机器人预计年底出货,已被Nvidia纳入Isaac GR00T参考设计,将与Jetson Thor整合。宇树以低成本、高可靠性的产品路线实现商业化,基础版G1机器人售价约1200美元。

具身智能现象/趋势
21:25
Orange AI@oran_ge
57
投资人Mike Vernal:AI时代创业应直接瞄准深水区

投资人Mike Vernal认为,AI让软件编写成本趋近于零,传统“找楔子→扩展套件→变平台”的三段式创业剧本已过时。他指出,Cursor等公司能在两年内从0做到一亿ARR,时间窗口被极大压缩。因此,他主张在创业初期就直接瞄准核心市场(即“深水区”),展现不可理喻、不可阻挡的野心。他以Cursor种子轮时就声称要替代VS Code为例,认为这个目标如今看来甚至还不够大胆。

Mike Vernal: http://x.com/i/article/2061520512174768128

大佬观点现象/趋势行业动态
21:21
SemiAnalysis@SemiAnalysis_
54
近期Ornn H100指数跌至2.63美元(-7.72%)令人困惑。但这主要因为该指数具有误导性。我们的H100小时价格已连续146天在2.70-3.01美元区间内波动。仅上月Ornn指数就经历了1.80→3.22→2.63美元的剧烈波动。 原因在于OCPI仅基于已成交交易构建。但数月来我们覆盖范围内H100按需实例已售罄。不存在连续的现货交易记录。剩余数据仅来自少数贡献者的双边交易残余。小样本量极易被扭曲。
现象/趋势部署/工程
19:10
AYi@AYi_AInotes
51
信息差副业:有人靠AI skills在小红书赚钱了

有用户发现“信息差”副业:在闲鱼、小红书上售卖AI合同审核skills。具体案例显示,一个skills定价69元,已售出超过5500元。主推文者认为,自己此前分享的一篇关于如何制作AI skills的文章提供了关键方法,使得这种“稳赚不赔的副业”成为可能。

AYi: http://x.com/i/article/2061406941541240838

教程/实践现象/趋势
18:35
小互@xiaohu
61
世界模型进医疗:AI模拟未来辅助临床决策

世界模型(World Model)在医疗领域实现突破,从传统的静态病灶识别转向动态预测模拟。医学世界模型(MeWM)能基于患者当前CT影像,模拟数月疾病进展,并合成治疗后的肿瘤轨迹视觉表征。在肝癌TACE等临床应用中,其通过反事实推理量化不同方案对生存率的影响,将临床决策成功率(F1-score)提升13%。这一“先模拟再行动”的范式正从医疗拓展至农业气候、城市规划等更多高风险领域。

FutureLivingLab: While showbiz bickers over AI video continuity glitches and educators remain stuck debating AI-generated PPTs, World Mod...

多模态现象/趋势
07:54
ginobefun@hongming731
71
BestBlogs 早报:MiniMax M3 开源模型发布,集成前沿能力

本期早报聚焦三个主题。核心是 MiniMax 发布其开源模型 M3,这是国内首个同时具备前沿 Coding 能力、1M 超长上下文和原生多模态的模型。M3 在 SWE-Bench Pro 上得分 59.0%,其自研 MSA 稀疏注意力架构显著降低了长上下文计算开销。实测中,M3 可在 24 小时内自主完成 CUDA 算子优化。此外,早报还简述了 Chromium 项目对 AI Coding 的规范化实践,以及 xAI 工程师关于视频 Agent 发展前景的观点。

智能体xAI模型发布现象/趋势
03:49
AYi@AYi_AInotes
65
NVIDIA RTX Spark发布,3nm SoC整合ARM CPU、Blackwell GPU及128GB统一内存

NVIDIA发布RTX Spark,一款3nm制程的SoC,整合了ARM CPU、Blackwell GPU及128GB统一内存。它被应用于超薄笔记本,可本地运行120B大模型,并在1440p分辨率下满帧运行3A游戏,拔电后性能不降。此举被视为PC行业竞争规则的转变,从比拼CPU性能转向比拼AI算力与CUDA软件生态,标志着NVIDIA对Wintel王朝的挑战。该方案绕开了苹果对CUDA的限制,并抢先在Windows平台复刻了ARM架构加完整GPU生态的路径,旨在争夺未来三十年的PC行业主导权。

推理现象/趋势端侧
02:05
Ethan Mollick@emollick
64
我发现现在争论企业是否觉得AI有用很奇怪 我与许多大公司的领导团队交流过,他们普遍获得了明显且真实的价值。现在的挑战是如何从个人应用扩展到公司层面,以及如何规模化。
大佬观点现象/趋势
01:10
Rohan Paul@rohanpaul_ai
61
高通CEO:AI将需要"海量"token

高通CEO Cristiano Amon指出,AI智能体(Agentic AI)因其执行规划、工具调用、验证等自主任务,单次请求的token消耗可能达普通回答的10至50倍以上,因此AI将需要“海量”token。高盛预测,到2030年AI智能体的token使用量将增长24倍,每月可能达120千万亿。同时,推理成本预计年降60%-70%。这标志着软件计量方式可能从按席位/点击转向主要按机器推理/token消耗量计算,Uber和Microsoft等公司已在重新评估高昂的智能体使用成本。

Rohan Paul: Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first se...

智能体MCP/工具现象/趋势
00:43
Berryxia.AI@berryxia
62
NVIDIA RTX Spark SoC发布,统一内存架构再获验证

NVIDIA发布了基于ARM架构的RTX Spark SoC,集成RTX 5070级GPU。其核心卖点在于拔掉电源后性能几乎不衰减,能在1440P分辨率下保持高帧率游戏体验,并大幅提升电池续航。该产品面向笔记本与桌面平台,AI算力亦高,预计2026年秋季上市。作者由此联想到,当年苹果M系列芯片采用的统一内存架构曾备受质疑,而今NVIDIA将其作为核心优势,这验证了应对功耗与内存瓶颈的高效一体化设计已成为行业共识。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

现象/趋势端侧
00:35
Ethan Mollick@emollick
65
许多公司正处于"鼓励采用AI"的阶段,无论是教员工使用ChatGPT/Claude,还是(叹气)堆砌token。 这回避了企业领导层更棘手的问题:你希望人们用AI做什么?哪些工作应保留给人类?还需要改变什么?
大佬观点现象/趋势
00:05
meng shao@shao__meng
50
淘宝不能搜 OpenAI ? 这又是踩到了哪个合规关键词了? 刚刚在淘宝找贴纸,手误打了 openai,发现居然搜不到结果,想半天也没想明白,哪个字母违规了吗?还是谐音?
OpenAI现象/趋势
6月1日
22:48
AYi@AYi_AInotes
31
书转AI技能教程:闲鱼小红书副业项目

介绍了一个将书籍内容转换为AI技能,然后在电商平台出售获利的副业方法。该教程提供了具体思路,建议将制作好的技能在闲鱼以19.9元或29.9元定价出售,或在小红书以99至199元的价格出售,声称销量可观。最终收益取决于个人执行力。

AYi: http://x.com/i/article/2061406941541240838

教程/实践现象/趋势
22:04
meng shao@shao__meng
62
多Agent工作流的知识孤岛问题

当前多Agent工作流(如OpenClaw、Codex、Claude Code并行使用)普遍存在“知识孤岛”问题,每个智能体拥有独立的记忆和上下文,导致工作虽能完成但缺乏“为何如此”的整体背景。将知识写入Repo的常见做法只保留了决策结论,却丢失了推理路径和争议过程。作者主张构建一个由用户拥有的共享记忆层(Hive Mind),使一个智能体的发现能即时同步给其他智能体,从而将“一群助手”转变为“一个分布式心智”。GBrain(共享知识图+MCP)和CASS(跨工具本地session检索)被视为解决该问题的方向项目。

Pejman Pour-Moezzi: http://x.com/i/article/2060957702340395008

智能体MCP/工具现象/趋势
22:03
Baidu Inc.@Baidu_Inc
62
ICYMI:我们最新的 AI Pulse 探讨了日活跃智能体(DAA)--一个衡量智能体时代价值的指标--以及我们的智能体组合。

Baidu Inc.: http://x.com/i/article/2060155258350014464

智能体现象/趋势
21:55
Microsoft Research@MSFTResearch
63
大规模评估智能体行为,论证代码库优于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。
智能体Microsoft安全/对齐现象/趋势
21:34
Ethan Mollick@emollick
57
默认的长文本墙是与AI建立连接的一种有缺陷的方式,部分原因是人们不想阅读所有内容,部分原因是即使阅读,其中也充满了太多导致认知负荷过高的干扰(正如论文所示),还有部分原因是AI写作本身只是尚可。
大佬观点现象/趋势
20:04
小互@xiaohu
53
OpenAI演示AI智能体操作系统,或颠覆手机应用生态

OpenAI Voice Hack Night现场演示了为手机设计的“AI智能体操作系统”。其核心思路是“UI即系统”——手机没有传统App,界面由端侧本地模型实时生成,复杂推理任务由云端GPT处理。演示中开发者全程语音指挥完成订机票、删日历、查AI新闻、发邮件等操作,但中途因“登录未配置”导致发邮件失败。该演示展示了无需调用App界面的交互形式,可能颠覆传统移动应用生态和商业模式。

智能体OpenAI多模态现象/趋势
19:09
Rohan Paul@rohanpaul_ai
57
哈佛毕业典礼演讲者激烈抨击AI

一位自称电影明星的哈佛毕业典礼演讲者在演讲中激烈抨击AI,称其“愚蠢且总是错误的”。他举例称AI曾建议他乘FlixBus往返纽约与哈佛,并质疑AI所称的哈佛569亿美元捐赠基金及研究生工会罢工信息的真实性,称之为“AI幻觉”。他号召学生,这一代人的使命是“摧毁AI”,并以电影《终结者2》作类比,提出需捕获、重编程AI并利用其时间旅行技术回到过去击败它。他的言论引发了现场学生的欢呼。

其他现象/趋势
19:04
meng shao@shao__meng
24
推文吐槽了行业内一种普遍的认知错位现象。当有人宣称是"AI智能体专家"时,却将两款知名产品--Anthropic的Claude Code(CC)与OpenAI的Codex--混为一谈,甚至错误地认为它们是同一个"AI员工"产品。这反映了"AI员工"等概念被滥用后,部分从业者对基础工具的理解存在严重偏差。

Luna: 遇到草台班子了 一个号称是AI智能体专家的人 和他沟通了两句 他问我 CC+CODEX,是我做的AI员工吗? ???????

现象/趋势
18:03
meng shao@shao__meng
55
Claude Opus 4.8 > 4.7 对,但没用

推文指出,Claude Opus 4.8相比4.7确实在各项基准测试和诚实度、长任务等方面有所进步。但对于已使用GPT-5.5、DeepSeek等其他大语言模型的用户而言,这种改进被视为常规升级,不足以构成切换模型的动力。至于未来的Opus 5是否可能,目前未知且很难。

ben hylak: opus 4.8 is way better than 4.7

Anthropic现象/趋势
14:42
Berryxia.AI@berryxia
40
多人协作持久世界模型:解耦状态与渲染

该推文介绍了一种新型“持久化、多人协作的世界模型”,明确强调其并非传统的视频生成模型。其核心突破在于将“世界状态”与“视觉渲染”彻底解耦。这使得世界不再是一系列连续画面,而是一个可持续运行、允许用户修改、并可从任意视角进行稳定观测的结构化环境。作者认为,这可能是目前最接近实现“可交互持久世界”的技术尝试。

具身智能多模态现象/趋势
09:25
swyx@swyx
66
PewDiePie发布个人AI生产力套件,成为DIY新标杆

2025年2月,soumithchintala关于个人、本地、私有AI智能体的愿景曾遭质疑。而至2026年6月,知名玩家PewDiePie已基于opencode封装发布了一款vibecoded的个人AI生产力套件,功能涵盖邮件、文档和日历。该产品在Hacker News上迅速获得超过1百万次浏览和超过10k星标。推文指出,这一成果为知识工作智能体初创公司设立了新的DIY基准。

智能体开源生态现象/趋势
09:03
Rohan Paul@rohanpaul_ai
65
一项研究揭示,科技巨头的巨额薪酬正将顶尖AI研究人员从高校吸引走。 工业界前1%的AI科学家现在年薪约200万美元。 转投这些私营公司的研究人员不再发表公开论文,而是提交多530%的专利以保密其工作。 这项研究追踪了42,000名AI研究人员。
大佬观点数据/训练现象/趋势
08:41
Berryxia.AI@berryxia
54
中国AI公司估值泡沫?高估值与低收入的巨大落差

国内五家纯LLM公司的总估值已高达2260亿美元,约Anthropic最新一轮估值的四分之一,但其收入运行率仅为Anthropic的四十分之一。这一数据凸显了国内厂商普遍采用的“低价+开放权重”融资与商业模式,与海外主流的闭源高定价模式形成鲜明对比。该现象将AI行业的核心矛盾——市场究竟为何为模型支付溢价以及估值逻辑在模型能力商品化后如何演变——直接摆上台面。

Kevin Simback 🍷: The Chinese LLM companies are raising at eye popping numbers Total valuation of the top 5 pure plays is $226B - about 1/...

AnthropicDeepSeek现象/趋势
07:56
StepFun@StepFun_ai
58
关于 Step 3.7 Flash 与智能体效率新前沿的深度思考,来自 @FrankYouChill 👇 【引用 @FrankYouChill】:http://x.com/i/article/2060950736851316737

Franky.: http://x.com/i/article/2060950736851316737

智能体现象/趋势
06:16
swyx@swyx
39
每家评估/分析初创公司都将在2026年经历一次性的代际升级,转型为持续学习平台。许多公司会失败,但一如既往,有品味的公司会胜出。
大佬观点现象/趋势评测/基准
04:23
Chubby♨️@kimmonismus
51
绝对精彩。这就是我想象中计算机使用的未来。我爱死它了。 GPT-Realtime 2.0 被严重低估了。 演示:

Farza 🇵🇰🇺🇸: Watch me control my computer with just my voice. This is the future of operating systems. No hands. GPT-Realtime 2.0 is ...

OpenAI现象/趋势语音
03:46
swyx@swyx
56
新加坡Vivian Bala博士提出"不能仅凭简报就治理技术"的倡议,成为全球集结号。日本领导人高弘安野在议会辩论中引用该理念,提及Bala部长亲身使用NanoClaw_ai的经历,并主动提出亲自教日本首相如何设置该工具,首相已同意。发推文者也正式自愿飞往日本协助首相部署,并幽默地将此邀请延伸至所有食物美味的国家元首。

Gavriel Cohen: "You cannot govern a technology you have only been briefed on." Dr. @VivianBala's challenge to his fellow legislators ha...

现象/趋势
02:50
Rohan Paul@rohanpaul_ai
60
陶哲轩:AI正在降低数学研究的门槛与试错成本

陶哲轩指出,AI工具和Lean等技术正在改变数学研究的参与门槛。过去需要多年博士训练才能触及前沿,而现在高中生也有可能参与项目并做出实质贡献。他强调,研究时间大多消耗在核查、验证等重复性工作上,AI降低了这类循环的成本,使研究者更敢于尝试“更疯狂”的想法。许多非常规思路并非因错误被否,而是因验证成本过高而被放弃;AI让犹豫变得廉价,这往往是科学发现的起点。

Rohan Paul: Terence Tao: "We lived in a world with cognitive friction until very recently, where every task required us to use our b...

大佬观点现象/趋势
01:20
SemiAnalysis@SemiAnalysis_
30
速度提升10倍,但每token价格溢价20至50倍。我们即将确切了解企业市场愿意为超低延迟AI支付多少费用。
推理现象/趋势行业动态
5月31日
23:49
Rohan Paul@rohanpaul_ai
64
Chamath:AI优势可能更多来自私有数据而非模型

Chamath认为,当各大实验室能构建相似模型时,真正的竞争优势将来自独特的“私有数据输入”。他以厨师比喻:若给三位厨师相同食材,其中一位若多一味独特食材,便能做出非凡菜品。当前大家都依赖公开网络数据,但未来数据所有者可能将独家数据用于训练自己的模型,从而建立优势。这将引发一场围绕私有数据的“军备竞赛”,并可能改变大型科技公司的收购逻辑——未来的并购可能旨在获取能提升其大语言模型性能的独特数据流,而非仅仅购买收入或品牌。

大佬观点数据/训练现象/趋势
22:45
Baidu Inc.@Baidu_Inc
59
百度提出DAA新指标,衡量AI智能体任务完成成果

在百度Create 2026大会上,CEO李彦宏提出了DAA(每日活跃智能体)新指标,用于衡量AI智能体的实际任务完成情况。该指标旨在解决现有DAU(仅反映用户规模)和token消耗量(仅反映模型投入)的局限性。据Goldman Sachs Research预测,智能体AI将驱动token消耗量到2030年增长24倍,但投入不等于产出。DAA则直接计数成功完成工作循环的智能体,衡量的是交付成果而非活动量。李彦宏预测,全球DAA最终可能超过100亿。

智能体现象/趋势
22:19
Rohan Paul@rohanpaul_ai
48
🎯"发明制冷技术的人赚了一些钱,但大部分钱是可口可乐赚的,他们用制冷技术建立了一个帝国。 LLM就像制冷技术,而可口可乐尚未出现" ~Chamath Palihapitiya (@chamath) ---- 来自"iConnections" YouTube频道(链接在评论区)
大佬观点现象/趋势
‹ 上一页
1…1213141516…37
下一页 ›