AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2401 条
全部一手资讯X论文
标签「大佬观点」清除
Andrej Karpathy@karpathy · 5月12日73

This works really well btw, at the end of your query ask your LLM to "structure your response as HTML", then view the generated file in your browser. I've also had some success asking the LLM to present its output as slideshows, etc. More generally, imo audio is the human-preferred input to AIs but vision (images/animations/video) is the preferred output from them. Around a ~third of our brains are a massively parallel processor dedicated to vision, it is the 10-lane superhighway of information into brain. As AI improves, I think we'll see a progression that takes advantage: 1) raw text (hard/effortful to read) 2) markdown (bold, italic, headings, tables, a bit easier on the eyes) <-- current default 3) HTML (still procedural with underlying code, but a lot more flexibility on the graphics, layout, even interactivity) <-- early but forming new good default ...4,5,6,... n) interactive neural videos/simulations Imo the extrapolation (though the technology doesn't exist just yet) ends in some kind of interactive videos generated directly by a diffusion neural net. Many open questions as to how exact/procedural "Software 1.0" artifacts (e.g. interactive simulations) may be woven together with neural artifacts (diffusion grids), but generally something in the direction of the recently viral https://x.com/zan2434/status/2046982383430496444 There are also improvements necessary and pending at the input. Audio nor text nor video alone are not enough, e.g. I feel a need to point/gesture to things on the screen, similar to all the things you would do with a person physically next to you and your computer screen. TLDR The input/output mind meld between humans and AIs is ongoing and there is a lot of work to do and significant progress to be made, way before jumping all the way into neuralink-esque BCIs and all that. For what's worth exploring at the current stage, hot tip try ask for HTML.

译作者认为,AI的人机交互界面正从当前的Markdown默认输出向更丰富的HTML格式演进,后者能提供更好的图形、布局和交互性。长远看,由扩散神经网络直接生成的交互式神经视频或模拟将是终极输出形式,但其如何与精确的传统软件结合仍是开放问题。在输入侧,仅靠音频、文本或视频并不足够,需整合如手势指点等更自然的交互方式。总体而言,在迈向脑机接口之前,人机输入输出的融合仍有大量工作要做。现阶段的一个实用建议是尝试让大语言模型以HTML格式结构化其回复。

Rohan Paul@rohanpaul_ai · 5月12日57

🇨🇳 China’s AI race is starting to look less like a model race and more like an adoption race. Alibaba’s Qwen App shows how AI becomes powerful when it slips into ordinary research habits. The difference is not capability, it is deployment shape. e.g doctors and medical researchers in China appear to be using it as a workflow layer: gathering papers, sorting evidence, framing mechanisms, shaping charts, and drafting research-style explanations. Alibaba is trying to place Qwen directly inside a mass consumer and services ecosystem, including shopping, payments, maps, travel, office tools, education, and healthcare, so the model is closer to daily task execution rather than only a premium research assistant. The important shift is that Qwen is not being used only as a chatbot that answers questions, but as a workflow tool. This strategy lands right in China’s comfort zone. It has a massive digital economy to spread AI apps fast, and people who are already very comfortable with tech. Ipsos, the polling firm, found that China is more excited about using AI than any other country. OpenAI is building a highly capable research assistant; China may be normalizing AI as a default work surface inside professional life. For Alibaba and China, the interesting part is the adoption surface: Qwen can become a front door to many services, which means ordinary users, students, doctors, researchers, and office workers may meet AI inside routine tasks rather than as a separate tool. A normal health question can become a research task because the app first shapes the question, then searches for relevant studies, then separates weak claims from stronger evidence, then turns the result into a clearer explanation. This matters for medicine because a lot of research work is not one big discovery moment, but thousands of small steps involving literature review, data cleanup, experiment interpretation, figure preparation, and careful writing. So for professors, students, office workers, and ordinary users, the difference is not just that Qwen can summarize text; it is being positioned as a work surface for preparing reports, generating presentations, studying, planning, searching, and completing real-world tasks without jumping between apps. Both superpowers are worried about slipping behind. In 2026, it could start to look like they are racing on separate tracks.

译中国AI竞争焦点正从模型能力转向实际应用与部署。以阿里巴巴通义千问为例,其正深度融入购物、支付、医疗、办公等庞大数字生态,成为日常任务与工作流程中的工具,而不仅是问答聊天机器人。例如,医生和研究人员已将其用于文献整理、证据筛选、图表制作等研究环节。这一策略契合中国庞大的数字经济和高科技接受度,旨在使AI成为专业与日常工作中的默认界面,让用户能在无需切换应用的情况下完成报告撰写、学习研究等实际任务。

Chubby♨️@kimmonismus · 5月11日63

Welcome to the first edition of "Intelligence from the Community", a new Sunday format for Superintelligence. The idea is simple: every week, I read hundreds of messages from readers who don't just consume AI news but think deeply about where this technology is heading. Some of you are researchers, some are operators, some are advisors shaping how organizations actually deploy these systems. That expertise deserves more than a comment section. Starting yesterday, Sunday belongs to you. Each week, a selected author from the community will publish an original essay or analysis here, bringing perspectives I can't offer alone. I'll stay out of the way and let the work speak for itself. Our first piece comes from Martin Fjeldbonde, Partner at Deloitte and one of the sharpest voices on AI governance in Europe. He argues that we've been asking the wrong question about trustworthy AI, and offers a framework that might finally be the right one. If you also think you have an exciting contribution, apply at the following link and reach over 220k subscriber: https://docs.google.com/forms/d/e/1FAIpQLScjSo4iYH24p5-p-PdPCcVoSayJRhEamhBOp_Srt1Jb9rI4zA/viewform?pli=1

译Superintelligence推出全新周日专栏“社区智慧”,每周精选社区成员发表原创分析与观点。首期文章由德勤合伙人Martin Fjeldbonde撰写,他指出当前关于可信AI的讨论存在根本性问题,并提出了一个可能更正确的新框架。该专栏旨在汇聚研究者、从业者等深度思考者的专业见解,并向社区开放投稿申请。

Nathan Lambert@natolambert · 5月11日41

Pretty wild I got my PhD 4 years ago to the day. I feel very lucky that I got to do it and make my switch into AI. Lot's of people today in AI are underselling the value of going through the process of a PhD.

译四年前的今天我获得了博士学位,回想起来仍觉不可思议。能完成学业并转型进入AI领域,我感到非常幸运。 如今AI领域许多人都在低估攻读博士过程的价值。

swyx 🌉@swyx · 5月11日72

the inside story of the legendary Cog House. i believe there have not been any public photos of this place until now (bc we were explicitly not allowed to lol) as an advisor its been awe inspiring to see this company grow into a well oiled product and gtm machine that will be worth $100B by EOY (imo)

译推文首次公开了Cognition AI总部“Cog House”的内部影像。创始人Scott Wu是美国顶尖竞技程序员,自幼展现数学天赋,曾三获国际信息学奥赛金牌。2023年11月,他在母亲去世与Sam Altman被OpenAI解雇的同日创立Cognition,并预见到AI将发展为全天候工作的智能体。公司推出的AI软件工程师Devin虽初期表现不佳,但上线18个月内已实现4.45亿美元年化营收,客户包括美国陆军、高盛和梅赛德斯-奔驰,公司估值约250亿美元。Wu认为自己的使命是“教AI编程”。

Rohan Paul@rohanpaul_ai · 5月11日57

Two years into the AI boom, and not a single team got faster. Individuals did. Teams didn't. That is the uncomfortable premise behind the newly launched Play: the bottleneck is no longer intelligence, but shared context. Play is the AI workspace where your whole team works together with AI. Not just one person at a time. The next workplace isn't AI-strapped to legacy SaaS. It's a shared environment where the work, the context, and the agents all live in one place, and the team actually compounds instead of starting from zero every Monday.

译AI繁荣两年后,个体效率提升而团队整体速度未改善,核心瓶颈在于缺乏共享上下文而非智能不足。新平台Play旨在构建团队与AI协同工作的共享环境,将工作、上下文和智能体整合于统一空间,使团队能力产生复合效应而非每周归零。创始团队拒绝八位数收购报价,认为其解决的"团队孤独与上下文割裂"问题价值更高,目标是颠覆传统SaaS模式,通过共享记忆与上下文让顶尖人才真正协同。

elvis@omarsar0 · 5月11日51

Great essay by Tobi. Building an AI-native company? Go read it now. I couldn't resist visualizing it with my artifact generator. Biggest takeaway for me: "The risk isn't that AI does the work. It's that nobody learns from it."

译Tobi的精彩文章。 正在建设AI原生公司?快去阅读。 我忍不住用我的神器生成器将其可视化。 我最大的收获是:“风险不在于AI完成工作,而在于无人从中学习。”

向阳乔木@vista8 · 5月11日60

AI降低内容生产成本 -&gt; 拼选题和审美 -&gt; 拼信任和分发渠道。

译AI降低内容生产成本 -> 拼选题和审美 -> 拼信任和分发渠道。

Ethan Mollick@emollick · 5月11日51

The inability of AI models to produce creative variation is a huge gap. The fact that they generate similar ideas limits their ability to do science &amp; the same-y writing limits their usefulness in many other applications This paper showed you can optimize models for creativity

译AI模型无法产生创造性变体是巨大缺陷。 它们生成相似想法的事实限制了其科研能力, 而千篇一律的写作也局限了其在众多其他应用中的效用 本文表明可通过优化模型提升创造力

Orange AI@oran_ge · 5月11日63

他们说工程师要失业了,可现实却完全相反。 上周我们做了一个给行业带来困惑的决定。当别的公司都在"优化人员结构"的时候,我们却在逆势招人。 原因是 AI 让每个人的产出都提高了十倍,这意味着我们需要更多的人来承载十倍的野心。 Indeed 数据显示,软件开发岗位从 2025 年中触底后连涨 10 个月,比最低点高了 15%。LinkedIn 上 AI 工程师岗位同比涨了 143%。a16z 专门写了一篇文章论证"AI 就业末日是彻头彻尾的幻想"。 AI 没有缩小工程师的路,以前你只能在软件行业写代码,现在你可以带着这个能力走进任何一个领域。 便宜的电力没有消灭工人,它消灭了重复,然后把人往上推。 软件工程师也是这样。

译AI未导致工程师失业,反而提升个人产出十倍,促使公司逆势招聘以实现更大目标。数据显示软件开发岗位增长15%,AI工程师岗位涨143%。a16z称AI就业末日是幻想,AI扩展工程师能力至各行各业,类比廉价电力消除重复劳动,推动更高价值工作。

Greg Brockman@gdb · 5月11日47

/goal is underrated

译/goal 被低估了 GPT-5.5 extra high thinking 配合 /goal 刚刚做到了。 我震惊了。

Greg Brockman@gdb · 5月11日30

agents make for a surprisingly great product

译智能体构成了令人惊喜的优秀产品

meng shao@shao__meng · 5月11日65

Codex 如何重塑产品营销的工作方式 @pranaveight 是 OpenAI Codex 的首位产品营销经理(PMM),他通过这篇文章,向我们展示了一个关键转变:Codex 已经从"写代码的工具"变成了"知识工作者贴近信息源头的工作台"。 Codex 的真正价值,是让 PMM(乃至任何跨职能角色)能够直接接触"原始素材",而不是等待别人把上下文整理好递给你。 · 过去:等 PM/工程师讲解 → 再做定位、写文档、对齐团队。 · 现在:直接读代码库、Linear、Slack、Notion → 带着已有的地图去和人沟通。 # 三个具体用法(按抽象层级递进) 1. 个人助理(Personal Assistant)—— 解决"信息过载" · 一个名为 Assistant 的 Codex 自动化任务,每小时巡检 Slack、Gmail、Notion、Figma、Google Drive。 · 关键不在"拉通知",而在预分类:紧急 / 与本周优先级相关 / 干系人请求 / 仅供知悉。 · 价值:把"散落在 5 个工具里的信号"变成"一份带初步判断的清单"。人只需要在这份清单上叠加判断力。 这一层解决的是 注意力管理 问题。 2. 跟上产品与工程(Product & Eng Tracking)—— 解决"理解滞后" · 把 Codex 指向 repo、Linear、Notion、Slack 频道。 · 让它回答:做了什么 / 在做什么 / 最近改了什么 / 功能实际行为 / 实现中的边界情况和限制。 · 然后再去和 PM/工程师对话,带着地图谈,而不是从零开始。 这一层解决的是 贴近产品(get close to the product) 这个 PMM 的老问题。 历史上 PMM 靠读 spec、参加评审、追线程来做这件事;现在可以直接读源码和真实状态。 3. 跨职能对齐(Cross-functional Alignment)—— 解决"协作熵增" · 让 Codex 横扫 Slack 线程、会议纪要、Google Docs、Notion、launch tracker。 · 输出一份对齐文档骨架:已决定的 / 仍开放的 / 谁负责什么 / 自上次更新以来的变化 / 需要决策的 / 下一里程碑。 · 人来做:调语气、校准确性、加判断。 这一层解决的是 信息可见性(legibility)。 作者强调一句很重的话:"不写文档也有代价"——决策被掩埋,团队从略有偏差的"真相版本"出发。 # 隐藏在三个用法背后的方法论 1. Assistant 处理的对象:信号/通知 Codex 的角色:聚合 + 初步分类 人的角色:判断什么真正重要 2. Product Tracking 处理的对象:状态/事实 Codex 的角色:跨源汇总当前实况 人的角色:提出更深的问题 3. Alignment Docs 处理的对象:叙事/共识 Codex 的角色:生成可编辑的初稿 人的角色:锐化信息、识别 gap # 对 PMM 角色的重新定义 "Codex 并没有抹掉产品营销中属于人的部分。如果有什么变化,是让那些部分变得更重要了。" 具体而言,AI 接管了"汇总、追踪、复述"之后,PMM 真正不可替代的部分浮现出来: · 判断何时一个表述太强(claim is too strong) · 判断何时一条信息会落地很糟 · 察觉团队在彼此错过(talking past each other) · 看出launch plan 中明显的漏洞 换句话说:AI 让"信息搬运型 PMM"贬值,让"判断型 PMM"升值。 # 对其他角色的可迁移启示 虽然文章讲 PMM,但底层模式适用于任何"上下文密集型"岗位(PM、TPM、Chief of Staff、Engineering Manager、Founder): 1. 不要让 AI 替你做判断;让它替你做"判断前的准备工作"。 文中反复出现"grounded first pass"(有据可依的初稿)这个表述,是个关键心智模型。 2. 把 AI 接入"工作真正发生的地方",而不是单独的对话框。 价值来自 Codex 能同时看 GitHub + Linear + Slack + Notion,而不是任何单点能力。 3. 自动化的杠杆点是"每小时跑一次",不是"问一次答一次"。 Assistant 案例是 cron 化的 agent,不是聊天机器人。 4. 越接近 source of truth,越能少做无用功。 "等别人总结给你"这件事,正在变成一种可以被消除的成本。

译OpenAI Codex的首位产品营销经理阐述了其核心价值:从“写代码的工具”转变为让知识工作者直接接触代码库、Slack等“信息源头”的工作台。具体通过三层应用重塑PMM角色:作为个人助理聚合多工具信息以管理注意力;跟踪产品与工程状态以直接理解源码;生成跨职能对齐文档初稿以提高信息可见性。AI接管了汇总与追踪工作,使人能更专注于不可替代的判断部分,如评估表述、识别计划漏洞。这一让AI做“有据可依的初稿”、接入真实工作场景并实现自动化的模式,可迁移至任何上下文密集型岗位。

Chubby♨️@kimmonismus · 5月11日17

Don’t know if I’m more excited for gpt 5.6, opus 4.8 a new Kimi or GLM model. What a freaking amazing time to be alive

译不知道我是更期待 GPT 5.6、Opus 4.8、新版 Kimi 还是 GLM 模型。 活在当下真是无比精彩的时代。

Chubby♨️@kimmonismus · 5月11日14

GPT-5.5 is the goat right now. Freaking excited for the next model. And Sama is great hyping it up ;)

译GPT-5.5 现在是无可争议的王者。 对下一个模型感到超级兴奋。 Sama 的宣传造势也很棒 ;)

Yuchen Jin@Yuchenj_UW · 5月11日28

AGI is achieved internally. Artificial Goblin Intelligence

译AGI已在内部实现。 人工地精智能 [引用 @sama]:what if we name the next model "goblin" almost worth it to make you all happy...

Sam Altman@sama · 5月11日30

what if we name the next model "goblin" almost worth it to make you all happy...

译如果我们将下一个模型命名为"哥布林" 几乎值得为了让你们开心而这样做...

阿绎 AYi@AYi_AInotes · 5月11日58

Damn,Elad Gil的这条帖,看得我后背发凉😨 他说AI的真实进步速度,被很多人严重低估了。 大AI实验室内部人员, 领先硅谷创业公司工程师3-4个月, 硅谷创始人, 领先纽约3-6个月。 纽约领先全球其他地区6-12个月。 绝大多数人,包括大部分企业和开发者, 落后最前沿1-2年。 未来已经到来,只是分布极不均匀。 最残酷的不是这个分层, 是绝大多数人根本不知道自己落后了1-2年。 他们以为现在的AI就是ChatGPT-4o的样子,以为AI还在炒概念,甚至还在用2024年的方法做2026年的产品。 LeCun立刻跳出来反驳说这是扯淡。 说Attention来自蒙特利尔,Llama来自巴黎,DeepSeek来自杭州。 但Elad说的其实不是谁先发明, 是谁先把最新的东西变成生产力。 硅谷的优势从来不是模型访问权, 是这里所有人默认,每30天就要重构一次自己的工作流, 是这里昨天刚出来的论文,今天就有人做成产品上线。 是这里失败了没人笑话,慢了才会被淘汰。 最反直觉的地方是 这个差距正在快速缩小, 但缩小速度本身,就是新的壁垒。 一个有品位的学生,加一台电脑,加正确的工具, 现在可以比50人的传统团队迭代更快。 以前的竞争是比谁钱多,谁人多。 现在的竞争是比谁的迭代周期更短。 比谁敢把自己昨天刚建好的东西,今天就全部拆掉。 我觉得这才是最可怕的地方吧 hhh, 你以为你在和别人赛跑, 其实别人已经在用明年的工具,建后年的公司了。 #AI #创业

译Elad Gil指出,AI的真实进步速度被严重低估,技术采纳存在显著层级差距:大型AI实验室内部人员领先硅谷工程师3-4个月,硅谷领先纽约3-6个月,纽约领先全球其他地区6-12个月。绝大多数人落后前沿1-2年,却误以为当前AI水平仅如ChatGPT-4o。硅谷的核心优势在于其快速迭代的文化,包括每30天重构工作流、迅速将论文转化为产品、容忍失败但恐惧缓慢。竞争关键已从资源规模转向迭代速度,个人凭借正确工具可超越传统团队,而差距缩小的速度本身正成为新的竞争壁垒。

François Chollet@fchollet · 5月11日30

If you cannot express your idea in the language of mathematics or code, you do not understand your idea just yet. It is only an intuition.

译如果你无法用数学或代码的语言表达你的想法,说明你还未真正理解它。那仅仅是一种直觉。

Chubby♨️@kimmonismus · 5月11日56

Thariq Claude Code engineer just wrote a whole post about why he switched from Markdown to HTML for agent outputs. His own admission: it uses 2-4x more tokens. Dont know if this is the best advice looking at my rates rn :D

译Thariq Claude Code工程师刚发文解释为何将智能体输出从Markdown转为HTML。他自述:这会多用2-4倍的令牌。 看着我的费率现在不确定这是否最佳建议 :D [引用 @trq212]:http://x.com/i/article/2052796100608974848

Yuchen Jin@Yuchenj_UW · 5月11日47

It's weird that the US still doesn’t have a truly competitive open-source model lab. It’s clearly not a money problem. Several neolabs have raised billions. It’s not a compute problem. US labs have easier access to B200s/B300s than Chinese labs. So what is the issue?

译美国至今没有真正具备竞争力的开源模型实验室,这很奇怪。 显然不是资金问题。多家新兴实验室已筹集数十亿美元。 也不是算力问题。美国实验室比中国实验室更容易获得B200/B300芯片。 那么问题究竟出在哪里?

Ethan Mollick@emollick · 5月11日44

I think we are past the point where “only people in San Francisco get AI” is true. AI users are in every industry &amp; they have access to the same models. SF is far from the epicenter of many of the craziest use cases I have seen in science, law, finance, marketing, education…

译我认为“只有旧金山人懂AI”的时代已经过去。 AI用户遍布各行各业 他们使用着相同的模型 在科学、法律、金融、营销、教育等领域 我见过最惊人的应用案例 很多都远离旧金山这个震中

Ethan Mollick@emollick · 5月10日71

The personification of Claude — in name (the only AI with a human one), in training, in Anthropic’s philosophy (see Claude Constitution), in fanfiction (see the Claude cartoons), etc — feels quite consequential in the medium term, for better and for worse.

译Claude的人格化体现——无论是名称(唯一拥有人类名字的AI)、训练方式、Anthropic的哲学理念(参见Claude宪法),还是同人创作(参见Claude卡通)等——从中期来看都颇具深远影响,这既可能带来好处也可能产生弊端。

阿绎 AYi@AYi_AInotes · 5月10日62

我一直觉得,现在 99% 的人使用 AI 的方式都是错的。 他们还在和 ChatGPT 聊天, 还在纠结哪个模型更好, 还在网上抄各种“神奇 prompt”。 就像汽车刚发明的时候,所有人还在研究怎么把马养得更壮、跑得更快。 而 Garry Tan 已经造好了属于自己的跑车。 我们正站在一个历史性的转折点: 从 Prompt Engineering,走向 System Engineering。 Garry 说过一句话,我反复读了很多遍: “我不思考 productivity,我思考 compounding。” 普通人追求今天快 10%, 聪明人追求系统每个月强 10 倍。 这才是 AI 真正的杠杆。 不是让你每天多写 10 封邮件, 而是拥有一个 24/7 永不疲倦、还会自主学习进化的第二神经系统。

译推文指出,当前多数人使用AI的方式仍停留在与ChatGPT聊天、比较模型或复制“神奇prompt”的层面,这如同汽车发明初期人们仍在优化马匹。真正的转折在于从单次任务的Prompt Engineering转向构建能持续自我增强的System Engineering。核心观点是,不应只追求单次效率提升,而应建立复合增长系统,让AI成为“第二神经系统”。例如,Garry Tan的Book Mirror能将书籍内容深度映射到个人经历中,生成极具个性化的分析,其效能远超普通检索和传统咨询,体现了AI的指数级能力放大。

meng shao@shao__meng · 5月10日63

Agent = Model + Harness — Why Claude Code, Cursor &amp; Codex Behave Differently (Same Model) https://youtu.be/si8EhxtRL7w?si=kk4UzfeYfh5aI4IY

译代理 = 模型 + 控制机制 — 为什么Claude Code、Cursor和Codex行为不同(相同模型) https://youtu.be/si8EhxtRL7w?si=kk4UzfeYfh5aI4IY

Ethan Mollick@emollick · 5月10日45

Apple may be planning to role out its updated Siri based on 2024's vision at the moment when Claude Code and Codex (also OpenClaw) can increasingly do the actual assistant thing: read my emails &amp; calendar, proactively spot &amp; solve problems, do delegated tasks, work with voice etc

译苹果可能计划在Claude Code和Codex(以及OpenClaw)日益能实现真正助理功能时,推出基于2024年愿景的升级版Siri: 读取我的邮件和日历, 主动发现并解决问题, 执行委派任务, 支持语音操作等

meng shao@shao__meng · 5月10日51

Delphi、C#、TypeScript 核心设计者 Anders Hejlsberg 谈 AI 与 Coding 的未来 AI 永远不能取代 Coders,而是会成为加速器,为什么? 1. AI 自身依赖代码而存在 —— 编程语言、编译器、框架、操作系统、CPU,都需要人去设计。AI 假定这些"下面的世界"已经存在。 2. AI 擅长重复模式(它训练集里见过无数遍的 To-Do 应用),但不擅长创新——业务逻辑、新发明、深层架构决策都来自人。 3. 行业的进步来自"洗澡时冒出的疯狂想法",AI 不会那样工作。 他对 "vibe coding" 态度明确:高度怀疑。代码总得来自某处,并不全由 AI 生成。 对学习者的建议 是否还值得学编程? 绝对值得。编程语言是 AI 表达自己的方式;不懂代码就无法理解 AI 在生成什么、依赖什么。 初学者最常见的错误 不去真正理解:变量是什么、数组是什么、数据结构是什么、指针怎么工作。一旦"grok"(吃透)这些,语言只是表层语法 —— 不同语言只是同一语义的不同外衣。停留在语法层,你只知道"要写什么",不知道"为什么写"。 计算机科学学位是否值得 值得。自学固然可行(他自己当年丹麦的工程学院尚未开设 CS),但系统教育能在数据结构、操作系统、数据库、编程语言原理上节省大量时间。 配合一句他的个人观点:热爱比什么都重要——"我从没有过一份真正的工作,因为编程一直是我的爱好"。 AI 时代该做什么项目 · 喜欢 UI/体验 → 写应用; · 喜欢极致性能 → 写无 UI 的系统层代码; · 喜欢理论 → 研究算法与数据结构。 C# 与 TypeScript 的设计哲学 C#:融合,而非二选一 90 年代要么选 VB(易用)、要么选 C++(强大)。C# 把两者合并,并把当时 OOP 中人人都在用、却没语言支持的 property、event 升格为一等公民。 原则:承认现实中的通用模式,做进语义层。 TypeScript:修 JS,而非绕开它 面对"JS 写大型应用很痛苦",Hejlsberg 的反应不是另造语言,而是问: "JavaScript 哪里坏了?能不能修好?" 加类型,不是为了类型本身,而是为了让工具成为可能——补全、跳转、红波浪线。 "开发者体验过就回不去了。" 对 Python 的旁注:没人用它写百万行应用——规模一上来,类型与工具不再是奢侈品。 五年后软件工程师做什么? AI 接管 grunt work(写测试、填模板、PR 流水任务),人则上移到: · 设计 CPU、操作系统、编译器、框架; · 想出"如何 shard 这个应用让创业公司跑得更快"这类架构决策; · 提出新点子。 "AI 是加速器,不是创新者。" 访谈视频地址 https://www.youtube.com/watch?v=CPrePbvbbic&t=11s

译Anders Hejlsberg 认为 AI 无法取代程序员,而是作为加速器存在。AI 依赖人类构建的底层系统(如编程语言、操作系统),擅长重复模式但缺乏创新能力,业务逻辑与架构决策仍需人类完成。他质疑“氛围编程”,强调理解变量、数据结构等基础概念比语法更重要,并肯定计算机科学学位的系统化价值。未来 AI 将接管琐碎任务,工程师则专注于底层设计、架构创新与新想法。C# 的设计哲学是融合易用与强大,TypeScript 则通过类型系统提升 JavaScript 的大规模开发体验。

Chubby♨️@kimmonismus · 5月10日44

just playing around a bit with codex claude code and what not while being sick. i just found out, that computer use within codex is still not available in europe?? why the heck is europe lacking behind in every single aspect. god damn @eucommission . seriously.

译生病期间随便玩玩codex claude代码之类的。 我刚发现欧洲居然还不能使用codex里的计算机功能?为什么欧洲在方方面面都落后。 该死的@eucommission。说真的。

meng shao@shao__meng · 5月10日60

Claude Code、Cursor、Codex、Aider、Cline 部分底层模型可能完全相同,但 Agent 表现却不一样,为什么? @addyosmani 认为:是因为模型之上的那层“外壳” —— Harness,它包括「提示词、工具、上下文策略、钩子、沙箱、子智能体、反馈回路、恢复路径」等。 Agent = Model + Harness 重新系统看看什么是 Harness? 凡是"不是模型本身"的部分都属于外壳: · 指令层:System prompt、CLAUDE.md、AGENTS.md、skill 文件、子 agent 指令 · 能力层:工具、skills、MCP servers 及其描述 · 基础设施:文件系统、沙箱、无头浏览器 · 编排层:子 agent 派发、任务交接、模型路由 · 执行控制:hooks、中间件(lint、上下文压缩等确定性逻辑) · 可观测性:日志、trace、成本与延迟监控 裸模型不是 agent。只有当外壳为它提供了状态、工具执行、反馈回路和强制约束,它才成为 agent。 思维范式的切换:不是"模型问题",是"配置问题" 行业默认反应是:agent 出错 → 等下一代模型。 Harness Engineering 拒绝这个默认。 每一类失败都是可定位的工程信号: · 忽略代码规范:写进 AGENTS.md · 执行破坏性命令:加 hook 阻止 · 长任务中途失焦:拆分为 planner + executor · 写出无法编译的代码:把 type-check 作为反压信号注入回路 同一个模型,放在精调过的外壳里,性能可以远高于跑在通用框架上。当前模型理论能力与你实际看到的能力之间的差距,主要是 harness gap。 最关键的工作方法:棘轮(The Ratchet) 每一次失误都变成一条永久规则。 · 一次"提交了被注释掉的测试"的事故 → AGENTS.md 增加"绝不注释测试",pre-commit hook 检测 .skip(,reviewer 子 agent 拦截。 · 约束只在观察到真实失败时加入,只在更强模型让它冗余时才移除。 · 系统提示词里每一行都应能追溯到一次具体的历史失败。 推论:没有通用最优 harness。 一个 harness 是一个代码库的"失败史"塑造出来的,是工程纪律而非框架。 设计方法:从行为反推组件 1. 文件系统 + Git —— 持久化状态 模型只能操作进入上下文窗口的内容。文件系统是工作区、暂存区、多 agent 协调面。Git 提供免费版本控制、分支实验、回滚。 2. Bash + 代码执行 —— 通用工具 ReAct 循环(reason → act → observe → repeat)。与其为每个动作预建工具,不如让 agent 用 bash 现场组装。Agent 在 shell 上表现普遍很强。 3. 沙箱 + 默认工具链 Bash 必须安全运行。好沙箱预装运行时、测试 CLI、无头浏览器,让 agent 能"自我验证"。 4. 记忆 + 搜索 —— 持续学习 模型不知道训练之后的世界。AGENTS.md 在每次会话注入领域知识;web search 和 MCP 工具补足实时信息。 5. 对抗 Context Rot 上下文越满,推理越退化。三种主要手法: · Compaction:智能压缩与卸载旧上下文 · Tool-call offloading:长输出(如 2000 行日志)落盘,只在上下文里保留头尾 · Progressive disclosure:按需披露指令和工具,而不是启动时全量加载 6. 长程执行 应对"过早停止"和"分解失败": · Loops:拦截模型的退出意图,在新上下文窗口里强制继续推进完成目标 · Planning:强制写出步骤计划文件,每步后用 self-verification hook 检查 · Splits:生成与评估拆给不同 agent,规避模型自评的正向偏差 7. Hooks —— 强制层 连接"请求行为"和"强制行为"。生命周期挂载点:工具调用前、文件编辑后、提交前。 成功应当沉默,失败应当冗长。typecheck 通过则无声;失败则把错误直接注入回路供自纠。 8. 规则手册和工具选择 · AGENTS.md 仍是仓库根部最高杠杆的配置点。但要把它当飞行员检查清单,不是风格指南——简短,每条都有失败史背书。 · 十个高度聚焦的工具,永远胜过五十个互相重叠的工具。 · 工具描述会进入 prompt,所以未审计的 MCP server 等同于 prompt 注入风险面。 生产中的样子 把对 Claude Code 架构的推测性拆解作为成熟外壳的参照 · 上下文注入 = 知识层 · 循环状态 = memory store + worktree 隔离器 · 破坏性动作 hook = 权限闸 · 子 agent 上下文防火墙 = 多 agent 层 · 工具 dispatch registry = MCP 与 bash 的统一插槽 外壳不会消失,只会迁移 模型变强不会让外壳消失,而是让它位移: · 老一代模型催生的"上下文焦虑缓解层"已经被新模型大幅淘汰 · 但能力上限抬高的同时,新的失败模式也随之出现 · 外壳里每一块脚手架都编码了"模型当前不能独立做到什么"——模型变强,过时的拆掉,新的搭起来去够下一条地平线 训练循环的反馈 模型 post-training 时通常会带特定 harness 入环 → 模型对这些 harness 偏向的动作(文件系统操作、bash、子 agent 派发)格外擅长 → 形成一定程度的过拟合。 最佳 harness 是为你具体任务和工作流定制的那个。 Harness-as-a-Service 行业从"在 LLM API(提供 completion)上构建"转向"在 Harness API(提供 runtime)上构建"。SDK 直接交付循环、工具、上下文管理、hooks、沙箱。 新默认范式:选一个 harness 框架 → 配置其核心支柱 → 只专注于领域特定的 prompt 与工具设计。 这让排错变成"调一个良好分层的配置面",而不是"重造整个 agent 架构"。 未来方向 · 顶尖编码 agent 之间的相似度,已经高于它们底层模型之间的相似度——外壳模式在收敛 · 开放问题正在越过"单 agent":多 agent 并行编排、agent 分析自身 trace 修复 harness 级故障、按需即时组装工具的环境 · 下一阶段:harness 不再是静态配置文件,而越来越像编译器。

译智能体表现差异的核心在于模型之上的“外壳”,它包括提示词、工具、上下文策略等工程组件。外壳为裸模型提供状态和执行能力,使其成为智能体。行业常将智能体失败归咎于模型,但实为可定位的配置问题。通过“棘轮”方法,每次失误都可转化为优化外壳的永久规则。没有通用的最优外壳,最佳外壳是为具体任务定制的。未来,行业焦点将从构建LLM API转向构建提供运行时环境的Harness API。

Orange AI@oran_ge · 5月10日60

我发现大多数人并不是真的信仰 AGI 包括了 AI 圈子的人和真金白银投了 AI 的投资人 怀疑 AGI 无法达到,只是个概念 怀疑 AGI 只是生产力过剩,不会产生新需求 怀疑 AGI 只是取代原有劳动,不会产生新机会 怀疑 AGI 只能是很窄的几个领域,不能泛化到全人类 满脑子都是历史,都是教训,都是周期 沉浸在人类过去的线性推演里,跳不出来 大家信念不同,其实也聊不到一起

译作者观察到,无论是AI领域从业者还是投资人,多数并非真正信仰AGI。他们普遍怀疑AGI无法实现,认为它只是概念炒作;或认为AGI仅是生产力过剩的产物,无法创造新需求;或认为AGI只会取代现有劳动,不会带来新机会;或认为AGI只能局限于狭窄领域,无法泛化至全人类。这些观点源于对历史教训和周期的过度沉浸,局限于人类过去的线性推演思维,导致持有不同信念的人难以深入交流。

阿绎 AYi@AYi_AInotes · 5月10日53

Garry的这个读书系统做到了真正的“理解”,但这还不是最厉害的地方。 整个系统真正的核心,是一个叫 Skillify 的元技能。 也就是说,任何时候,只要你手动完成了一次重复性的工作, 你只需要说一句 “skillify this”, AI 就会自动分析你的整个操作流程, 写成一个自包含的可复用技能文件,并注册到系统里。 从此以后,所有类似的工作,系统都会自动帮你完成。 而且这个技能每改进一次, 所有用到它的工作流都会永久受益。 这就是真正的复利, 不是今天快 10%, 而是整个系统每个月都自动变强 10 倍。 Garry 把整个架构浓缩成一句话: Fat Skills + Fat Code + Fat Data + Thin Harness (胖技能 + 胖代码 + 胖数据 + 瘦路由) 模型只是引擎, 真正的价值,是你积累的 10 万页结构化人生数据, 和 100+ 个只属于你自己的可组合技能。

译Garry Tan系统的核心是Skillify元技能,它能将用户任何一次手动操作自动分析、封装成可复用的技能文件,实现复利效应——技能每改进一次,所有相关流程永久增强。其架构理念为“胖技能+胖代码+胖数据+瘦路由”,强调AI模型仅是引擎,真正的价值源于个人积累的海量结构化数据与专属可组合技能。该系统不仅是工具,更是AI时代个人能力的指数级放大方案,例如Book Mirror能将书籍内容深度映射至个人全部经历,远超普通RAG的检索能力。

Chubby♨️@kimmonismus · 5月10日45

Podcasts will remain human. Although more and more AI-generated podcast content is being created by AI, I firmly believe that successful podcasts will continue to be hosted by people. Why? Podcasts are regularly successful because of their hosts. Whether it's because they're good speakers or because you find them likeable, you want to be part of the podcast, part of the conversation. It's the same with live concerts. It's the presence, the human interaction, the social dynamic. I'm not saying that learning with NotebookLM isn't possible; on the contrary, its dialogue format is extremely helpful. However, there's a difference between learning with tools like NotebookLM and being an engaging part of a podcast with human listeners.

译尽管AI生成播客内容日益增多,但成功的播客仍将依赖人类主播。播客的成功核心在于主播的个人魅力、表达能力和亲和力,这使听众渴望参与对话并成为节目的一部分。这与现场音乐会的魅力类似,关键在于“在场感”、人际互动与社会性动态。虽然如NotebookLM等AI工具的对话形式对学习有帮助,但这与作为人类听众参与一个有吸引力的播客体验存在本质区别。

宝玉@dotey · 5月10日61

http://x.com/i/article/2053350663170449408 # 机器人的终局:英伟达 Jim Fan 宣告 VLA 时代结束,WAM 登场 Jim Fan 是英伟达机器人与 AI 研究组(GEAR Lab)负责人,过去几年主推的 GR00T 人形机器人基础模型用的是 VLA(Vision-Language-Action,视觉 - 语言 - 动作)架构。他刚在 Sequoia AI Ascent 2026 上做了一场 20 分钟的演讲,主题叫《Robotics' End Game》,第一件事就是宣布 VLA 路线过时——包括他自己半年前还在推的 GR00T。 取而代之的新范式叫世界动作模型(WAM),代表作是英伟达 2 月发布的 DreamZero。他把这套思路叫“底层同构”:复制 LLM(Large Language Model,大语言模型)走过的三步(预训练→对齐→强化学习),用视频世界模型替代语言模型,用人类第一人称视频替代遥操作数据,最终在 2040 年前让机器人自己设计和制造下一代自己。他对此有 95% 的把握。 演讲来源:Sequoia Capital AI Ascent 2026,2026 年 4 月 30 日发布。 原视频:https://www.youtube.com/watch?v=3Y8aq_ofEVs ## 要点速览 - VLA 路线落幕:Jim 公开宣告 VLA 路线过时,新范式叫世界动作模型(WAM),代表作是 DreamZero(140 亿参数)。 - 告别遥操作数据:遥操作物理上限低,预测一两年内降到接近 0,被传感化人类数据取代。 - 神经缩放定律:EgoScale 用 21,000 小时人类第一人称视频预训练,团队发现了灵巧操作的神经缩放定律(R² = 0.998)。 - 神经仿真器:Dream Dojo 用 44,000 小时人类视频训练出一个完全绕过物理引擎的神经仿真器。 - 终局倒计时:给出 2040 年完成机器人终局的预测(物理自动研究),置信度 95%。 ## 从 DGX-1 签名到“底层同构” Jim 用一段往事开场。2016 年夏天,就在 OpenAI 当时的办公室,黄仁勋穿着标志性皮夹克,抱着一块大金属托盘走进来,上面写着:“致 Elon 和 OpenAI 团队,致计算和人类的未来。”那是全球第一台 DGX-1。 Jim 当时是 OpenAI 的第一个实习生,赶紧排队去上面签了名。“那时候我完全不知道自己在签什么。”旁边一起签的还有 Andrej Karpathy。这台机器现在在 Computer History Museum 收藏。Jim 补了一句,说自己感觉像恐龙一样老了。 > 注:Jim Fan(范麟熙)是英伟达机器人与 AI 总监、杰出科学家,领导 GEAR Lab 和 GR00T 人形机器人项目。2016 年在 OpenAI 实习时的导师是 Ilya Sutskever 和 Andrej Karpathy,后在 Stanford 跟随 Fei-Fei Li 读完博士。 这个故事是为了引出他的核心框架。他引了 Ilya 那句“你信深度学习,深度学习就信你”,然后说 LLM 只用三次阶跃、六年时间就走到今天:GPT-3 的预训练,InstructGPT 的监督微调,o1 风格的强化学习,再到自动研究。 于是他做出了一个决定:抄作业,换个名字,叫**“底层同构”(the Great Parallel)**。把“模拟字符串的下一个状态”换成“模拟物理世界的下一个状态”,通过动作微调收敛到机器人需要的那部分,最后让强化学习走完最后一公里。 > 打不过就加入。 (“If you can't beat them, join them.”) ## VLA 怎么了:参数都堆在了语言上 过去三年,机器人领域的主流架构是 VLA(Vision-Language-Action,视觉 - 语言 - 动作模型)。英伟达自家的 GR00T 和 Physical Intelligence 的 π0 都属于这个类别。 Jim 指出了结构性问题:其实这些模型该叫 LVA,因为参数大头全堆在语言上了。语言是一等公民,视觉次之,动作只能垫底。 > VLA 擅长编码知识和名词,不擅长物理和动词。重心放在了不对的地方。 他举了 RT-2 原始论文里那个经典 demo:让机器人把可乐罐推到 Taylor Swift 的照片旁边。模型没见过 Taylor Swift,但能泛化过去。问题是,泛化的是名词(能认出 Taylor Swift),而不是动词(该怎么推、找什么角度、用多大力)。 ## 从 AI 垃圾视频到 DreamZero VLA 不是答案,那下一个预训练范式是什么?结果发现是视频模型,它们在内部学会了模拟物理世界的下一个状态。 怎么把这些世界模型变有用?做动作微调。把“所有可能的未来”这种叠加态,收敛到一条对真实机器人有意义的动作轨迹上。 英伟达的答案叫 DreamZero。这是一种新型策略模型,在执行动作之前先往未来“做梦”几秒钟,然后根据梦境行动。DreamZero 同时解码下一帧画面和下一步动作。在这里,视觉和动作第一次真正成为了“一等公民”。 Jim 坦率地承认 DreamZero 目前做不到每个任务都 100% 可靠。“它大概相当于 GPT-2 的阶段,方向对了,但表现还不够稳定可靠。”他给这个新架构起名叫 WAM(World Action Models,世界动作模型)。 > 为我们亲爱的 VLA 默哀片刻。它已完成了历史使命。安息吧。世界动作模型万岁。 > 注:DreamZero 论文(arXiv 2602.15922)2026 年 2 月发布,140 亿参数,基于 Wan2.1 视频扩散模型。它有一个关键限制:14B 模型必须经过 38 倍系统级优化加 GB200 硬件,才能把闭环控制压到 7Hz,部署门槛极高。 ## 数据革命:从遥操作到“机器人不用参与的数据采集” 过去三年是遥操作(teleop)的黄金时代。但遥操作有一个硬上限:每台机器人每天 24 小时。 “我说一天 24 小时,那是骗自己的。实际一天能干 3 小时就不错了,还得看当天的‘机器人之神’赏不赏脸——毕竟这帮机器天天闹脾气出毛病。” 怎么破局?把机器人的末端执行器直接戴在人手上,直接采集数据,完全绕过机器人本体。 英伟达方案是 DexUMI,一种外骨骼装置。用外骨骼数据训练出的机器人策略可以完全自主运行,训练数据里没有任何遥操作数据。 > 机器人很开心,因为它们终于不用参与数据采集了。 ## EgoScale:21,000 小时人类视频和缩放定律 英伟达推出了 EgoScale:99.9% 的训练数据来自人类第一人称视频(egocentric video)。 预训练用了 21,000 小时的野外人类数据,零机器人数据。动作微调阶段仅仅用了 50 小时的高精度动捕手套数据,外加 4 小时遥操作数据——加起来连训练总量的 0.1% 都不到。 最重要的发现是:灵巧操作的神经缩放定律。预训练投入的算力小时数与最优验证损失之间,存在一条极其清晰的对数线性关系,R² 达到了惊人的 0.998。 Jim 把所有数据策略的扩展性放在了一起:遥操作在最不可扩展的角落;第一人称视频如果能转动 FSD(Full Self-Driving,完全自动驾驶)式的数据飞轮,一年内能到 1000 万小时。 ## Dream Dojo:不用物理引擎的神经仿真器 机器人领域也需要花大钱买几百万个编程环境做强化学习(RL),但直接用真机(real-to-sim-to-real)不够。 进一步的方案是 Dream Dojo:不搞物理引擎那一套,直接把视频世界模型变成一个完整的神经仿真器。输入是连续动作信号,实时输出下一帧 RGB 画面和传感器状态。没有物理方程,没有图形引擎,完完全全是数据驱动的。 > 你看到的画面里没有一个像素是真实的。 “现在算力等于环境等于数据。或者用某位智者的话:买得越多,省得越多。这条消息已获得我老板批准。” ## 终局路线图:2040 年前的三个成就 Jim 把机器人的剩余路径类比成了必须解锁的三个科技树成就: 1. 物理图灵测试:2-3 年内,你分不出执行任务的是人还是机器人。 1. 物理 API:用软件和大模型编排机器人配置,建造“暗工厂”和自动化科学实验室。 1. 物理自动研究:机器人开始自己设计、改进并制造出下一代机器人。 至于时间表,他类比 AI 从 AlexNet(2012)到智能体(2026)用了 14 年。再加 14 年,正好是 2040 年。 > 我们这一代人,生得太晚,没赶上大航海时代去探索地球;又生得太早,够不着星辰大海去探索宇宙。但我们生得刚刚好,赶上了攻克机器人难题的时代。 ## 五个问题速答 Q:VLA 真的死了吗? A:演讲层面是死了。但英伟达自家最新的 GR00T N1.7(2026 年 4 月)论文里还明确写“VLA 模型”。范式迁移在内部尚未完成。 Q:DreamZero 现在能用在生产环境吗? A:不能。Jim 自己说它“大概是 GPT-2 阶段”。论文披露 14B 模型跑闭环控制只有 7Hz,且必须用 GB200。 Q:遥操作真的会被淘汰吗? A:Jim 预测一两年内降到接近 0。但戴设备做家务不像开车是刚需,且行业大量已有的遥操作基础设施不会一夜间报废。 Q:灵巧操作的缩放定律意味着什么? A:如果 R² = 0.998 持续成立,意味着增加人类视频数据,机器人灵巧性就会可预测地提升。这是整场演讲中最核心的实证论据。 Q:英伟达在这盘棋里赚什么? A:WAM 和神经仿真器对算力需求极高。Jim 的那句“buy more, save more”直接反映了范式切换天然有助于卖芯片的商业意图。 ## 最后:值得追踪的三个悬念 三件事最值得追踪: 1. DreamZero 如何跨越“GPT-2 阶段”:未来 12-18 个月能不能把极限参数做稳,决定了这套范式的真实威力。 1. 英伟达内部对 VLA 范式的切换时刻:观察其产品更新中架构实质演进。如果下一代还是 VLA,则演讲更偏向概念营销。 1. 第一人称视频数据的飞轮载体:英伟达自身没有消费级硬件入口,需观望谁(如苹果、Meta)能真正转动这块千万小时量级的数据。

译英伟达GEAR Lab负责人Jim Fan宣布,以GR00T为代表的VLA架构已过时,新范式是世界动作模型。其核心是“底层同构”,复制LLM成功路径:用视频世界模型替代语言模型,用人类第一人称视频数据替代遥操作数据进行预训练,再通过动作微调和强化学习收敛。他预测遥操作数据将迅速被淘汰,并展示了完全数据驱动的神经仿真器Dream Dojo。Jim Fan给出了机器人发展的终局路线图,预测在2040年前实现“物理自动研究”的置信度高达95%。

ginobefun@hongming731 · 5月10日59

阿里这篇关于 AI Native 时代组织研发的思考非常值得一读。它在思路一个非常重要的底层问题:过去两千年的组织形态,都是围绕人的局限建立起来的。 人会遗忘,会疲惫,会误解,会有情绪。一个人能够稳定协作和管理的人数有限,信息在层级之间传递一定会衰减,所以组织才需要汇报链、部门边界、经理角色、需求评审、流程审批和各种协调机制。很多我们习以为常的管理制度,本质上不是先进设计,而是对人类认知带宽的妥协。 AI Agent 进入组织之后,这个前提开始松动。它不是普通工具。普通工具只是延伸人的手脚,Agent 则开始参与理解、执行、调用系统和交付结果。它没有疲劳,没有情绪,没有传统意义上的沟通损耗,也几乎没有上下文切换成本。于是,旧组织里大量围绕人设计出来的结构,都会被重新审视。 这并不意味着人马上被替代。更准确的说法是,组织过去长期依赖人的地方,第一次被暴露出来了。 很多系统之所以能运转,并不是因为它们真的清晰、完备、结构化,而是因为人在中间做了太多隐性修补。需求写得不完整,可以开会问。接口约定不一致,可以找熟人确认。代码缺少说明,可以凭经验猜。业务规则藏在老员工脑子里,也可以靠人肉沟通补齐。这些动作太常见,以至于我们忘了它们本身就是成本。 当 AI 接管更多执行工作之后,问题就变得尖锐。AI 需要清晰的上下文、稳定的接口、可执行的测试、完整的文档、明确的权限和可追踪的结果。传统系统没有为 AI 留出这些入口,所以员工反而变成了人肉中间件:从系统里复制数据,贴给 AI,再把 AI 的输出搬回系统。看起来是在用 AI,实际是在用人弥补系统对 AI 的不友好。 因此,AI Native 转型的核心瓶颈,往往不是模型能力不够,而是组织的信息形态太旧。真正重要的工作,是把隐性的经验、流程、标准和判断,转化成 AI 可以理解、调用和验证的基础设施。文章里提到的 Harness,可以理解为让 Agent 真正能干活的底层环境。它包括测试、文档、权限、日志、评估、工具接口和事故响应。它不显眼,却是未来组织速度的本金。 这也解释了为什么资深工程师和架构师会变得更重要。过去高价值人才可能体现在亲自解决复杂问题,现在更高的杠杆来自定义系统如何解决问题。他们要把领域经验写成规则,把失败模式沉淀为测试,把判断标准变成可复用的评估,把只可意会的经验变成可执行的流程。一个好的 Architect,不只是写代码的人,更像是在为一群 Agent 设计工作环境和行动边界。 与此同时,管理也不会简单消失。会消失的是大量信息传递型、协调型、汇报型的管理工作。战略传达、进度聚合、资源协调、日常决策,会越来越多地被系统承接。但人的激励、辅导、冲突处理、身份安顿、文化建设,仍然需要人来完成。更重要的是,转型本身会带来真实焦虑。员工把经验蒸馏成组织资产时,会自然担心自己被替代。这个问题不能靠口号解决,必须靠清晰的角色迁移、利益分享和评价机制来接住。 文章里另一个值得警惕的点,是不要把所有工作都推向极致透明和彻底结构化。执行类工作适合透明,适合让失败快速暴露,适合减少防御性自我。可创新类工作需要一些保护空间。很多真正有价值的想法,一开始都很脆弱、粗糙、反共识。如果过早暴露在统一评估和公共审视中,很容易被磨平。AI 很擅长执行和优化,但它没有那种连续几个月死磕一个问题的执念。人的生产性自我,依然是创新里最重要的燃料。 所以,AI Native 组织的成熟形态,很可能不是更冷冰冰的机器公司,而是上下两层同时存在:底层极度结构化,让 AI 能安全、稳定、高速地执行;上层保持足够开放和松散,让人提出问题、形成判断、冒险试错、保护尚未成形的想法。 这篇文章最终给我的启发是,AI 对组织最大的改变,并不是降本增效这么简单。它会逼迫组织回答一个更深的问题:你的经验是否能被沉淀,你的流程是否能被调用,你的判断是否能被验证,你的系统是否真的清晰。如果答案是否定的,AI 只会放大混乱。如果答案是肯定的,组织会获得一种新的适应速度。

译传统组织为适应人类认知局限(如遗忘、沟通损耗)而设计了汇报链、流程审批等机制。AI Agent的引入动摇了这一基础,因其无疲劳、无情绪、低切换成本。转型核心瓶颈常是信息形态陈旧,需将隐性经验、非结构化流程转化为AI可操作的基础设施(如测试、文档、工具接口)。资深工程师角色将更关键,负责将领域经验编码为规则与可复用评估。管理工作中的信息传递与协调部分将被系统承接,但人员激励、文化建设等仍需人力。需警惕过度结构化可能扼杀创新,理想组织应是底层高度结构化以支持AI高效执行,上层保持开放松散以容纳人的探索与试错。

阿绎 AYi@AYi_AInotes · 5月10日71

Dario Amodei刚刚说,第一个10亿美元的一人公司,还有7个月就会出现。 很多人觉得这是天方夜谭,但我觉得他说的是事实。 因为现在已经有两人公司做到了10亿美元估值,而且已经有很多一人公司用AI做到了每月几万美元的收入。 当然我知道你们会说,10亿美元和我没关系。 没错,不过10K MRR,也就是每月7万人民币,应该和你有关系😄 我觉得这是99%的普通人,在接下来的7个月里,完全可以做到的事。 帖子里直接给出了精确到每一步的路线图,我把它翻译成普通人能懂的中文,你今晚就能开始做。 1️⃣第一步,选一个具体的、可重复的任务。 不要做通用Agent,不要做什么都能干的东西。 就找一个你熟悉的行业里,最无聊、最繁琐、但别人愿意付钱的小事。 2️⃣第二步,把系统提示词写成岗位JD, 不要写"帮我写文案"。 要写"你是一个有5年经验的电商客服,负责回复亚马逊的客户邮件,语气要友好,解决率要达到95%"。 把AI当成你的员工,而不是工具。 3️⃣第三步,接入MCP工具链, 让它能真正操作你的Slack、邮箱、Google Drive、GitHub。 让它不用你插手,就能自己完成整个工作流。 4️⃣第四步,迭代10次, 每次失败,不要怪AI, 去优化你的提示词, 失败不是bug,是让你的员工变得更聪明的燃料。 5️⃣第五步,定时运行,然后撒手不管, 真正的一人公司,可不是你每天工作16小时,要让AI每天工作24小时,你只需要每周花2小时检查异常和收钱。 嗯,就是这么简单, 没有任何复杂的技术, 不需要你会写复杂的代码, 只需要你能找到一个别人愿意付钱解决的痛点。 当然这条路也不是没有坑, 我把最容易踩的三个坑直接说出来: 第一,构建容易,分发难。 Agent本身不难,找100个愿意付费的用户才是瓶颈。 第二,边缘案例永远存在。客户退款、合同纠纷、愤怒的周五邮件,还是需要你亲自处理。 第三,不要追求完美。能用80分的AI解决问题,就不要等100分。 Dario说过一句话,我反复读了很多遍。 "一个人或者一小群人,现在有能力去做以前根本无法想象的事。" 我觉得这不是未来的事,就是现在正在发生的事。 很多人问,AI时代普通人的机会在哪里? 其实答案就在这里, 不是去大厂当算法工程师, 不是去炒AI币, 是用AI,建一个只属于你自己的、自动化的、能持续赚钱的小生意。 现在这个窗口只剩7个月了, 等所有人都反应过来的时候,就没有你的机会了。 铁汁们,这个周末不要刷手机了, 打开你的笔记,写下你熟悉的领域里,最无聊的那个任务。 然后今晚就搭你的第一个Agent。 #AI创业 #一人公司 #Agent

译Anthropic联合创始人预测首个十亿美元一人公司即将出现,而普通人利用AI实现月入1万美元(约7万人民币)则更为切实可行。核心路径包括:选择具体、可重复的付费任务;将系统提示词编写为详细岗位描述;通过MCP工具链连接实际工作流实现自动化;持续迭代优化提示词;最终实现系统自动运行,创始人仅需每周花少量时间处理异常。成功关键在于找到付费痛点并快速交付可用方案,而非追求技术完美。当前是利用AI创建自动化小生意的关键窗口期。

小互@xiaohu · 5月10日49

「HTML 比Markdown让人更容易读懂 Agent 的工作 更适合人机协作交互」 让Codex 用HyperFrames 制作个解说视频 除了解说文案有一点AI味,效果其实还不错的 嘿嘿

译推文提出,在Agent工作流和人机协作交互场景中,HTML格式比Markdown更易于人类阅读和理解。作者建议让Codex使用HyperFrames来制作解说视频,并指出虽然生成的解说文案带有明显的AI风格,但整体效果不错。引用的推文提供了关于HyperFrames技术或相关演示的背景支持,强调了HTML在提升人机交互清晰度方面的优势。

Orange AI@oran_ge · 5月10日34

AI 时代最大的护城河竟然是公司本身 哪个组织能让每个员工都实现10倍产出 哪个组织就能获得极致的效率 员工也能从中获得10倍回报

译AI时代中,企业的核心护城河转向自身组织能力。关键在于实现员工生产力的10倍提升,从而获得极致运营效率,员工也能从中获取10倍回报。这揭示了竞争焦点从外部技术转向内部效率优化,强调组织赋能和人力资源变革在AI驱动下的决定性作用。

Ethan Mollick@emollick · 5月10日67

I suspect there was a moment, probably 2022-2023, where anything you wrote publicly about AI that was popular is likely to still have influence over current models. Since then, the open internet has become less key to training but the models remain very 2022-brained in many ways

译我怀疑在某个时刻,大概是2022-2023年, 你公开撰写的任何关于AI的流行内容, 可能仍对当前模型产生影响。 自那以后,开放互联网对训练的重要性有所下降, 但模型在许多方面仍保持着非常2022年的思维方式。

swyx 🌉@swyx · 5月10日41

this is a big deal, on the order of Kelsey Hightower’s “Kubernetes The Hard Way” and probably all ai engineers should go thru this once mostly i advocate “just in time learning”, but this is one scenario you want “just in case”

译这是件大事,其重要性堪比Kelsey Hightower的《Kubernetes The Hard Way》,可能所有AI工程师都应该至少经历一次。 虽然我通常主张“即时学习”,但这是少数需要“以防万一”学习的情况。

François Chollet@fchollet · 5月10日65

Agentic coding is a form of machine learning. Generated code is best treated as a blackbox artifact whose behavior and generalization should be managed via empirical evaluation, like with any ML model.

译智能体编程本质上是机器学习过程:工程师设定优化目标与搜索空间约束(如规范和测试),编码智能体通过迭代优化生成代码库。生成的代码应被视为黑箱模型,其行为与泛化能力需通过实证评估来管理,如同对待神经网络权重。这意味着机器学习中的经典问题,如对规范的过拟合、无法泛化的“聪明汉斯”式捷径、数据泄露和概念漂移等,都将出现在智能体编程中。作者进一步提出,未来需要寻找类似Keras的高级抽象工具,以最低认知开销来引导代码库的“训练”。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月12日
00:20
Andrej Karpathy@karpathy
73
人机交互界面的演进:从文本到交互式神经视频

作者认为,AI的人机交互界面正从当前的Markdown默认输出向更丰富的HTML格式演进,后者能提供更好的图形、布局和交互性。长远看,由扩散神经网络直接生成的交互式神经视频或模拟将是终极输出形式,但其如何与精确的传统软件结合仍是开放问题。在输入侧,仅靠音频、文本或视频并不足够,需整合如手势指点等更自然的交互方式。总体而言,在迈向脑机接口之前,人机输入输出的融合仍有大量工作要做。现阶段的一个实用建议是尝试让大语言模型以HTML格式结构化其回复。

Thariq: http://x.com/i/article/2052796100608974848

多模态大佬观点
00:01
Rohan Paul@rohanpaul_ai
57
中国AI竞赛重心转向应用部署,通义千问融入日常与工作流

中国AI竞争焦点正从模型能力转向实际应用与部署。以阿里巴巴通义千问为例,其正深度融入购物、支付、医疗、办公等庞大数字生态,成为日常任务与工作流程中的工具,而不仅是问答聊天机器人。例如,医生和研究人员已将其用于文献整理、证据筛选、图表制作等研究环节。这一策略契合中国庞大的数字经济和高科技接受度,旨在使AI成为专业与日常工作中的默认界面,让用户能在无需切换应用的情况下完成报告撰写、学习研究等实际任务。

大佬观点现象/趋势
5月11日
23:53
Chubby♨️@kimmonismus
63
社区智慧专栏启动,首期探讨可信AI新框架

Superintelligence推出全新周日专栏“社区智慧”,每周精选社区成员发表原创分析与观点。首期文章由德勤合伙人Martin Fjeldbonde撰写,他指出当前关于可信AI的讨论存在根本性问题,并提出了一个可能更正确的新框架。该专栏旨在汇聚研究者、从业者等深度思考者的专业见解,并向社区开放投稿申请。

大佬观点安全/对齐
23:39
Nathan Lambert@natolambert
41
四年前的今天我获得了博士学位,回想起来仍觉不可思议。能完成学业并转型进入AI领域,我感到非常幸运。 如今AI领域许多人都在低估攻读博士过程的价值。
大佬观点安全/对齐
23:34
swyx 🌉@swyx
72
推文首次公开了Cognition AI总部"Cog House"的内部影像。创始人Scott Wu是美国顶尖竞技程序员,自幼展现数学天赋,曾三获国际信息学奥赛金牌。2023年11月,他在母亲去世与Sam Altman被OpenAI解雇的同日创立Cognition,并预见到AI将发展为全天候工作的智能体。公司推出的AI软件工程师Devin虽初期表现不佳,但上线18个月内已实现4.45亿美元年化营收,客户包括美国陆军、高盛和梅赛德斯-奔驰,公司估值约250亿美元。Wu认为自己的使命是"教AI编程"。

Colossus: Scott Wu is the co-founder of Cognition AI, one of the fastest-growing companies in history. He's also the greatest comp...

智能体大佬观点
23:30
Rohan Paul@rohanpaul_ai
57
AI时代团队效率瓶颈在于共享上下文

AI繁荣两年后,个体效率提升而团队整体速度未改善,核心瓶颈在于缺乏共享上下文而非智能不足。新平台Play旨在构建团队与AI协同工作的共享环境,将工作、上下文和智能体整合于统一空间,使团队能力产生复合效应而非每周归零。创始团队拒绝八位数收购报价,认为其解决的"团队孤独与上下文割裂"问题价值更高,目标是颠覆传统SaaS模式,通过共享记忆与上下文让顶尖人才真正协同。

Amitay Gilboa: We got an 8-figure acquisition offer 2 days after launch. We said no, because the problem we're solving is worth way mor...

大佬观点
23:28
elvis@omarsar0
51
Tobi的精彩文章。 正在建设AI原生公司?快去阅读。 我忍不住用我的神器生成器将其可视化。 我最大的收获是:"风险不在于AI完成工作,而在于无人从中学习。"

tobi lutke: http://x.com/i/article/2052738533111013380

大佬观点现象/趋势
22:20
向阳乔木@vista8
60
AI降低内容生产成本 -> 拼选题和审美 -> 拼信任和分发渠道。
大佬观点现象/趋势
20:58
Ethan Mollick@emollick
51
AI模型无法产生创造性变体是巨大缺陷。 它们生成相似想法的事实限制了其科研能力, 而千篇一律的写作也局限了其在众多其他应用中的效用 本文表明可通过优化模型提升创造力
大佬观点
14:30
Orange AI@oran_ge
63
他们说工程师要失业了,可现实却完全相反。

AI未导致工程师失业,反而提升个人产出十倍,促使公司逆势招聘以实现更大目标。数据显示软件开发岗位增长15%,AI工程师岗位涨143%。a16z称AI就业末日是幻想,AI扩展工程师能力至各行各业,类比廉价电力消除重复劳动,推动更高价值工作。

Kris Xu: http://x.com/i/article/2053714989119410177

其他大佬观点
14:27
Greg Brockman@gdb
47
/goal 被低估了 GPT-5.5 extra high thinking 配合 /goal 刚刚做到了。 我震惊了。

james yu: We have a gnarly refactor in our codebase that I test every frontier model on. I've been doing this since the release of...

OpenAI大佬观点推理编码
08:57
Greg Brockman@gdb
30
智能体构成了令人惊喜的优秀产品
智能体OpenAI大佬观点
08:33
meng shao@shao__meng
65
Codex 如何重塑产品营销的工作方式

OpenAI Codex的首位产品营销经理阐述了其核心价值:从“写代码的工具”转变为让知识工作者直接接触代码库、Slack等“信息源头”的工作台。具体通过三层应用重塑PMM角色:作为个人助理聚合多工具信息以管理注意力;跟踪产品与工程状态以直接理解源码;生成跨职能对齐文档初稿以提高信息可见性。AI接管了汇总与追踪工作,使人能更专注于不可替代的判断部分,如评估表述、识别计划漏洞。这一让AI做“有据可依的初稿”、接入真实工作场景并实现自动化的模式,可迁移至任何上下文密集型岗位。

pranav: http://x.com/i/article/2053505234522238976

智能体OpenAI大佬观点教程/实践
06:52
Chubby♨️@kimmonismus
17
不知道我是更期待 GPT 5.6、Opus 4.8、新版 Kimi 还是 GLM 模型。 活在当下真是无比精彩的时代。
AnthropicOpenAI大佬观点
05:22
Chubby♨️@kimmonismus
14
GPT-5.5 现在是无可争议的王者。 对下一个模型感到超级兴奋。 Sama 的宣传造势也很棒 ;)

Sam Altman: @icanvardar curious to see if you still feel this way after the next model!

OpenAI大佬观点
04:44
Yuchen Jin@Yuchenj_UW
28
AGI已在内部实现。 人工地精智能 【引用 @sama】:what if we name the next model "goblin" almost worth it to make you all happy…

Sam Altman: what if we name the next model "goblin" almost worth it to make you all happy...

OpenAI大佬观点
04:37
Sam Altman@sama
30
如果我们将下一个模型命名为"哥布林" 几乎值得为了让你们开心而这样做…
OpenAI大佬观点
03:34
阿绎 AYi@AYi_AInotes
58
AI进步速度被严重低估,技术采纳存在巨大层级差距

Elad Gil指出,AI的真实进步速度被严重低估,技术采纳存在显著层级差距:大型AI实验室内部人员领先硅谷工程师3-4个月,硅谷领先纽约3-6个月,纽约领先全球其他地区6-12个月。绝大多数人落后前沿1-2年,却误以为当前AI水平仅如ChatGPT-4o。硅谷的核心优势在于其快速迭代的文化,包括每30天重构工作流、迅速将论文转化为产品、容忍失败但恐惧缓慢。竞争关键已从资源规模转向迭代速度,个人凭借正确工具可超越传统团队,而差距缩小的速度本身正成为新的竞争壁垒。

Elad Gil: People at major AI labs (using internal models) 3-4 months ahead of startup silicon valley engineers SV founders/eng 3-6...

大佬观点现象/趋势
02:57
François Chollet@fchollet
30
如果你无法用数学或代码的语言表达你的想法,说明你还未真正理解它。那仅仅是一种直觉。
Google大佬观点
02:22
Chubby♨️@kimmonismus
56
Thariq Claude Code工程师刚发文解释为何将智能体输出从Markdown转为HTML。他自述:这会多用2-4倍的令牌。 看着我的费率现在不确定这是否最佳建议 :D 【引用 @trq212】:http://x.com/i/article/2052796100608974848

Thariq: http://x.com/i/article/2052796100608974848

智能体Anthropic大佬观点
01:14
Yuchen Jin@Yuchenj_UW
47
美国至今没有真正具备竞争力的开源模型实验室,这很奇怪。 显然不是资金问题。多家新兴实验室已筹集数十亿美元。 也不是算力问题。美国实验室比中国实验室更容易获得B200/B300芯片。 那么问题究竟出在哪里?
大佬观点开源生态
00:58
Ethan Mollick@emollick
44
我认为"只有旧金山人懂AI"的时代已经过去。 AI用户遍布各行各业 他们使用着相同的模型 在科学、法律、金融、营销、教育等领域 我见过最惊人的应用案例 很多都远离旧金山这个震中
大佬观点现象/趋势
5月10日
23:28
Ethan Mollick@emollick
71
Claude的人格化体现--无论是名称(唯一拥有人类名字的AI)、训练方式、Anthropic的哲学理念(参见Claude宪法),还是同人创作(参见Claude卡通)等--从中期来看都颇具深远影响,这既可能带来好处也可能产生弊端。
Anthropic大佬观点安全/对齐现象/趋势
22:33
阿绎 AYi@AYi_AInotes
62
从Prompt工程到系统构建:解锁AI的真正潜力

推文指出,当前多数人使用AI的方式仍停留在与ChatGPT聊天、比较模型或复制“神奇prompt”的层面,这如同汽车发明初期人们仍在优化马匹。真正的转折在于从单次任务的Prompt Engineering转向构建能持续自我增强的System Engineering。核心观点是,不应只追求单次效率提升,而应建立复合增长系统,让AI成为“第二神经系统”。例如,Garry Tan的Book Mirror能将书籍内容深度映射到个人经历中,生成极具个性化的分析,其效能远超普通检索和传统咨询,体现了AI的指数级能力放大。

阿绎 AYi: 说实话,Garry Tan 这篇长帖,是我今年看到的最重要的 AI 文章,没有之一。 大多数人看完估计只会惊叹:"哇,这个读书工具好厉害。" 但他们其实并没看懂,这不仅仅是一个工具,说是一份 AI 时代个人能力的指数级放大说明书更合适一些。...

智能体大佬观点
22:33
meng shao@shao__meng
63
代理 = 模型 + 控制机制 - 为什么Claude Code、Cursor和Codex行为不同(相同模型) https://youtu.be/si8EhxtRL7w?si=kk4UzfeYfh5aI4IY
智能体大佬观点编码
22:28
Ethan Mollick@emollick
45
苹果可能计划在Claude Code和Codex(以及OpenClaw)日益能实现真正助理功能时,推出基于2024年愿景的升级版Siri: 读取我的邮件和日历, 主动发现并解决问题, 执行委派任务, 支持语音操作等
智能体大佬观点
21:33
meng shao@shao__meng
51
Delphi、C#、TypeScript 核心设计者 Anders Hejlsberg 谈 AI 与编程的未来

Anders Hejlsberg 认为 AI 无法取代程序员,而是作为加速器存在。AI 依赖人类构建的底层系统(如编程语言、操作系统),擅长重复模式但缺乏创新能力,业务逻辑与架构决策仍需人类完成。他质疑“氛围编程”,强调理解变量、数据结构等基础概念比语法更重要,并肯定计算机科学学位的系统化价值。未来 AI 将接管琐碎任务,工程师则专注于底层设计、架构创新与新想法。C# 的设计哲学是融合易用与强大,TypeScript 则通过类型系统提升 JavaScript 的大规模开发体验。

Mario Zechner: recommended viewing. in anders we trust. https://youtu.be/CPrePbvbbic?is=HCZ2pawMGxOTifWl

大佬观点编码
21:22
Chubby♨️@kimmonismus
44
生病期间随便玩玩codex claude代码之类的。 我刚发现欧洲居然还不能使用codex里的计算机功能?为什么欧洲在方方面面都落后。 该死的@eucommission。说真的。
智能体OpenAI大佬观点
21:03
meng shao@shao__meng
60
智能体表现差异的关键:模型之上的"外壳"

智能体表现差异的核心在于模型之上的“外壳”,它包括提示词、工具、上下文策略等工程组件。外壳为裸模型提供状态和执行能力,使其成为智能体。行业常将智能体失败归咎于模型,但实为可定位的配置问题。通过“棘轮”方法,每次失误都可转化为优化外壳的永久规则。没有通用的最优外壳,最佳外壳是为具体任务定制的。未来,行业焦点将从构建LLM API转向构建提供运行时环境的Harness API。

Addy Osmani: http://x.com/i/article/2050749611237847040

智能体MCP/工具大佬观点编码
19:59
Orange AI@oran_ge
60
多数人并不真正信仰AGI,受历史线性思维局限

作者观察到,无论是AI领域从业者还是投资人,多数并非真正信仰AGI。他们普遍怀疑AGI无法实现,认为它只是概念炒作;或认为AGI仅是生产力过剩的产物,无法创造新需求;或认为AGI只会取代现有劳动,不会带来新机会;或认为AGI只能局限于狭窄领域,无法泛化至全人类。这些观点源于对历史教训和周期的过度沉浸,局限于人类过去的线性推演思维,导致持有不同信念的人难以深入交流。

大佬观点
19:33
阿绎 AYi@AYi_AInotes
53
Garry的这个读书系统做到了真正的"理解",但这还不是最厉害的地方。

Garry Tan系统的核心是Skillify元技能,它能将用户任何一次手动操作自动分析、封装成可复用的技能文件,实现复利效应——技能每改进一次,所有相关流程永久增强。其架构理念为“胖技能+胖代码+胖数据+瘦路由”,强调AI模型仅是引擎,真正的价值源于个人积累的海量结构化数据与专属可组合技能。该系统不仅是工具,更是AI时代个人能力的指数级放大方案,例如Book Mirror能将书籍内容深度映射至个人全部经历,远超普通RAG的检索能力。

阿绎 AYi: 说实话,Garry Tan 这篇长帖,是我今年看到的最重要的 AI 文章,没有之一。 大多数人看完估计只会惊叹:"哇,这个读书工具好厉害。" 但他们其实并没看懂,这不仅仅是一个工具,说是一份 AI 时代个人能力的指数级放大说明书更合适一些。...

智能体检索增强大佬观点
18:21
Chubby♨️@kimmonismus
45
人工智能无法取代人类播客主播的魅力

尽管AI生成播客内容日益增多,但成功的播客仍将依赖人类主播。播客的成功核心在于主播的个人魅力、表达能力和亲和力,这使听众渴望参与对话并成为节目的一部分。这与现场音乐会的魅力类似,关键在于“在场感”、人际互动与社会性动态。虽然如NotebookLM等AI工具的对话形式对学习有帮助,但这与作为人类听众参与一个有吸引力的播客体验存在本质区别。

大佬观点语音
14:01
宝玉@dotey
61
英伟达Jim Fan宣告VLA时代结束,世界动作模型WAM成为机器人新范式

英伟达GEAR Lab负责人Jim Fan宣布,以GR00T为代表的VLA架构已过时,新范式是世界动作模型。其核心是“底层同构”,复制LLM成功路径:用视频世界模型替代语言模型,用人类第一人称视频数据替代遥操作数据进行预训练,再通过动作微调和强化学习收敛。他预测遥操作数据将迅速被淘汰,并展示了完全数据驱动的神经仿真器Dream Dojo。Jim Fan给出了机器人发展的终局路线图,预测在2040年前实现“物理自动研究”的置信度高达95%。

具身智能大佬观点
11:44
ginobefun@hongming731
59
AI Native时代组织研发的思考:重构围绕人的局限建立的组织形态

传统组织为适应人类认知局限(如遗忘、沟通损耗)而设计了汇报链、流程审批等机制。AI Agent的引入动摇了这一基础,因其无疲劳、无情绪、低切换成本。转型核心瓶颈常是信息形态陈旧,需将隐性经验、非结构化流程转化为AI可操作的基础设施(如测试、文档、工具接口)。资深工程师角色将更关键,负责将领域经验编码为规则与可复用评估。管理工作中的信息传递与协调部分将被系统承接,但人员激励、文化建设等仍需人力。需警惕过度结构化可能扼杀创新,理想组织应是底层高度结构化以支持AI高效执行,上层保持开放松散以容纳人的探索与试错。

智能体大佬观点
11:32
阿绎 AYi@AYi_AInotes
71
普通人如何用AI构建月入7万的一人公司:七个月行动路线图

Anthropic联合创始人预测首个十亿美元一人公司即将出现,而普通人利用AI实现月入1万美元(约7万人民币)则更为切实可行。核心路径包括:选择具体、可重复的付费任务;将系统提示词编写为详细岗位描述;通过MCP工具链连接实际工作流实现自动化;持续迭代优化提示词;最终实现系统自动运行,创始人仅需每周花少量时间处理异常。成功关键在于找到付费痛点并快速交付可用方案,而非追求技术完美。当前是利用AI创建自动化小生意的关键窗口期。

Khairallah AL-Awady: http://x.com/i/article/2052883842948632579

智能体Anthropic大佬观点教程/实践
11:13
小互@xiaohu
49
HTML比Markdown更利于人机协作与Agent工作理解

推文提出,在Agent工作流和人机协作交互场景中,HTML格式比Markdown更易于人类阅读和理解。作者建议让Codex使用HyperFrames来制作解说视频,并指出虽然生成的解说文案带有明显的AI风格,但整体效果不错。引用的推文提供了关于HyperFrames技术或相关演示的背景支持,强调了HTML在提升人机交互清晰度方面的优势。

Thariq: http://x.com/i/article/2052796100608974848

智能体MCP/工具OpenAI大佬观点
08:29
Orange AI@oran_ge
34
AI时代中,企业的核心护城河转向自身组织能力。关键在于实现员工生产力的10倍提升,从而获得极致运营效率,员工也能从中获取10倍回报。这揭示了竞争焦点从外部技术转向内部效率优化,强调组织赋能和人力资源变革在AI驱动下的决定性作用。

Jaya Gupta: http://x.com/i/article/2052868796495564800

大佬观点
08:28
Ethan Mollick@emollick
67
我怀疑在某个时刻,大概是2022-2023年, 你公开撰写的任何关于AI的流行内容, 可能仍对当前模型产生影响。 自那以后,开放互联网对训练的重要性有所下降, 但模型在许多方面仍保持着非常2022年的思维方式。
大佬观点数据/训练
07:01
swyx 🌉@swyx
41
这是件大事,其重要性堪比Kelsey Hightower的《Kubernetes The Hard Way》,可能所有AI工程师都应该至少经历一次。 虽然我通常主张"即时学习",但这是少数需要"以防万一"学习的情况。

Ahmad: http://x.com/i/article/2050058966072524800

大佬观点部署/工程
06:27
François Chollet@fchollet
65
智能体编程本质上是机器学习过程:工程师设定优化目标与搜索空间约束(如规范和测试),编码智能体通过迭代优化生成代码库。生成的代码应被视为黑箱模型,其行为与泛化能力需通过实证评估来管理,如同对待神经网络权重。这意味着机器学习中的经典问题,如对规范的过拟合、无法泛化的"聪明汉斯"式捷径、数据泄露和概念漂移等,都将出现在智能体编程中。作者进一步提出,未来需要寻找类似Keras的高级抽象工具,以最低认知开销来引导代码库的"训练"。

François Chollet: Sufficiently advanced agentic coding is essentially machine learning: the engineer sets up the optimization goal as well...

智能体大佬观点编码
‹ 上一页
1…3940414243…50
下一页 ›