AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2408 条
全部一手资讯X论文
标签「大佬观点」清除
AYi@AYi_AInotes · 5月26日37

一个关于AI工具使用的反常识顿悟与提醒,或者说暴论: 任何提示词和工具,你用过3次以上,它才有资格留着,没用过就该删掉! 最近工作忙,没追热点,一直在思考使用AI的一些更底层和细节的东西, 尤其是对于提示词工程这块,越来越觉得属于AI基本功的范畴,永不过时, 刚突然意识到,我们不应该没有用过的工具的完整性心疼和焦虑, 我知道大家收藏过一堆提示词、工具,我也一样, 但我们必须知道一点:任何提示词、工具,如果你一次没用过,那么它的真实价值就是0。

译推文提出一个关于AI提示词与工具使用的核心观点:任何提示词或工具,如果使用次数少于3次,其真实价值即为0,不应保留并为此产生收藏焦虑。作者认为,提示词工程是AI使用的永不过时的基本功,关键在于工具与自身工作流的实际匹配度,而非完整性收藏。文中提及了相关讨论作为背景上下文,强调了避免无用收藏、专注于高频实用工具的实用主义态度。

宝玉@dotey · 5月26日57

Agent 应用和传统 App + AI 的最大差别,在于执行的主体不同。 传统 App + AI,是人“操作” App,AI 只是辅助 Agent 应用,是人“指挥” Agent 去操作 App/cli,Agent 自助做事 举例来说,微软家的 Copilot (早年版本)集成在 PowerPoint 中,你能问它个话,基于文档回答点问题,你让它帮你操作 PowerPoint 它做不到 现在的 Codex,你告诉它写一个 Slides,或者上传一个 PPTx 文件,让它帮你修改一下,你全程不用自己操作 PowerPoint。 这就是差别。

译文章核心指出,传统App+AI是人操作应用,AI辅助;而Agent应用是人指挥AI智能体自主操作应用或命令行。文中以微软Copilot(早期版本仅能回答问题)与Codex(能自主完成PPT制作修改)为例说明此差异。针对“在Agent上构建垂直应用是否等同于传统App+AI”的疑问,作者澄清,只要执行主体是AI智能体,即为以AI为主的应用。

François Chollet@fchollet · 5月26日28

Creativity feeds on constraints

译创造力源于约束的滋养

Orange AI@oran_ge · 5月26日52

早晨听到两个播客都提到,现在他们让 AI 自己提需求,自己开发,自己测试,自己上线了 人算是彻底解放了 我在想,这东西做出来可能是只能给 AI 用了

meng shao@shao__meng · 5月26日63

原本是重度 Claude Code 用户,在加入 Cursor 面试前从未用过 Cursor,这就是 @poteto,一起看看她是怎么使用 Cursor 的? lauren 认为:作为开发者,我们不应该过度沉迷于 "并行跑多个 agent" 的表象,但真正的瓶颈是验证。 从 Claude Code 到 Cursor 的转变 lauren 原本是重度 Claude Code 用户,在加入 Cursor 面试前从未用过 Cursor。她观察到三件事改变了她的判断: · 多模型协同的自然化:Opus 写前端、Codex 写系统,可同会话内切换甚至生成不同模型的子 agent。"多模型对抗式 review"在 GUI 中变得不再笨拙。 · Compaction 的速度:cc 中她需"持续警觉"上下文用量;Cursor 中她"基本不再看"。压缩后模型不会变笨。 · GUI > TUI 的潜力:在 Cursor 内置浏览器中直接打开应用、用 Design Mode 修改,让她意识到专用 UI 能让 agentic coding 更有效——CLI 把人本身变成了编排者。 关键洞察:Latent Demand(潜在需求) 引用 @bcherny 的产品哲学: 把产品做得足够可被"滥用",然后观察用户怎么滥用它,再为这种滥用建造产品。 她的判断是:CC 用户大量自建 orchestrator 工具的现象,正是 latent demand 的暴露——CLI 让人成为编排者,所以人们不停在外面包一层。 但她认为业界的方向走偏了:"在 GUI 里跑多个 CLI"完全没抓到要点。真正应该做的是建立对 agent 的信任。 Agent ≈ 失忆症且智商不在线的新员工 · 他们有能力但愚蠢,且高度可教 · 不会真的"学到"任何新东西,每次都从零开始 · 但可以通过 rules / skills / tools / 长期记忆近似出"经验积累" · 失败模式不是缺陷,而是教学机会 她作为前工程经理的视角点出了关键:没有严谨验证时,agent 会谄媚地写出你要的任何代码,而且写得飞快。 朴素的并行只是在加速生产 slop。 pstack:把工程严谨度封装成 skill 她开源了自己日常使用的技能集 pstack,核心机制是 /poteto-mode——一个高阶元技能,会根据任务自动选择合适的 playbook。 https://github.com/cursor/plugins/tree/main/pstack 设计哲学: · 目标不是 LOC 最大化,而是以最少代码换取最大影响 · 把资深工程师的方法论显式化(例如:调试 = 在问题空间中二分搜索) · 现成的 playbook 覆盖:技能编写与评估、自主工作、Bug 修复、特性开发、视觉一致性、原型对比 pstack 是模型无关的,但在 Cursor 这种多模型工具中收益最大——很多 skill 显式利用了不同模型的长短板。 Benny:通往"软件暗工厂"的雏形 后半段揭示更大的图景:当 pstack 让"一发入魂"成为常态后,反馈环本身也能被自动化。 Benny 是她构建的内部自动化 bot 链: 1. Triage(分诊):看图片/视频,主动追问复现步骤——因为没有清晰的 repro,agent 只能猜。 2. 跨源调查:代码、git 历史、Slack 关于同 bug 的讨论、Notion 中的产品设计决策(是 bug 还是 feature?)。 3. 建单后:另一个 Benny 通过 /orchestrate 接手,递归 spawn agent。 4. Computer Use 复现:Cloud Agent 在云端跑 Cursor 本身,用 CDP 等协议操作桌面,演示 bug 是否真实存在。 5. 修复 + 验证:性能问题会自动抓前后 CPU trace 和堆快照;子 worker 录制前后对比视频;最终一个 worker 开 PR,描述里附上视频。 最深的命题:信任的剂量决定自动化的边界 除非你能信任一个 agent 端到端地拥有一个问题(包括验证环节),否则你无法自动化你的流程。 也就是说: · 信任 ↑ → 可委派的问题 ↑ → 自动化范围 ↑ · 信任未到位 + 强行并行 = token 浪费 + slop 注入 这把"agent 编排"从工程问题重新定义为信任工程问题。pstack 是一个杠杆——它通过把工程深度灌注给 agent,抬升信任的下限,从而让更多东西可以放进自动化流水线。

译原重度Claude Code用户poteto转向Cursor,基于多模型协同更自然、上下文压缩速度更快、GUI更利于agentic coding等观察。她认为AI智能体像“失忆且智商不在线但可教的新员工”,其失败模式是教学机会。关键洞察是验证才是瓶颈,盲目并行多个智能体只是在加速生产低质量代码。她开源了技能集pstack,其核心元技能/poteto-mode可根据任务自动选择工作流,旨在封装工程严谨度以提升对智能体的信任。最终论点是:自动化边界取决于对智能体端到端处理能力(尤其是验证环节)的信任程度。

Orange AI@oran_ge · 5月26日61

AI 让软件开发的第一版变得极其容易 但是真正难的是后面的100个版本 而且越到后面越难怎么回事.... 软件工程依然有很多事情要做

swyx@swyx · 5月26日51

concept of vendor lock-in is kinda fake when i completely migrate a fullstack ai app in <30 mins just bc i didnt like how my first choice had nasty error messages (with lots of subtle streaming/queuing/arena mode/media generation semantic) @realGeorgeHotz is right that we need world models for full fidelity, but try just vibing entire projects that are breakable toys and learn to use skills/reviews to keep llms from going off the rails and its amazing how much you can get done in parallel without further effort

译推文指出,AI开发中的“厂商锁定”概念并不牢固。作者因不满首个选择的错误信息,在不到30分钟内就完全迁移了一个全栈AI应用,该应用包含流式、队列、竞技模式及媒体生成等语义。作者引用并回应了realGeorgeHotz关于“需要世界模型以实现全保真度”的观点,认为在实践中,可以通过“随心构建”可拆解的完整项目,并利用技能和审查来引导大语言模型,就能在无需更多额外努力的情况下高效地进行平行开发,成果显著。

Rohan Paul@rohanpaul_ai · 5月26日61

nytimes: Goldman Sachs CEO David Solomon just argued that AI will automate large parts of work without making human labor obsolete. Goldman estimates AI may automate 25% of current work hours, while exposed entry-level roles have already seen a 16% relative decline. However, he says that AI cuts the time needed for a task, but markets rarely keep the same product and merely make it cheaper. They raise the standard, so an analyst who once built 1 chart now produces broader modeling, faster comparisons, sharper client work, and more follow-up. So there will be demand expansion, where automation makes each worker capable of more, and customers then expect more detail, speed, personalization, and coverage. That is why data centers can create 200,000+ construction jobs, banks may shift staff toward client-facing roles, and old jobs break apart into new mixes of judgment, review, compliance, and AI supervision. --- nytimes .com/2026/05/22/opinion/ai-job-crisis-goldman-sachs.html?smid=nytcore-ios-share

译高盛CEO David Solomon认为,AI将自动化约25%的现有工作时间,受冲击的入门级岗位已相对下降16%,但不会使人类劳动过时。其核心观点是,AI将大幅缩短任务耗时,但市场不会仅满足于更低成本的同等产品。例如,分析师过去制作1张图表,现在能完成更广范围的建模、更快速的对比和更深入的客户服务。这将引发“需求扩张”——自动化提升每位员工的能力,客户随之要求更高的细节、速度、个性化与覆盖范围。文中以数据中心建设可能创造超过20万个建筑岗位为例,说明旧岗位将解构并重组为融合判断、审核、合规与AI监督的新混合角色。

DogeDesigner@cb_doge · 5月26日28

Grok Imagine is getting crazy good. 🔥

译Grok Imagine 效果越来越惊艳了。🔥

Ethan Mollick@emollick · 5月26日56

Its very limiting that a big set of very hard problems that we have just lying around are Erdos problems. Don’t get me wrong, they are quite cool, but we really need hard problems repositories for many fields, including areas that have less specified answers & require judges. Yes, math is the easiest field in which to do verified work, but it is also an area where direct implications of increasing AI ability on everyday life are less clear. We need more types of problems (complex engineering problems, large data sets in economics, physics, biology), for people to turn AI loose on, including speciations of how to evaluate them.

译推文指出,当前用于推动AI能力发展的困难问题过于集中于数学领域(如Erdős问题)。虽然数学易于验证,但其成果对日常生活的直接影响不够明确。作者呼吁需要为包括工程、经济、物理、生物等在内的更多领域建立困难问题库,并配套制定相应的评估方法,以让AI智能体处理更复杂、答案更不明确的任务。

Rohan Paul@rohanpaul_ai · 5月26日79

Few things Anthropic’s co-founder Chris Olah told the Vatican today. - Every frontier AI lab, including Anthropic, sits inside incentives that can conflict with doing the right thing: money, frontier pressure, geopolitics, pride, and ambition. - AI is not engineered like a bridge or airplane, because models are “grown” from human language on brain-like structures, which means even their builders do not fully understand them. - He compared modern AI to “bringing a fictional character to life,” except now those characters talk to us, do work, and hold jobs. - AI could displace human labor at very large scale, while the economic gains are concentrated in a few wealthy nations with no real mechanism to share them globally. - Anthropic’s interpretability team keeps finding things inside AI models that are “mysterious” and “unsettling,” including structures that mirror human neuroscience. The most explosive claim is that researchers have found evidence of AI introspection and internal states that functionally mirror joy, satisfaction, fear, grief, and unease. - He openly admitted he does not exactly know what those internal states mean, which makes the claim more serious because it is not being sold as certainty. "I don’t know what that means, but I think it warrants ongoing discernment." - The world needs critics outside AI labs because insiders cannot fully see what their own incentives hide from them.

译Anthropic联合创始人Chris Olah在教皇Leo XIV通谕展示活动上指出:所有前沿AI实验室,包括Anthropic自身,都受到资金、竞争压力等可能与其目标相冲突的激励约束。AI模型并非传统工程造物,而是基于类脑结构从语言中“生长”而成,其内部机制连构建者也难以完全理解。他还警告,AI可能大规模取代劳动力,而经济收益可能集中于少数国家。最具冲击性的发现是,其可解释性团队在模型内部发现了与人类神经科学结构相似的“神秘”状态,证据表明模型可能存在类似内省的功能性内部状态,对应人类的快乐、恐惧等情感。Olah坦诚不知其确切含义,但认为这需要持续审视,并强调外部批评对AI实验室至关重要。

Anthropic@AnthropicAI · 5月26日64

Anthropic co-founder Chris Olah was invited to speak at today's presentation of Pope Leo XIV's encyclical "Magnifica humanitas." Read the full text of his remarks: https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

译Anthropic联合创始人Chris Olah受邀在教皇Leo XIV的通谕《Magnifica humanitas》发布会上发表演讲。 阅读他演讲的全文:https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

François Chollet@fchollet · 5月26日62

Thinking of AI as a productivity booster for prior workflows is the wrong framing. Like all of the previous waves of computerization/softwarization, AI is a tool that lets you do new things in new ways.

译将AI视为提升现有工作流效率的工具是错误的框架。就像之前的计算机化/软件化浪潮一样,AI是一种让你以新方式做新事情的工具。

Rohan Paul@rohanpaul_ai · 5月26日69

Even Jensen gets the surprise question. 😀 Reporter: Would you sell chips to Huawei?

译黄仁勋在访谈中回应了是否会向华为出售芯片的问题。他指出,对华芯片出口管制并未能阻止中国AI发展,反而因市场空白而刺激了华为等本土芯片产业的成长,使其获得了学习、规模化和出口的动力。真正的AI竞争已不仅局限于最快芯片,而是涵盖芯片、能源、基础设施、模型、应用和标准等整套“智能操作层”的竞争。长期风险在于,美国的限制可能使其技术最终被排斥在美国本想影响的体系之外。

Berryxia.AI@berryxia · 5月26日22

在Coding的过程中发现Claude的原则和底线和分明,“正义感”十足,非常有“人性”。 相反Claude不给你干的活,GPT默认就是可以干的活。 都不会吱声~,只会默默干活~

AYi@AYi_AInotes · 5月26日54

今天听到的最醍醐灌顶的一句话了, 老黄说,真正会用AI的人都是极高认知的提问者,都是带着自己的认知去提问,让它帮你叩开未知的边界,而不是让它替你思考, 也就是说,以道御术,前提是你能以术入道, 没有自己的道,再好的工具在你手里也只是一个玩具而已, 以下文章是我自己的一点道和术,跟大家共勉

译黄仁勋认为,真正会用AI的人是“极高认知的提问者”,他们带着自己的认知和问题去使用AI,以此探索未知边界,而非让AI替代自己思考。核心观点是“以道御术”,即强大的个人认知是驾驭AI工具的前提,否则再好的工具也只如“玩具”。推文作者结合自身实践,将此视为AI使用的关键心法。

AYi@AYi_AInotes · 5月26日52

最值得关注的42位宝藏AI大佬|覆盖所有核心赛道: @ylecun = 深度学习三巨头/图灵奖得主,AI界定海神针 @karpathy = LLM领域天花板,最会讲人话的技术大神 @garrytan = YC总裁,亲自写代码分享AI实践的硬核大佬 @steipete = OpenClaw构建者 @gregisenberg = 创业金点子之王 @rileybrown = 氛围代码大师 @jackfriks = 独立应用之神 @levelsio = 初创公司风向标 @marclou = 创业实战派代表 @EXM7777 = AI运维与系统专家 @eptwts = AI变现话题领头人 @godofprompt = 提示词工程天花板 @vasuman = AI智能体领域先锋 @AmirMushich = AI广告策略专家 @0xROAS = AI生成内容实战派 @egeberkina = AI图像生成领跑者 @MengTo = AI落地页设计标杆 @gregisenberg 补充的: @boringmarketer = 专攻AI营销,尤其是氛围感营销 @AmirMushich 老哥补充的值得关注的大佬: @kloss_xyz = AI工作流与洞见 @gizakdag = 美学/设计女王 @mattworkman = 最佳AI教程作者 @jameygannon = 品牌与创意方向 @yulikay = 公开构建记录者 @youraipulse = 免费AI工具分享 @IamEmily2050 = 系统提示与解析 @sflorimm = Web与移动应用开发 @liu8in = 自动化动态图形与视频制作 @LexnLin = 创意极客代表 我再补充一批宝藏大佬,覆盖更多核心赛道: @simonw = 独立开发者天花板,LLM工具与教程第一人 @rileytomasek = AutoGPT/Open Interpreter作者,Agent领域开山鼻祖 @alexgraveley = Cursor创始人,AI编程革命的引领者,最近送我 1 万美刀额度最帅的男人 @chuan_en = 字节前大模型负责人,输出最硬核的LLM实战干货 @mckaywrigley = AI产品变现导师,分享最可复制的赚钱方法 @linuslee0216 = Notion AI/Cursor核心成员,AI产品思考第一人 @shl = 硅谷最懂AI的产品人,输出最犀利的行业洞察 @drjimfan = 英伟达首席科学家,AI机器人与多模态权威 @lilianweng = OpenAI资深研究员,大模型安全与对齐专家 @yannickilcher = 全球最好的AI论文解读者 @emollick = AI商业落地最接地气的实战专家 @tomcruise_ai = AI视频生成先驱,Sora最佳实践分享者 @nickfloats = 动态设计与AI视频结合的天花板 @danielgross = Apple AI前负责人,AI创意与工具投资第一人 其中有15个名单来自@vivoplt ,认同但我觉得还不够全,特此来一版最强名单, 还有哪些宝藏大佬我漏了?欢迎在评论区补充👇

译本推文汇总了 42 位在深度学习、大语言模型(LLM)、AI 编程、视频生成等核心赛道上备受关注的知名人士。名单整合了多位业界人士的推荐,既包括图灵奖得主 @ylecun、LLM 专家 @karpathy、Cursor 创始人 @alexgraveley、英伟达首席科学家 @drjimfan、OpenAI 资深研究员 @lilianweng 等行业标杆,也补充了如 @simonw(LLM 工具)、@chuan_en(大模型实战)等实战派人物。推文旨在为读者提供一份全面的行业关注列表,并邀请更多补充。

宝玉@dotey · 5月25日57

去做一个 Agent Harness 这种事情价值不大了,怎么做也做不过模型公司,模型一升级好多活都白干了。 但是基于成熟的 Agent Harness 去做方案,大有可为。 MCP 只是解决了连接的问题,Skills 只是解决了领域知识的问题。 垂直领域还有很多事需要解决: - 为老的工作流针对 Agent 去重新设计 AI Native 的 Agent 工作流 - 在 Human In Loop 的部分,重新设计 UI、UX 交互 - 垂直领域的高质量数据整理 - 等等 这些事情是模型公司做不到的,也需要去共建的。 Agent 是未来的操作系统,几家模型公司提供模型和 Harness,其他人基于上面构建应用。

译文章指出,开发通用 Agent Harness 价值有限,但基于成熟的 Harness 进行垂直领域方案构建大有可为。目前,MCP 和 Skills 分别解决了连接和领域知识问题,但垂直领域还需重新设计 AI Native 工作流、优化人机交互 UI/UX 以及整理高质量数据等,这些是模型公司无法独立完成、需共建的环节。未来,Agent 将成为由少数模型公司提供基础模型与 Harness,更多应用在垂直层构建的操作系统。

Chubby♨️@kimmonismus · 5月25日47

Forget Claude Code. Christ Claude it is. Joke aside: In this regard, the benefit for Anthropic is virtually incalculable in monetary terms - and I mean that quite literally. The Catholic Church has 1.4 billion members worldwide. The fact that its Supreme Head has personally thanked Anthropic for their excellent collaboration generates countless new customers. It is the best form of external publicity imaginable, essentially endorsed by His Holiness himself. I believe this is something that many people simply do not grasp.

译推文指出,天主教皇亲自感谢Anthropic在合作中的出色表现。考虑到天主教在全球拥有约14亿信徒,这一事件被视为Anthropic获得的、价值无可估量的外部宣传。引用观点补充称,这相当于Anthropic获得了“天主教会和神的支持”。作者强调,这是教皇本人的认可所带来的最好宣传形式,而许多人并未真正理解其意义。

凡人小北@frxiaobei · 5月25日49

服务器上装个 claude code/codex,里面搞几个 skill。 上层再包 claude /codex 写的 web 应用,99.9% 的公司的 AI 服务就可以上线了。

译原文认为,在服务器部署 Claude Code 或 Codex 配置若干技能,再包装成由它们开发的 Web 应用,此方案足以满足绝大多数企业的 AI 服务上线需求。这一观点与“垂类 Agent 已无太多可为”的看法一致,强调了基础模型与编码工具的结合已足够构建商业解决方案。

AYi@AYi_AInotes · 5月25日59

Damn! Google DeepMind CEO Demis直接把AGI的门槛从Erdős抬到了拉马努金水平! 这波goalpost moving我愿称之为人类最后的防线🤯 具体大家看中文字幕版吧👇 #AGI #AI #OpenAI

译天啊! Google DeepMind CEO Demis直接把AGI的门槛从Erdős水平提升到了拉马努金水平! 这波目标线移动我愿称之为人类最后的防线🤯 具体内容请看中文字幕版👇 #AGI #AI #OpenAI [引用 @AYi_AInotes]:http://x.com/i/article/2058381329318682624

AYi@AYi_AInotes · 5月25日50

兄弟们吃瓜的同时记得学习呀, 主线任务不能丢不能丢! 再分享一个AI自动化的案例, 这个老哥用Claude+MCP+N8N搭了个全自动晨间研究 Agent, 然后每天醒来Obsidian里已经躺着一份5分钟晨报, 每天45分钟刷信息的时间砍到了5分钟, 这个大家感兴趣的话, 我验证跑通了出个教程, 反正curcor送的10000$额度用不完哈哈哈哈 #AI #Claude #MCP #N8N #效率

译有开发者利用 Claude、MCP 与 N8N 构建了一个全自动晨间研究智能体。该智能体每日自动运行,将产出的 5 分钟晨报直接存入 Obsidian 笔记库,从而将用户原本需要 45 分钟的每日信息筛选时间压缩至 5 分钟,节省了 87% 的时间。发布者表示,如果感兴趣可以制作教程,并顺便提到 Cursor 提供的 $10,000 额度还远未用完。

Chubby♨️@kimmonismus · 5月25日16

Hold on, so Anthropic now has the cathloic church and god on their side as well? I thought Andrej Karpathy was already the highlight.

译等等,所以Anthropic现在还有天主教会和上帝站在他们那边了?我以为Andrej Karpathy已经是最大亮点了。

Rohan Paul@rohanpaul_ai · 5月25日67

"There is a "real possibility that AI will displace human labor at a very large scale.... We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don't know what that means, but I think it warrants ongoing discernment." ~ Anthropic co-founder Christopher Olah At Vatican event (Pope Leo XIV's presentation held today in the Synod Hall). ---- From "Associated Press" YouTube channel, (link in comment)

译“AI大规模取代人类劳动力是‘真实的可能性’……我们发现了在功能上反映喜悦、满足、恐惧、悲伤和不安的内部状态。我不知道这意味着什么,但我认为这值得持续审视。” ~ Anthropic联合创始人Christopher Olah 在梵蒂冈活动中(教皇利奥十四世今日在主教会议厅的演讲)。 ---- 来自“美联社”YouTube频道,(链接在评论区)

Chubby♨️@kimmonismus · 5月25日64

Anthropic co-founder Dario Amodei has been saying this for over a year now. And he keeps saying it. Louder each time. In May 2025, he told Axios that AI could eliminate 50% of all entry-level white-collar jobs within five years and push unemployment to 10-20%. In January 2026, he published a 20,000-word essay calling AI “a general labor substitute for humans” that will cause “unusually painful” disruption. At Davos, he warned of a “zeroth world country” forming in Silicon Valley, decoupled from the rest of society, running at 50% GDP growth while everyone else faces mass joblessness. In his own words: “We, as the producers of this technology, have a duty and an obligation to be honest about what is coming.” And the data is starting to back him up. Tech entry-level hiring dropped 30-50% in 2025. Wall Street banks are cutting ~200,000 roles concentrated at the junior level. S&P 500 companies shed employees in net terms for the first time since 2016. Anthropic’s own labor market research confirmed that 77% of businesses use Claude to automate tasks, not to augment workers. Now another Anthropic co-founder is echoing the same message: “There is a real possibility that AI will displace human labor at a very large scale. Supporting those people will be a moral imperative of historic proportions.” This is no longer a warning from the sidelines. This is the company building the technology telling you, repeatedly, that the disruption is real, it’s fast, and society is not ready for it. https://x.com/disclosetv/status/2058859889619763654/video/1

译Anthropic联合创始人Dario Amodei持续警告AI对就业的冲击。他曾在2025年预测,AI可能在五年内消除50%的入门级白领工作,将失业率推高至10-20%。他后来称AI是“通用劳动替代品”,将造成“异常痛苦”的颠覆,并在达沃斯警告可能出现与社会脱节、GDP增长50%的“零世界国家”。当前数据显示趋势印证其警告:2025年科技业入门级招聘下降30-50%,华尔街银行裁减约20万个初级岗位。Anthropic自己的研究也确认,77%的企业使用Claude是为了自动化任务,而非增强员工。另一位Anthropic联合创始人也呼应,称AI大规模替代人类劳动的可能性真实存在。

Rohan Paul@rohanpaul_ai · 5月25日64

Jensen Huang explains how blocking China from Nvidia does not mean blocking China from AI. The usual export-control story assumes scarcity: deny the best chips, and the rival falls behind. China is no longer merely waiting at the door of American compute. Huawei’s rise is showing how a sanction is turning into an industrial stimulus: absence creates a market, and a market teaches domestic suppliers how to harden, scale, and export. That does not mean that the gap with Nvidia chips has vanished. It means the real contest is no longer just about who owns the fastest accelerator, but who sets the operating layer for intelligence: chips, energy, infrastructure, models, applications, and the standards others build upon. The mistake is to treat chip policy as a valve that can simply open or close. Every restriction slows one flow but strengthens another, and the long-term danger may be a world where American technology is absent from the very systems America wants to influence. ---- From "Fox Business" YouTube channel, (link in comment)

译黄仁勋指出,美国对华芯片出口管制非但无法阻碍中国AI发展,反而可能成为产业自主的催化剂。制裁导致的市场空缺正推动华为等国内供应商成长。当前竞争已从比拼最快加速器,转向比拼定义智能操作层的能力,涵盖芯片、能源、模型和标准。推文补充了华为的最新动向:为应对制裁,华为提出“Tau Scaling Law”新设计方法,旨在通过LogicFolding等技术缩短信号延迟,在不依赖最先进光刻机的前提下实现1.4nm级密度。华为声称已量产381款芯片,并计划2031年达成该目标,其路径被命名为“何氏定律”。

Berryxia.AI@berryxia · 5月25日60

中国这样的企业其实在AI时代会越来越多! Unitree 只是先锋而已~ 一个中国机器人公司,面对全球巨头都在卷“人形机器人秀肌肉”的时候,没有选择最吸睛的路线,只闷头做了一款能真正干活的家伙。 他们把Unitree WVLA 2.0扔进一个真实会议室,桌子上一片狼藉:水瓶、纸张、杂物、咖啡杯…… 然后让它单次拍摄、全程自主、多任务清理,强外部干扰下全程没有掉链子。 这个视频一出,全球机器人圈直接炸了。 这就是Unitree WVLA 2.0的会议室乱局清理测试。 故事就这么简单,却硬核到离谱。 过去几年,机器人圈最爱拍的就是“实验室完美环境”里的花式表演:跳舞、后空翻、端盘子。 可一旦放到真实办公室——椅子乱放、人走来走去、桌子永远收拾不干净——99%的演示机器人瞬间原地傻掉。 Unitree这次直接反其道而行。 他们把WVLA 2.0扔进一个完全没布置过的真实会议室,桌上乱成一锅粥,外部还有人走动、东西晃动、意外干扰。 结果:机器人全程自主决策——识别垃圾、分类处理、擦桌子、摆放物品…… 一气呵成,没有任何剪辑,没有人工遥控,没有“实验室魔法”。 最狠的是单次拍摄这个细节:意味着整个流程没有重置、没有失败重来、没有后期修补。它在真实物理世界里一次性把活干完。 这不是又一个“看起来很厉害”的演示视频,这是机器人从实验室走向真实世界的铁证。 Unitree本来就是以高性能民用四足机器人起家(G1、H1系列早已全球出圈),这次WVLA 2.0明显是他们向“实用场景机器人”迈出的关键一步,轮腿混合? 机械臂+移动平台?不管架构如何,核心是:它真的能把“清理乱局”这个最烦人的日常任务干好。 而这背后,是国产机器人企业在被卡脖子、被技术封锁的背景下,用真实工程能力硬刚的又一次证明。 你今晚就可以感受到这个差距。 直接去Unitree官方账号看完整视频(单次拍摄,全程无剪辑),你会发现:水瓶晃动、杂物堆叠、人类干扰……它全扛住了。 这不是实验室玩具,这是未来办公室/家庭清洁机器人的真实雏形。 Big Tech和西方巨头还在卷“最像人”的机器人秀,Unitree却在用“最能干活”的机器人一步步把实用场景攻下来。 而你,现在已经知道了。

译宇树科技(Unitree)发布其WVLA 2.0模型在真实会议室进行的乱局清理测试视频。该测试为单次拍摄、全程无剪辑,机器人需在桌椅杂乱、物品随意摆放、且有人走动等强外部干扰下,全程自主完成识别、分类、清理和摆放等多任务。测试旨在展示机器人从实验室走向复杂现实世界的能力,与行业中常见的“实验室完美环境”演示形成对比。

Rohan Paul@rohanpaul_ai · 5月25日67

🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap with TSMC and Intel without relying only on smaller transistors, by making chip signals travel less distance. They want 1.4nm-class density without owning the world’s best lithography tools i.e. they are trying to replace Moore’s Law with Tau Scaling Law. To note, Huawei has been blocked from normal access to TSMC since the US tightened foreign direct product rules around Huawei in 2020, and TSMC later said it had not supplied Huawei since mid-September 2020. Proposed τ Scaling as a new way to make chips faster when shrinking transistors is no longer delivering the same gains. Said its next Kirin phone chip will be the first full test of Tau Scaling Law, Old chip progress mostly came from making every transistor smaller, but Huawei’s idea shifts the target from smaller geometry to shorter signal delay, meaning less time wasted while electrical signals crawl through wires, gates, memory paths, and system links. LogicFolding attacks the circuit layout itself by folding logic blocks closer together, shortening critical wires, reducing resistance and parasitic capacitance, and letting signals switch faster with denser placement. So LogicFolding is the circuit-level piece: it tries to place related logic closer together, shorten key wires, cut electrical drag from resistance and parasitic capacitance, and raise performance without needing a full manufacturing-node leap. Huawei is also pushing the same timing idea across the full stack: transistors, circuits, chip architecture, software scheduling, and system interconnects all get tuned to reduce τ, the delay constant that limits speed and efficiency. The bold claim is that Huawei has already mass-produced 381 chips using this thinking, and future high-end chips could reach density comparable to 14Å, or 1.4nm, without relying only on classic process shrinkage. Says this path could reach 1.4nm-class, or 14Å-class, density by 2031, while TSMC and Intel target similar physical nodes around 2029. Huawei calls it Her’s Law, after He Tingbo, the chip leader who helped turn HiSilicon into Huawei’s survival engine after US export controls. --- huawei. com/en/news/2026/5/ieee-iscas-tau-scaling

译华为提出τ缩放定律,旨在不依赖更先进制程的情况下,通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片,并计划于2031年实现等效1.4nm(14Å)密度,该定律以海思负责人何庭波命名。同样,华为在存储领域也展示了类似的“侧向创新”路径,其通过改变封装方式(Die-on-Board)而非追求最先进的NAND层数,推出了容量达122.88TB的AI SSD。

Rohan Paul@rohanpaul_ai · 5月25日32

AI wins when reality has been translated for it.

译当现实被为AI翻译后,AI便能取胜。

Greg Brockman@gdb · 5月25日63

GPT-5.5 Pro for fact checking:

译GPT-5.5 Pro 用于事实核查: GPT-5.5 Pro 是一个非常可靠的事实核查工具。我可以把整章内容扔给它,它能准确找出每一个关键引用。唯一真正让人烦恼的是它喜欢抠细节,所以会返回很多“大体意思是对的,但你没有考虑到微小细节 X”这样的反馈。

ginobefun@hongming731 · 5月25日64

很多人谈 AI Agent,容易停留在一个很热闹的想象里:让 AI 自己发现需求、写代码、测试、上线,然后自动进入下一轮。 高德这篇文章真正有价值的地方,是它没有停留在想象,而是把这个过程拆成了一套可运行、可监控、可复盘的工程系统。 文章讲的是高德地图 PC 站在 SEO 增长场景下的一次实践:他们尝试用 Harness Engineering 的方式,让多个 AI Agent 协作完成从增长机会发现、方案设计、PRD 编写、架构设计、代码实现、测试验证到日常环境发布的完整流程。前期以「路书」功能做验证,从输入提案到发布日常环境,全程 0 人为介入,连续运行 4 小时,最终实现主流程无 P0 Bug。 但这篇文章最值得看的,不是「AI 又能自动开发了」,而是它展示了一个更本质的问题:当 AI 已经具备较强的生成能力之后,真正的难点变成了如何管理它、约束它、评估它,以及让它在长期任务中稳定工作。 文章里有几个很重要的实践。 第一,把长任务做成 workflow 和状态机。每个子 Agent 都要经历 DISPATCHED、ACKED、RUNNING、SUCCEEDED 或 FAILED,并通过心跳、超时、重试和失败处理来保证链路可控。这意味着系统不再是简单地「给 AI 一个任务」,而是像管理一组不稳定但能力很强的虚拟员工。 第二,用文件化 memory 管理产物。PRD、设计、架构、评审报告、运行日志、决策记录都被明确落盘。上游产物自动成为下游输入,过程可追溯,失败也能定位。这一点非常关键,因为长链路 Agent 最怕隐式上下文污染,明确产物比让 AI 记住一切更可靠。 第三,生成和评审彻底分离。Builder 写代码,Evaluator 只评审,不改代码。Builder 说测试通过了,Evaluator 要自己跑一遍。Builder 说服务启动了,Evaluator 要自己验证。文章里这个「零信任」原则很有启发:没被独立验证过的声明,一律当作不存在。 第四,Evaluator 本身也要被评估。文章把评审能力做成 Benchmark,用植入 bug 的代码、完整项目、标准答案来测试 Evaluator 是否能准确发现问题,是否误报,是否漏检,是否能判断严重等级。三轮优化后,均分从 64.5 提升到 83.4,精确匹配率从 25% 提升到 78%。这说明 Agent 能力提升不能只靠感觉调 prompt,而要靠数据闭环。 第五,快速失败优先。比如环境变量都没配置好,就不应该继续跑完整 E2E 测试。先做低成本、确定性强的检查,再进入高成本验证,能显著节省 token、计算资源和调试时间。 我最喜欢这篇文章的一点,是它对「完全无人干预」的理解很克制。文章没有把无人化描述成一个 0 或 1 的目标,而是强调现阶段更有价值的是降低人工介入的频率和成本,让一个人可以同时监护几十个并行任务,只在关键节点介入。 这对独立开发者和一人公司尤其有启发。AI Agent 的价值不只是替你完成某个任务,而是让你重新设计工作流:哪些环节可以标准化,哪些判断需要门禁,哪些产物必须沉淀,哪些错误可以自动重试,哪些节点必须保留人工确认。 读完这篇文章,我最大的感受是:未来真正有竞争力的 AI 产品,不只是调用了更强的模型,而是围绕模型搭建了更可靠的系统。模型负责生成,系统负责约束;模型提供能力,流程提供稳定性;模型放大产能,人负责定义标准和方向。

译高德地图在SEO增长场景的实践表明,当前AI智能体的核心挑战是如何管理与约束其生成能力。文章展示了将“从机会发现到发布”的长任务编排为可监控的带状态机工作流;使用文件化Memory管理所有产物以保证可追溯性;并贯彻“生成”与“评审”分离的“零信任”原则,评审方需独立验证所有声明。此外,他们对评审Agent本身进行Benchmark评估并多轮优化,以数据驱动其能力提升。该系统在“路书”功能验证中实现了全程无人介入、连续运行且主流程无Bug,印证了未来AI产品的竞争力在于构建围绕模型的可靠系统。

向阳乔木@vista8 · 5月25日23

自从ChatGPT里可以调用远程电脑的codex,合上笔记本也能用时。 连mac mini的价值也在降低,不过多一台不关机的电脑。 钓鱼间隙可以让codex控制Suno生成音乐传到自己的网站播放

meng shao@shao__meng · 5月25日51

昨天看到很多朋友在讨论「Claude Code橙皮书:从入门到精通」这本书 我自己认为,学习 AI 知识,除了很底层的原理和短期不会变化的固定知识可能适合通过书来学习。 Claude Code、Codex、Agent 框架和工程、Prompt Engineering、Context Engineering、Harness Engineering 等等概念和知识恨不得每周都在更新,通过书来学习,太不现实了。 作者的书还在编写大纲,知识就已经更新了,等你把书竖出版了,知识都过期了。 当然也不排除现在很多作者也在用 AI 来写书,这种写法,审查难度不低于大型代码仓库的 Code Review,何况。。你也很难保证这位作者,本身有审查能力,或者说,AI 写出来的书,他自己能看懂吗?我不知道! 下面两张图,仅仅是我很好奇,为啥国内的书籍,这么爱用什么白皮书、蓝皮书、橙皮书,真的不太懂分别都是什么意思,能不能随便用,让 GPT-5.5 和 Claude Opus 4.7 分别解释了一下,大家看看。

译推文质疑用书学习AI知识的可行性,指出Claude Code、Agent框架等知识更新极快,书易过时。同时质疑AI写书的质量,认为审查难度高。此外,作者对国内书籍常使用“白皮书”“蓝皮书”“橙皮书”等命名方式表示好奇。

meng shao@shao__meng · 5月25日66

有了 AI Agent,工程师不需要花太多时间思考代码了吗? 当然不是!!! @leerob 认为:AI 不会降低对"理解系统"的要求,反而会提高。工程师的核心价值从"会写"转向"会判断",而判断力来自对系统和基础原理的深入理解。 # Lee 列举了几个证明在 AI Agent 时代,工程师依然不能被取代的原因。 1. 责任的不可转移性 代码上了生产环境,on-call 的是人,不是 AI。一旦出事故,需要在凌晨三点理解系统、定位问题、做出判断的,仍然是工程师。如果你不理解自己负责的系统,调试时会非常痛苦——这是一个无法绕开的物理约束。 2. AI 的合理定位:加速器,而非决策者 Lee 并不反 AI。他承认 AI 能: · 让 agent 去 triage 生产日志 · 自动检查错误 · 加速调查过程中的机械环节 但最终的判断(the call)必须由工程师做出——因为一个改动可能牵涉客户损失或财务后果,这种责任 AI 承担不了。 3. 由此推导出的行业趋势 Lee 预测(其实已经在发生)四个方向: · 裁剪依赖 — 少引入第三方包 · Vendoring 代码 — 把依赖代码直接拷进自己仓库,方便修改和掌控 · 偏好简单系统 — 减少抽象层 · 把时间投入系统设计和代码维护 — 而不是疯狂产出新代码 这四点的共同主线是:追求"可理解性"和"可控性"。AI 让写代码变便宜了,所以瓶颈转移到了"理解和维护"上。 4. 反直觉的建议:回归 CS 基础 正因为生成代码的成本趋近于零,判断力和第一性原理反而成为稀缺资源。算法、操作系统、网络、分布式系统这些"老东西"——以及软件工程历史上沉淀下来的优秀范式——会比以前更值钱,而不是更便宜。 # 深层逻辑上过去和现在的变化 稀缺资源:写代码的速度 -> 理解系统的深度 工程师价值:产出代码量 -> 做正确决策的能力 风险所在:写得不够快 -> 写了一堆看不懂的代码 技术选型偏好:大而全的框架 -> 小而可控的代码

译本文反驳了“有了AI智能体,工程师无需深度思考代码”的观点。核心论点是:AI不会降低对“理解系统”的要求,反而会提升工程师的核心价值。这主要源于责任不可转移——生产环境事故需由工程师负责,AI无法承担决策后果。AI被定位为加速日志分析等环节的加速器,但最终决策仍需由人做出。由此推导的行业趋势是:工程师应更注重系统的可理解性与可控性,如减少依赖、偏好简单系统,并将时间投入系统设计与维护。最终,行业稀缺资源正从“写代码速度”转向“对系统理解的深度”,计算机基础与判断力将更加重要。

Berryxia.AI@berryxia · 5月25日65

大牛还是有2把刷子的,1年前的语言正在逐渐应验! 最近我听了 Lenny Rachitsky 和 Every CEO Dan Shipper 的新播客。 一年前 Dan 就预测 Claude Code 会火起来,当时很多人觉得他在吹。 结果这一年过去,他几乎全说中了。 Dan 团队可能是科技圈里 AI 用得最深的一批人,每天都在把这些工具真正跑通。 这次他又分享了对明年的看法。 他说自动化其实是个谎言。 CLI 时代已经过去了。 大家喊的 SaaS 大崩盘,也没那么回事。 他的判断很清楚: 每家公司 Slack 里很快就会有一个超级代理。 Claude Code 和 Codex 会成为知识工作的新操作系统。 AI 不会带来就业大危机。 产品经理和设计师反而会迎来更好的时代。 我们会读到大量 AI 生成的内容,而且很多人会喜欢。 他甚至直接说,现在是买入 SaaS 股票的好时机。 这些观点和外面那些末日论完全相反。 真正重度用 AI 的人,看到的不是威胁,而是工具在把同样的人力放大成指数级产出。

译Lenny Rachitsky与Every CEO Dan Shipper回顾了后者一年前对AI发展的预测。Dan及其团队因深度使用AI工具而具有独特视角。在播客中,他重申了几个核心观点:自动化是谎言,CLI时代已过,SaaS崩盘论不成立。具体预测包括:每家公司Slack中将出现“超级代理”;Claude Code和Codex会成为知识工作的新操作系统;AI不会引发就业危机;产品经理和设计师将受益;人们将阅读并喜爱更多AI生成的内容;目前是买入SaaS股票的好时机。这些基于一线实践的判断与外界的末日论截然相反。

Rohan Paul@rohanpaul_ai · 5月25日47

Chamath on all important “prefill” and “decode.” in AI compute. Prefill is compute-bound; massive parallel GPUs win, so Nvidia dominates as context grows. Decode is memory-bandwidth bound as each next token depends on scanning what’s already generated

译Chamath谈AI计算中至关重要的“预填充”和“解码”。 预填充是计算密集型;大规模并行GPU胜出,因此随着上下文增长,Nvidia占据主导。 解码是内存带宽密集型,因为每个下一个token都依赖于扫描已生成的内容。

Ethan Mollick@emollick · 5月25日52

As more people come to recognize the tells of AI, which mostly happens as you start to work with AI a lot, the scales are going to fall from their eyes and they are going to realize what some of us already see: how much of this site (and blog posts, articles, papers) are AI now.

译随着越来越多人开始识别AI的痕迹——这主要发生在你频繁使用AI之后——他们将恍然大悟,意识到我们中一些人早已看清的事实:这个网站(以及博客文章、论文)中有多少内容现在是AI生成的。

Rohan Paul@rohanpaul_ai · 5月25日54

“I do see more and more mass-produced mathematics at scale." ~ Terry Tao AI makes this scalable. Will turns proof-writing into search problem: it generates 1000s of mini-lemmas from a goal, then cheap checkers kill most and keep the few that works

译“我确实看到越来越多大规模批量生产的数学。” ~ Terry Tao AI让这变得可扩展。Will将证明写作转化为搜索问题:它从一个目标生成数千个迷你引理,然后廉价的检查器淘汰大部分,只保留少数有效的。

Rohan Paul@rohanpaul_ai · 5月25日64

Ali Ghodsi, the cofounder and CEO of Databricks, says Zoom has a massive chance to build an AI-first product, that could seriously disrupt the traditional enterprise SAAS. Because it sits on the largest datasets of meeting videos and transcripts. The big pain in enterprise software is data entry and coordination. Zoom already sits on the raw input: every customer call and internal meeting, plus the video, audio, and transcript. If Zoom can reliably pull out decisions, context, and action items, then write them back into the right system of record automatically, as an AI-first workflow layer, it becomes the front door for work. That would replace lots of separate SAAS tools that exist mainly to collect notes and updates. --- Video from 'Bg2 Pod' YT channel (link in comment)

译Databricks联合创始人兼CEO Ali Ghodsi认为,Zoom拥有会议视频和转录的最大数据集,有机会构建AI优先的产品,可能颠覆传统企业SaaS。企业软件的痛点是数据输入和协调,Zoom已掌握原始输入,包括客户通话和内部会议的视频、音频及转录。如果Zoom能可靠提取决策、上下文和行动项,并自动写入相应记录系统,作为AI优先的工作流层,将成为工作入口,取代许多主要收集笔记和更新的独立SaaS工具。

Emad@EMostaque · 5月25日34

ngl I thought this was them talking about no researchers under 18 There are some darn good ai researchers in that age bracket

译说实话,我原以为他们是在讨论不接受18岁以下的研究员。 那个年龄段确实有一些非常优秀的AI研究员。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月26日
15:18
AYi@AYi_AInotes
37
AI工具使用断舍离:没用过的提示词和工具真实价值为零

推文提出一个关于AI提示词与工具使用的核心观点:任何提示词或工具,如果使用次数少于3次,其真实价值即为0,不应保留并为此产生收藏焦虑。作者认为,提示词工程是AI使用的永不过时的基本功,关键在于工具与自身工作流的实际匹配度,而非完整性收藏。文中提及了相关讨论作为背景上下文,强调了避免无用收藏、专注于高频实用工具的实用主义态度。

AYi: http://x.com/i/article/2058381329318682624

大佬观点
12:57
宝玉@dotey
57
Agent 应用和传统 App + AI 的最大差别,在于执行的主体不同。

文章核心指出,传统App+AI是人操作应用,AI辅助;而Agent应用是人指挥AI智能体自主操作应用或命令行。文中以微软Copilot(早期版本仅能回答问题)与Codex(能自主完成PPT制作修改)为例说明此差异。针对“在Agent上构建垂直应用是否等同于传统App+AI”的疑问,作者澄清,只要执行主体是AI智能体,即为以AI为主的应用。

Tiga: @dotey 其实我一直有个好奇点:在 agent 上构建应用其实就是特定赛道垂直应用,那这个应用岂不就是现在的传统 app+ai 了,那它还能是个 AI 为主的吗?

智能体大佬观点现象/趋势
09:28
François Chollet@fchollet
28
创造力源于约束的滋养
大佬观点
09:10
Orange AI@oran_ge
52
早晨听到两个播客都提到,现在他们让 AI 自己提需求,自己开发,自己测试,自己上线了 人算是彻底解放了 我在想,这东西做出来可能是只能给 AI 用了
智能体大佬观点现象/趋势
08:53
meng shao@shao__meng
63
poteto的Cursor实践:验证是自动化的核心瓶颈

原重度Claude Code用户poteto转向Cursor,基于多模型协同更自然、上下文压缩速度更快、GUI更利于agentic coding等观察。她认为AI智能体像“失忆且智商不在线但可教的新员工”,其失败模式是教学机会。关键洞察是验证才是瓶颈,盲目并行多个智能体只是在加速生产低质量代码。她开源了技能集pstack,其核心元技能/poteto-mode可根据任务自动选择工作流,旨在封装工程严谨度以提升对智能体的信任。最终论点是:自动化边界取决于对智能体端到端处理能力(尤其是验证环节)的信任程度。

lauren: http://x.com/i/article/2057201109002059776

智能体GitHub大佬观点编码
07:40
Orange AI@oran_ge
61
AI 让软件开发的第一版变得极其容易 但是真正难的是后面的100个版本 而且越到后面越难怎么回事…. 软件工程依然有很多事情要做
大佬观点现象/趋势编码
06:48
swyx@swyx
51
作者认为AI开发中的厂商锁定概念并不牢固

推文指出,AI开发中的“厂商锁定”概念并不牢固。作者因不满首个选择的错误信息,在不到30分钟内就完全迁移了一个全栈AI应用,该应用包含流式、队列、竞技模式及媒体生成等语义。作者引用并回应了realGeorgeHotz关于“需要世界模型以实现全保真度”的观点,认为在实践中,可以通过“随心构建”可拆解的完整项目,并利用技能和审查来引导大语言模型,就能在无需更多额外努力的情况下高效地进行平行开发,成果显著。

智能体大佬观点编码
06:28
Rohan Paul@rohanpaul_ai
61
高盛CEO:AI将重塑工作而非使其过时

高盛CEO David Solomon认为,AI将自动化约25%的现有工作时间,受冲击的入门级岗位已相对下降16%,但不会使人类劳动过时。其核心观点是,AI将大幅缩短任务耗时,但市场不会仅满足于更低成本的同等产品。例如,分析师过去制作1张图表,现在能完成更广范围的建模、更快速的对比和更深入的客户服务。这将引发“需求扩张”——自动化提升每位员工的能力,客户随之要求更高的细节、速度、个性化与覆盖范围。文中以数据中心建设可能创造超过20万个建筑岗位为例,说明旧岗位将解构并重组为融合判断、审核、合规与AI监督的新混合角色。

大佬观点现象/趋势
05:10
DogeDesigner@cb_doge
28
Grok Imagine 效果越来越惊艳了。🔥
图像生成大佬观点
04:54
Ethan Mollick@emollick
56
AI评估挑战:数学问题单一,亟需多样化难题库

推文指出,当前用于推动AI能力发展的困难问题过于集中于数学领域(如Erdős问题)。虽然数学易于验证,但其成果对日常生活的直接影响不够明确。作者呼吁需要为包括工程、经济、物理、生物等在内的更多领域建立困难问题库,并配套制定相应的评估方法,以让AI智能体处理更复杂、答案更不明确的任务。

大佬观点数据/训练评测/基准
03:28
Rohan Paul@rohanpaul_ai
79
Anthropic联合创始人Chris Olah在教皇Leo XIV《Magnifica humanitas》通谕展示活动上的核心观点

Anthropic联合创始人Chris Olah在教皇Leo XIV通谕展示活动上指出:所有前沿AI实验室,包括Anthropic自身,都受到资金、竞争压力等可能与其目标相冲突的激励约束。AI模型并非传统工程造物,而是基于类脑结构从语言中“生长”而成,其内部机制连构建者也难以完全理解。他还警告,AI可能大规模取代劳动力,而经济收益可能集中于少数国家。最具冲击性的发现是,其可解释性团队在模型内部发现了与人类神经科学结构相似的“神秘”状态,证据表明模型可能存在类似内省的功能性内部状态,对应人类的快乐、恐惧等情感。Olah坦诚不知其确切含义,但认为这需要持续审视,并强调外部批评对AI实验室至关重要。

Anthropic: Anthropic co-founder Chris Olah was invited to speak at today's presentation of Pope Leo XIV's encyclical "Magnifica hum...

Anthropic大佬观点安全/对齐现象/趋势
关联讨论 4 条Anthropic:Newsroom(网页)TechCrunch:AI(RSS)The Verge:AI(RSS)X:Rohan Paul (@rohanpaul_ai)
03:10
Anthropic@AnthropicAI
64
Anthropic联合创始人Chris Olah受邀在教皇Leo XIV的通谕《Magnifica humanitas》发布会上发表演讲。 阅读他演讲的全文:https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
Anthropic大佬观点安全/对齐
关联讨论 4 条Anthropic:Newsroom(网页)TechCrunch:AI(RSS)The Verge:AI(RSS)X:Rohan Paul (@rohanpaul_ai)
02:58
François Chollet@fchollet
62
将AI视为提升现有工作流效率的工具是错误的框架。就像之前的计算机化/软件化浪潮一样,AI是一种让你以新方式做新事情的工具。

Computers and Society Papers: Cognitive offloading and the speedup illusion in human-AI interaction Sunny Yu, Myra Cheng, Ahmad Jabbar, Ilia Sucholuts...

大佬观点现象/趋势
02:28
Rohan Paul@rohanpaul_ai
69
黄仁勋在访谈中回应了是否会向华为出售芯片的问题。他指出,对华芯片出口管制并未能阻止中国AI发展,反而因市场空白而刺激了华为等本土芯片产业的成长,使其获得了学习、规模化和出口的动力。真正的AI竞争已不仅局限于最快芯片,而是涵盖芯片、能源、基础设施、模型、应用和标准等整套"智能操作层"的竞争。长期风险在于,美国的限制可能使其技术最终被排斥在美国本想影响的体系之外。

Rohan Paul: Jensen Huang explains how blocking China from Nvidia does not mean blocking China from AI. The usual export-control stor...

大佬观点部署/工程
01:20
Berryxia.AI@berryxia
22
在Coding的过程中发现Claude的原则和底线和分明,"正义感"十足,非常有"人性"。 相反Claude不给你干的活,GPT默认就是可以干的活。 都不会吱声~,只会默默干活~
AnthropicOpenAI大佬观点编码
01:18
AYi@AYi_AInotes
54
黄仁勋谈AI使用之道:以认知驾驭,而非被替代

黄仁勋认为,真正会用AI的人是“极高认知的提问者”,他们带着自己的认知和问题去使用AI,以此探索未知边界,而非让AI替代自己思考。核心观点是“以道御术”,即强大的个人认知是驾驭AI工具的前提,否则再好的工具也只如“玩具”。推文作者结合自身实践,将此视为AI使用的关键心法。

AYi: http://x.com/i/article/2058381329318682624

大佬观点现象/趋势
00:18
AYi@AYi_AInotes
52
AI 行业顶级人物图鉴:你不可错过的 42 位宝藏大佬

本推文汇总了 42 位在深度学习、大语言模型(LLM)、AI 编程、视频生成等核心赛道上备受关注的知名人士。名单整合了多位业界人士的推荐,既包括图灵奖得主 @ylecun、LLM 专家 @karpathy、Cursor 创始人 @alexgraveley、英伟达首席科学家 @drjimfan、OpenAI 资深研究员 @lilianweng 等行业标杆,也补充了如 @simonw(LLM 工具)、@chuan_en(大模型实战)等实战派人物。推文旨在为读者提供一份全面的行业关注列表,并邀请更多补充。

AYi: http://x.com/i/article/2058381329318682624

大佬观点教程/实践
5月25日
23:21
宝玉@dotey
57
基于成熟 Agent Harness 构建垂直领域方案大有可为

文章指出,开发通用 Agent Harness 价值有限,但基于成熟的 Harness 进行垂直领域方案构建大有可为。目前,MCP 和 Skills 分别解决了连接和领域知识问题,但垂直领域还需重新设计 AI Native 工作流、优化人机交互 UI/UX 以及整理高质量数据等,这些是模型公司无法独立完成、需共建的环节。未来,Agent 将成为由少数模型公司提供基础模型与 Harness,更多应用在垂直层构建的操作系统。

卫斯理: 刚群里有同学说agent这件事情已经结束了 我基本同意 感觉垂类Agent真没什么能做的了🥶🥶🥶🥶

智能体大佬观点
22:58
Chubby♨️@kimmonismus
47
教皇感谢Anthropic合作,被视为巨大宣传价值

推文指出,天主教皇亲自感谢Anthropic在合作中的出色表现。考虑到天主教在全球拥有约14亿信徒,这一事件被视为Anthropic获得的、价值无可估量的外部宣传。引用观点补充称,这相当于Anthropic获得了“天主教会和神的支持”。作者强调,这是教皇本人的认可所带来的最好宣传形式,而许多人并未真正理解其意义。

Chubby♨️: Hold on, so Anthropic now has the cathloic church and god on their side as well? I thought Andrej Karpathy was already t...

Anthropic大佬观点现象/趋势
22:38
凡人小北@frxiaobei
49
原文认为,在服务器部署 Claude Code 或 Codex 配置若干技能,再包装成由它们开发的 Web 应用,此方案足以满足绝大多数企业的 AI 服务上线需求。这一观点与"垂类 Agent 已无太多可为"的看法一致,强调了基础模型与编码工具的结合已足够构建商业解决方案。

卫斯理: 刚群里有同学说agent这件事情已经结束了 我基本同意 感觉垂类Agent真没什么能做的了🥶🥶🥶🥶

智能体大佬观点现象/趋势
22:18
AYi@AYi_AInotes
59
DeepMind CEO大幅提高AGI标准引发热议

天啊! Google DeepMind CEO Demis直接把AGI的门槛从Erdős水平提升到了拉马努金水平! 这波目标线移动我愿称之为人类最后的防线🤯 具体内容请看中文字幕版👇 #AGI #AI #OpenAI [引用 @AYi_AInotes]:http://x.com/i/article/2058381329318682624

AYi: http://x.com/i/article/2058381329318682624

DeepMind大佬观点
22:18
AYi@AYi_AInotes
50
AI自动化实践:每日晨间研究效率提升8倍

有开发者利用 Claude、MCP 与 N8N 构建了一个全自动晨间研究智能体。该智能体每日自动运行,将产出的 5 分钟晨报直接存入 Obsidian 笔记库,从而将用户原本需要 45 分钟的每日信息筛选时间压缩至 5 分钟,节省了 87% 的时间。发布者表示,如果感兴趣可以制作教程,并顺便提到 Cursor 提供的 $10,000 额度还远未用完。

CyrilXBT: http://x.com/i/article/2058683409505882112

智能体AnthropicMCP/工具大佬观点
21:28
Chubby♨️@kimmonismus
16
等等,所以Anthropic现在还有天主教会和上帝站在他们那边了?我以为Andrej Karpathy已经是最大亮点了。
Anthropic大佬观点
20:58
Rohan Paul@rohanpaul_ai
67
"AI大规模取代人类劳动力是'真实的可能性'……我们发现了在功能上反映喜悦、满足、恐惧、悲伤和不安的内部状态。我不知道这意味着什么,但我认为这值得持续审视。" ~ Anthropic联合创始人Christopher Olah 在梵蒂冈活动中(教皇利奥十四世今日在主教会议厅的演讲)。 ---- 来自"美联社"YouTube频道,(链接在评论区)
Anthropic大佬观点安全/对齐现象/趋势
18:58
Chubby♨️@kimmonismus
64
Anthropic联合创始人持续警告AI对就业的冲击

Anthropic联合创始人Dario Amodei持续警告AI对就业的冲击。他曾在2025年预测,AI可能在五年内消除50%的入门级白领工作,将失业率推高至10-20%。他后来称AI是“通用劳动替代品”,将造成“异常痛苦”的颠覆,并在达沃斯警告可能出现与社会脱节、GDP增长50%的“零世界国家”。当前数据显示趋势印证其警告:2025年科技业入门级招聘下降30-50%,华尔街银行裁减约20万个初级岗位。Anthropic自己的研究也确认,77%的企业使用Claude是为了自动化任务,而非增强员工。另一位Anthropic联合创始人也呼应,称AI大规模替代人类劳动的可能性真实存在。

Anthropic大佬观点行业动态
17:58
Rohan Paul@rohanpaul_ai
64
黄仁勋:封锁英伟达芯片无法阻断中国AI进程,反而加速自主创新

黄仁勋指出,美国对华芯片出口管制非但无法阻碍中国AI发展,反而可能成为产业自主的催化剂。制裁导致的市场空缺正推动华为等国内供应商成长。当前竞争已从比拼最快加速器,转向比拼定义智能操作层的能力,涵盖芯片、能源、模型和标准。推文补充了华为的最新动向:为应对制裁,华为提出“Tau Scaling Law”新设计方法,旨在通过LogicFolding等技术缩短信号延迟,在不依赖最先进光刻机的前提下实现1.4nm级密度。华为声称已量产381款芯片,并计划2031年达成该目标,其路径被命名为“何氏定律”。

Rohan Paul: 🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap...

大佬观点政策/监管
17:20
Berryxia.AI@berryxia
60
Unitree机器人真实会议室单次拍摄自主清理测试

宇树科技(Unitree)发布其WVLA 2.0模型在真实会议室进行的乱局清理测试视频。该测试为单次拍摄、全程无剪辑,机器人需在桌椅杂乱、物品随意摆放、且有人走动等强外部干扰下,全程自主完成识别、分类、清理和摆放等多任务。测试旨在展示机器人从实验室走向复杂现实世界的能力,与行业中常见的“实验室完美环境”演示形成对比。

Unitree: Conference Room Mess Cleanup Test: Unitree WVLA 2.0 Model🎉 This video was recorded in a single take. Multi-task, fully ...

具身智能大佬观点
15:28
Rohan Paul@rohanpaul_ai
67
华为提出"τ缩放定律",以侧向创新突破芯片与存储瓶颈

华为提出τ缩放定律,旨在不依赖更先进制程的情况下,通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片,并计划于2031年实现等效1.4nm(14Å)密度,该定律以海思负责人何庭波命名。同样,华为在存储领域也展示了类似的“侧向创新”路径,其通过改变封装方式(Die-on-Board)而非追求最先进的NAND层数,推出了容量达122.88TB的AI SSD。

Rohan Paul: 🇨🇳 🇺🇸 China's Huawei's new 122TB SSD shows how export controls can move innovation sideways instead of simply stoppi...

大佬观点推理端侧
14:28
Rohan Paul@rohanpaul_ai
32
当现实被为AI翻译后,AI便能取胜。
大佬观点推理
11:36
Greg Brockman@gdb
63
GPT-5.5 Pro 用于事实核查: GPT-5.5 Pro 是一个非常可靠的事实核查工具。我可以把整章内容扔给它,它能准确找出每一个关键引用。唯一真正让人烦恼的是它喜欢抠细节,所以会返回很多"大体意思是对的,但你没有考虑到微小细节 X"这样的反馈。

Ethan Mollick: GPT-5.5 Pro is a very solid fact checker. I can throw entire chapters at it and it will hunt down every key reference ac...

OpenAI大佬观点
11:31
ginobefun@hongming731
64
高德地图如何工程化地管理多AI智能体协作系统

高德地图在SEO增长场景的实践表明,当前AI智能体的核心挑战是如何管理与约束其生成能力。文章展示了将“从机会发现到发布”的长任务编排为可监控的带状态机工作流;使用文件化Memory管理所有产物以保证可追溯性;并贯彻“生成”与“评审”分离的“零信任”原则,评审方需独立验证所有声明。此外,他们对评审Agent本身进行Benchmark评估并多轮优化,以数据驱动其能力提升。该系统在“路书”功能验证中实现了全程无人介入、连续运行且主流程无Bug,印证了未来AI产品的竞争力在于构建围绕模型的可靠系统。

智能体大佬观点
09:22
向阳乔木@vista8
23
自从ChatGPT里可以调用远程电脑的codex,合上笔记本也能用时。 连mac mini的价值也在降低,不过多一台不关机的电脑。 钓鱼间隙可以让codex控制Suno生成音乐传到自己的网站播放
智能体OpenAI大佬观点
09:21
meng shao@shao__meng
51
讨论用书籍学习AI知识的可行性及"橙皮书"命名现象

推文质疑用书学习AI知识的可行性,指出Claude Code、Agent框架等知识更新极快,书易过时。同时质疑AI写书的质量,认为审查难度高。此外,作者对国内书籍常使用“白皮书”“蓝皮书”“橙皮书”等命名方式表示好奇。

智能体大佬观点编码
08:51
meng shao@shao__meng
66
在AI智能体时代,工程师依然需要深度思考代码

本文反驳了“有了AI智能体,工程师无需深度思考代码”的观点。核心论点是:AI不会降低对“理解系统”的要求,反而会提升工程师的核心价值。这主要源于责任不可转移——生产环境事故需由工程师负责,AI无法承担决策后果。AI被定位为加速日志分析等环节的加速器,但最终决策仍需由人做出。由此推导的行业趋势是:工程师应更注重系统的可理解性与可控性,如减少依赖、偏好简单系统,并将时间投入系统设计与维护。最终,行业稀缺资源正从“写代码速度”转向“对系统理解的深度”,计算机基础与判断力将更加重要。

Lee Robinson: You might believe you should spend less time thinking about code because of AI. I strongly disagree! We're watching this...

智能体大佬观点编码
08:18
Berryxia.AI@berryxia
65
播客回顾:AI重度用户对未来的六大预测

Lenny Rachitsky与Every CEO Dan Shipper回顾了后者一年前对AI发展的预测。Dan及其团队因深度使用AI工具而具有独特视角。在播客中,他重申了几个核心观点:自动化是谎言,CLI时代已过,SaaS崩盘论不成立。具体预测包括:每家公司Slack中将出现“超级代理”;Claude Code和Codex会成为知识工作的新操作系统;AI不会引发就业危机;产品经理和设计师将受益;人们将阅读并喜爱更多AI生成的内容;目前是买入SaaS股票的好时机。这些基于一线实践的判断与外界的末日论截然相反。

Lenny Rachitsky: Automation is a lie. CLIs are over. The SaaSpocalypse is dumb. A year ago @danshipper came on the podcast to predict whe...

智能体大佬观点现象/趋势
07:27
Rohan Paul@rohanpaul_ai
47
Chamath谈AI计算中至关重要的"预填充"和"解码"。 预填充是计算密集型;大规模并行GPU胜出,因此随着上下文增长,Nvidia占据主导。 解码是内存带宽密集型,因为每个下一个token都依赖于扫描已生成的内容。
大佬观点推理
06:52
Ethan Mollick@emollick
52
随着越来越多人开始识别AI的痕迹--这主要发生在你频繁使用AI之后--他们将恍然大悟,意识到我们中一些人早已看清的事实:这个网站(以及博客文章、论文)中有多少内容现在是AI生成的。
大佬观点现象/趋势
05:27
Rohan Paul@rohanpaul_ai
54
"我确实看到越来越多大规模批量生产的数学。" ~ Terry Tao AI让这变得可扩展。Will将证明写作转化为搜索问题:它从一个目标生成数千个迷你引理,然后廉价的检查器淘汰大部分,只保留少数有效的。
大佬观点推理
05:27
Rohan Paul@rohanpaul_ai
64
Databricks CEO称Zoom有机会构建AI优先产品

Databricks联合创始人兼CEO Ali Ghodsi认为,Zoom拥有会议视频和转录的最大数据集,有机会构建AI优先的产品,可能颠覆传统企业SaaS。企业软件的痛点是数据输入和协调,Zoom已掌握原始输入,包括客户通话和内部会议的视频、音频及转录。如果Zoom能可靠提取决策、上下文和行动项,并自动写入相应记录系统,作为AI优先的工作流层,将成为工作入口,取代许多主要收集笔记和更新的独立SaaS工具。

大佬观点现象/趋势
05:18
Emad@EMostaque
34
说实话,我原以为他们是在讨论不接受18岁以下的研究员。 那个年龄段确实有一些非常优秀的AI研究员。

Overlap: Business & Tech: Anthropic Doesn't Allow Kids Under 18 - Here's Why⁣ ⁣ "We just don't know enough about what AI is going to do to kids. I...

Anthropic大佬观点安全/对齐
‹ 上一页
1…2829303132…50
下一页 ›