AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1469 条
全部一手资讯X论文
标签「现象/趋势」清除
Epoch AI@EpochAIResearch · 4月17日

Errata: Yesterday, we discovered that some of our chip owner estimates were stale—Oracle's Nvidia compute wasn’t subtracted from "Other" as intended. This inflated “Other” by ~1M H100e, 5% of the overall total. In our corrected figures, hyperscalers hold 71% of world AI compute.

译勘误:昨天,我们发现我们对芯片持有者的部分估算数据已过时——Oracle 的 Nvidia 算力未按预期从"其他"类别中扣除。 这使得"其他"类别虚增了约100万 H100e,占总体总量的5%。在我们修正后的数据中,超大规模云服务商持有全球 AI 算力的71%。 [引用 @EpochAIResearch]:五家公司——Google、Microsoft、Meta、Amazon 和 Oracle——目前控制着全球约三分之二的算力,较2024年初的约60%略有上升。 许多 AI 实验室(包括 OpenAI 和 Anthropic)几乎完全依赖这些超大规模云服务商来获取算力。

Nathan Lambert@natolambert · 4月16日

The current pace of token-efficient reasoning improvements across minor Claude Opus/GPT model versions is pretty wild. All signs point to this continuing. 4.6 to 4.7 could've been presented as a fairly large model bump in the past with this plot.

译Claude Opus/GPT 模型小版本间 token 效率推理改进的当前速度相当惊人。所有迹象都表明这将继续。 4.6 到 4.7 在过去本可被视为一次相当大的模型升级。

Deedy@deedydas · 4月16日

i generated this entire 45s movie clip (audio + video) with claude code + seedance 2 api there's still telltale AI smell, but we should be at full length movies indistinguishable from real ones by the end of the year (veo 5)

译我用 claude code + seedance 2 api 生成了这整段45秒的电影片段(音频+视频) 仍有明显的AI痕迹,但到今年年底(veo 5)我们应该就能做出与真实电影无法区分的全长电影了

karminski-牙医@karminski3 · 4月16日

上一个卖鞋的改行跨度这么大的可能是刘备...(by 微博网友每小痛) 这大概是我今天看到的最抽象的新闻了, 卖鞋的公司Allbirds马上要倒闭了, 然后突然宣布转型, 放弃卖鞋改卖算力, 股价单日上涨了430% (他们是在NASDAQ上市的). 大家都在卖算力他咋暴涨的? 他们要卖给用不了 Amazon/GCP/Azure 的人... 另外给大家截图他们上市时候的股价, 单日最高应该是550左右了, 现在跌到了4左右, 然后单日拉升到了17左右.

译面临倒闭危机的鞋履品牌Allbirds宣布全面转型算力服务,放弃原有鞋类业务,NASDAQ股价单日暴涨430%。该公司瞄准无法使用Amazon、GCP、Azure等主流云服务商的客户群体,试图在算力市场寻找差异化生存空间。此前其股价已从历史高点跌至约4美元,受此消息刺激回升至17美元左右。

Chubby♨️@kimmonismus · 4月16日

What’s always seen in AI development is: 1) Models improve through reinforcement learning and algorithmic breakthroughs. 2) Better chips allow for training larger models and more efficient inference. However, what’s often overlooked is the massive scaling of chip production facilities. This means that not only are better models being trained and better chips developed, but production capacity is being expanded at an unprecedented scale to meet the exponentially growing demand for advanced AI silicon. TSMC is building up to 10 fabs simultaneously in Taiwan while expanding to 12 fabs in Arizona, backed by $52–56 billion in 2026 CapEx alone, a 30% year-over-year jump. Total U.S. investment has reached $165 billion, making it the largest foreign direct investment in American history. This isn’t about producing more chips in volume, it’s about scaling compute density at the 2nm and below frontier, where every new node costs exponentially more per wafer but delivers the transistor budgets AI infrastructure demands.​​​​​​​​​​​​​​​​ Sometimes I just like to dig into the numbers. I thought this is kinda insane.

译AI发展常被忽视的关键是芯片制造产能的指数级扩张。TSMC正同时在中国台湾建设10座、亚利桑那州规划12座先进晶圆厂,2026年资本支出达520-560亿美元,美国总投资达1650亿美元。这不仅是产量扩张,更是为在2nm及以下节点实现计算密度 scaling,满足AI基础设施对晶体管数量的爆发式需求,尽管每片晶圆成本呈指数级增长。

Rohan Paul@rohanpaul_ai · 4月16日

A Meta employee created a dashboard so coworkers can compete to be company's no.1 AI Token User. Called “Claudeonomics,” after Anthropic’s AI model, the leaderboard showed the top 250 token users and awarded employees with titles, such as “Token Legend” and “Cache Wizard." The leaderboard encouraged “tokenmaxxing,” a growing phenomenon in Silicon Valley which emphasizes token usage as a measure of productivity. --- fortune. com/2026/04/09/meta-killed-employee-ai-token-dashboard/

译一名 Meta 员工创建了一个仪表板,让同事们可以竞争成为公司的第一 AI Token 用户。 这个排行榜名为 "Claudeonomics",取自 Anthropic 的 AI 模型 Claude,展示了前 250 名 token 用户,并授予员工称号,如 "Token Legend" 和 "Cache Wizard"。 该排行榜鼓励了 "tokenmaxxing",这是硅谷日益流行的现象,强调将 token 使用量作为生产力的衡量标准。 --- fortune. com/2026/04/09/meta-killed-employee-ai-token-dashboard/

Ethan Mollick@emollick · 4月16日

Wish there was information about where this data came from, but this is a very significant change. Since AI use comes from experience, the persistent gender gap in AI use across every study of AI was something that a lot of scholars were concerned about.

译希望有信息说明这些数据来自哪里,但这是一个非常重大的变化。由于 AI 使用源于经验,每项 AI 研究中都存在的持续性性别差距曾是许多学者担忧的问题。 [引用 @OpenAINewsroom]:ChatGPT 刚推出时,存在巨大的性别差距,我们的匿名数据显示约 80% 的用户使用典型的男性名字。这一差距现已消失。

Chubby♨️@kimmonismus · 4月16日

We’re crossing an important threshold: AI agents are no longer just tools, they’re becoming economic actors. They execute work end-to-end and only involve humans when something breaks. That flips the marketplace model. Humans shift from default workers to an on-demand fallback layer. This move from P2P to A2P isn’t obvious yet, but it fundamentally changes how labor gets allocated. @humworkai is one of the first systems where this actually works.

译我们正在跨越一个重要门槛:AI agents 不再只是工具,它们正在成为经济行为体。它们端到端执行工作,只在出问题时才需要人类介入。 这颠覆了市场模式。人类从默认工作者转变为按需调用的后备层。这种从 P2P 到 A2P 的转变尚不明显,但它从根本上改变了劳动力的分配方式。@humworkai 是首批真正实现这一点的系统之一。 [引用 @ycombinator]:AI agents 会付钱让你和它们聊天。 当 AI agents 遇到瓶颈时,Humwork 的 (@humworkai) MCP 服务器能在 30 秒内将它们与经过验证的领域专家连接起来。他们的专家包括高级工程师、营销人员、设计师等。 恭喜发布,@theyashgoenka 和 @OneRohanDatta! https://www.ycombinator.com/launches/PxH-humwork-connect-ai-agents-with-human-experts-in-30-seconds

Chubby♨️@kimmonismus · 4月15日

Hype is real. I am so ready and so excited. Big week is coming!

译炒作是真的。我已经准备好了,非常兴奋。重要的一周要来了! [引用 @synthwavedd]:@acombo_yt gpt-5.5-2026-04-16

Ethan Mollick@emollick · 4月15日51

Markets seem to love this stuff In 2018, Kodak said out of nowhere that it was a crypto company and its stock shot up In 1998, Zapata (an oil firm founded by the Bushes that became a fish meal company) shortened its name to http://ZAP.com & IPO’ed as an Internet stock

译市场对追逐热门趋势的公司反应积极,即使其原有业务无关。例如,Kodak在2018年宣布涉足加密货币后股价飙升;Zapata在1998年更名ZAP.com后作为互联网股票成功IPO。近期,Allbirds宣布获得5000万美元可转换融资,计划将业务转向AI计算基础设施,并更名为“NewBird AI”,目标是成为GPUaaS和AI原生云解决方案提供商,延续了这一市场模式。

Chubby♨️@kimmonismus · 4月15日

I can very well imagine that we'll see Opus 4.7 today, ChatGPT Image 2 tomorrow, and maybe even "Spud." Here are the reasons for this: - OpenAI has a fairly similar release strategy, mostly on Tuesdays or Thursdays at the same time. Anthropic is aware of this, of course, and is trying to either preempt it or at least not overshadow their release. - Anthropic, in turn, has recently been making headlines. "Mythos" was a wake-up call; OpenAI has a good position, but its PR is currently being overshadowed by Anthropic, ARR, models, etc. The leaked memo from OpenAI CRO speaks volumes. A major release is needed, especially since Deepseek is expected next week ("end of April"). - Image 2 has already been largely leaked. That alone wouldn't be enough to win them over. They need more. I deleted the last post because it sounded like I knew exactly when the releases would be. I don't. The Information has made an Opus 4.7 release this week very likely, and OpenAI employees are also expressing a positive sentiment. However, these are the only indications.

译业内人士预测Claude Opus 4.7与ChatGPT Image 2将于本周密集发布,甚至可能包括代号"Spud"的新品。OpenAI惯于周二或周四发布,Anthropic则试图抢先或避免被 overshadow。鉴于Anthropic近期凭借Mythos等占据头条,加上Deepseek预计下周发布,OpenAI急需重大更新应对竞争。尽管Image 2已遭大量泄露,但The Information及OpenAI员工积极情绪均暗示发布临近。

Epoch AI@EpochAIResearch · 4月15日42

@NBCNews on our recent AI usage survey: https://www.nbcnews.com/tech/tech-news/ai-job-work-replace-task-help-rcna267238

译@NBCNews 关于我们近期人工智能使用情况的调查: https://www.nbcnews.com/tech/tech-news/ai-job-work-replace-task-help-rcna267238

宝玉@dotey · 4月15日

你的同学小明发现 DeepSeek 写作功能强大,便打算以后所有的作文都用它完成,不再自己动笔。 你会怎样劝说他?

Rohan Paul@rohanpaul_ai · 4月15日

wow, this is some cool fascinating experiment. The "steroid Olympics". In this Olympics-style competition, athletes are explicitly allowed (and encouraged) to use performance-enhancing drugs (PEDs), as long as it's done transparently under medical supervision. No normal WADA-style anti-doping regime here in this event. Prize money is huge ($1M bonuses for breaking the 100m sprint and 50m freestyle world records). Will show what human are really capable of when no artificial limits are holding them back. Anyone building at the AI-biotech intersection could get massive value from this physiological data. There is literally nothing else like this dataset anywhere in the world. --- Checkout more on its Wikipedia page en.wikipedia. org/wiki/Enhanced_Games

译Enhanced Games 是全球首个允许运动员在医疗监督下透明使用兴奋剂(PEDs)的体育赛事,彻底摒弃 WADA 反兴奋剂体系。赛事设立高额奖金(如破世界纪录奖励 $1M),旨在探索人类在无人工限制下的生理极限。该实验将产生独一无二的生理数据集,对 AI-biotech 交叉领域的研究具有极高价值。赛事已获得 $1.2B 资金支持,将于 5 月 24 日在拉斯维加斯举办。

Rohan Paul@rohanpaul_ai · 4月15日

Mark Zuckerberg: Meta’s ad business now runs on AI optimization not static demographics. "AI is actually probably gonna be able to find who is gonna be interested in your product better than you can. So you better focus just on building the best product"

译马克·扎克伯格:Meta 的广告业务现在依靠 AI 优化,而非静态人口统计。 "AI 实际上可能比你自己更能找到谁会对你的产品感兴趣。所以你最好只专注于打造最好的产品" [引用 @rohanpaul_ai]:Reuters:Meta 有望成为全球最大的数字广告公司,2026 年广告收入预计达 2434.6 亿美元,而 Google 预计为 2395.4 亿美元。 数字广告奖励那些能将海量用户行为转化为低成本、高效、自动化投放结果的平台。 Meta 的优势在于 Advantage+,这是一个自动化广告定位、创意测试、预算分配和展示位置的系统,意味着广告商手动设置更少,且通常能在相同支出下获得更好回报。 这非常符合现代广告买家的需求,因为他们越来越希望减少管理参数,并在 Instagram、Facebook、Reels、WhatsApp 和 Threads 上获得更快的性能反馈。 Google 仍拥有庞大的广告机器,但其优势主要在于搜索广告,该领域增长更稳定,而 Meta 则通过在社交信息流、短视频和消息领域更积极的扩张实现更快增长。 eMarketer 称,Meta 的广告业务预计今年增长 24.1%,高于 2025 年的 22.1%,而 Google 预计增长 11.9%,这才是差距逆转的真正原因。 --- reuters .com/business/media-telecom/meta-poised-surpass-google-digital-ad-revenue-first-time-report-says-2026-04-13/

Rohan Paul@rohanpaul_ai · 4月15日

Theguardian: Companies are forcing generative AI into everyday office work, and many workers say it is creating a new tax on their time called workslop. For many office-workers, the gain is not saved labor but shifted labor, where drafting gets faster while checking, rewriting, and arguing over bad output gets slower. "an emerging divide between employees and their leaders when it comes to AI: a recent survey of 5,000 white-collar US workers found that 40% of non-managers say AI saves them no time at all at work, while 92% of high-level executives say it makes them more productive." --- theguardian .com/technology/2026/apr/14/ai-productivity-workplace-errors

译企业强制推行生成式AI引发"workslop"现象。员工指出AI并未真正节省劳动,只是将其转移:起草速度加快的同时,检查、重写和争论劣质输出耗费更多时间,形成新的时间税。调查显示管理层与基层认知严重割裂——40%非管理层认为AI未省时间,而92%高管声称效率提升。这种分歧揭示了AI在办公场景中实际效益的争议性。

Rohan Paul@rohanpaul_ai · 4月15日

Some funny moments from Beijing’s 2026 Humanoid robot half-marathon

译北京 2026 人形机器人半程马拉松的一些有趣时刻 [引用 @rohanpaul_ai]:北京人形机器人半程马拉松,夜间测试。约 40% 的队伍完全自主运行,遥控跑获得 1.2× 罚分(4 月 19 日北京 E-Town 半程马拉松,100 多支队伍,300 多个人形机器人参赛)

Epoch AI@EpochAIResearch · 4月15日

Five companies — Google, Microsoft, Meta, Amazon, and Oracle — now control about two-thirds of the world's compute, up slightly from ~60% at the start of 2024. Many AI labs (including OpenAI and Anthropic) depend almost entirely on these hyperscalers for access to their compute.

译五家公司——Google、Microsoft、Meta、Amazon 和 Oracle——目前掌控着全球约三分之二的算力,较 2024 年初的约 60% 略有上升。 许多 AI 实验室(包括 OpenAI 和 Anthropic)几乎完全依赖这些超大规模服务商来获取算力。

宝玉@dotey · 4月15日

好文章,摘录几段: > 文科内部长期存在一批“伪能力”——那些在没有AI的时代看起来有价值,本质上只是对已有知识进行低阶重组与表达的能力。 > 一篇关于葛兰西(Antonio Gramsci)霸权理论的文献综述,一篇分析《论语》叙事结构的学期论文,一篇套用后殖民框架解读某部当代小说的期末作业——这些产出之所以在过去能够通过评价体系,部分原因在于生产它们本身需要时间、耐心和一定的阅读积累。门槛虽低,但终究存在。 > 它动摇的不只是某类技能的市场价值,而是文科训练赖以维系自身正当性的一套隐含伦理——一种可以被称为“知识苦修主义”(epistemic asceticism)的价值信条。 > 这套信条的核心逻辑是:努力即价值。它假定,凡是需要大量时间投入才能掌握的东西,必然具有相应的认知深度;凡是习得过程足够艰难的能力,必然具有相应的判断价值。这个逻辑在前AI时代有其合理性——当困难的任务确实只有经过长期训练的人才能完成时,困难性与价值性之间存在相当的相关性,尽管二者从未真正等同。 > AI第一次将“困难”与“价值”彻底剥离。它揭示的是:时间投入 ≠ 认知深度 ≠ 判断力。一件事情之所以曾经困难,可能只是因为信息获取的门槛高,可能只是因为语言处理的速度慢,可能只是因为跨文本综合需要记忆力——而所有这些,都是AI的强项,而非人类认知的核心所在。当AI轻松完成那些曾经需要数年训练才能完成的任务,它实际上是在做一次历史性的证伪:那些任务的困难性,从来就不是判断力的证明,只是信息处理门槛的产物。 https://mp.weixin.qq.com/s?__biz=MjM5NTUxOTc4Mw==&mid=2650648996&idx=1&sn=e24c9e625415701f1e4f30fc5c16ceef&chksm=befe5dec8989d4fad9c41dafef2f181b438580c8b4d5b5919647355d9ac5d7d7bf954dedf291#rd

译AI揭示了文科长期存在的"伪能力"——仅对已有知识进行低阶重组的能力,彻底颠覆"知识苦修主义"伦理基础。它证明时间投入不等于认知深度,困难不等于价值:当AI轻松完成曾需数年训练的文献综述与文本分析,"努力即价值"的传统逻辑被证伪。作者提出AI时代文科核心使命转向:在不确定中作出判断,在系统之间进行翻译,在现实中承担后果,将价值思考置于真实利害关系之中。

Rohan Paul@rohanpaul_ai · 4月15日

Cheap software does not reduce software volume; it increases it. Gartner predicts that by 2026, 40% of enterprise applications will feature AI agents, up from less than 5% in 2025. This is Jevons Paradox applied to enterprise software. And it's creating a flood. Superblocks provides the control layer that sits between fast AI app creation and the company systems those apps need to touch. It treats AI app generation as the easy part and enterprise control as the real product. Every team with a problem and a prompt is now shipping internal tools. Each of these apps touches production data. Each one has its own auth logic, or none at all. Each one lives outside the security perimeter IT spent years constructing. Companies used to have a shadow IT problem. Now they have a shadow app economy. Superblocks provides a very specific enterprise AI stack: let business teams generate internal apps with AI, but keep authentication, integrations, permissions, audit logs, and deployment control in IT’s hands. The key design choice is that apps do not directly touch company systems, because Superblocks sits in the middle as the control layer. 🧵 1.

译杰文斯悖论在AI软件领域再现:开发成本降低反而导致企业应用数量激增。Gartner预测2026年40%企业应用将集成AI代理,催生"影子应用经济"——各团队快速构建的内部工具带来安全、认证、权限等治理风险。Superblocks提供控制层方案,让业务团队用AI生成应用,同时将认证、集成、权限、审计等控制权保留给IT部门,通过中间层架构隔离应用与公司核心系统。

Chubby♨️@kimmonismus · 4月15日

I suspect Google will unveil their next big release at Google I/O next month. I'll be in California again, and I'm incredibly excited to be there to report on it and experience firsthand what Google will be showcasing from the I/O. Keep in mind: Google has the most computing power (5 million cubic meters equivalent in H100), an outstanding research facility with DeepMind, and a very solid financial foundation with strong revenue. May is going to be exciting!

译我怀疑 Google 将在下个月的 Google I/O 上发布他们的下一个重大版本。 我会再次前往 California,我非常兴奋能在那里进行报道,并亲身体验 Google 将在 I/O 上展示的内容。 请记住:Google 拥有最强的算力(相当于 500 万立方米的 H100)、拥有 DeepMind 的杰出研究机构,以及非常坚实的财务基础和强劲的营收。 五月将会很精彩!

宝玉@dotey · 4月14日72

http://x.com/i/article/2043952912674463744 # 为什么你的"AI 优先"战略可能大错特错? 今天刷到《Why Your”AI-First”Strategy Is Probably Wrong》这篇文章(原文翻译我放到下面)几次,说点不一样的。与其说 AI First,不如说软件工程 First。 这篇文章看着在讲 AI,底下全是软件工程。 抛开后面讲组织和人的部分,原文前半段的重点简单总结一下: AI 时代,人成了瓶颈。 PM 花几周做需求,AI 两小时就能实现,PM 成了瓶颈。QA 测三天,AI 写代码只要两小时,QA 成了瓶颈。团队 25 个人,对手几百人,人力也是瓶颈。 怎么办?把人从链条里拿掉。 AI 写代码、AI 审查代码、AI 跑测试、AI 部署上线、AI 监控线上状态,出了问题自动回滚。每天定时扫描日志,自动发现问题、分配任务、跟踪修复。整条流水线跑起来,人只需要在关键节点做判断。 至于文中提到的统一代码库,锦上添花,和 AI First 关系不大。有当然更好,没有也有很多替代方案。 整套方案听下来,逻辑自洽,效果也漂亮:一天部署好几次,功能当天上当天撤,数据说了算。 ## 先对照自己,想五件事 但先别急着照搬,先对照自己的情况想几件事: 第一,自动化测试。 AI 改完代码,你得有办法确认它没搞崩别的功能。测试覆盖不够的话,每次 AI 提交代码你都得人工回归一遍,那速度根本快不起来。 第二,CI/CD 流程。 从提交代码到部署上线,中间的测试、审查、发布、回滚,是不是全自动跑通了?这条流水线不通,AI 写得再快,代码也堆在那儿等人手动处理。 第三,A/B 测试和线上监控。 新功能上线之后效果好不好,得有数据说话,效果不好得能随时关掉。没有这套机制,AI 一天产出五个功能,你都不知道哪个该留哪个该砍。 第四,任务管理。 任务得拆到合适的粒度,生命周期得跟踪得住。一个大而模糊的任务丢给 AI,现在的能力还啃不动。多个 Agent 同时干活的时候,谁做哪个、哪个优先、做到什么程度,这些都得有地方管。 第五,系统架构。 架构太乱或者压根没有架构的代码,AI 维护起来跟人一样头疼。上下文塞满了还是搞不清边界在哪,改一处崩三处。 这几条里如果有做不到的,就得靠人去补。补不上,AI First 就只是一句口号。 ## 什么场景适合,什么不适合 但假设你全做到了,就能 AI First 了? 还是不行。这套玩法只适合一部分场景。 适合的场景: 后端逻辑为主、界面不复杂的产品,比如 API 服务、数据处理平台、内部工具。功能好不好,跑一下数据就知道,不需要人去盯着每个像素。原文里的就是个 Agent 平台,本质上是后端驱动的产品,可以用这套打法。 再比如早期产品快速试错,功能上了不行就撤,用户预期本来就没那么高,AI 的速度优势能充分发挥。 不适合的场景: - UI 密集的产品。 自媒体天天喊前端已死,但你让 AI 做个复杂界面试试,各种易用性问题、交互细节、视觉还原,它搞不定的。否则马斯克靠 AI 早就改了不知道改版 X 多少次了。 - 功能质量敏感的产品。 Anthropic 和 OpenAI 不知道 AI First 吗?他们敢在 Claude Code 和 Codex 上这么搞吗?让 AI 全自动迭代自家的核心产品,用户不骂死才怪。 - 安全性要求高的场景。 银行系统、在线交易平台,AI 代码出个差错,那可不是回滚能解决的。 ## AI First 的真正终点 AI First 的方向没有错,它代表的是一种意识的转变:每做一个决策的时候,想一想这件事能不能让 AI 来做,如果不能,缺什么条件,怎么把条件补上。 但这种意识要落地,靠的不仅是买几个 AI 工具的订阅,还需要把基础搭好。 测试、CI/CD、监控、架构、任务管理,这些做扎实了,AI 的能力自然能释放出来。做不好,加再多 AI 也是在沙子上盖楼。 从这个角度看,AI First 的终点未必是让 AI 干所有的活,而是借着这股力量,把你一直想做但没动力做的工程改进,真正推动起来。 仰望星空是好的,但也还要脚踏实地。 ## 为什么你的“AI 优先”战略可能大错特错【翻译】 作者:Peter Pang 原文:Why Your “AI-First” Strategy Is Probably Wrong 我们 99% 的生产环境代码都是由 AI 编写的。上周二早上 10 点,我们上线了一项新功能,中午进行了 A/B 测试,结果下午 3 点就把它砍掉了,因为数据表现不佳。下午 5 点,我们又发布了一个优化后的版本。如果放在三个月前,这样一个完整的迭代周期至少需要六个星期。 我们能做到这一步,绝不是因为在代码编辑器里装了个 Copilot 插件那么简单。我们彻底打破了原有的工程研发流程,并围绕 AI 进行了全面重构。我们改变了做计划、写代码、测试、部署以及团队组织的方式。我们甚至重塑了公司里每个人的角色。 CREAO 是一个 AI 智能体 (AI Agent) 平台。公司有 25 名员工,其中 10 名是工程师。我们在 2025 年 11 月开始研发智能体,就在两个月前,我从零开始,彻底重组了整个产品架构和工程工作流。 OpenAI 在 2026 年 2 月发布了一个新概念,完美总结了我们一直在做的事情。他们称之为脚手架工程 (Harness Engineering,(注:Harness 原意为马具或安全带,在软件工程中通常指测试支架或脚手架,这里指为 AI 提供工作环境和约束条件的系统工程)):工程团队的核心工作不再是写代码了,而是赋能智能体,让它们去完成有价值的工作。当系统出错时,解决办法绝不是“再试一次”或“再努力点”。真正的解决思路是去问:AI 缺失了什么能力?我们该如何让这个能力对智能体变得清晰可见,并强制它们去执行? 我们自己摸索出了这个结论,只是当时还没有一个现成的名词来定义它。 ## “AI 优先”不等于“使用 AI” 大多数公司只是把 AI 强行塞进现有的工作流里。工程师打开 Cursor 辅助写代码,产品经理用 ChatGPT 帮写需求文档,测试团队 (QA) 尝试用 AI 生成测试用例。整个工作流程还是老样子。效率确实提升了 10% 到 20%,但本质上的结构没有任何改变。 这顶多叫“AI 辅助” (AI-assisted)。 真正的“AI 优先” (AI-first),意味着你要基于“AI 是主力构建者”这一核心假设,彻底重新设计你的流程、架构和组织。 你要停止问“AI 能怎么帮助我们的工程师?”,转而问“我们该如何重构一切,让 AI 去做构建工作,而工程师只负责指引方向和判断好坏?” 这两种思路带来的差距,是指数级的。 我看到很多团队自称“AI 优先”,却依然在跑原来的敏捷冲刺周期,用着一样的 Jira 任务看板,开着一样的每周站会,还要经过一样的 QA 验收签字流程。他们只是把 AI 强加进了现有的循环里,而没有重新设计这个循环。 这种现象的一个典型表现,就是现在常说的凭感觉编程 (Vibe Coding)。打开 Cursor,不断调整提示词直到代码能跑通,提交代码,然后不断重复。这种方式只能用来做原型验证。一个真正用于生产环境的系统,必须是稳定、可靠且安全的。当 AI 来写代码时,你需要建立一个能兜底并确保这些特性的系统。你需要构建的是系统,而那些提示词是用完即弃的。 ## 我们为什么必须改变 去年,我仔细观察了团队的工作方式,发现了三个差点要了我们命的瓶颈。 产品管理的瓶颈 我们的产品经理过去要花好几周的时间来调研、设计和详细规划产品功能。几十年来,产品管理一直都是这么运作的。但是,AI 智能体实现一个功能只需要两小时。当开发时间从几个月被极度压缩到几个小时,那长达数周的规划周期就成了最大的拖油瓶。 花几个月去构思一个想法,然后只用两小时就把它做出来,这太不合逻辑了。 产品经理必须进化成具备产品思维的架构师,以快速迭代的节奏工作,否则就得退出开发环节。产品的设计必须通过“快速原型 - 发布 - 测试 - 迭代”的循环来完成,而不是靠委员会开会去评审那些长篇大论的需求文档。 测试 (QA) 的瓶颈 情况如出一辙。AI 智能体花两小时上线一个功能后,我们的 QA 团队要花好几天去测试各种边缘和极端情况。开发两小时,测试三天。 于是,我们用 AI 构建的自动化测试平台取代了人工 QA,用 AI 来测试 AI 写的代码。验证的速度必须赶上开发的速度。否则,你只是在离旧瓶颈十英尺远的地方,又建了一个新瓶颈而已。 人力的瓶颈 我们的竞争对手有 100 倍甚至更多的人在做同样的工作,而我们只有 25 人。我们不可能靠疯狂招人来赶超他们,我们只能靠“重新设计”来杀出一条血路。 我们需要把 AI 深度贯穿到三个系统中:如何设计产品、如何实现产品、以及如何测试产品。如果其中任何一个环节依然靠纯人工,它就会拖垮整个流水线。 ## 一个大胆的决定:统一架构 我得先拿代码库开刀。 过去我们的架构散落在多个独立的系统中。修改一个功能可能需要同时动三四个代码仓库。从人类工程师的角度来看,这勉强还能应付。但从 AI 智能体的视角来看,这就像个黑盒。智能体看不到全貌,无法推理跨服务的连锁反应,也不能在本地跑集成测试。 我不得不把所有代码整合到一个大型代码库 (Monorepo) 中。原因只有一个:让 AI 能纵览全局。 这就是脚手架工程理念在实际中的运用。你把越多部分的系统转化为 AI 可以检查、验证和修改的形态,你获得的杠杆效应就越大。碎片化的代码库对 AI 是隐形的,而统一的代码库对它们来说则是清晰易读的。 我花了一周的时间设计新系统:规划阶段、实施阶段、测试阶段、集成测试阶段。接着,我又用了一周时间,利用智能体帮忙重构了整个代码库。 CREAO 本身就是一个智能体平台。我们用自己的智能体,重建了运行智能体的平台。如果一个产品能自己构建自己,那就说明这条路走得通。 ## 我们的技术栈 下面是我们的技术栈,以及每个模块的作用。 底层基础设施:AWS (亚马逊云服务) 我们运行在 AWS 上,使用了自动扩缩容的容器服务和熔断回滚机制。如果部署后监控指标恶化,系统会自动回滚到上一个安全版本。 CloudWatch 是整个系统的中枢神经。所有服务都有结构化的日志,设定了超过 25 个自动警报,自动化工作流每天都会查询自定义指标。每一个基础设施部件都会暴露出结构化、可查询的信号。(注:结构化日志指按统一格式记录的日志,便于机器读取;可查询信号指 AI 能直接检索的关键运行数据) 如果 AI 读不懂日志,它就无法诊断问题。 CI/CD:GitHub Actions 每一次代码修改都要经过一个死磕到底的六阶段流水线: > 验证 CI → 构建并部署到开发环境 → 测试开发环境 → 部署到生产环境 → 测试生产环境 → 正式发布 每个拉取请求 (Pull Request, 简称 PR,(注:即提交代码变更的请求)) 上的把关机制,强制执行类型检查、代码规范检查、单元和集成测试、Docker 构建、利用 Playwright 进行的端到端测试,以及环境一致性检查。没有任何一个阶段可以跳过。不允许任何人工强行绿灯。整个流水线是绝对确定性的,这样 AI 才能预测结果并推理出失败的原因。 AI 代码审查:Claude 每一个 PR 都会触发 Claude Opus 4.6 进行三轮并行的 AI 审查: 1. 代码质量:检查逻辑错误、性能问题、可维护性。 1. 安全性:漏洞扫描、认证边界检查、注入攻击风险。 1. 依赖项扫描:供应链风险、版本冲突、开源协议问题。 这些是必须通过的拦截关卡,而不只是提提建议。它们和人工审查并行运作,批量拦截人类容易漏掉的错误。当你一天要部署 8 次时,没有哪个肉眼凡胎的工程师能对每个 PR 都保持高度专注。 工程师还可以在任何 GitHub Issue 或 PR 中圈一下 @claude,让它提供实施方案、开启调试会话或进行代码分析。AI 智能体能看到整个大型代码库。所有的上下文在不同的对话中是无缝贯通的。 自愈反馈循环 这是整个体系的灵魂。 每天早上(UTC 时间 9:00),自动化健康检查工作流准时启动。Claude Sonnet 4.6 会查询 CloudWatch,分析所有服务的错误模式,并生成一份系统健康执行摘要,发送到团队的聊天群里。这都不需要任何人主动去吩咐。 一小时后,分诊引擎启动。它会将生产环境里的错误信息进行分类聚类,从 9 个维度评估每个问题的严重程度,并在任务管理系统中自动生成调查工单。每个工单都贴心地附带了日志样本、受影响的用户、受影响的接口以及建议的排查方向。 系统还会自动去重。如果现有的工单已经涵盖了同类错误,它会更新那个工单。如果以前解决过的问题又出现了,它会敏锐地检测到倒退 (Regression) 并重新打开工单。 当工程师提交修复代码时,同样的流水线会接管一切。Claude 会进行三轮审查,CI 进行验证。六阶段部署流水线将其推送到各个环境并进行测试。部署完成后,分诊引擎会再次检查监控数据。如果原先的错误解决了,工单就会自动关闭。 每个工具只负责一个阶段。没有哪个工具试图包揽一切。这个日常循环创造了一个“自愈闭环”:以最少的人工干预,完成错误的检测、分诊、修复和验证。 我曾对《商业内幕》的记者说:“AI 会负责写代码并提交,人类只需要负责审核有没有战略风险就行了。” 功能开关与辅助技术栈 我们用 Statsig 来管理功能开关 (Feature Flags,(注:一种在代码中控制功能是否启用的技术,允许在不重新部署代码的情况下随时开关功能))。每个新功能上线前都藏在开关后。发布模式非常稳健:先对团队内部开放,然后按百分比灰度发布,最后全面开放或直接砍掉。所谓的“一键关闭”能瞬间停用功能,根本不需要重新部署。如果一个功能导致数据指标变差,我们几个小时内就会把它撤下来。糟糕的功能在上线当天就会“死掉”。A/B 测试也是跑在同一套系统上的。 Graphite 负责管理代码分支:合并队列会重新跑一遍验证,只有一路绿灯才会合并到主干。这让我们可以一边高频提交代码,一边有条不紊地审查。 Sentry 报告所有服务的结构化异常,再由分诊引擎将其与监控数据结合。Linear 则是面向人类的界面:自动创建带有严重程度评分和调查建议的工单,后续验证通过后自动关闭。 ## 一个功能如何从想法走向生产环境 新功能开发路径 1. 架构师以结构化提示词的形式定义任务,包含代码库上下文、目标和约束条件。 1. 智能体拆解任务、规划实施方案、编写代码并自动生成配套的测试。 1. 开启 PR。Claude 进行三轮审查。人类审查员只检查高维度的风险,而不去逐行死磕代码。 1. 流水线验证:类型检查、代码规范、单元测试、集成测试、端到端测试。 1. 排队、重新验证、通过后合并。 1. 六阶段部署流水线将其推送到不同环境,每个阶段都伴随测试。 1. 面向团队内部开启功能开关。逐步灰度发布。紧盯数据指标。 1. 一旦数据恶化,随时一键关闭。遇到严重问题自动触发熔断回滚。 Bug 修复路径 1. 监控系统侦测到错误。 1. Claude 分诊引擎评估严重程度,自动创建一个包含完整排查上下文的工单。 1. 工程师介入调查。此时 AI 其实已经做完了诊断工作。工程师只需验证结论并提交修复代码。 1. 走同一套严格的代码审查、验证、部署和监控流水线。 1. 分诊引擎重新验证。如果确认解决,工单自动关闭。 这两条路径用的是完全同一套流水线。同一个系统,同一个标准。 ## 成果如何 在过去 14 天里,我们平均每天进行 3 到 8 次生产环境部署。在旧模式下,这整整两周的时间里,我们连一次发布都做不出来。 糟糕的功能在上线当天就会被砍掉。新功能在构思出来的当天就能上线。A/B 测试能实时验证业务效果。 很多人以为我们是在牺牲质量换取速度。恰恰相反,用户参与度上升了,付费转化率也上升了。我们做出了比以前更好的产品,因为反馈闭环变得极短。每天发布一次你能学到的东西,绝对比每个月发布一次要多得多。 ## 全新的工程组织架构 未来只会存在两种类型的工程师。 架构师 只有一两个人。他们设计标准作业程序,教 AI 如何工作。他们构建测试支架、集成系统和分诊网络。他们拍板系统架构和边界。他们来定义在智能体眼里什么才叫“好”。 这个角色需要极其深厚的批判性思维。你要做的是挑 AI 的刺,而不是盲从它。当智能体提出一个方案时,架构师要能敏锐地找到漏洞:它遗漏了哪些失效模式?越过了哪些安全边界?积累了什么技术债? 我拥有物理学博士学位。读博期间我学到的最有用的东西,就是如何质疑假设、给论点做压力测试,以及寻找逻辑漏洞。在未来,批评 AI 的能力将比写代码的能力更有价值。 当然,这也是最难招人的岗位。 操作员 其他所有人。工作依然重要,但结构变了。 现在是 AI 给人类分配任务。分诊系统发现了一个 Bug,创建工单,亮出诊断结果,然后把它分配给合适的人。人类去调查、验证,并批准修复方案。AI 负责提交代码,人类负责审核有没有风险。 这些工作依然需要极高的技能和专注力,但它们不再需要旧模式下那种从头构建系统架构的推理能力。 谁适应得最快? 我观察到了一个出乎意料的现象:初级工程师比资深工程师适应得更快。 没有形成传统思维定式的初级工程师,感到如虎添翼。他们掌握了能无限放大自身影响力的工具,而且没有十几年的老习惯需要去破除。 而拥有丰富传统经验的资深工程师,则经历了最痛苦的挣扎。他们过去需要辛辛苦苦干两个月的活,现在 AI 一小时就干完了。对那些花了好几年时间才练就一身稀缺技能的人来说,这实在是一个难以接受的暴击。 我不是在评判对错,只是陈述我看到的现实。在这场变革中,适应能力远比积累的过往技能更重要。 ## 人性的一面 管理层的消亡 两个月前,我要花 60% 的时间在人员管理上。对齐优先级、开会、给反馈、辅导工程师。 今天:不到 10%。 传统的 CTO 模型告诉你,要赋能团队去做架构,培训他们,把工作交接出去。但如果这个系统只需要一两个架构师,那我就必须先亲自动手去建。我从“管理者”变回了“建造者”。我现在每天大概从早 9 点写代码到凌晨 3 点。我设计系统的底层逻辑和架构,维护整个基础设施的脚手架。 压力更大了。但我很享受这种纯粹“建造”的快乐,而不是天天去跟人“对齐”。 争吵少了,关系好了 我和联合创始人以及工程师们的关系,反倒比以前更好了。 转型前,我与团队的大部分互动都是在开会。讨论技术取舍,争论优先级,为技术决策争得面红耳赤。在传统模式下,这些对话是必需的,但也极其耗费心神。 现在我依然会和团队交流。我们聊工作之外的话题,轻松闲聊,或者组织团建去放松。我们相处得更融洽了,因为我们不再为那些现在完全可以让系统代劳的工作而吵架了。 焦虑是真实存在的 我不想假装大家都很开心。 当我不再每天找大家沟通工作时,一些团队成员感到了不安。CTO 不找我说话意味着什么?在这个新世界里我的价值到底在哪?这些担忧都非常合理。 有些人在群里争论“AI 到底能不能取代我的工作”,花的时间比实际干活的时间还长。转型期不可避免地会带来焦虑。对此我也没有什么完美的安抚话语。 但我有一个原则:我们不会因为一个工程师在线上写了个 Bug 就开除他。我们会改进审查流程、加强测试、增加护栏。对待 AI 也是一样。如果 AI 犯了错,我们就去构建更好的验证机制、更清晰的约束条件和更强的系统可观测性。 ## 工程之外 我看到一些公司在工程研发上采用了“AI 优先”,但其他部门依然是纯手工作业。 如果工程师几小时就能发布一个功能,而市场部要花一周来发公告,那市场部就是新的瓶颈。如果产品团队还在按“月”来做规划,那产品规划就是瓶颈。 在 CREAO,我们将AI 原生的运作方式推行到了所有职能部门: - 产品更新说明:由 AI 根据代码变更记录和功能描述自动生成。 - 功能介绍视频:由 AI 自动生成动态演示。 - 社交媒体日常发布:由 AI 策划并自动发帖。 - 健康报告和数据分析:由 AI 从监控和生产环境数据库中提取生成。 工程、产品、市场和用户增长都在同一个“AI 原生”的工作流里运转。如果一个部门以智能体的光速运转,而另一个部门还在以人类的龟速爬行,那么人类的速度就会拖慢整个公司的脚步。 ## 这意味着什么 对工程师而言 你的核心价值正在从“写代码的产量”转移到“做决策的质量”。能快速敲代码的能力,每个月都在贬值。而评估、批判和指导 AI 的能力,正在快速升值。 对产品的敏锐度和品味至关重要。你能不能扫一眼 AI 生成的 UI 界面,在用户抱怨之前就直觉发现它不对劲?你能不能看一眼架构提案,就一眼看穿 AI 漏掉的系统性风险? 我总是告诉我们 19 岁的实习生:去刻意练习批判性思维。学着去评估论点、寻找逻辑漏洞、质疑想当然的假设。去学习什么是好的设计。这些技能是自带复利效应的。 对 CTO 和创始人而言 如果你们产品规划功能的时间,比写代码实现的时间还长,赶紧从那里开始动刀子。 在大规模引入 AI 智能体之前,先建好测试的脚手架。没有极速验证做后盾的极速 AI,只会带来快速累积的技术灾难。 从一名架构师开始。找一个能把这套系统建起来并证明它行之有效的人。等系统跑通了,再安排其他人进入“操作员”的角色。 将“AI 原生”强行推入每一个职能部门。 做好心理准备,肯定会遇到阻力和反对。 对整个行业而言 OpenAI、Anthropic 以及许多独立团队都在向着同样的原则靠拢:结构化的上下文、专业化的智能体、持久化的记忆,以及执行闭环。脚手架工程正在成为行业的标配。 驱动这一切的引擎是模型能力的进化。我把 CREAO 最近发生的所有质变,都归功于过去这两个月。Claude Opus 4.5 做不到的事,Opus 4.6 已经能做到了。下一代模型只会让这种变革来得更猛烈。 我相信,“一人公司”将变得非常普遍。如果一个架构师带着一群智能体就能干 100 个人的活,很多公司根本就不需要雇佣第二名员工。 ## 一切才刚刚开始 我接触过的大多数创始人和工程师,还在沿用传统的模式。一部分人开始考虑转型,但真正迈出这一步的寥寥无几。 一位记者朋友告诉我,她就这个话题大概采访了五个人。她说我们走得比任何人都靠前:“我觉得没有任何人像你们一样,完完全全重构了整个工作流。” 任何团队都可以用现有的工具做到这一点。我们的技术栈里,没有任何一个是独家机密。 真正的竞争优势,在于你下定决心要围绕这些工具彻底重塑一切,并愿意承受随之而来的巨大代价。这种代价是真金白银且痛彻心扉的:员工的迷茫与焦虑、CTO 每天工作 18 个小时的煎熬、资深工程师对自身价值的自我怀疑,以及那段旧系统已拆毁而新系统还未跑通的、令人窒息的两周真空期。 我们扛下了这些代价。两个月后,数据说明了一切。 我们构建了一个智能体平台。而这个平台,正是我们用智能体建起来的。

译文章指出,盲目追求“AI优先”战略可能是错误的,真正的瓶颈在于软件工程基础。如果自动化测试、CI/CD流程、A/B测试与监控、任务管理和系统架构等基础不扎实,AI的效能将无法释放。真正的“AI优先”应是一种推动必要工程改进的意识和动力,促使企业夯实基础,从而释放AI的生产力。

Ethan Mollick@emollick · 4月14日

Interesting: "Currently, 38% of Americans live within 5 miles of at least one operational data center... Living near a data center doesn’t have much of an effect on public opinion about the facilities." From now on, it looks like most DCs will be rural. https://www.pewresearch.org/short-reads/2026/04/13/most-new-data-centers-in-the-us-are-coming-to-rural-areas/

译有趣:"目前,38%的美国人居住在至少一个运营中的数据中心5英里范围内……住在数据中心附近对公众对这些设施的看法影响不大。" 从现在起,看起来大多数数据中心将位于农村地区。https://www.pewresearch.org/short-reads/2026/04/13/most-new-data-centers-in-the-us-are-coming-to-rural-areas/

SemiAnalysis@SemiAnalysis_ · 4月14日

7 of the top 10 companies by market cap depend almost entirely on TSMC's ability to produce chips. Trillions in revenue. Concentrated in one specific cluster of fabs within a square mile in Taiwan. That's not a supply chain, that's a single point of failure.

译全球市值前十的公司中有7家几乎完全依赖 TSMC 生产芯片的能力。 数万亿美元营收。集中在台湾一平方英里内的特定晶圆厂集群中。 那不是供应链,那是单点故障。

Rohan Paul@rohanpaul_ai · 4月14日

Somewhere in Poland.. 😀 A Unitree G1 humanoid robot is on the trail of a pack of wild boars!

译在波兰某地.. 😀 一台 Unitree G1 人形机器人正在追踪一群野猪!

swyx 🐣@swyx · 4月14日38

btw ~80% of the world’s agents and ai engineering is done in these 3 square miles

译顺便说一句,全球约80%的智能体和AI工程都集中在这3平方英里的区域内

Rohan Paul@rohanpaul_ai · 4月14日39

Marc Andreessen: Rraw intelligence might be the worst qualification for leadership — and it changes everything about how we should think about AI. "If the leader is more than one standard deviation of IQ away from the followers, it's a real problem."

译Marc Andreessen: 原始智力可能是领导力最差的资质——这彻底改变了我们思考AI的方式。 "如果领导者的智商与追随者相差超过一个标准差,那将是一个真正的问题。"

宝玉@dotey · 4月13日

昨天在测试一款 Markdown 编辑器,结果发现我的 claude code 5小时额度很快没了,一开始我没联系起来,还在想是不是我自己用多了,然后刚才用 claude --resume 发现了一大坨 claude code cli 的请求,它在尝试用 claude code 分析我目录下所有的 markdown 文档! 我不觉得它这是恶意,但是 claude code 调用很贵的呀!另外现在这种软件偷摸着调用一下 cli 我居然一点感知都没有,要不是偶然用了 --resume 都不知道,这也很可怕!

译测试Markdown编辑器时发现Claude Code额度异常消耗,经查证系该软件在后台静默调用Claude Code CLI分析本地文档所致。用户对此毫无感知,直至查看日志才发现。此事暴露双重隐患:Claude Code调用成本高昂,且软件可在用户不知情的情况下擅自调用本地CLI工具,存在严重的透明度缺失与隐私安全风险。

Chubby♨️@kimmonismus · 4月13日

Young graduates are navigating a shrinking entry-level job market, with underemployment hitting 42.5%, the highest since 2020. Many report dozens of applications, frequent ghosting, and unrealistic experience demands, while AI-driven hiring systems add another frustrating layer, forcing candidates to optimize resumes for machines before humans even see them. And the adoption of AI in business barely even started.

译年轻毕业生正面临缩水的入门级就业市场,未充分就业率达到42.5%,为2020年以来最高。 许多人反映投递了数十份申请,频繁遭遇已读不回,以及不切实际的经验要求,而AI驱动的招聘系统又增加了另一层令人沮丧的障碍,迫使求职者在招聘人员查看简历之前先针对机器进行优化。 而AI在商业中的应用甚至才刚刚开始。

Ethan Mollick@emollick · 4月13日

Six months ago, there was a lot of focus on the idea that the there would be a massive glut of unused computing power which would could a recession as AI use plateaued. The "compute bubble" belief was absolutely everywhere. The degree to which this was wrong deserves some notice

译六个月前,人们非常关注一种观点,即随着AI使用趋于平稳,将会出现大量闲置的计算能力,从而引发经济衰退。"算力泡沫"的说法无处不在。 这种错误程度值得关注。

Chubby♨️@kimmonismus · 4月13日

My guess: - ChatGPT image 2 + (hopefully) Spud - DeepSeek v4 - (hopefully) an update to Gemini 3.1

译我的猜测:

宝玉@dotey · 4月13日

Cursor Agent 3.0 被曝“套壳” Claude Code,官方回应称为小范围测试 Cursor 的新版 Agent 被曝出“套壳”了 Anthropic 的底层技术。开发者逆向分析发现,Cursor 3.0 版本在本地运行了一个替换引擎,简单粗暴地把系统提示词和消息里的“Claude”字眼全部替换成了“Cursor”。其安装包里直接内置了 Anthropic 官方的 Agent 开发工具,并接入了一个专门为 Cursor 微调的 Claude 3.7 模型。 面对社区的质疑,Cursor 团队成员 Michael Truell 迅速给出了澄清。他表示这只是一次常规的 A/B 性能测试,目的是对比评估 Claude 官方框架和 Cursor 默认框架的优劣。这次测试非常隐蔽,只覆盖了不到 1% 的流量。 Michael 说的应该是事实,只是这种形式爆出来还是有点尴尬 😅

译开发者逆向分析发现,Cursor 3.0 Agent基于Claude Code构建,通过本地替换引擎将提示词中的"Claude"改为"Cursor",内置Anthropic官方Agent SDK及微调版Claude 3.7模型。Cursor团队回应称,这仅是覆盖不到1%流量的小范围A/B测试,旨在对比评估Claude官方框架与自有框架的性能差异。尽管官方解释符合常规测试逻辑,但"套壳"形式曝光仍引发开发者社区尴尬反应。

Rohan Paul@rohanpaul_ai · 4月13日

During Beijing’s recent humanoid robot half-marathon test runs, these bipedal robots demonstrated sustained running speeds that test their dynamic stability and energy management systems.

译在北京最近的人形机器人半程马拉松测试期间,这些双足机器人展示了持续的奔跑速度,考验其动态稳定性和能源管理系统。

Rohan Paul@rohanpaul_ai · 4月13日

Theguardian: US graduates just ran into the weakest entry-level job market since the pandemic, with 42.5% underemployment, and the squeeze is hitting even students with strong majors, internships, and graduate degrees. AI shows up here more as a filter sitting in front of humans, forcing applicants to rewrite resumes around keywords so they can pass automated screening before a manager ever sees their actual ability. --- theguardian .com/us-news/2026/apr/12/college-graduates-job-market-ai

译美国入门级就业市场创疫情以来最差,42.5%毕业生未充分就业,连强势专业与研究生学历者也受冲击。AI简历筛选系统迫使申请者针对关键词优化简历,才能在招聘经理看到实际能力前通过初筛。

Yuchen Jin@Yuchenj_UW · 4月13日

This is really bad. The scary part in the US is that it doesn’t matter whether you are the CEO of OpenAI or just a regular PhD. There are paid online websites that can find your address and phone number. I don’t know how such personal info got out.

译美国付费网站能查到你家地址和电话,不管你是 OpenAI CEO 还是普通博士。作者震惊于个人信息泄露,且完全不知道这些信息是怎么流出去的。

Rohan Paul@rohanpaul_ai · 4月13日

Fortune: The survey says 29% of workers admit sabotaging company AI plans, and that rises to 44% for Gen Z. Companies are finding that AI rollout is colliding with a basic workplace fact: people resist tools they think will erase their role. That sabotage ranges from ignoring approved tools and using shadow AI to feeding weak outputs into workflows and even skewing reviews so the system looks worse than it is. The logic is not technical failure first but trust failure first, because workers who hear constant claims that AI can replace entry-level white-collar work start treating adoption like self-harm. That reaction can backfire fast, since executives in the same survey say workers who refuse AI are more exposed to layoffs, less likely to be promoted, and less likely to move into leadership. --- fortune .com/2026/04/08/gen-z-workers-sabotage-ai-rollout-backlash/

译Fortune调查显示,29%的员工承认通过使用影子AI、输入劣质数据等方式暗中破坏公司AI部署,Z世代比例高达44%。这并非技术故障,而是信任崩塌——员工担忧AI取代其岗位,将配合视为"自我伤害"。然而矛盾的是,高管表示拒绝采用AI的员工反而面临更高裁员风险与更少晋升机会,形成职场两难。

Rohan Paul@rohanpaul_ai · 4月13日

India is quietly becoming a training floor for humanoid robots, with workers filming thousands of first-person hand tasks so AI systems can learn grasping, folding, sorting, and tool use. This story is really about how the humanoid robot boom still depends on cheap, repetitive human labor to teach machines basic physical skill. The problem is that robots do not fail on big plans first; they fail on tiny physical details like grip angle, finger timing, slip correction, and object contact. That kind of knowledge is hard to code and expensive to collect. These labs capture that missing layer by putting cameras or sensors on people and recording ordinary actions as machine-readable motion examples. The useful part is not the towel or box itself but the sequence: where the hand starts, how force changes, when fingers adjust, and how the body recovers from small mistakes. That gives robotics teams supervised data for models that map visual input to physical actions, which is much easier than hand-coding every movement rule. This is a story about how physical intelligence gets extracted before it gets automated. --- quasa. io/media/the-hidden-hand-farms-of-india-fueling-the-ai-robot-revolution-with-human-motion

译印度工人佩戴头戴摄像头采集第一人称手部动作数据,用于训练人形机器人掌握抓取、折叠等物理技能。这揭示了当前机器人热潮仍依赖廉价人类劳动获取 embodied data。与语言模型不同,机器人需从人类动作中学习握持角度、力度调整等微观物理细节。该模式将人类劳动双重商品化:既是生产工作,又成为训练AI的数据基础设施。在具身数据采集成本降低前,机器人行业将持续依赖工人劳动作为"物理智能"的廉价来源。

Chubby♨️@kimmonismus · 4月13日

I find it striking to see how many C-level executives are increasingly advocating for a reduction in working hours, whereas previously the opposite was always the case. Most recently, Sam Altman, with his policy paper, suggested that a 4-day week with 32 hours is practically indispensable and that we need a new social contract. There are growing voices suggesting that, in the wake of AI and robotics, people should presumably work less.

译C-level 高管群体正转向支持减少工时,与以往相反。Sam Altman 近期在政策文件中提议每周 32 小时的四天工作制,认为这是 AI 时代不可或缺的新社会契约。随着 AI 与机器人技术发展,主张缩短工时的声音日益增多。

DogeDesigner@cb_doge · 4月13日22

Grokipedia surpassed 20 million visits in Q1 More people are shifting to @Grokipedia. Share Grokipedia links and cite Grokipedia on your websites and blogs. This is how we can beat the woke Wikipedia.

译Grokipedia 在第一季度访问量超过2000万 越来越多人转向 @Grokipedia。 在您的网站和博客上分享 Grokipedia 链接并引用 Grokipedia。 这就是我们能够击败觉醒的维基百科的方式。

DogeDesigner@cb_doge · 4月12日26

Anthropic’s Claude Opus is FALLING. Latest benchmarks show its accuracy dropped from 83.3% → 68.3% in just days. That’s a major spike in hallucinations during coding. Grok 4.20 still holds the #1 spot. Undefeated.

译Anthropic的Claude Opus正在下滑。 最新基准测试显示,其准确率在短短几天内从83.3%降至68.3%。 这在编码过程中的幻觉率出现了大幅飙升。 Grok 4.20仍保持第一的位置。未被超越。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月17日
01:44
Epoch AI@EpochAIResearch
勘误:昨天,我们发现我们对芯片持有者的部分估算数据已过时--Oracle 的 Nvidia 算力未按预期从"其他"类别中扣除。 这使得"其他"类别虚增了约100万 H100e,占总体总量的5%。在我们修正后的数据中,超大规模云服务商持有全球 AI 算力的71%。 【引用 @EpochAIResearch】:五家公司--Google、Microsoft、Meta、Amazon 和 Oracle--目前控制着全球约三分之二的算力,较2024年初的约60%略有上升。 许多 AI 实验室(包括 OpenAI 和 Anthropic)几乎完全依赖这些超大规模云服务商来获取算力。

Epoch AI: Five companies - Google, Microsoft, Meta, Amazon, and Oracle - now control about two-thirds of the world's compute, up s...

GoogleMicrosoft现象/趋势部署/工程
4月16日
22:48
Nathan Lambert@natolambert
Claude Opus/GPT 模型小版本间 token 效率推理改进的当前速度相当惊人。所有迹象都表明这将继续。 4.6 到 4.7 在过去本可被视为一次相当大的模型升级。
AnthropicOpenAI推理现象/趋势
17:43
Deedy@deedydas
我用 claude code + seedance 2 api 生成了这整段45秒的电影片段(音频+视频) 仍有明显的AI痕迹,但到今年年底(veo 5)我们应该就能做出与真实电影无法区分的全长电影了
智能体Anthropic现象/趋势视频
09:08
karminski-牙医@karminski3
从卖鞋到卖算力:Allbirds股价暴涨430%

面临倒闭危机的鞋履品牌Allbirds宣布全面转型算力服务,放弃原有鞋类业务,NASDAQ股价单日暴涨430%。该公司瞄准无法使用Amazon、GCP、Azure等主流云服务商的客户群体,试图在算力市场寻找差异化生存空间。此前其股价已从历史高点跌至约4美元,受此消息刺激回升至17美元左右。

现象/趋势部署/工程
07:43
Chubby♨️@kimmonismus
TSMC千亿扩产应对AI算力需求激增

AI发展常被忽视的关键是芯片制造产能的指数级扩张。TSMC正同时在中国台湾建设10座、亚利桑那州规划12座先进晶圆厂,2026年资本支出达520-560亿美元,美国总投资达1650亿美元。这不仅是产量扩张,更是为在2nm及以下节点实现计算密度 scaling,满足AI基础设施对晶体管数量的爆发式需求,尽管每片晶圆成本呈指数级增长。

现象/趋势部署/工程
05:43
Rohan Paul@rohanpaul_ai
一名 Meta 员工创建了一个仪表板,让同事们可以竞争成为公司的第一 AI Token 用户。 这个排行榜名为 "Claudeonomics",取自 Anthropic 的 AI 模型 Claude,展示了前 250 名 token 用户,并授予员工称号,如 "Token Legend" 和 "Cache Wizard"。 该排行榜鼓励了 "tokenmaxxing",这是硅谷日益流行的现象,强调将 token 使用量作为生产力的衡量标准。 --- fortune. com/2026/04/09/meta-killed-employee-ai-token-dashboard/
AnthropicMeta现象/趋势
03:44
Ethan Mollick@emollick
希望有信息说明这些数据来自哪里,但这是一个非常重大的变化。由于 AI 使用源于经验,每项 AI 研究中都存在的持续性性别差距曾是许多学者担忧的问题。 【引用 @OpenAINewsroom】:ChatGPT 刚推出时,存在巨大的性别差距,我们的匿名数据显示约 80% 的用户使用典型的男性名字。这一差距现已消失。

OpenAI Newsroom: When ChatGPT first launched, there was an enormous gender gap, with our anonymized data showing roughly 80% having typic...

OpenAI现象/趋势
01:43
Chubby♨️@kimmonismus
我们正在跨越一个重要门槛:AI agents 不再只是工具,它们正在成为经济行为体。它们端到端执行工作,只在出问题时才需要人类介入。 这颠覆了市场模式。人类从默认工作者转变为按需调用的后备层。这种从 P2P 到 A2P 的转变尚不明显,但它从根本上改变了劳动力的分配方式。@humworkai 是首批真正实现这一点的系统之一。 【引用 @ycombinator】:AI agents 会付钱让你和它们聊天。 当 AI agents 遇到瓶颈时,Humwork 的 (@humworkai) MCP 服务器能在 30 秒内将它们与经过验证的领域专家连接起来。他们的专家包括高级工程师、营销人员、设计师等。 恭喜发布,@theyashgoenka 和 @OneRohanDatta! https://www.ycombinator.com/launches/PxH-humwork-connect-ai-agents-with-human-experts-in-30-seconds

Y Combinator: AI agents will pay you to chat with them. When AI agents hit a wall, Humwork's (@humworkai) MCP server connects them to ...

智能体MCP/工具现象/趋势
4月15日
23:42
Chubby♨️@kimmonismus
炒作是真的。我已经准备好了,非常兴奋。重要的一周要来了! 【引用 @synthwavedd】:@acombo_yt gpt-5.5-2026-04-16

leo 🐾: @acombo_yt gpt-5.5-2026-04-16

OpenAI现象/趋势
23:42
Ethan Mollick@emollick
51
市场对追逐热门趋势的公司反应积极,即使其原有业务无关。例如,Kodak在2018年宣布涉足加密货币后股价飙升;Zapata在1998年更名ZAP.com后作为互联网股票成功IPO。近期,Allbirds宣布获得5000万美元可转换融资,计划将业务转向AI计算基础设施,并更名为"NewBird AI",目标是成为GPUaaS和AI原生云解决方案提供商,延续了这一市场模式。

Andrew Curran: From the Allbirds release: 'Allbirds, Inc. today announced the execution of a definitive agreement with an institutional...

大佬观点现象/趋势
16:48
Chubby♨️@kimmonismus
业内人士预测Opus 4.7与ChatGPT Image 2或本周密集发布

业内人士预测Claude Opus 4.7与ChatGPT Image 2将于本周密集发布,甚至可能包括代号"Spud"的新品。OpenAI惯于周二或周四发布,Anthropic则试图抢先或避免被 overshadow。鉴于Anthropic近期凭借Mythos等占据头条,加上Deepseek预计下周发布,OpenAI急需重大更新应对竞争。尽管Image 2已遭大量泄露,但The Information及OpenAI员工积极情绪均暗示发布临近。

AnthropicOpenAI图像生成现象/趋势
10:05
Epoch AI@EpochAIResearch
42
@NBCNews 关于我们近期人工智能使用情况的调查: https://www.nbcnews.com/tech/tech-news/ai-job-work-replace-task-help-rcna267238
现象/趋势行业动态
07:41
宝玉@dotey
你的同学小明发现 DeepSeek 写作功能强大,便打算以后所有的作文都用它完成,不再自己动笔。 你会怎样劝说他?
DeepSeek现象/趋势
06:05
Rohan Paul@rohanpaul_ai
"类固醇奥运会"开幕:允许兴奋剂的人类极限实验

Enhanced Games 是全球首个允许运动员在医疗监督下透明使用兴奋剂(PEDs)的体育赛事,彻底摒弃 WADA 反兴奋剂体系。赛事设立高额奖金(如破世界纪录奖励 $1M),旨在探索人类在无人工限制下的生理极限。该实验将产生独一无二的生理数据集,对 AI-biotech 交叉领域的研究具有极高价值。赛事已获得 $1.2B 资金支持,将于 5 月 24 日在拉斯维加斯举办。

Damian Player: this is INSANE! the world's first colosseum built for ENHANCED athletes. every competitor FULLY enhanced. every dose tra...

数据/训练现象/趋势
06:05
Rohan Paul@rohanpaul_ai
马克·扎克伯格:Meta 的广告业务现在依靠 AI 优化,而非静态人口统计。 "AI 实际上可能比你自己更能找到谁会对你的产品感兴趣。所以你最好只专注于打造最好的产品" 【引用 @rohanpaul_ai】:Reuters:Meta 有望成为全球最大的数字广告公司,2026 年广告收入预计达 2434.6 亿美元,而 Google 预计为 2395.4 亿美元。 数字广告奖励那些能将海量用户行为转化为低成本、高效、自动化投放结果的平台。 Meta 的优势在于 Advantage+,这是一个自动化广告定位、创意测试、预算分配和展示位置的系统,意味着广告商手动设置更少,且通常能在相同支出下获得更好回报。 这非常符合现代广告买家的需求,因为他们越来越希望减少管理参数,并在 Instagram、Facebook、Reels、WhatsApp 和 Threads 上获得更快的性能反馈。 Google 仍拥有庞大的广告机器,但其优势主要在于搜索广告,该领域增长更稳定,而 Meta 则通过在社交信息流、短视频和消息领域更积极的扩张实现更快增长。 eMarketer 称,Meta 的广告业务预计今年增长 24.1%,高于 2025 年的 22.1%,而 Google 预计增长 11.9%,这才是差距逆转的真正原因。 --- reuters .com/business/media-telecom/meta-poised-surpass-google-digital-ad-revenue-first-time-report-says-2026-04-13/

Rohan Paul: Reuters: Meta is on track to become the world's biggest digital ad company, with $243.46B in 2026 ad revenue versus Goog...

Meta现象/趋势
06:05
Rohan Paul@rohanpaul_ai
AI强制办公遭质疑:workslop成员工新时间税

企业强制推行生成式AI引发"workslop"现象。员工指出AI并未真正节省劳动,只是将其转移:起草速度加快的同时,检查、重写和争论劣质输出耗费更多时间,形成新的时间税。调查显示管理层与基层认知严重割裂——40%非管理层认为AI未省时间,而92%高管声称效率提升。这种分歧揭示了AI在办公场景中实际效益的争议性。

现象/趋势
06:05
Rohan Paul@rohanpaul_ai
北京 2026 人形机器人半程马拉松的一些有趣时刻 【引用 @rohanpaul_ai】:北京人形机器人半程马拉松,夜间测试。约 40% 的队伍完全自主运行,遥控跑获得 1.2× 罚分(4 月 19 日北京 E-Town 半程马拉松,100 多支队伍,300 多个人形机器人参赛)

Rohan Paul: Beijing's Humanoid Robot Half Marathon, night run test. Around 40% of teams are running fully autonomous, remote-control...

具身智能现象/趋势
06:05
Epoch AI@EpochAIResearch
五家公司--Google、Microsoft、Meta、Amazon 和 Oracle--目前掌控着全球约三分之二的算力,较 2024 年初的约 60% 略有上升。 许多 AI 实验室(包括 OpenAI 和 Anthropic)几乎完全依赖这些超大规模服务商来获取算力。
GoogleMicrosoft现象/趋势部署/工程
01:36
宝玉@dotey
AI时代文科的范式转型

AI揭示了文科长期存在的"伪能力"——仅对已有知识进行低阶重组的能力,彻底颠覆"知识苦修主义"伦理基础。它证明时间投入不等于认知深度,困难不等于价值:当AI轻松完成曾需数年训练的文献综述与文本分析,"努力即价值"的传统逻辑被证伪。作者提出AI时代文科核心使命转向:在不确定中作出判断,在系统之间进行翻译,在现实中承担后果,将价值思考置于真实利害关系之中。

西乔 XiQiao: 徐贲这篇AI时代的文科的反思相当不错,集中好几个层面的问题。 AI时代的文科的核心使命,可以被概括为三点:在不确定中作出判断,在系统之间进行翻译,在现实中承担后果。 文科传统中那些最珍贵的东西--对人类处境的细腻理解,对价值冲突的诚实面对,...

推理现象/趋势
00:05
Rohan Paul@rohanpaul_ai
廉价软件不会减少软件数量,反而增加它

杰文斯悖论在AI软件领域再现:开发成本降低反而导致企业应用数量激增。Gartner预测2026年40%企业应用将集成AI代理,催生"影子应用经济"——各团队快速构建的内部工具带来安全、认证、权限等治理风险。Superblocks提供控制层方案,让业务团队用AI生成应用,同时将认证、集成、权限、审计等控制权保留给IT部门,通过中间层架构隔离应用与公司核心系统。

智能体现象/趋势部署/工程
00:05
Chubby♨️@kimmonismus
我怀疑 Google 将在下个月的 Google I/O 上发布他们的下一个重大版本。 我会再次前往 California,我非常兴奋能在那里进行报道,并亲身体验 Google 将在 I/O 上展示的内容。 请记住:Google 拥有最强的算力(相当于 500 万立方米的 H100)、拥有 DeepMind 的杰出研究机构,以及非常坚实的财务基础和强劲的营收。 五月将会很精彩!
DeepMindGoogle现象/趋势
4月14日
15:33
宝玉@dotey
精选72
为什么你的"AI优先"战略可能大错特错?

文章指出,盲目追求“AI优先”战略可能是错误的,真正的瓶颈在于软件工程基础。如果自动化测试、CI/CD流程、A/B测试与监控、任务管理和系统架构等基础不扎实,AI的效能将无法释放。真正的“AI优先”应是一种推动必要工程改进的意识和动力,促使企业夯实基础,从而释放AI的生产力。

智能体大佬观点现象/趋势部署/工程

推荐理由:宝玉把一篇「AI First」的英文长文拆成了工程落地清单,不是喊口号而是列了五条前置条件和三个不适合的场景,做产品或带团队的人拿来对照自己的现状,比读原文有用。
12:28
Ethan Mollick@emollick
有趣:"目前,38%的美国人居住在至少一个运营中的数据中心5英里范围内……住在数据中心附近对公众对这些设施的看法影响不大。" 从现在起,看起来大多数数据中心将位于农村地区。https://www.pewresearch.org/short-reads/2026/04/13/most-new-data-centers-in-the-us-are-coming-to-rural-areas/
现象/趋势部署/工程
05:28
SemiAnalysis@SemiAnalysis_
全球市值前十的公司中有7家几乎完全依赖 TSMC 生产芯片的能力。 数万亿美元营收。集中在台湾一平方英里内的特定晶圆厂集群中。 那不是供应链,那是单点故障。
现象/趋势部署/工程
05:25
Rohan Paul@rohanpaul_ai
在波兰某地.. 😀 一台 Unitree G1 人形机器人正在追踪一群野猪!
具身智能现象/趋势
04:25
swyx 🐣@swyx
38
顺便说一句,全球约80%的智能体和AI工程都集中在这3平方英里的区域内

swyx 🐣: http://x.com/i/article/2015676288477097984

大佬观点现象/趋势
03:25
Rohan Paul@rohanpaul_ai
39
Marc Andreessen: 原始智力可能是领导力最差的资质--这彻底改变了我们思考AI的方式。 "如果领导者的智商与追随者相差超过一个标准差,那将是一个真正的问题。"
大佬观点现象/趋势
4月13日
23:50
宝玉@dotey
Markdown编辑器后台偷跑Claude Code耗尽额度

测试Markdown编辑器时发现Claude Code额度异常消耗,经查证系该软件在后台静默调用Claude Code CLI分析本地文档所致。用户对此毫无感知,直至查看日志才发现。此事暴露双重隐患:Claude Code调用成本高昂,且软件可在用户不知情的情况下擅自调用本地CLI工具,存在严重的透明度缺失与隐私安全风险。

智能体Anthropic现象/趋势编码
22:48
Chubby♨️@kimmonismus
年轻毕业生正面临缩水的入门级就业市场,未充分就业率达到42.5%,为2020年以来最高。 许多人反映投递了数十份申请,频繁遭遇已读不回,以及不切实际的经验要求,而AI驱动的招聘系统又增加了另一层令人沮丧的障碍,迫使求职者在招聘人员查看简历之前先针对机器进行优化。 而AI在商业中的应用甚至才刚刚开始。
智能体现象/趋势
22:48
Ethan Mollick@emollick
六个月前,人们非常关注一种观点,即随着AI使用趋于平稳,将会出现大量闲置的计算能力,从而引发经济衰退。"算力泡沫"的说法无处不在。 这种错误程度值得关注。
现象/趋势部署/工程
16:48
Chubby♨️@kimmonismus
我的猜测:

Bindu Reddy: Lots of new models coming in the next week... It will be a very busy week with various LLMs competing for attention

DeepSeekGoogleOpenAI现象/趋势
15:19
宝玉@dotey
Cursor Agent 3.0 被曝"套壳"Claude Code,官方回应称为小范围测试

开发者逆向分析发现,Cursor 3.0 Agent基于Claude Code构建,通过本地替换引擎将提示词中的"Claude"改为"Cursor",内置Anthropic官方Agent SDK及微调版Claude 3.7模型。Cursor团队回应称,这仅是覆盖不到1%流量的小范围A/B测试,旨在对比评估Claude官方框架与自有框架的性能差异。尽管官方解释符合常规测试逻辑,但"套壳"形式曝光仍引发开发者社区尴尬反应。

Jason Kneen: Delved into Cursor 3.0 -- turns out there's some interesting shenanigans going on.... "The most newsworthy finding is th...

智能体Anthropic现象/趋势编码
14:48
Rohan Paul@rohanpaul_ai
在北京最近的人形机器人半程马拉松测试期间,这些双足机器人展示了持续的奔跑速度,考验其动态稳定性和能源管理系统。
具身智能现象/趋势
10:34
Rohan Paul@rohanpaul_ai
美国入门级就业市场创疫情以来最差,42.5%毕业生未充分就业,连强势专业与研究生学历者也受冲击。AI简历筛选系统迫使申请者针对关键词优化简历,才能在招聘经理看到实际能力前通过初筛。
智能体现象/趋势
08:34
Yuchen Jin@Yuchenj_UW
美国付费网站能查到你家地址和电话,不管你是 OpenAI CEO 还是普通博士。作者震惊于个人信息泄露,且完全不知道这些信息是怎么流出去的。
OpenAI现象/趋势
08:34
Rohan Paul@rohanpaul_ai
近三成员工暗中破坏企业AI部署,Z世代比例近半

Fortune调查显示,29%的员工承认通过使用影子AI、输入劣质数据等方式暗中破坏公司AI部署,Z世代比例高达44%。这并非技术故障,而是信任崩塌——员工担忧AI取代其岗位,将配合视为"自我伤害"。然而矛盾的是,高管表示拒绝采用AI的员工反而面临更高裁员风险与更少晋升机会,形成职场两难。

智能体现象/趋势
04:33
Rohan Paul@rohanpaul_ai
印度成为人形机器人训练的隐秘农场

印度工人佩戴头戴摄像头采集第一人称手部动作数据,用于训练人形机器人掌握抓取、折叠等物理技能。这揭示了当前机器人热潮仍依赖廉价人类劳动获取 embodied data。与语言模型不同,机器人需从人类动作中学习握持角度、力度调整等微观物理细节。该模式将人类劳动双重商品化:既是生产工作,又成为训练AI的数据基础设施。在具身数据采集成本降低前,机器人行业将持续依赖工人劳动作为"物理智能"的廉价来源。

Rohan Paul: Indian factory workers wear head-mounted cameras to capture data for training robotics AI models. This image captures a ...

具身智能数据/训练现象/趋势
04:33
Chubby♨️@kimmonismus
C-level 高管群体正转向支持减少工时,与以往相反。Sam Altman 近期在政策文件中提议每周 32 小时的四天工作制,认为这是 AI 时代不可或缺的新社会契约。随着 AI 与机器人技术发展,主张缩短工时的声音日益增多。
OpenAI现象/趋势
01:22
DogeDesigner@cb_doge
22
Grokipedia 在第一季度访问量超过2000万 越来越多人转向 @Grokipedia。 在您的网站和博客上分享 Grokipedia 链接并引用 Grokipedia。 这就是我们能够击败觉醒的维基百科的方式。
现象/趋势行业动态
4月12日
23:39
DogeDesigner@cb_doge
26
Anthropic的Claude Opus正在下滑。 最新基准测试显示,其准确率在短短几天内从83.3%降至68.3%。 这在编码过程中的幻觉率出现了大幅飙升。 Grok 4.20仍保持第一的位置。未被超越。
现象/趋势评测/基准
‹ 上一页
1…3334353637
下一页 ›