AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2303 条
全部一手资讯X论文
标签「行业动态」清除
Alibaba Cloud@alibaba_cloud · 5月25日31

Qwen Conference 2026 | Livestream Live Singapore stage, global audience. Wherever you are, be part of the moment—stream the keynotes live: 🎤 Tech Leader Keynotes 💻 Full-Stack AI 💡 Global Insights ✨ Biz Innovation 🚀 Secure your livestream access: https://x.com/i/broadcasts/1vJpPrMXaZbJE

译Qwen Conference 2026 | 直播进行中 新加坡舞台,全球观众。无论您身在何处,共同见证这一刻——收看主题演讲直播: 🎤 技术领袖主题演讲 💻 全栈 AI 💡 全球洞察 ✨ 商业创新 🚀 获取直播观看权限:https://x.com/i/broadcasts/1vJpPrMXaZbJE

ginobefun@hongming731 · 5月25日49

#BestBlogs 早报 05-26 今天 BestBlogs 早报精选 10 篇,3 篇深度精讲: 📌 Google 把 FDE 面试压缩到 2 天、OpenAI 斥资 40 亿成立独立部署公司,AI 商业竞争主战场已从训练转向落地; 📌 Anthropic 研究 PM 首度揭秘下一代 Claude 的「dreaming 机制」与意识研究; 📌 以及一篇反直觉洞察:超级个体不是被培训出来的,而是被完整 Closed-loop 激发的。 听播客 / 读图文版,链接在 http://BestBlogs.dev 👇

译早报精选10篇文章并精讲3篇:包括Google与OpenAI将AI商业竞争焦点转向部署落地,Anthropic研究PM揭秘下一代Claude的「dreaming机制」,以及关于“超级个体”是通过完整Closed-loop被激发而成的反直觉观点。

Chubby♨️@kimmonismus · 5月25日57

Tech companies aren't hiding it anymore. Meta is laying off 8,000 people and spending $100 billion on AI data centers. Cisco's CEO called cutting 4,000 jobs "optimistically low." Intuit fired 3,000 workers to restructure around AI, then told the press it's "not about AI." Over 100,000 tech jobs gone in 2026 so far. TrueUp projects 370,000 by year end. The interesting part isn't the layoffs themselves but hat companies are now openly framing human headcount as a line item they're converting into GPU clusters. That used to be the quiet part.

译2026年科技行业出现大规模裁员,多家公司公开将人力成本转向AI投资。Meta裁员8000人,同时投入1000亿美元建设AI数据中心;Cisco CEO称裁员4000人已是“乐观地低”;Intuit裁员3000人以重构业务,但对媒体否认“因AI裁员”。据统计,今年已有超10万科技岗位流失,TrueUp预测全年可能达37万。推文指出,核心变化在于公司不再避讳,正公开地将人力预算“转换为GPU集群”。

Ant Ling@AntLingAGI · 5月25日50

To accelerate developer adoption, we are offering a limited-time 75% discount for Ling-2.6-1T, 1T total parameters with 63B activation, on OpenRouter. Built for real production needs, it delivers strong intelligence with lower token overhead — no long reasoning traces required 👇

译为加速开发者采用,我们正在OpenRouter上为Ling-2.6-1T提供限时75%折扣。该模型拥有1T总参数和63B激活参数,专为真实生产需求打造,以更低的token开销提供强大智能——无需长推理链 👇

Rohan Paul@rohanpaul_ai · 5月24日40

🇨🇳 China's Hangzhou Airport is now using its first track-guided bird-dispersion robot. Has directional sound devices, insect-killing lamps & cameras. Gives runways 24/7 protection with smart patrols, HD cameras, and a greener way to keep birds away.

译🇨🇳 中国杭州机场现已启用其首台轨道式驱鸟机器人。 配备定向声波装置、杀虫灯和摄像头。 通过智能巡逻、高清摄像头和更环保的驱鸟方式,为跑道提供全天候保护。

Rohan Paul@rohanpaul_ai · 5月24日22

Robotic Companies in the United States

译美国机器人公司

Rohan Paul@rohanpaul_ai · 5月24日58

The Economist: Top 5 big labs will spend a huge $800 Bn this year real cash on AI infrastructure. But their profit statements hardly notice these investments, since depreciation begins only after the assets are built, and then happens slowly. When a company buys AI servers, GPUs, buildings, power systems, and networking equipment, accounting treats those as assets, not normal expenses. So the profit statement does not show the full $800B hit right away. But the cashflow statement shows the truth more directly: the money has already left the company. The scary part is the scale: these firms may spend around 40% of their revenue on capital expenditure this year. That is bigger than the oil industry’s shale-boom spending and bigger than telecom spending during the dotcom bubble. --- economist .com/business/2026/05/13/big-tech-is-sacrificing-its-cashflows-to-prop-up-the-ai-boom

译The Economist指出,五大AI实验室今年将投入高达8000亿美元的现金用于AI基础设施。由于会计上将其视为资产并进行长期折旧,这笔巨额支出并未立刻体现在利润表上,掩盖了投资的真实冲击。然而,现金流量表揭示了资金已大规模流出。关键风险在于,这些公司的资本支出可能占到其收入的约40%,规模已超过油气页岩繁荣时期与电信泡沫时期的投资,引发了大公司从“印钱”转向“烧钱”的严重财务关注。

Chubby♨️@kimmonismus · 5月24日62

So it starts: Generative AI video is no longer just a demo. Kling is now being used in real TV and film production. House of David is the first Hollywood production to openly discuss using AI video generation at an industrial level. The show has reportedly reached over 44M viewers worldwide, ranked among the top 10 new series debuts in the U.S., and hit #1 on Prime Video in the U.S.

译事情开始了: 生成式AI视频不再只是演示。 Kling正被用于真实的电视和电影制作中。 《House of David》是首部公开讨论在工业层面使用AI视频生成的好莱坞作品。 据报道,该剧全球观众已超4400万,跻身美国新剧首播收视率前十,并登顶Prime Video美国区榜首。

Rohan Paul@rohanpaul_ai · 5月24日36

Humanoin in Shenzhen, China. Real-time stability management is among the toughest problems in developing reliable legged robots outdoors.

译中国深圳的Humanoin。 实时稳定性管理是开发可靠的户外双足机器人面临的最棘手问题之一。

Alibaba Cloud@alibaba_cloud · 5月24日42

On May 26, Professor Steven Hoi (Head of Multimodal Interaction, Tongyi Large Model Business Unit) will hit the main stage at Sands Expo Singapore to unpack Foundation Models for the Agent Era. 🚀 Register: https://click.qwencloud.com/m/20000000190/

译5月26日,通义大模型事业部多模态交互负责人Steven Hoi教授将在新加坡金沙会展中心主舞台,解析智能体时代的基础模型。 🚀 报名链接:https://click.qwencloud.com/m/20000000190/

Alibaba Cloud@alibaba_cloud · 5月24日42

On May 26, Alex Chen (Vice President of International Business, GM for North America Region at Alibaba Cloud) will take the main stage at Sands Expo Singapore to explore Agent Engine — Inference at Scale, Agents Unleashed. 🚀 Register: https://click.qwencloud.com/m/20000000190/

译5月26日,阿里云国际业务副总裁、北美大区总经理Alex Chen将在新加坡金沙会展中心主舞台,探讨Agent Engine——大规模推理,智能体释放潜能。 🚀 注册:https://click.qwencloud.com/m/20000000190/

Alibaba Cloud@alibaba_cloud · 5月24日29

On May 26, Junhua Wang, Vice President of Product & Engineering, Head of Computing Platform at Alibaba Cloud, will hit the main stage at Sands Expo Singapore to unpack Agentic Cloud — Powering Tokens, Empowering Agents. 🚀 Register: https://click.qwencloud.com/m/20000000190/

译5月26日,阿里云产品与工程副总裁、计算平台负责人王俊华将在新加坡金沙会展中心主舞台,深入解析“智能体云——驱动Token,赋能智能体”。 🚀 注册:https://click.qwencloud.com/m/20000000190/

Alibaba Cloud@alibaba_cloud · 5月24日18

On May 26, Narek Hayrapetyan (Head of Video Product, Picsart) will be at Sands Expo Singapore to break down how multimodal AI is completely redefining visual creation. 🚀 Register: https://click.qwencloud.com/m/20000000190/

译5月26日,Picsart视频产品负责人Narek Hayrapetyan将在新加坡金沙会展中心,解析多模态AI如何彻底重塑视觉创作。 🚀 报名链接:https://click.qwencloud.com/m/20000000190/

凡人小北@frxiaobei · 5月24日34

Anthropic 估值有望突破 9000 亿美元,预计 10 月份正式上市。 再努努力,争取进入万亿俱乐部。 有一说一,打铁还得自身硬。

Alibaba Cloud@alibaba_cloud · 5月24日23

On May 26, Dr. Feifei Li (CTO of Alibaba Cloud, President of International Business) will hit the main stage at Sands Expo Singapore to unpack Ship the Next and Scaling Trustworthy Agents. 🚀 Register: https://click.qwencloud.com/m/20000000190/

译5月26日,李飞飞博士(阿里云CTO、国际业务总裁)将在新加坡金沙会展中心主舞台,解读“Ship the Next”与“Scaling Trustworthy Agents”。 🚀 报名链接:https://click.qwencloud.com/m/20000000190/

向阳乔木@vista8 · 5月24日31

月底我和姚老师会在waytoagi开GEO公开课。 到时候姚老师主要分享GEO,我来推荐一些AI工具,还有一些AI使用实践。

译作者宣布将于本月底在waytoagi平台举办一场关于GEO的公开课。姚老师将主要分享GEO(生成式引擎优化)的系统逻辑与核心策略原则,作者本人则推荐一些AI工具并分享相关实践。公开课具体时间为本月底周六晚八点。此外,已建立GEOflow交流群,有意加入者可添加指定微信。

凡人小北@frxiaobei · 5月24日36

有点期待 codex 经常出一些不大不小的 bug

凡人小北@frxiaobei · 5月24日52

果然,竞争之下用户才能受益。 Claude 被封的陈年旧号可以申诉了。 Claude 他急了。

译在AI模型竞争加剧的背景下,Anthropic的Claude恢复了部分被封禁旧账号的登录功能,并提供申诉引导。这一变动被推测为应对OpenAI Codex等产品竞争而采取的用户召回策略。竞争压力可能正在推动服务方重新审视封禁政策,对用户而言,竞争环境往往带来更灵活的服务选择与权益保障。

ginobefun@hongming731 · 5月24日42

#BestBlogs 早报 2026-05-24 今日主题 🔽 Anthropic 联合 50 家伙伴用 Claude Mythos 在一个月内发现逾 1 万个高危漏洞,安全瓶颈已从「发现」转移到「修补」,AI 找 bug 的速度已超过人类部署补丁的能力。 与此同时,每秒 1,200 tokens 的 Codex Spark 揭示了一个反直觉真相:模型越快,工程师反而要越慢,实时监督、逐步微验收才是高速 AI coding 的核心纪律。 腾讯玄武 150 组实验则用数据打破迷思,装上 AI Skill 不等于更强,token 消耗平均多 48%,真正有效的 Skill 提供的是外部工具与约束性结构,而非对模型能力的Markdown 重包装。

译Anthropic案例显示AI发现漏洞速度已超修补能力,安全瓶颈转移。高速模型如Codex Spark反而要求人类工程师进行更精细的实时监督。腾讯实验则证实,为AI赋能的正解是提供外部工具与结构化约束,而非简单技能包装。这共同指向了更高效的人机协作新范式。

Chubby♨️@kimmonismus · 5月24日56

„AI is going to make everything cost less.” The new Fed Chair says the next few years could be a hugely exciting moment, arguing that AI is “structurally disinflationary.” Read that again: „structurally disinflationary“. And that from the new Fed Chair.

译“AI将使一切成本降低。”新任美联储主席表示,未来几年可能是一个极其激动人心的时刻,他认为AI具有“结构性抑制通胀”的作用。 再读一遍:“结构性抑制通胀”。 这出自新任美联储主席之口。

Chubby♨️@kimmonismus · 5月24日66

Can found opus 4.8 in Google Vertex. Can’t confirm any of this tho. However, the fact that Sonnet 4.8 is coming soon has been common knowledge since the data leak. The inclusion of Opus 4.8 in Vertex comes as a surprise to me - though, considering the accelerated release schedule and the massive success of GPT-5.5, it is certainly plausible. Couldn’t be more excited!

译在Google Vertex上发现了Opus 4.8。不过这一点尚无法确认。 然而,自数据泄露以来,Sonnet 4.8即将到来已是众所周知。 Opus 4.8出现在Vertex上让我感到意外——不过,考虑到加速的发布节奏和GPT-5.5的巨大成功,这确实有可能。 简直太令人兴奋了!

Chubby♨️@kimmonismus · 5月23日49

Many of the best researchers at OpenAI, Anthropic, Google, Meta and other frontier labs are not U.S. citizens. They are in the U.S. on temporary visas while building the very systems Washington increasingly describes as critical to national security. Forcing them to leave the country to apply for a Green Card adds uncertainty, delays and risk to one of America’s biggest advantages: attracting the world’s best technical talent. I'm not American, so take this with a grain of salt. But from what I've researched, it makes many things significantly more complicated for OpenAI and Anthropic.

译美国前沿AI实验室(如OpenAI、Anthropic)的核心研发人员多为持临时签证的非美国公民。美国国土安全部(DHSgov)近期收紧政策,要求在美持临时签证者须离境返回原籍国才能申请绿卡。此举为OpenAI、Anthropic等公司顶尖人才的绿卡申请流程增加了不确定性、延迟和风险,可能动摇美国吸引全球顶尖技术人才的关键优势,并对其国家安全所倚重的AI系统研发生态构成潜在冲击。

Chubby♨️@kimmonismus · 5月23日62

NVIDIA has completely halted the release of graphics cards for the gaming market for 2026. Full Focus AI: a gap that China is now also attempting to fill. Not only are high-quality, affordable ev-cars now coming out of China, but - presumably soon - affordable consumer GPUs as well. Curious for benchmarks. If they compete with - let’s say - a RTX 3070 for 1/5 its price this would be a huge win.

译英伟达已完全暂停2026年游戏显卡的发布。全力聚焦AI:中国现在也正试图填补这一空白。 不仅高质量、价格实惠的电动汽车正从中国涌现,而且——很可能不久之后——价格实惠的消费级GPU也将出现。 很好奇基准测试结果。如果它们能与——比如说——RTX 3070竞争,而价格只有其五分之一,那将是一个巨大的胜利。

Rohan Paul@rohanpaul_ai · 5月23日44

Marc Andreessen on the future path of AI. "There's like a rotation from software into hardware. It's possible all the value accrues to the chips, and the energy, and then software is all open source."

译Marc Andreessen谈AI的未来路径。 “存在一种从软件向硬件的转向。 可能所有价值都将集中在芯片和能源上,而软件则全部开源。”

宝玉@dotey · 5月23日39

帮转 AI Agent 实习生招聘

译当前AI Agent开发实习生的招聘需求显著上升,其核心技术栈已从传统的后台开发项目(如秒杀、电商)转向集中应用Langchain框架与RAG(检索增强生成)技术。这反映出市场对AI应用开发岗位的技能要求正发生明确转变,具备相关实践经验的实习生受到青睐。

Kling AI@Kling_ai · 5月23日60

Debut in Cannes | Kling AI Conference Highlights On May 18, Kling AI hosted its official conference at Marché du Film, bringing together global film professionals to explore how AI is entering real film production workflows. This Cannes conference marks Kling AI’s significant debut on the world’s most prestigious film stage. From animated features to Hollywood series, from experimental shorts to theatrical feature films, Kling AI has proven its ability to empower diverse forms of cinematic production. Moving forward, Kling AI will continue to advance film-grade AI imaging, working with global creators to bring more "impossible" stories to the screen. #KlingAI #Cannes2026 #MarcheDuFilm

译Kling AI在戛纳电影市场(Marché du Film)举办官方会议,首次登上这一世界顶级电影舞台。会议汇集全球电影专业人士,共同探讨AI如何融入实际电影制作流程。Kling AI已证明其能力可服务于动画长片、好莱坞剧集、实验短片及影院电影等多种创作形式。未来,Kling AI将继续推进电影级AI影像技术,与全球创作者合作,将更多“不可能”的故事呈现在银幕上。

ginobefun@hongming731 · 5月23日39

#BestBlogs 早报 05-23 今日主题: - Agent 架构在生产端形成长时程与实时两类分化(LangChain Interrupt 2027); - Notion 以爵士乐队模式和哑铃型人才重新创业(Ivan Zhao × Sequoia) - GLM-5.1 高速版 400 tokens/s 打破「快必然小」惯例(智谱 × TileRT)

ginobefun@hongming731 · 5月23日61

http://x.com/i/article/2057993057891655680 # BestBlogs 早报 · 05-23|Agent 架构分化、Notion 重组、GLM-5.1 高速版 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-23 ## 导语 今天是 2026 年 5 月 23 日,欢迎收听 BestBlogs 早报 EP65。 本期早报聚焦三条主线:Agent 架构的生产端分化​、SaaS 公司在 AI 时代的组织重构​,以及推理速度的新基准。LangChain 在 Interrupt 2027 主题演讲中,正式点名 Agent 生产分裂为两类——长时程知识型与亚秒延迟响应型,两条路径的工程取舍已趋于清晰。Notion CEO Ivan Zhao 则把 SaaS 公司「重新创业」的经历讲成了一门组织课,「爵士乐队」取代「行进乐队」,哑铃型人才结构上线。智谱同期发布 GLM-5.1 高速版,400 tokens/s 打破「快的模型必然更小」的行业惯例,让 Coding Agent 密集调用场景第一次有了旗舰质量加持。 此外,阿里云在 2026 年峰会亮出全栈 Agent 化升级、Spotify 把 AI 开发体验推广到 3000 名工程师、李飞飞团队发布 ESI-Bench 挑战 AI 空间智能,以及 OpenAI 与 Anthropic 截然不同的财务走势——这些内容都在今天的速览与补充阅读中等你探索。 ## 精讲一:AI 智能体的未来:展望 Interrupt 2027 来源:LangChain 两类 Agent 的生产分叉 如果说 2024 年是 Agent 的「探索期」,那么 2026 年已经进入「生产分化期」。LangChain 在 Interrupt 2027 主题演讲中,清晰描绘了 Agent 在生产环境中分裂为两个截然不同类别的格局: 长时程知识 Agent(Long-Horizon Knowledge Agents) 的设计目标是跨越分钟、小时乃至数天的任务周期。它们需要安全沙箱环境来执行代码、多层子 Agent 协同、以及多 Agent 框架支撑,核心追求的是长期结果而非单次提示的响应。典型场景包括大型重构、深度调研、多步骤自动化流水线。 延迟敏感型客户体验 Agent(Latency-Sensitive CE Agents) 则以亚秒延迟为硬性约束,服务于用户互动、支持自动化、销售流程等实时场景。这一路径正在加速推动行业向原生语音模型(Voice-to-Voice)转型,告别「STT → Text LLM → TTS」的拼接架构,转向更低延迟的端到端原生语音交互。 LangSmith Fleet:让领域专家无需写代码就能构建 Agent 演讲中同步发布的 LangSmith Fleet 是「托管式 Agent 规模落地」的一个具体基准。它让领域专家通过自然语言而非代码来构建 Agent,内置 200+ 集成与 7500 个长尾工具。内测数据显示:商机合格率提升 240%、每位销售工程师每月节省 40 小时。这不是演示 demo,而是在生产环境中跑出来的数字。 持续学习循环:三层优化框架 LangChain 提出了一个 Agent 系统持续优化的三层框架,这是目前工程实践中最具指导价值的部分之一: - 模型层(Model Layer):面向特定领域的基础模型微调(如针对代码调试场景的 Qwen 系列)。关键洞察是针对领域特定任务的微调可以同时提升精度和响应速度 - Harness 层(Harness Layer):连接 LLM 与工具/沙箱的结构化应用代码。研究表明 Agent 驱动的 Harness 迭代(在 Terminal Bench 2 测试的方案)可以在不更新基础模型的前提下持续超越人工工程优化——这意味着应用层的架构优化有时比升级底层模型更高效 - Context 层(Context Layer):运行时行为调整所需的外部引导文件、本地记忆资产与配置摘要。这一层是成本最低、迭代最快的优化通道,也是长期积累的重要资产 三层叠加的关键优势在于:每一层都可以独立迭代,团队可以根据瓶颈位置针对性地投入优化资源,而不需要等待底层模型版本更新。 为了集中研究自动化优化系统,LangChain 同步宣布了内部研究部门 LangChain Labs,专门追踪生产 trace 历史以优化执行 Harness。这个部门的成立本身也说明:Agent 系统的优化已经复杂到需要专职团队持续研究。 开源模型的成本优势正在放大 演讲中还有一个值得关注的信号:在 token 密集型场景(如代码调试)中,开源基础模型的基础性能已逼近前沿闭源模型,而运营 token 成本显著更低。更重要的是,开源架构允许团队在私有用户 trace 上进行后训练与微调,这对需要公司特定领域知识的 Agent 场景具有战略价值。 LangChain 的整体判断是:未来两年 Agent 工程的核心挑战,不在于「能不能跑起来」,而在于「如何在长时程与低延迟两类截然不同的约束下,分别做到最好」。沙箱执行环境、多 Agent 协调框架、Native Voice 实时交互——这三个方向将成为 Agent 基础设施演进的主轴,决定下一代 Agent 应用的能力天花板。对于正在构建 Agent 系统的团队,认清自己的产品属于哪一类,将直接影响技术栈的选型方向。 观看完整视频 → ## 精讲二:Notion 创始人 Ivan Zhao:重塑公司的艺术 来源:Sequoia Capital 从「行进乐队」到「爵士乐队」 Notion CEO Ivan Zhao 在 Sequoia 的深度对话中,把过去三年的组织转型概括为一句话:「我们想成为一支爵士乐队,而不是行进乐队。」 行进乐队的运作方式是:有固定脚本,人人按部就班,指令自上而下流动。爵士乐队则不同——有底层结构,但个体在共享上下文中高度自主,可以即兴发挥,可以互相补位。这个比喻精准描述了 Notion 内部的组织信条:分布式决策、共享上下文、自律而非管控。 「酿啤酒 vs 造桥」:AI 产品为何抵制传统 PM 流程 Ivan 提出了理解 AI 产品开发本质的核心比喻: 造桥(Classic Software):可预测的工程过程。能设计出来的,基本都能造出来。传统 PM 收集需求 → 设计师出方案 → 工程团队实现,流水线清晰。 酿啤酒(AI Software):高度实验性,充满不确定性。你不能「命令酵母按你要的口味发酵」,只能投入最好的人才,持续做 eval,看模型最终能产出什么。 这个认知让 Notion 彻底调整了产品开发模式——不再以客户需求为唯一驱动,而是技术优先加实验驱动。PM 开始直接参与 token 消耗分析和模型 eval,设计师开始写代码,工程师开始做产品判断。 哑铃型人才结构:架构师 + 初级 IC 随着 AI 编程能力的成熟,Notion 重构了整个工程团队的人才结构,形成所谓「哑铃型分布」: 一端:高级架构师,提供方向感、审美判断、系统设计,以及语言模型无法模拟的领域 taste。 另一端:初级独立贡献者(IC),高能量、充满好奇心,同时驱动 4 到 6 个 Coding Agent 并行工作,充当 Agent 编排者而非纯粹的代码执行者。 中间的「经验层」被大幅压缩——不是因为他们不重要,而是这个能力区间已经被 AI 工具基本覆盖。 解散 CMO,品牌嵌入产品 另一个令人印象深刻的决策是:Ivan 解散了 CMO 职位,把品牌叙事的责任直接嵌入产品团队。背后逻辑是:在 AI 时代,品牌的塑造越来越发生在产品体验的每一个触点,而不是独立的营销活动。产品即品牌,品牌即产品,二者不应再由两个分离的组织来驱动。 与今日其他主题的关联 Ivan Zhao 的分享与今天早报的另外几个主题形成了有趣的共鸣。 LangChain 对 Agent 架构分化的描述,印证了 Notion 内部「酿啤酒」式开发方式的合理性——当底层模型本身具有不确定性时,严格的 PM 流程确实会成为阻碍而非支撑。而哑铃型人才结构的「初级 IC 驱动 4-6 个 Coding Agent」场景,直接依赖 GLM-5.1 高速版这类推理速度提升——只有当模型响应足够快,并行驱动多个 Agent 才能在体感上从「等待」变成「协作」。 从产品公司 CEO 的视角来看,Ivan 的这场分享本质上是在回答一个问题:当 AI 让「执行」的边际成本趋近于零,公司的核心竞争力应该沉淀在哪里?他的答案是:沉淀在共识(Shared Context)、判断力(Taste)与信任(Trust)之中——这些是模型无法复制的东西。 观看完整视频 → ## 精讲三:GLM-5.1 高速版:400 tokens/s,顶尖模型跑出最快速度 来源:智谱 打破「快 = 小」的行业惯例 长期以来,AI 推理领域有一个默认共识:高速模型 = 轻量模型,想要极致低延迟就必须牺牲能力。GLM-5.1 高速版正面打破了这一惯例——在完整保留 GLM-5.1 旗舰能力的前提下,将输出速度推至 400 tokens/s,刷新当前全球大模型厂商 API 的速度上限。 这个数字意味着什么?一位作者连续伏案数天才能写完的文字量,它在 1 分钟内交付完毕;一名工程师埋头敲键盘 3 天才能完成的开发任务,在喝一杯咖啡的时间里完成。 为什么 Coding Agent 特别需要高速模型 Coding Agent 是这次发布最重要的受益场景。原因在于 Agent 的任务特性: 一个 Coding Agent 任务往往需要经历数十轮模型调用。单轮响应只要慢上几秒,整体耗时就可能拉长十几分钟。面对大型重构项目,每一步响应慢 1 秒,逐步累加又是几分钟的空等。 GLM-5.1 高速版带来的体感改变是质变而非量变:模型开始真正成为可以实时协作的伙伴,「和你坐在一起盯着画布调参」。这是之前无论是小模型的快还是大模型的慢都无法实现的体验。 TileRT:系统级优化的三层架构 400 TPS 是稳定生产能力,不是峰值数字。背后是智谱 GLM 团队与 TileRT 团队联合的系统级优化,在三个层面同时发力: 推理引擎层:针对 GLM-5.1 的架构特点,重写核心推理路径,提升单卡吞吐能力。 调度系统层:动态批处理、请求合并与 KV 缓存调度优化,大幅降低高并发场景下的尾延迟。 基础设施层:推理集群部署、网络链路、负载均衡的协同优化,确保高速能力在生产环境稳定可用。 TileRT 的设计核心是在编译期(AOT)将整个计算图静态编排为一个常驻 GPU 的 persistent Engine Kernel,彻底抛弃 Runtime 层的动态调度开销。算子间的中间结果不再写回 Global Memory,而是经由寄存器、Shared Memory 与 L2 Cache 直传,host 调度与跨算子同步全部压进同一个常驻 kernel——这是速度大幅提升的技术根因。 在多卡尺度上,TileRT 进一步将 SM 内部的 Warp Specialization 思路外推到整张 8 卡 NVL 拓扑,不同 GPU rank 不再执行同构逻辑,而是按计算密度与数据依赖被特化为不同 worker,进一步榨取集群整体吞吐。 适用场景与当前开放状态 GLM-5.1 高速版当前面向智谱 MaaS 平台部分企业客户开放,模型 ID 为 GLM-5.1-highspeed。重点适用于以下延迟敏感场景: - AI 编程:多轮 Coding Agent 调用中每轮节省数秒,整体任务时长显著压缩 - 实时交互:3D 场景根据用户输入实时建模,此前因延迟无法实现的产品形态开始具备落地可能 - 实时语音:作为原生语音 Agent 的后端推理引擎,低延迟响应是音质之外的关键体验要素 - 商业决策辅助:高并发场景下的实时分析与方案生成 400 TPS 与旗舰能力的同时达成,把「速度 vs 质量」的权衡从一道单选题变成了可以同时满足的工程目标。这对整个行业的推理架构方向有示范意义。 阅读原文 → ## 速览 以下 7 篇精选内容,每篇约 150 字导读,覆盖 Agent 工程实践、组织变革、AI 基础设施与产业财务等多个维度。 1. Spotify 如何把 AI 开发体验扩展到团队与 Agent:Claude Code、Honk、Backstage 与 MCP Spotify 工程基础设施负责人 Niklas Gustavsson 分享了公司如何将 AI 辅助开发规模化到 3000 名工程师的完整路径。关键数据:引入 Claude 3.5 Opus 后,99% 的工程师每周使用 AI 工具,94% 表示 AI 直接提升了交付表现,PR 频率上升 76%。Spotify 的做法是把 Claude Code、标准化代码库(Fleetshift)、内部工具平台(Backstage)、验证闭环与 MCP 整合成一套系统——不是单点替换工具,而是重构整个开发者体验的架构层。对于正在规模化 AI 开发工具的工程团队,这是少有的「大规模落地」案例。 观看视频 → 2. 阿里李飞飞首秀:一口气面向 Agent 发了 32 个新品 阿里云 CTO 李飞飞在 2026 年峰会上完成首秀,发布超 50 项新品。核心是「芯 - 云 - 模型 - 推理」全栈 Agent 化升级:自研芯片真武 M890(性能较上一代提升 3 倍)、Agentic Cloud(运行时、编排、治理、安全、记忆、数据平面六大能力模块)、旗舰模型 Qwen3.7-Max(Arena 国产第一),以及面向 Agent 友好的新产品「千问云」。这是国内云厂商首次围绕 Agent 进行全栈产品发布,从面向人的云服务向面向 Agent 的云基础设施的战略转向信号明确。 阅读原文 → 3. 专业化胜过规模:大多数 AI 采购决策忽视的战略变量 一个 30 亿参数的专业化模型,在结构化 OCR 基准测试中以约五十分之一的成本,超越了所有商业前沿 API 的表现。核心结论:当模型的训练分布足够贴近部署任务时,参数规模不再是决定性变量。这一发现对企业 AI 采购决策有直接启示——对于有明确领域边界的任务,专业化小模型在性价比上可以碾压通用旗舰。文章提供了结构化 OCR 的完整对比数据,包括生产稳定性与退化率指标,结论扎实可复现。 阅读原文 → 4. AI 原生工程 Meta Reality Labs 旗下 Horizon Experiences 团队负责人 Ian Thomas 分享了构建「AI 原生工程」文化的案例。核心愿景是将工程师从「建造者」转变为「探索者与创新者」——用 AI 消化大量日常性工作(更新测试、修复 bug、处理平凡的代码变更),释放人的时间聚焦于真正需要创造力的问题。演讲分享了从小型社区到大规模应用框架的结构化路径,以及可量化的生产力提升数据。对于正在思考如何在团队层面而非个人层面推广 AI 工程实践的技术管理者,值得参考。 阅读原文 → 5. Agent 核心技术概念与范式发生了哪些演变以及背后的思考 来自阿里云开发者的系统性梳理,覆盖 Agent 从 2023 年早期 ReAct 架构到 2026 年自进化阶段的四个演进阶段。每个阶段都有明显的技术特征标志:被动式响应 → 结构化工作流 → 多 Agent 协同 → 自进化。文章从 Prompt、Planning、Memory、Tools、Workflow、Environment 六个核心维度,深入分析了技术概念前后变化及其背后的工程化逻辑。对于仍在用「早期 Agent 框架思维」理解当前 Agent 系统的开发者,这篇文章能帮助重新校准认知坐标。 阅读原文 → 6. 李飞飞再出手,空间智能的 ImageNet 来了 李飞飞团队发布 ESI-Bench,一个专门评测具身空间智能的新基准,包含 10 个任务类别、29 个子类别、3081 个任务实例。与此前 benchmark 不同的是,ESI-Bench 第一次把「观察者」变成「行动者」,要求 AI 智能体主动行动才能获取解题信息。核心结论清晰:感知不是瓶颈,行动才是。当前最强多模态模型(含 GPT-5 和 Gemini 系列)在主动探索任务上的表现远低于给定最优视角时的得分,说明 AI 能「看懂」但仍然「不知道该怎么动」。 阅读原文 → 7. OpenAI「赚一块亏一块二」,Anthropic 已开始赚钱 两家 AI 巨头同期亮出底牌:OpenAI Q1 营收 57 亿美元,但运营利润率为 -122%,每赚 1 美元亏损 1.22 美元;Anthropic Q1 营收 48 亿美元,Q2 预测营收 109 亿美元,并实现约 5.59 亿美元运营利润,成为 AI 模型公司中率先摸到盈利门槛的案例。差异根源在于客户结构——OpenAI 需要补贴庞大的 9 亿周活免费用户群,Anthropic 几乎全部收入来自企业和开发者。两种模式的财务命运正在快速分化,这篇文章是理解当前 AI 商业格局的精要读本。 阅读原文 → ## 补充阅读 以下 9 篇内容作为延伸阅读,适合有特定兴趣方向的读者深入探索。 从 0 到 1 搭建 Agent:Agent 原理分析及个人助手实践(长文干货)(阿里技术) 系统覆盖 Agent 全链路原理,包括记忆系统、RAG、Function Calling 与 MCP,并附带个人助手项目的完整实践方案。约需 50 分钟阅读时间,适合想亲手构建 Agent 系统的开发者作为入门参考手册。 阅读原文 → 腾讯云 Agent Memory 节省 61% Token 提升 52% 成功率的诀窍:Mermaid 无限画布 × 上下文卸载(腾讯技术工程) 解决 Agent 长任务中上下文快速耗尽的实际工程问题。「上下文卸载 + Mermaid 无限画布」的组合方案,在超长 Session 实验中节省 61% Token 并将任务通过率从 33% 提升至 50%。适合正在处理 Agent 长任务内存压缩问题的工程师。 阅读原文 → Gemini 负责人:在智能体时代从执行者转向指挥者(Silicon Valley Girl) Google Gemini 负责人 Josh Woodward 谈 Agent 时代的人机协作范式转变。Gemini Spark 的目标是让知识工作者从任务执行者转变为「AI 网络的指挥者」,通过原生生态系统集成并行运行数百个后台任务。适合想了解 Google 在 Agent 时代整体战略思路的读者。 观看视频 → 你的 Coding Agent 应该做 AI 系统工程(AI Engineer) Hugging Face 的 Ben Burtenshaw 提出 Coding Agent 的下一步:进入 AI 系统工程领域,包括 CUDA kernels 优化、自动 fine-tuning,以及基于 open primitives 构建多 Agent 研究实验室。适合已有 Coding Agent 使用经验、想进一步探索其能力边界的工程师。 观看视频 → Cerebras 630 亿美元 IPO 背后:晶圆级芯片、OpenAI 大单与 AI 基础设施竞赛(No Priors) Cerebras 创始人兼 CEO Andrew Feldman 讲述公司如何把晶圆级芯片的逆向押注推进成一家上市 AI 基础设施公司。推理速度已从技术奢侈品变为商业必需品——这个判断与今天 GLM-5.1 高速版的发布形成有趣的呼应。 观看视频 → 最新对话 Claude Code 负责人:智能体时代的爆发,Anthropic 重构生产力边界(Web3 天空之城) 深度编译 Claude Code 负责人 Boris Cherny 的访谈。Anthropic 产品需求同比增长 80 倍,Claude Code 是核心引擎。文章覆盖范式转移、生产力实证(引入 Claude Code 后每位工程师产出提升约 250%)、组织变革启示,以及软件行业护城河的演变方向。与今天精讲二 Notion 的组织重构主题形成互文。 阅读原文 → 如何用 AI 构建自我改进型公司(Y Combinator) YC 视角的 AI-native 组织设计:不要停留在 copilot 式生产力提升,而应把公司重构为由传感器、策略、工具、质量门和学习系统组成的递归自我改进循环。与今天多篇内容的组织变革主题高度呼应,适合思考 AI-native 公司架构的创业者和管理者。 观看视频 → 浏览器自动化:从 GUI 到 OpenCLI(大淘宝技术) 针对 Agent 操控浏览器「路不好走」的实际痛点,提出 OpenCLI 方案:直接解析和复现浏览器底层 API 请求,绕过不稳定的前端 UI 自动化。思路清晰、工具可直接上手(npm install)。适合正在为 Agent 构建浏览器自动化能力的工程师。 阅读原文 → 马斯克的「一人王朝」,6 月 12 日敲钟(腾讯科技) SpaceX 正式提交 S-1,计划 6 月 12 日纳斯达克上市,目标估值 1.75 万亿至 2 万亿美元,马斯克保留 85% 投票权。财务结构「冰火两重天」:Starlink 年入 114 亿美元营业利润,xAI 单季亏损 64 亿美元,天上赚的钱被地上的大模型全部烧完。AI 叙事如何支撑超高估值,这篇文章提供了一手数据。 阅读原文 → ## 今日阅读路径 时间有限?以下是根据今日内容为你规划的最短有价值阅读路径: 如果你只有 15 分钟: 优先读「精讲三」——GLM-5.1 高速版的发布代表了一个具体可感知的技术里程碑,400 tokens/s 旗舰质量是 2026 年推理能力的新基准,对所有在生产中使用 AI 模型的人都有直接参考价值。文章篇幅适中,技术细节扎实,10 分钟读完,结论即可用。 如果你有 30 分钟: 加上「精讲一」——LangChain 对 Agent 架构分化的描述是目前最清晰的生产端视角之一,长时程 vs 延迟敏感的框架能帮你理清当前项目的技术取舍。 如果你有 1 小时,想要更完整的视角: 三篇精讲都读完,再加速览中的「阿里 Agent 全栈发布」和「OpenAI vs Anthropic 财务对比」——这两篇分别代表了 AI 基础设施格局和 AI 商业模式的两个关键截面,与精讲主题形成完整的上下文。 工程师专题路径: 精讲三(推理速度与 TileRT 架构)→ Spotify 案例(工具规模化)→ Agent 范式演变(技术全景)→ Coding Agent AI 系统工程(能力拓展边界) 管理者与创业者路径: 精讲二(Notion 组织重构与爵士乐队模式)→ Claude Code 负责人访谈(生产力实证)→ 如何用 AI 构建自我改进型公司(系统设计框架) 以上就是今天 BestBlogs 早报全部内容。感谢阅读,我们明天见。

译LangChain在演讲中指出,Agent生产架构已明确分化为长时程知识型与低延迟响应型两类,工程路径各异。Notion CEO分享了公司转向更灵活的“爵士乐队”模式,并采用“哑铃型”人才结构以适应AI开发。智谱同期发布GLM-5.1高速版,在保持旗舰能力的同时实现400 tokens/s的输出速度。三者共同揭示了AI应用在底层架构、组织形态与基础性能上的演进方向。

Rohan Paul@rohanpaul_ai · 5月23日25

Dyson has deployed robotic arms that selectively harvest strawberries based on ripeness detection in their innovative vertical farming system located in the UK.

译戴森在其位于英国的创新垂直农场系统中,部署了能够根据成熟度检测选择性采摘草莓的机械臂。

Google DeepMind@GoogleDeepMind · 5月23日60

We’re expanding our partnership with Singapore to help safely deploy AI at scale. 🇸🇬 Together with country experts, our new programs will focus on accelerating scientific discovery, advancing pandemic preparedness, and improving healthcare. Find out more → https://goo.gle/49jGwjv

译我们正在扩大与新加坡的合作,以帮助安全地大规模部署AI。🇸🇬 与各国专家合作,我们的新项目将重点加速科学发现、加强大流行病防范并改善医疗保健。 了解更多 → https://goo.gle/49jGwjv

Rohan Paul@rohanpaul_ai · 5月23日59

Interesting. SpaceX doing AI feels like the sequel to Peter Thiel introducing Elon and Demis in 2012. If AI becomes the dominant layer of coordination, prediction, design, logistics, science, and warfare, then Mars is not outside the problem; it is just another environment the system can model, enter, and optimize. SpaceX touching AI therefore does not feel like a random expansion into the fashion of the moment. It looks like a defensive necessity inside Musk’s own worldview, because building the transport layer of civilization is incomplete if another intelligence owns the decision layer above it. 🙂 --- Demis Hassabis: “I’m working on the most important project in the world. I’m building a superhuman AI.” Elon Musk: “Well, I work on the most important project in the world. I am turning us into an interplanetary species.” Demis Hassabis: “Well, you know, my AI will be able to follow you to Mars.” --- Video from "Interesting Times with Ross Douthat" + "New York Times Podcasts" + "New York Times Opinion" channel (link in comment)

译媒体指出,SpaceX涉足AI并非简单追逐技术热点,而是源于埃隆·马斯克世界观下的“防御性必要”。其核心逻辑是,若AI未来成为主导全球协调、预测与决策的关键层,那么火星环境也将被其建模与优化。若决策层被其他智能体掌控,马斯克构建的“文明运输层”便是不完整的。结合SpaceX近期以“SPCX”代码申请纳斯达克IPO的动向,其定位已从纯粹的发射服务商,转变为涵盖发射、Starlink卫星网络与AI基础设施的综合平台公司。此次IPO反映出投资者正将其重新估值为拥有运输、通信乃至地外算力潜力的平台级公司,而不仅是传统航天承包商。

Chubby♨️@kimmonismus · 5月23日72

Insane: Anthropic is reportedly nearing the close of its latest funding round, which could exceed $30 billion and value the company at more than $900 billion. - $900 would make it more valuable than OpenAI + the most valuable private company - ARR $50b by end of June, up from $44b via bloomberg

译据报道,Anthropic即将完成最新一轮融资,金额可能超过300亿美元,公司估值将超过9000亿美元。 - 9000亿美元将使其比OpenAI加上最有价值的私营公司更有价值 - 截至6月底,年化收入达500亿美元,高于此前的440亿美元 via bloomberg

Chubby♨️@kimmonismus · 5月23日63

DeepSeek is moving ahead with a $10.29 billion financing round. Good news: Liang Wenfeng, however, remains focused on building open-source AI models rather than chasing short-term commercialization. Via Bloomberg

译DeepSeek正在进行一轮102.9亿美元的融资。 好消息是:梁文锋依然专注于构建开源AI模型,而非追逐短期商业化。 Via Bloomberg

Replit ⠕@Replit · 5月23日56

Replit is featured in the @msft4startups startup spotlight at Microsoft Build 2026, and we're proud to be in good company. Check out the full cohort of startups building on Azure and solving real enterprise problems at the link below. See you in San Francisco. https://msft.it/6016vVpM2

译Replit在微软Build 2026活动中被@msft4startups重点推介,是构建Azure并解决企业实际问题的创业公司之一。该计划聚焦于弥合AI演示与生产环境实际运行之间的鸿沟,入选的初创公司正通过Azure平台将技术方案落地。

SemiAnalysis@SemiAnalysis_ · 5月23日58

Great BoM Analysis from our friends at Morgan Stanley A couple things to point out: 1. The memory value indicated here is referring to the LPDDR5x SOCAMM and the NVMe SSD. It does not include the HBM value, which is included in the GPU item. 2. The memory value indicated here does not equal revenue to the memory vendors, given that Nvidia charges margin on top of the cost they purchased the memory at. 3. PCB content increase stems from the cableless design, which drives significant PCB area increase and material upgrades 4. The total BoM price indicated here is the OEM channel price. Hyperscaler and Neoclouds will have lower BoM compared to this. Our institutional clients have had these insights since February 2026 from our VR NVL72 BoM Report https://semianalysis.com/vr-nvl72-model/. We also analyze the networking connector and backplane content along side many other contents. Also we discussed the changes in the supplier landscape from GB to VR NVL72. Contact sales@semianalysis.com if you are interested.

译本文解读了摩根士丹利关于英伟达VR200服务器物料清单的分析。报告特别指出,所列“记忆”成本仅指LPDDR5x SOCAMM与NVMe SSD,不含包含在GPU内的HBM成本;该成本也非存储厂商的最终收入,因英伟达加收了利润。BoM成本上升主要源于无缆设计导致PCB面积与材料升级。需注意此价格为OEM渠道价,超大规模用户成本更低。SemiAnalysis称其机构客户自2026年2月起已通过报告获此洞察,并涵盖更多组件与供应商分析。

Rohan Paul@rohanpaul_ai · 5月23日78

Bloomberg: DeepSeek prioritizes AGI over commercialization in funding talks They are pushing forward with $10.29 billion financing round, with Liang Wenfeng committing to continue developing open-source AI models rather than pursuing short-term commercialization goals --- bloomberg. com/news/articles/2026-05-22/deepseek-founder-declares-agi-goal-as-10-billion-round-advances

译Bloomberg:DeepSeek在融资谈判中优先考虑AGI而非商业化 他们正推进102.9亿美元的融资轮,梁文锋承诺继续开发开源AI模型,而非追求短期商业化目标

🚨 AI News | TestingCatalog@testingcatalog · 5月23日81

DeepSeek permanently reduced pricing for DeepSeek V4 Pro by 75%! > $0.003625 per million input tokens (with cache) > $0.435 per million input tokens. > $0.87 per million output tokens. Cache is almost free 👀

译DeepSeek永久下调DeepSeek V4 Pro定价75%! > 每百万输入token $0.003625(使用缓存) > 每百万输入token $0.435。 > 每百万输出token $0.87。 缓存几乎免费 👀

elvis@omarsar0 · 5月23日67

this is the way. 1/4 of the original price! the agentic stuff you can build with deepseek-v4-pro is already impressive so this like the best news for builders

译这才是正道。 价格仅为原价的四分之一! 用 DeepSeek-V4-Pro 构建的智能体功能已经令人印象深刻,所以这简直是开发者的最佳消息。

Berryxia.AI@berryxia · 5月23日43

DeepSeek充了值有种用不完的感觉,尤其flash… 这又给你75折优惠来啦…

译DeepSeek充了值有种用不完的感觉,尤其flash… 这又给你75折优惠来啦… [引用 @deepseek_ai]:我们正在将折扣永久化!🎉 享受使用 DeepSeek-V4-Pro 构建的乐趣,将您的创新想法变为现实!🚀

SemiAnalysis@SemiAnalysis_ · 5月23日44

Great BoM Analysis from our friends at Morgan Stanley A couple things to point out: 1. The memory value indicated here is referring to the LPDDR5x SOCAMM and the NVMe SSD. It does not include the HBM value, which is included in the GPU item. 2. The memory value indicated here is referring to the LPDDR5x SOCAMM and the NVMe SSD. It does not include the HBM value, which is included in the GPU item.ory at. 3. PCB content increase stems from the cableless design, which drives significant PCB area increase and material upgrades 4. The total BoM price indicated here is the OEM channel price. Hyperscaler and Neoclouds will have lower BoM compared to this. Our institutional clients have had these insights since February 2026 from our VR NVL72 BoM Report https://semianalysis.com/vr-nvl72-model/. We also analyze the networking connector and backplane content along side many other contents. Also we discussed the changes in the supplier landscape from GB to VR NVL72. Contact sales@semianalysis.com if you are interested.

译摩根士丹利发布了对NVIDIA VR200的物料清单分析。报告指出,其内存成本特指LPDDR5x SOCAMM与NVMe SSD,而GPU成本中已单独包含HBM。因采用无缆设计,PCB面积与材料成本有所上升。报告列示的总成本为OEM渠道价格,大型云服务商的采购成本将更低。该机构客户自2026年2月起已获得此分析,报告同时研究了网络连接器、背板等组件的变化及供应商格局演变。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月25日
09:53
Alibaba Cloud@alibaba_cloud
31
Qwen Conference 2026 | 直播进行中 新加坡舞台,全球观众。无论您身在何处,共同见证这一刻--收看主题演讲直播: 🎤 技术领袖主题演讲 💻 全栈 AI 💡 全球洞察 ✨ 商业创新 🚀 获取直播观看权限:https://x.com/i/broadcasts/1vJpPrMXaZbJE
开源生态行业动态
09:31
ginobefun@hongming731
49
BestBlogs 5月26日早报精选

早报精选10篇文章并精讲3篇:包括Google与OpenAI将AI商业竞争焦点转向部署落地,Anthropic研究PM揭秘下一代Claude的「dreaming机制」,以及关于“超级个体”是通过完整Closed-loop被激发而成的反直觉观点。

AnthropicGoogleOpenAI现象/趋势
00:57
Chubby♨️@kimmonismus
57
科技业裁员潮与AI基建狂飙

2026年科技行业出现大规模裁员,多家公司公开将人力成本转向AI投资。Meta裁员8000人,同时投入1000亿美元建设AI数据中心;Cisco CEO称裁员4000人已是“乐观地低”;Intuit裁员3000人以重构业务,但对媒体否认“因AI裁员”。据统计,今年已有超10万科技岗位流失,TrueUp预测全年可能达37万。推文指出,核心变化在于公司不再避讳,正公开地将人力预算“转换为GPU集群”。

Meta行业动态部署/工程
00:50
Ant Ling@AntLingAGI
50
为加速开发者采用,我们正在OpenRouter上为Ling-2.6-1T提供限时75%折扣。该模型拥有1T总参数和63B激活参数,专为真实生产需求打造,以更低的token开销提供强大智能--无需长推理链 👇
行业动态部署/工程
5月24日
21:27
Rohan Paul@rohanpaul_ai
40
🇨🇳 中国杭州机场现已启用其首台轨道式驱鸟机器人。 配备定向声波装置、杀虫灯和摄像头。 通过智能巡逻、高清摄像头和更环保的驱鸟方式,为跑道提供全天候保护。
具身智能行业动态部署/工程
20:57
Rohan Paul@rohanpaul_ai
22
美国机器人公司
具身智能行业动态
18:57
Rohan Paul@rohanpaul_ai
58
AI投资巨浪下的会计迷雾:8000亿支出如何被"隐形"

The Economist指出,五大AI实验室今年将投入高达8000亿美元的现金用于AI基础设施。由于会计上将其视为资产并进行长期折旧,这笔巨额支出并未立刻体现在利润表上,掩盖了投资的真实冲击。然而,现金流量表揭示了资金已大规模流出。关键风险在于,这些公司的资本支出可能占到其收入的约40%,规模已超过油气页岩繁荣时期与电信泡沫时期的投资,引发了大公司从“印钱”转向“烧钱”的严重财务关注。

The Economist: America's biggest companies have gone from printing money to burning it. It does not take Poirot to work out what's goin...

现象/趋势行业动态
18:27
Chubby♨️@kimmonismus
62
事情开始了: 生成式AI视频不再只是演示。 Kling正被用于真实的电视和电影制作中。 《House of David》是首部公开讨论在工业层面使用AI视频生成的好莱坞作品。 据报道,该剧全球观众已超4400万,跻身美国新剧首播收视率前十,并登顶Prime Video美国区榜首。
图像生成行业动态视频
18:27
Rohan Paul@rohanpaul_ai
36
中国深圳的Humanoin。 实时稳定性管理是开发可靠的户外双足机器人面临的最棘手问题之一。
具身智能行业动态
16:22
Alibaba Cloud@alibaba_cloud
42
5月26日,通义大模型事业部多模态交互负责人Steven Hoi教授将在新加坡金沙会展中心主舞台,解析智能体时代的基础模型。 🚀 报名链接:https://click.qwencloud.com/m/20000000190/
智能体多模态行业动态
16:22
Alibaba Cloud@alibaba_cloud
42
5月26日,阿里云国际业务副总裁、北美大区总经理Alex Chen将在新加坡金沙会展中心主舞台,探讨Agent Engine--大规模推理,智能体释放潜能。 🚀 注册:https://click.qwencloud.com/m/20000000190/
智能体MCP/工具行业动态
16:22
Alibaba Cloud@alibaba_cloud
29
5月26日,阿里云产品与工程副总裁、计算平台负责人王俊华将在新加坡金沙会展中心主舞台,深入解析"智能体云--驱动Token,赋能智能体"。 🚀 注册:https://click.qwencloud.com/m/20000000190/
智能体行业动态
16:22
Alibaba Cloud@alibaba_cloud
18
5月26日,Picsart视频产品负责人Narek Hayrapetyan将在新加坡金沙会展中心,解析多模态AI如何彻底重塑视觉创作。 🚀 报名链接:https://click.qwencloud.com/m/20000000190/
多模态行业动态
16:07
凡人小北@frxiaobei
34
Anthropic 估值有望突破 9000 亿美元,预计 10 月份正式上市。 再努努力,争取进入万亿俱乐部。 有一说一,打铁还得自身硬。
Anthropic行业动态
15:52
Alibaba Cloud@alibaba_cloud
23
5月26日,李飞飞博士(阿里云CTO、国际业务总裁)将在新加坡金沙会展中心主舞台,解读"Ship the Next"与"Scaling Trustworthy Agents"。 🚀 报名链接:https://click.qwencloud.com/m/20000000190/
智能体行业动态
13:22
向阳乔木@vista8
31
作者宣布将于本月底在waytoagi平台举办一场关于GEO的公开课。姚老师将主要分享GEO(生成式引擎优化)的系统逻辑与核心策略原则,作者本人则推荐一些AI工具并分享相关实践。公开课具体时间为本月底周六晚八点。此外,已建立GEOflow交流群,有意加入者可添加指定微信。

姚金刚: 有GEOflow交流群,可以加我微信"laoyaoke",晚点统一拉进群; 另外,这个月底的周六晚上八点,也会在waytoAGI开GEO公开课,会详细分析系统的逻辑及GEO的一些核心策略原则等,欢迎参加

行业动态
11:07
凡人小北@frxiaobei
36
有点期待 codex 经常出一些不大不小的 bug

Tibo: Some of you noticed limits drained faster in Codex, we root caused it to an optimization that we rolled back that had an...

OpenAI编码行业动态
10:37
凡人小北@frxiaobei
52
在AI模型竞争加剧的背景下,Anthropic的Claude恢复了部分被封禁旧账号的登录功能,并提供申诉引导。这一变动被推测为应对OpenAI Codex等产品竞争而采取的用户召回策略。竞争压力可能正在推动服务方重新审视封禁政策,对用户而言,竞争环境往往带来更灵活的服务选择与权益保障。

沐阳: 之前被封的Claude账号,居然可以登录了,登录之后会有申述引导。 这是察觉到Codex超车,搞了个用户召回策略?

Anthropic行业动态
08:31
ginobefun@hongming731
42
AI发展的三大启示:安全、协作与有效赋能

Anthropic案例显示AI发现漏洞速度已超修补能力,安全瓶颈转移。高速模型如Codex Spark反而要求人类工程师进行更精细的实时监督。腾讯实验则证实,为AI赋能的正解是提供外部工具与结构化约束,而非简单技能包装。这共同指向了更高效的人机协作新范式。

AnthropicMCP/工具OpenAI安全/对齐
02:57
Chubby♨️@kimmonismus
56
"AI将使一切成本降低。"新任美联储主席表示,未来几年可能是一个极其激动人心的时刻,他认为AI具有"结构性抑制通胀"的作用。 再读一遍:"结构性抑制通胀"。 这出自新任美联储主席之口。
政策/监管行业动态
00:57
Chubby♨️@kimmonismus
66
在Google Vertex上发现了Opus 4.8。不过这一点尚无法确认。 然而,自数据泄露以来,Sonnet 4.8即将到来已是众所周知。 Opus 4.8出现在Vertex上让我感到意外--不过,考虑到加速的发布节奏和GPT-5.5的巨大成功,这确实有可能。 简直太令人兴奋了!

can: claude-opus-4.8 is on Google Vertex 👀

Anthropic模型发布行业动态
5月23日
23:57
Chubby♨️@kimmonismus
49
AI人才绿卡政策引争议,美国科技优势面临挑战

美国前沿AI实验室(如OpenAI、Anthropic)的核心研发人员多为持临时签证的非美国公民。美国国土安全部(DHSgov)近期收紧政策,要求在美持临时签证者须离境返回原籍国才能申请绿卡。此举为OpenAI、Anthropic等公司顶尖人才的绿卡申请流程增加了不确定性、延迟和风险,可能动摇美国吸引全球顶尖技术人才的关键优势,并对其国家安全所倚重的AI系统研发生态构成潜在冲击。

Homeland Security: An alien who is in the U.S. temporarily and wants a Green Card must return to their home country to apply. This policy a...

AnthropicOpenAI政策/监管行业动态
18:57
Chubby♨️@kimmonismus
62
英伟达已完全暂停2026年游戏显卡的发布。全力聚焦AI:中国现在也正试图填补这一空白。 不仅高质量、价格实惠的电动汽车正从中国涌现,而且--很可能不久之后--价格实惠的消费级GPU也将出现。 很好奇基准测试结果。如果它们能与--比如说--RTX 3070竞争,而价格只有其五分之一,那将是一个巨大的胜利。

Pamphlets: 🚨🇨🇳 BREAKING - China Unveils Gaming GPU To Challenge NVIDIA

大佬观点现象/趋势行业动态
10:57
Rohan Paul@rohanpaul_ai
44
Marc Andreessen谈AI的未来路径。 "存在一种从软件向硬件的转向。 可能所有价值都将集中在芯片和能源上,而软件则全部开源。"
大佬观点行业动态
10:49
宝玉@dotey
39
当前AI Agent开发实习生的招聘需求显著上升,其核心技术栈已从传统的后台开发项目(如秒杀、电商)转向集中应用Langchain框架与RAG(检索增强生成)技术。这反映出市场对AI应用开发岗位的技能要求正发生明确转变,具备相关实践经验的实习生受到青睐。

Leo Xiang: 之前招后台的研发的实习生项目都是 秒杀、电商。如今招 AI Agent 开发的实习生项目都是 Langchain + Rag。 话说 X 上有想找 AI Agent 开发实习生方向的工作的不? 我这里在招实习生。

智能体检索增强行业动态
10:37
Kling AI@Kling_ai
60
Kling AI亮相戛纳,推动AI赋能电影制作

Kling AI在戛纳电影市场(Marché du Film)举办官方会议,首次登上这一世界顶级电影舞台。会议汇集全球电影专业人士,共同探讨AI如何融入实际电影制作流程。Kling AI已证明其能力可服务于动画长片、好莱坞剧集、实验短片及影院电影等多种创作形式。未来,Kling AI将继续推进电影级AI影像技术,与全球创作者合作,将更多“不可能”的故事呈现在银幕上。

行业动态视频
09:30
ginobefun@hongming731
39
#BestBlogs 早报 05-23 今日主题: - Agent 架构在生产端形成长时程与实时两类分化(LangChain Interrupt 2027); - Notion 以爵士乐队模式和哑铃型人才重新创业(Ivan Zhao × Sequoia) - GLM-5.1 高速版 400 tokens/s 打破「快必然小」惯例(智谱 × TileRT)
智能体推理行业动态
09:30
ginobefun@hongming731
61
AI应用新趋势:架构分化、组织重构与性能突破

LangChain在演讲中指出,Agent生产架构已明确分化为长时程知识型与低延迟响应型两类,工程路径各异。Notion CEO分享了公司转向更灵活的“爵士乐队”模式,并采用“哑铃型”人才结构以适应AI开发。智谱同期发布GLM-5.1高速版,在保持旗舰能力的同时实现400 tokens/s的输出速度。三者共同揭示了AI应用在底层架构、组织形态与基础性能上的演进方向。

智能体AnthropicOpenAI推理
09:27
Rohan Paul@rohanpaul_ai
25
戴森在其位于英国的创新垂直农场系统中,部署了能够根据成熟度检测选择性采摘草莓的机械臂。
具身智能行业动态
08:45
Google DeepMind@GoogleDeepMind
60
我们正在扩大与新加坡的合作,以帮助安全地大规模部署AI。🇸🇬 与各国专家合作,我们的新项目将重点加速科学发现、加强大流行病防范并改善医疗保健。 了解更多 → https://goo.gle/49jGwjv
Google安全/对齐行业动态
06:27
Rohan Paul@rohanpaul_ai
59
SpaceX的AI战略:从火箭公司到火星决策层的必争之地

媒体指出,SpaceX涉足AI并非简单追逐技术热点,而是源于埃隆·马斯克世界观下的“防御性必要”。其核心逻辑是,若AI未来成为主导全球协调、预测与决策的关键层,那么火星环境也将被其建模与优化。若决策层被其他智能体掌控,马斯克构建的“文明运输层”便是不完整的。结合SpaceX近期以“SPCX”代码申请纳斯达克IPO的动向,其定位已从纯粹的发射服务商,转变为涵盖发射、Starlink卫星网络与AI基础设施的综合平台公司。此次IPO反映出投资者正将其重新估值为拥有运输、通信乃至地外算力潜力的平台级公司,而不仅是传统航天承包商。

Rohan Paul: SpaceX just filed for a Nasdaq IPO under SPCX that could turn Elon Musk's SpaceX stake into the first $1T personal fortu...

大佬观点行业动态
05:27
Chubby♨️@kimmonismus
72
据报道,Anthropic即将完成最新一轮融资,金额可能超过300亿美元,公司估值将超过9000亿美元。 - 9000亿美元将使其比OpenAI加上最有价值的私营公司更有价值 - 截至6月底,年化收入达500亿美元,高于此前的440亿美元 via bloomberg
Anthropic行业动态
03:57
Chubby♨️@kimmonismus
63
DeepSeek正在进行一轮102.9亿美元的融资。 好消息是:梁文锋依然专注于构建开源AI模型,而非追逐短期商业化。 Via Bloomberg
DeepSeek开源生态行业动态
03:08
Replit ⠕@Replit
56
Replit在微软Build 2026活动中被@msft4startups重点推介,是构建Azure并解决企业实际问题的创业公司之一。该计划聚焦于弥合AI演示与生产环境实际运行之间的鸿沟,入选的初创公司正通过Azure平台将技术方案落地。

Microsoft for Startups: The startups joining us at #MSBuild 2026 are working on the problems that sit between a promising AI demo and something ...

Microsoft行业动态
02:05
SemiAnalysis@SemiAnalysis_
58
解读英伟达VR200服务器BoM分析

本文解读了摩根士丹利关于英伟达VR200服务器物料清单的分析。报告特别指出,所列“记忆”成本仅指LPDDR5x SOCAMM与NVMe SSD,不含包含在GPU内的HBM成本;该成本也非存储厂商的最终收入,因英伟达加收了利润。BoM成本上升主要源于无缆设计导致PCB面积与材料升级。需注意此价格为OEM渠道价,超大规模用户成本更低。SemiAnalysis称其机构客户自2026年2月起已通过报告获此洞察,并涵盖更多组件与供应商分析。

Aaron: Sheesh. $NVDA VR200 Bom Analysis from MS.

行业动态
01:56
Rohan Paul@rohanpaul_ai
同事件精选78
Bloomberg:DeepSeek在融资谈判中优先考虑AGI而非商业化 他们正推进102.9亿美元的融资轮,梁文锋承诺继续开发开源AI模型,而非追求短期商业化目标
DeepSeek开源生态行业动态
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
推荐理由:DeepSeek 百亿融资押注开源 AGI 而非短期变现,在这个闭源收费风潮里是个重要信号,做开源的可以看看。
01:37
🚨 AI News | TestingCatalog@testingcatalog
81
DeepSeek永久下调DeepSeek V4 Pro定价75%! > 每百万输入token $0.003625(使用缓存) > 每百万输入token $0.435。 > 每百万输出token $0.87。 缓存几乎免费 👀

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek推理行业动态
01:20
elvis@omarsar0
67
这才是正道。 价格仅为原价的四分之一! 用 DeepSeek-V4-Pro 构建的智能体功能已经令人印象深刻,所以这简直是开发者的最佳消息。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

智能体DeepSeek行业动态
01:18
Berryxia.AI@berryxia
43
DeepSeek充了值有种用不完的感觉,尤其flash… 这又给你75折优惠来啦… 【引用 @deepseek_ai】:我们正在将折扣永久化!🎉 享受使用 DeepSeek-V4-Pro 构建的乐趣,将您的创新想法变为现实!🚀

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek行业动态
00:35
SemiAnalysis@SemiAnalysis_
44
摩根士丹利发布NVIDIA VR200物料清单分析

摩根士丹利发布了对NVIDIA VR200的物料清单分析。报告指出,其内存成本特指LPDDR5x SOCAMM与NVMe SSD,而GPU成本中已单独包含HBM。因采用无缆设计,PCB面积与材料成本有所上升。报告列示的总成本为OEM渠道价格,大型云服务商的采购成本将更低。该机构客户自2026年2月起已获得此分析,报告同时研究了网络连接器、背板等组件的变化及供应商格局演变。

Aaron: Sheesh. $NVDA VR200 Bom Analysis from MS.

行业动态部署/工程
‹ 上一页
1…3031323334…50
下一页 ›