AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2304 条
全部一手资讯X论文
标签「行业动态」清除
Rohan Paul@rohanpaul_ai · 5月31日76

FT: SoftBank just pledged €75B to build Europe’s largest AI computing facility in France, turning cheap, stable nuclear-heavy power into the raw fuel for training and running bigger AI systems. The plan starts with €45B for 3.1GW of capacity in Hauts-de-France by 2031, then adds another 2GW, creating a 5GW AI complex roughly comparable to the power draw of a major city. Dunkirk is the anchor site, with Schneider Electric expected to help build an AI infrastructure and robotics manufacturing hub around the project. The weak point is financing, because industry estimates put 1GW of AI infrastructure near $50B, meaning SoftBank will probably need heavy project debt and outside partners. --- ft .com/content/1022f9bd-5b6d-44a5-9303-c8b05b8c6463?syn-25a6b1a6=1

译软银宣布在法国投资750亿欧元,旨在打造欧洲规模最大的AI算力设施。该计划旨在利用当地稳定廉价的核电。项目分阶段推进,第一阶段投资450亿欧元,目标是到2031年在法国北部-加来海峡大区建成3.1GW容量,随后再增加2GW,最终形成5GW的AI综合体。敦刻尔克是核心选址,施耐德电气预计参与建设AI基础设施及机器人制造中心。融资是潜在挑战,行业估算显示1GW的AI基础设施成本约为500亿美元,因此软银可能需要依赖大量项目债务和外部合作伙伴。

Chubby♨️@kimmonismus · 5月31日71

Fortune reports Microsoft is building a "super app" to unify its scattered Copilots. Under 4.5% of 450 million Microsoft 365 seats pay for Copilot. Around 20 million, out of nearly half a billion. The app is pitched as a fix for fragmentation. The open question is whether fragmentation is really the problem, or whether no single interface moves a number that low. GitHub Copilot is the exception at 4.7M paid, and it's the one now facing real pressure from Cursor and Claude Code. Source: Fortune

译据《财富》报道,微软正构建一个“超级应用”,以统一其分散的Copilot产品。此举的背景是付费率低迷:在Microsoft 365近5亿席位中,仅约2000万(不到4.5%)付费使用Copilot。GitHub Copilot是例外,拥有470万付费用户,但正面临来自Cursor和Claude Code的竞争压力。核心疑问在于,产品分散是否是付费率低的主因,抑或单一界面本身难以驱动用户大规模付费。

OpenAI Developers@OpenAIDevs · 5月31日59

🧵 Our Voice Hack Night finalists are here. 4 projects. 6 hours. Realtime voice agents in real-world builds. Now it’s your turn to vote for your favorite. We’ll announce the winner on Monday. https://cerebralvalley.ai/e/openai-voice-hack-night/hackathon/gallery

译🧵 我们的语音黑客之夜决赛作品已揭晓。 4个项目。6小时。真实场景中的实时语音智能体现已构建完成。 现在轮到你投票选出你最喜欢的作品了。我们将于周一公布获胜者。 https://cerebralvalley.ai/e/openai-voice-hack-night/hackathon/gallery

Berryxia.AI@berryxia · 5月31日51

最近大家看到小米的MiMo 模型的降价! 我今天看了一下用了120 w 差不多花了3块多钱! 正好看到小米MiMo团队罗福莉分享的一篇技术博客。 V2.5系列刚把API价格降下来,背后其实是他们把推理系统彻底重构了一遍。 他们用的Hybrid Sliding Window Attention架构,能把KVCache存储压缩到全注意力的约1/7。 但罗福莉他们很清楚,架构优势在真实生产流量里不会自动变现。 于是团队重新设计了KVCache管理、层级缓存和prefix-cache tree,针对SWA特有的缓存难题做了专项处理,同时深度优化了调度策略和Prefill/Decode流水线。 在真实生产流量验证后,有效KVCache容量提升了接近5倍,主流框架下的服务端缓存命中率稳定在93%到95%。 再叠加MoE配置调优和多模态推理优化,才真正把长上下文推理成本打下来,支撑了这次降价。 这恰巧说明,好架构只是天花板,把它真正落地成可规模化、低成本的生产能力,才是决定模型性价比的关键。

译小米MiMo-V2.5系列近期实现了API降价。其核心支撑是团队对推理系统进行了彻底的工程重构。模型基于Hybrid Sliding Window Attention架构,理论上可将KVCache存储压缩至全注意力模型的约1/7。为将此架构优势落地,团队重新设计了KVCache管理、层级缓存和prefix-cache tree,并深度优化了调度与Prefill/Decode流水线。经真实生产流量验证,有效KVCache容量提升了近5倍,服务端缓存命中率稳定在93%-95%。这些优化与MoE配置调优共同作用,显著降低了长上下文推理成本,从而支撑了本次降价。

Chubby♨️@kimmonismus · 5月31日51

Nvidia, Microsoft and Arm posted the same “a new era of PC” teaser this week, with coordinates pointing at Jensen Huang’s Computex keynote. The reveal everyone expects is N1X, Nvidia’s first Arm-based Windows laptop chip. Nvidia tried to buy Arm outright for $40 billion and gave up in 2022 after regulators lined up against the deal. Now it’s about to ship the most important Arm processor in the Windows market without owning any of the architecture underneath it.

译Nvidia、微软与Arm本周同步发布预告,指向Computex主题演讲,外界普遍期待发布N1X——这是Nvidia首款基于Arm架构的Windows笔记本电脑处理器。此前,Nvidia曾在2022年试图以400亿美元收购Arm未果。如今,Nvidia即将推出这款被认为将是Windows市场最重要Arm处理器之一的芯片,尽管其并未拥有Arm架构的底层所有权。

Eric@ericmitchellai · 5月30日37

OpenAI is famous for leaks but man to just go out there and tell people we will train more models Huge alpha in following this guy

译OpenAI 以泄露闻名,但直接站出来告诉大家我们会训练更多模型 关注这个人能获得巨大优势 [引用 @thsottiaux]:当我们从 GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5 时,版本号的递增伴随着能力提升和 token 效率改进(这转化为速度提升)。GPT-5.5 是我们迄今最好的模型。 这是我们希望继续的简单策略。

StepFun@StepFun_ai · 5月30日30

Glad it was smooth. Now comes the interesting part!

译很高兴一切顺利。现在有趣的部分来了!

Rohan Paul@rohanpaul_ai · 5月30日74

The information: Meta is preparing its biggest AI wearable push yet, with a AI pendant, more AI glasses, and a business service called Wearables for Work. Meta’s bet is that the next AI interface is not a chat box, but a sensor-rich device tied to an assistant that can remember meetings, summarize conversations, answer visual questions, and trigger actions. The reported target is huge: 10M wearable sales in the second half of 2026 and 6.8M monthly active wearable users by year-end. The software layer may matter more than the hardware, because Meta AI Assistant, Hatch, subscriptions, and wearable apps turn a device sale into recurring AI revenue. The pressure is obvious: Reality Labs posted a $4.03B operating loss on only $402M revenue in Q1-26, so Meta needs wearables to become a platform, not another expensive gadget line. --- theinformation .com/briefings/meta-plans-ai-pendant-part-ambitious-wearables-expansion

译Meta正准备迄今规模最大的AI可穿戴设备推进,包括AI项链、更多AI眼镜以及企业服务“Wearables for Work”。其押注下一代AI交互界面不是聊天框,而是具备丰富传感器、能记住会议、总结对话、回答视觉问题并触发操作的AI助手设备。报道的销售目标宏大:2026年下半年销量目标1000万台,年底月活用户目标680万。软件层被视作关键,可将设备销售转化为持续性AI收入。此举背后的财务压力明显:Reality Labs在2026年第一季度录得40.3亿美元运营亏损,营收仅为4.02亿美元,因此Meta亟需将可穿戴设备发展成一个平台,而非又一条昂贵的硬件产品线。

Chubby♨️@kimmonismus · 5月30日63

A team of former DeepMind researchers just raised $50M to build an AI lab built around recursive self-improvement at the level of the whole research organization, not only a single model. Index and Radical co-led, NVIDIA's venture arm is in, and angels like Dwarkesh Patel, Thomas Wolf and Max Jaderberg are on the cap table. The founders have the track record to back it up. Louis Kirsch comes out of the Schmidhuber lineage on self-improving systems. Edward Hughes has argued that open-endedness is essential for artificial superhuman intelligence. Tantum Collins worked on AI policy in the Biden White House. Their idea is simple and big at the same time. Today's models are great at answering questions, but real discovery also depends on knowing which questions are worth asking. Inherent wants AI that works right next to humans inside that loop, as a collaborator and not only a tool. They call it living within the experiment. They also set it up as a Public Benefit Corporation, so the mission is written into the company from day one. This is the direction a lot of us have been hoping for, and one of the more credible attempts at recursive self-improvement I've seen so far. Really excited for it.

译由前 DeepMind 研究员创立的 AI 实验室 Inherent 完成了 5000 万美元的种子轮融资,由 Index Ventures 和 Radical 共同领投,NVIDIA 旗下风投部门 NVentures 参投。创始团队包括 Louis Kirsch、Edward Hughes 和 Tantum Collins。该公司旨在构建能够主动发现新知识的 AI 智能体,其核心理念是实现整个研究组织的“递归自我改进”,使 AI 成为人类研究中的协作伙伴。Inherent 被定位为一家公共利益公司,总部位于伦敦。

Rohan Paul@rohanpaul_ai · 5月30日54

Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first serious cost test for the AI boom. As was reported this week, Uber and Microsoft are already rethinking expensive agent usage. A chatbot may answer once, but an agent plans, calls tools, checks results, edits mistakes, and repeats the loop. That loop can make one user request consume 10x, 50x, or even far more tokens than a normal answer. Goldman’s bullish case is that monthly token use could reach 120 quadrillion by 2030, while inference cost per token keeps falling 60%-70% per year. The fight is now between agent productivity and token waste. Earlier this month, Microsoft began revoking developer access to Claude Code, with plans to move them to its in-house Copilot Command Line Interface tool by June 30. The company has framed this as consolidating teams around its own tools, but the timing at the fiscal year’s end hints it may also be about lowering costs.

译高盛预测,到 2030 年,由 AI 智能体驱动的模型 token 月度消耗量将激增至 120 quadrillion,较当前增长约 24 倍。核心原因是智能体在完成单次用户请求时,需要进行多轮工具调用、结果检查与修正,导致其 token 消耗量可能达到普通问答的 10 倍甚至 50 倍以上。这一趋势引发了成本担忧,Uber 和 Microsoft 等公司已开始重新评估昂贵的智能体使用方案。报告同时指出,推理成本正以每年 60%-70% 的速度下降,智能体带来的生产力提升与潜在的 token 浪费正成为新的博弈焦点。

凡人小北@frxiaobei · 5月30日26

罢了,错信了 Claude,新账号且用且珍惜。

Rohan Paul@rohanpaul_ai · 5月30日63

Reuter: ByteDance is building its own AI data-center CPUs because running agents at TikTok scale now depends on scarce server processors, not only Nvidia GPUs. inspired by Groq's "language processing units," they are testing both Arm and RISC-V, which lets it compare a mature commercial design against a more controllable open instruction set before mass production. The market is seeing a 10%-35% quarterly CPU price increases and long supply delays, hence making an in-house silicon is now cost and supply-chain move, not just a prestige project. So ByteDance wants to both reduce dependence on restricted foreign AI hardware and make inference cheaper per query. The deeper shift is that AI agents is now turning CPUs into strategic chips. A gentic inference stresses CPUs much more because one user request can trigger many smaller steps: retrieve files, call a tool, query a database, run a model, check the answer, call another model, send data across servers, and manage memory. However, ByteDance does not seem to have in-house chip design teams and is reportedly relying on several external partners, who are also expected to handle the actual silicon manufacturing. --- reuters .com/world/china/bytedance-developing-custom-cpu-chips-support-ai-rollout-sources-say-2026-05-28/

译路透社报道称,字节跳动正开发自研数据中心CPU芯片,以支持TikTok规模的AI智能体运行。此举受Groq的“语言处理单元”启发,旨在应对当前服务器处理器短缺问题。公司正在测试Arm和RISC-V两种架构,以比较成熟商业设计与可控开放指令集。由于CPU价格季度性上涨10%-35%且供应链延迟,开发自研芯片已成为一项成本与供应链策略,旨在减少对受限外国AI硬件的依赖并降低单次查询推理成本。AI智能体的推理对CPU依赖远大于传统模型,因单个用户请求可能触发多个步骤。据报道,字节跳动可能依赖外部合作伙伴进行芯片设计与制造。

Rohan Paul@rohanpaul_ai · 5月30日63

Reuter: Japanese banks are getting early access to OpenAI’s newest model for security testing, which is believed to be on a par with that of rival Anthropic's Claude Mythos. There were also reports that Japan's three largest banks are expected ​to gain access to Anthropic Mythos. Adoption of the new models is expected to help stop new types of cyberattacks. These 2 “frontier AIs” are said to detect vulnerabilities far better than earlier models. --- reuters .com/world/asia-pacific/openai-gives-japan-banks-access-latest-model-japans-finance-minister-says-2026-05-29/

译日本银行已获得OpenAI最新模型的早期访问权限,用于网络安全测试。据报道,该模型性能据称与竞争对手Anthropic的Claude Mythos相当。同时,日本三大银行预计将获得Anthropic Mythos的访问权限。这两款前沿AI模型被期望能帮助阻止新型网络攻击,因为它们在检测漏洞方面远优于早期模型。

SemiAnalysis@SemiAnalysis_ · 5月30日76

BREAKING NEWS: JAX NVIDIA GPU & XLA: GPU's biggest customer just announced that they have dropped JAX GPUs and would rather vibe code an C training framework with Grok Build. Reportedly xAI's JAX stack had MFU lower than 10%. NVIDIA JAX team entire main 996 focus for the past 2 years was to support xAI yet has failed, I guess they can rest & vest now.

译突发新闻:JAX NVIDIA GPU & XLA:GPU最大客户刚刚宣布已放弃JAX GPU,宁愿用Grok Build“氛围编程”一个C训练框架。据报道xAI的JAX堆栈MFU低于10%。NVIDIA JAX团队过去两年全部主力996专注于支持xAI却失败了,我想他们现在可以休息并兑现期权了。

Tibo@thsottiaux · 5月30日38

I looked at a number today on a codex dashboard and it made me happy. More news about the number soon. 👀 Thanks to everyone who keeps adopting codex. We are still early. So early.

译我今天在Codex仪表盘上看到了一个数字,它让我很开心。关于这个数字的更多消息即将公布。👀 感谢所有持续采用Codex的用户。我们仍处于早期阶段。非常早期。

Orange AI@oran_ge · 5月30日37

Anthropic 蒸馏中国模型这回事,我第一次听到是在线下,从投资人的嘴里听到的 那时候他们说的是 Claude 蒸馏了 Kimi 我说你确定不是 Cursor 蒸馏了 Kimi 吗? 他非常肯定地说,是 Claude 不光蒸馏了 Kimi,还蒸馏了 Qwen 现在似乎证据越来越多了 这魔幻的世界已经难辨真假 我怀疑这事儿全部的责任都在 @CuiMao

译推文转述一个传闻:有投资人声称Anthropic的Claude模型通过知识蒸馏(Distillation)使用了Kimi和Qwen的成果。作者对此表示质疑,最初怀疑是Cursor工具所为,但对方坚持是Claude的行为。推文提到目前似乎有更多证据支持这一说法,但整体语境表达了对传闻真实性的怀疑和事件本身的“魔幻”感。文中并未提供任何关于蒸馏过程、模型参数或性能提升的具体证据或数字。

Alibaba Cloud@alibaba_cloud · 5月30日64

UEFA and UC3 have announced Alibaba Group as global AI, Cloud Computing and E-Commerce Partner for UEFA EURO 2028, as well as UEFA men’s club competitions from 2027 to 2033. Alibaba Cloud and Qwen will leverage its leading artificial intelligence (AI) technologies, cloud computing capabilities and global e-commerce platform to deliver intelligent innovations across UEFA’s flagship competitions and create a more immersive fan experience worldwide.

译阿里云和Qwen成为UEFA官方独家AI、云计算与电子商务合作伙伴,合作期覆盖2027/2028赛季至2032/2033赛季的UEFA男子俱乐部赛事,以及UEFA EURO 2028。阿里巴巴集团主席蔡崇信表示,将投入云计算、全栈AI及全球电商平台能力,支持赛事运营。合作将利用Qwen大语言模型部署先进AI技术,增强球迷互动与媒体内容体验,并依托阿里云基础设施打造全球沉浸式观赛体验。

SemiAnalysis@SemiAnalysis_ · 5月30日67

TRUTH SOCIAL: NVLink multicast is not supported on Blackwell "Confidential Computing" leading to 61% performance regression on SGLang Qwen3.5 397B according to @verdacloud 's recent github ticket. NVIDIA's  "Confidential Computing" is complete slop as in addition Hopper's  confidential computing had fully unencrypted NVLink according to NVIDIA's own "NVIDIA Secure AI with Blackwell and Hopper GPUs" Whitepaper.

译TRUTH SOCIAL:根据@verdacloud最近的GitHub工单,NVLink多播在Blackwell“机密计算”上不被支持,导致SGLang Qwen3.5 397B性能下降61%。NVIDIA的“机密计算”完全是垃圾,此外根据NVIDIA自己的《NVIDIA Secure AI with Blackwell and Hopper GPUs》白皮书,Hopper的机密计算也存在完全未加密的NVLink。

Chubby♨️@kimmonismus · 5月30日58

Anthropic surpassed $1t valuation Party

译Anthropic估值突破1万亿美元 Party

🚨 AI News | TestingCatalog@testingcatalog · 5月30日60

Microsoft ❤️ NVIDIA > NVIDIA GTC Keynote is happening on June 1 > Microsoft Build Keynote event is happening on June 2 > Both Windows and NVIDIA accounts teased an upcoming announcement, saying "A new era of PC." A new Windows hardware is coming 👀

译Microsoft ❤️ NVIDIA > NVIDIA GTC 主题演讲将于6月1日举行 > Microsoft Build 主题演讲活动将于6月2日举行 > Windows和NVIDIA的账号都预告了即将发布的公告,称“PC的新时代”。 新的Windows硬件即将到来 👀

Rohan Paul@rohanpaul_ai · 5月30日64

Today’s edition of my newsletter just went out. 🔗 https://www.rohan-paul.com/p/anthropic-releases-claude-opus-48 🗞️ Anthropic releases Claude Opus 4.8 on the same day as its $965B valuation round. 🗞️ KogAI just achieved 3,000 tokens/s on 8× AMD MI300X GPUs and 2,100 on 8× NVIDIA H200 (FP16, no speculative decoding) with a 2B model. 🗞️ Video to Watch: Transformer vs Post-Transformer, argued by leading researchers, inside a real physical boxing ring. 🗞️ Anthropic secures a massive post-money valuation of $965B after raising $65 B. 🗞️ Datacurve launches DeepSWE, a tougher coding benchmark made to show where leading models truly separate. 🗞️ OpenAI and Thrive just built a self-improving tax agent with up to 97% accuracy.

译本期简报要点如下:Anthropic发布了Claude Opus 4.8模型,并宣布完成650亿美元融资,投后估值达到9650亿美元。KogAI展示了其在特定硬件上的性能:使用8块AMD MI300X GPU时处理速度达3000 tokens/s,使用8块NVIDIA H200 GPU时达2100 tokens/s(FP16精度,无推测解码),模型参数为20亿。此外,Datacurve推出了更具挑战性的编程基准测试DeepSWE,旨在更清晰地评估顶尖模型的性能差异。

Rohan Paul@rohanpaul_ai · 5月30日68

McKinsey report: AI skills are getting hotter across Europe’s job market. Nearly 1 in 5 European occupations now ask for AI-related skills, more than 3x the share seen in 2023. The fastest-growing skill is not model building, but AI fluency, which means knowing how to prompt, manage, check, and apply AI systems inside real jobs. Demand for AI fluency grew 5x, from work covering 1.9M employees in 2023 to 9.4M in 2025. Demand for technical AI skills grew only 1.7x, which means Europe needs far more AI users than AI engineers. The demand is still concentrated, with 75% coming from computer, management, and business-finance roles, but it is spreading into logistics, HR, compliance, and skilled trades.

译根据麦肯锡报告,近五分之一的欧洲职业现已要求AI相关技能,这一比例是2023年的三倍多。增长最快的技能是AI流畅度,即在实际工作中应用、提示、管理和核查AI系统的能力。该技能的需求从2023年覆盖的190万员工跃升至2025年的940万,增长了5倍。相比之下,技术性AI技能需求仅增长1.7倍,表明欧洲对AI用户的需求远大于工程师。当前75%的需求集中在计算机、管理和商业金融领域,但已开始向物流、人力资源、合规及技术工种扩散。

Rohan Paul@rohanpaul_ai · 5月30日71

Bessemer Venture Partners’@bdeeter on Anthropic “We have not seen a company like this in the history of business. They have been growing at a rate of 10x p/a & potentially a $100 bn run rate at the end of this year. They grew 80x run rate just in Q1.”

译Bessemer Venture Partners的@bdeeter谈Anthropic “我们在商业史上从未见过这样的公司。他们一直以每年10倍的速度增长,今年年底可能达到1000亿美元的年化收入。 仅在第一季度,他们的年化收入就增长了80倍。”

Replit ⠕@Replit · 5月30日37

Working at the intersection of AI, data, and the built environment, few have shaped the language of AI-driven art like @refikanadol. See him take the stage with @pirroh on day two of Vibecon. NYC, June 17–18. Get your tickets at http://vibecon.ai

译在AI、数据与建筑环境的交叉领域工作,很少有人能像@refikanadol那样塑造AI驱动艺术的语言。 请看他在Vibecon第二天与@pirroh同台演讲。 纽约,6月17-18日。 购票请访问 http://vibecon.ai

Chubby♨️@kimmonismus · 5月30日65

NVIDIA is moving all four open model families - Cosmos, Isaac GR00T, Ising, Nemotron - onto the Linux Foundation's OpenMDW-1.1. Right now open-weight models come with a patchwork of software licenses that were never meant for AI plus bespoke terms with usage limits, so anyone serious has to run legal on each one before they build. OpenMDW puts weights, code, docs and data under a single permissive license, so that becomes one review instead of ten. It makes a lot of sense -for NVIDIA in particular. Their business is mainly on compute, so getting more people to deploy and fine-tune open weights is a very good business case.

译NVIDIA 宣布将其四个开放模型系列(Cosmos、Isaac GR00T、Ising、Nemotron)迁移至 Linux 基金会的 OpenMDW-1.1 框架下。此举旨在解决当前开放模型因许可杂乱和附加限制导致的法律审查负担。OpenMDW 框架为模型权重、代码、文档和数据提供了统一的宽松许可证,使得开发者和企业从多次审查简化为一次。这符合 NVIDIA 以算力为核心的业务逻辑,能够促进更多人部署和微调其开放模型。

Chubby♨️@kimmonismus · 5月30日41

The 2026 collaboration i did not see coming.

译2026年的这次合作,我完全没料到。

Runway@runwayml · 5月30日27

Last chance to RSVP for our annual CVPR Friends Dinner in Denver on June 4th for conversation, cocktails and bites. RSVP at the link below.

译参加我们6月4日在丹佛举办的年度CVPR朋友晚宴的最后机会,届时将有交流、鸡尾酒和小食。 请通过下方链接报名。

Orange AI@oran_ge · 5月29日47

也许会有一种新的软件商业模式 第一版免费 后续更新每次都收费 毕竟 AI Coding 第一版是最简单的… 维护是很费心力的… 或者 agent 自己迭代的版本免费 人类迭代的版本收费

Chubby♨️@kimmonismus · 5月29日61

ByteDance is reportedly building its own inference chip modeled on Groq's LPU, the same architecture Nvidia paid roughly $20B to license in December. The LPU keeps the model in on-chip SRAM and skips high-bandwidth memory. HBM is the component the US restricts most tightly for export to China. ByteDance's memory partner InnoStar fabs at TSMC's mature nodes, which also sit outside the controls. Each of those choices routes around a US restriction. What's left is the architecture Nvidia just spent $20B to own. China is increasingly moving toward developing its own chips and is succeeding in becoming ever more independent of the USA. That is truly impressive. Source: The Information.

译据报道,字节跳动正在开发基于 Groq LPU 架构的自研推理芯片。该架构将模型保存在片上 SRAM 中,跳过了受美国对华出口管制最严格限制的组件——高带宽内存。字节跳动的内存合作伙伴 InnoStar 在台积电的成熟制程节点进行生产,这些节点也处于管制之外。这一系列设计选择均旨在规避美国的限制,而正是同一架构,Nvidia 刚刚花费约200亿美元获得了其授权。

AYi@AYi_AInotes · 5月29日63

史上最贵的一觉:CEO醒了,欠了Anthropic 5亿美元

Peter Steinberger 🦞@steipete · 5月29日37

Couldn’t be more excited to have Vince on board. 🦞 Very few people understand the new ways, how software is built. He gets it.

译非常高兴Vince加入。🦞 很少有人理解软件构建的新方式。他理解。 [引用 @vincent_koc]:我已加入🦞@openclaw基金会,担任首席架构师!很兴奋能与@steipete和世界级团队一起推动智能体计算的未来。 在后claw时代,AI正从编码领域扩展到我们的个人生活。@nvidia Computex和@Microsoft Build上将有重大发布!

Peter Steinberger 🦞@steipete · 5月29日25

I smell a takedown in 3...2...1 https://clawd.rip/

译我闻到了关停的气息,3...2...1 https://clawd.rip/

Alibaba Cloud@alibaba_cloud · 5月29日41

Join Alibaba Cloud and Appnovation for a strategic briefing on how Qwen is helping enterprises rethink the balance between AI performance and cost. Learn why global leaders are choosing Qwen and what your team needs to know to stay competitive. 📅 Tuesday, June 9 | 11:00 AM PT / 2:00 PM ET | 55 min | Online Register here: https://lnkd.in/gHEyw6EQ

译加入阿里云和Appnovation的战略简报,了解通义千问(Qwen)如何帮助企业重新思考AI性能与成本的平衡。了解全球领先企业为何选择Qwen,以及您的团队需要了解哪些信息以保持竞争力。 📅 6月9日星期二 | 太平洋时间上午11:00 / 东部时间下午2:00 | 55分钟 | 线上 立即注册:https://lnkd.in/gHEyw6EQ

Kling AI@Kling_ai · 5月29日25

Every imagination of nature comes alive in brand-new forms. Thanks to Kling creators’ inspiration, all things are in bloom. 💚

译自然的每一种想象都以全新的形式焕发生机。 感谢Kling创作者的灵感,万物皆在绽放。💚

Chubby♨️@kimmonismus · 5月29日47

So OpenAI did want to ship something bigger yesterday after all, but had to delay it.

译所以OpenAI昨天确实想发布更大的更新,但不得不推迟。

meng shao@shao__meng · 5月29日32

帮转!又一个 A\ 厂付费用户被禁的案例,希望看到妥善解决!

SenseTime@SenseTime_AI · 5月29日28

𝗔𝗜 𝘃𝗶𝗱𝗲𝗼 𝘁𝗼𝗼𝗹𝘀 𝗮𝗿𝗲 𝗿𝗲𝘀𝗵𝗮𝗽𝗶𝗻𝗴 𝘁𝗵𝗲 𝗰𝗼𝗻𝘁𝗲𝗻𝘁 𝗶𝗻𝗱𝘂𝘀𝘁𝗿𝘆. Zibin Wang, VP of AIGC and General Manager of #Seko at SenseTime, says amateur creators are making AI short films in just one to two weeks — sparking a new wave of creativity. Hear what he said, and try it yourself with Seko, our AI video creation agent. 🎬

译AI视频工具正在重塑内容行业。 商汤AIGC副总裁、#Seko总经理王梓彬表示,业余创作者仅需一到两周就能制作AI短片——这正引发一波新的创作浪潮。 听听他的分享,并亲自体验我们的AI视频创作智能体Seko。🎬

Berryxia.AI@berryxia · 5月29日24

身边不少人都说小米这次送的Token没多大用处,我反倒觉得只是没有用起来~~ 刚领到小米赠送的Token,第一时间就安排上了。 特意给Berry小跟班补充好储备。 之前总听大家讨论MiMo-2.5-Pro,一直没空实测。 现在直接接入我的Agent,专门测试它的调用能力。 坐等测试结果,后续慢慢跟大家分享。

译作者分享使用小米赠送的模型token,对MiMo-2.5-Pro进行实测。其计划将该模型接入自己的AI智能体环境,专门评估其在实际调用场景下的表现,并表示将在后续分享测试结果。

小互@xiaohu · 5月29日48

Anthropic 的估值时间线 2025年底,也就是Claude Code 爆火后 Anthropic开启了🚀模式...

SenseTime@SenseTime_AI · 5月29日27

"Hong Kong is uniquely positioned to become a leading hub for #TrustedAI innovation — combining advanced infrastructure, #multimodal foundation models, and strong #ecosystem partnerships." — Lewis Fung, Managing Director, SenseTime Hong Kong and Macau, Asia Pacific Business Group. Lewis recently joined the Cyberport × Hong Kong Police Force Smart Policing Joint AI Lab inauguration, sharing how responsible AI can strengthen #CyberSecurity, #PublicSafety, and #SmartCity operations. SenseTime looks forward to continued collaboration with partners in advancing trusted AI innovation for a smarter, safer Hong Kong.

译SenseTime高管Lewis Fung表示,香港凭借先进基础设施、多模态基础模型和生态伙伴合作,有条件成为可信AI创新中心。他近日出席数码港与警方智能 policing 联合 AI 实验室启动活动,分享了AI在网络安全、公共安全与智慧城市方面的应用。SenseTime将继续与伙伴合作推动可信AI发展,打造更智慧安全的香港。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月31日
04:17
Rohan Paul@rohanpaul_ai
76
软银在法国投资750亿欧元建设欧洲最大AI算力设施

软银宣布在法国投资750亿欧元,旨在打造欧洲规模最大的AI算力设施。该计划旨在利用当地稳定廉价的核电。项目分阶段推进,第一阶段投资450亿欧元,目标是到2031年在法国北部-加来海峡大区建成3.1GW容量,随后再增加2GW,最终形成5GW的AI综合体。敦刻尔克是核心选址,施耐德电气预计参与建设AI基础设施及机器人制造中心。融资是潜在挑战,行业估算显示1GW的AI基础设施成本约为500亿美元,因此软银可能需要依赖大量项目债务和外部合作伙伴。

数据/训练行业动态部署/工程
02:16
Chubby♨️@kimmonismus
71
微软拟建"超级应用"统一Copilot产品,应对低付费率

据《财富》报道,微软正构建一个“超级应用”,以统一其分散的Copilot产品。此举的背景是付费率低迷:在Microsoft 365近5亿席位中,仅约2000万(不到4.5%)付费使用Copilot。GitHub Copilot是例外,拥有470万付费用户,但正面临来自Cursor和Claude Code的竞争压力。核心疑问在于,产品分散是否是付费率低的主因,抑或单一界面本身难以驱动用户大规模付费。

Microsoft行业动态
01:27
OpenAI Developers@OpenAIDevs
59
🧵 我们的语音黑客之夜决赛作品已揭晓。 4个项目。6小时。真实场景中的实时语音智能体现已构建完成。 现在轮到你投票选出你最喜欢的作品了。我们将于周一公布获胜者。 https://cerebralvalley.ai/e/openai-voice-hack-night/hackathon/gallery
OpenAI行业动态语音
00:34
Berryxia.AI@berryxia
51
小米MiMo-V2.5降价背后的技术重构

小米MiMo-V2.5系列近期实现了API降价。其核心支撑是团队对推理系统进行了彻底的工程重构。模型基于Hybrid Sliding Window Attention架构,理论上可将KVCache存储压缩至全注意力模型的约1/7。为将此架构优势落地,团队重新设计了KVCache管理、层级缓存和prefix-cache tree,并深度优化了调度与Prefill/Decode流水线。经真实生产流量验证,有效KVCache容量提升了近5倍,服务端缓存命中率稳定在93%-95%。这些优化与MoE配置调优共同作用,显著降低了长上下文推理成本,从而支撑了本次降价。

Fuli Luo: Inference Optimizations Behind the MiMo-V2.5 Series API Price Reductions Read the full technical blog: https://mimo.xiao...

推理行业动态部署/工程
00:16
Chubby♨️@kimmonismus
51
Nvidia、微软与Arm本周同步发布预告,指向Computex主题演讲,外界普遍期待发布N1X--这是Nvidia首款基于Arm架构的Windows笔记本电脑处理器。此前,Nvidia曾在2022年试图以400亿美元收购Arm未果。如今,Nvidia即将推出这款被认为将是Windows市场最重要Arm处理器之一的芯片,尽管其并未拥有Arm架构的底层所有权。

The Verge: Nvidia, Microsoft, and Arm are all teasing Nvidia's new N1X laptop processors https://www.theverge.com/news/940275/nvidi...

Microsoft端侧行业动态
5月30日
23:48
Eric@ericmitchellai
37
OpenAI 以泄露闻名,但直接站出来告诉大家我们会训练更多模型 关注这个人能获得巨大优势 【引用 @thsottiaux】:当我们从 GPT-5.0 -> GPT-5.1 -> … -> GPT-5.5 时,版本号的递增伴随着能力提升和 token 效率改进(这转化为速度提升)。GPT-5.5 是我们迄今最好的模型。 这是我们希望继续的简单策略。

Tibo: When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and...

OpenAI行业动态
21:12
StepFun@StepFun_ai
30
很高兴一切顺利。现在有趣的部分来了!

0xSero: Every model provider should do it like this, their launch is well organised. It was trivial getting the model setup in f...

行业动态
19:46
Rohan Paul@rohanpaul_ai
74
Meta计划大规模推进AI可穿戴设备

Meta正准备迄今规模最大的AI可穿戴设备推进,包括AI项链、更多AI眼镜以及企业服务“Wearables for Work”。其押注下一代AI交互界面不是聊天框,而是具备丰富传感器、能记住会议、总结对话、回答视觉问题并触发操作的AI助手设备。报道的销售目标宏大:2026年下半年销量目标1000万台,年底月活用户目标680万。软件层被视作关键,可将设备销售转化为持续性AI收入。此举背后的财务压力明显:Reality Labs在2026年第一季度录得40.3亿美元运营亏损,营收仅为4.02亿美元,因此Meta亟需将可穿戴设备发展成一个平台,而非又一条昂贵的硬件产品线。

Meta端侧行业动态
19:16
Chubby♨️@kimmonismus
63
前 DeepMind 研究员创立 AI 实验室 Inherent,完成 5000 万美元种子轮融资

由前 DeepMind 研究员创立的 AI 实验室 Inherent 完成了 5000 万美元的种子轮融资,由 Index Ventures 和 Radical 共同领投,NVIDIA 旗下风投部门 NVentures 参投。创始团队包括 Louis Kirsch、Edward Hughes 和 Tantum Collins。该公司旨在构建能够主动发现新知识的 AI 智能体,其核心理念是实现整个研究组织的“递归自我改进”,使 AI 成为人类研究中的协作伙伴。Inherent 被定位为一家公共利益公司,总部位于伦敦。

Inherent: We're excited to introduce Inherent, a lab designed from scratch to build AI agents that discover new knowledge. The com...

智能体DeepMind行业动态
17:46
Rohan Paul@rohanpaul_ai
54
高盛:AI 智能体 token 消耗到 2030 年将增长 24 倍

高盛预测,到 2030 年,由 AI 智能体驱动的模型 token 月度消耗量将激增至 120 quadrillion,较当前增长约 24 倍。核心原因是智能体在完成单次用户请求时,需要进行多轮工具调用、结果检查与修正,导致其 token 消耗量可能达到普通问答的 10 倍甚至 50 倍以上。这一趋势引发了成本担忧,Uber 和 Microsoft 等公司已开始重新评估昂贵的智能体使用方案。报告同时指出,推理成本正以每年 60%-70% 的速度下降,智能体带来的生产力提升与潜在的 token 浪费正成为新的博弈焦点。

智能体现象/趋势行业动态
17:19
凡人小北@frxiaobei
26
罢了,错信了 Claude,新账号且用且珍惜。

凡人小北: 果然,竞争之下用户才能受益。 Claude 被封的陈年旧号可以申诉了。 Claude 他急了。

Anthropic行业动态
17:16
Rohan Paul@rohanpaul_ai
63
字节跳动开发自研CPU芯片,以支持AI智能体大规模部署

路透社报道称,字节跳动正开发自研数据中心CPU芯片,以支持TikTok规模的AI智能体运行。此举受Groq的“语言处理单元”启发,旨在应对当前服务器处理器短缺问题。公司正在测试Arm和RISC-V两种架构,以比较成熟商业设计与可控开放指令集。由于CPU价格季度性上涨10%-35%且供应链延迟,开发自研芯片已成为一项成本与供应链策略,旨在减少对受限外国AI硬件的依赖并降低单次查询推理成本。AI智能体的推理对CPU依赖远大于传统模型,因单个用户请求可能触发多个步骤。据报道,字节跳动可能依赖外部合作伙伴进行芯片设计与制造。

推理行业动态
16:16
Rohan Paul@rohanpaul_ai
63
日本银行获OpenAI前沿AI模型用于安全测试

日本银行已获得OpenAI最新模型的早期访问权限,用于网络安全测试。据报道,该模型性能据称与竞争对手Anthropic的Claude Mythos相当。同时,日本三大银行预计将获得Anthropic Mythos的访问权限。这两款前沿AI模型被期望能帮助阻止新型网络攻击,因为它们在检测漏洞方面远优于早期模型。

AnthropicOpenAI安全/对齐行业动态
12:18
SemiAnalysis@SemiAnalysis_
精选76
突发新闻:JAX NVIDIA GPU & XLA:GPU最大客户刚刚宣布已放弃JAX GPU,宁愿用Grok Build"氛围编程"一个C训练框架。据报道xAI的JAX堆栈MFU低于10%。NVIDIA JAX团队过去两年全部主力996专注于支持xAI却失败了,我想他们现在可以休息并兑现期权了。
xAI开源生态行业动态

推荐理由:xAI 这个 GPU 最大客户突然甩了 JAX,要自研 C 训练框架,理由是 JAX 利用率太低。如果连万亿参数集群都搞不定,JAX 的底层缺陷可能比想象的大,做大规模训练的团队得认真评估了。
11:40
Tibo@thsottiaux
38
我今天在Codex仪表盘上看到了一个数字,它让我很开心。关于这个数字的更多消息即将公布。👀 感谢所有持续采用Codex的用户。我们仍处于早期阶段。非常早期。
OpenAI编码行业动态
09:01
Orange AI@oran_ge
37
Anthropic被指蒸馏Kimi与Qwen,传闻魔幻难辨真假

推文转述一个传闻:有投资人声称Anthropic的Claude模型通过知识蒸馏(Distillation)使用了Kimi和Qwen的成果。作者对此表示质疑,最初怀疑是Cursor工具所为,但对方坚持是Claude的行为。推文提到目前似乎有更多证据支持这一说法,但整体语境表达了对传闻真实性的怀疑和事件本身的“魔幻”感。文中并未提供任何关于蒸馏过程、模型参数或性能提升的具体证据或数字。

Anthropic数据/训练行业动态
08:44
Alibaba Cloud@alibaba_cloud
64
阿里云和Qwen成为UEFA官方独家AI、云计算与电子商务合作伙伴,合作期覆盖2027/2028赛季至2032/2033赛季的UEFA男子俱乐部赛事,以及UEFA EURO 2028。阿里巴巴集团主席蔡崇信表示,将投入云计算、全栈AI及全球电商平台能力,支持赛事运营。合作将利用Qwen大语言模型部署先进AI技术,增强球迷互动与媒体内容体验,并依托阿里云基础设施打造全球沉浸式观赛体验。

Alibaba Group: Alibaba will become the official and exclusive partner for AI, Cloud Computing Services, and E-commerce of the UEFA Cham...

行业动态
08:18
SemiAnalysis@SemiAnalysis_
67
TRUTH SOCIAL:根据@verdacloud最近的GitHub工单,NVLink多播在Blackwell"机密计算"上不被支持,导致SGLang Qwen3.5 397B性能下降61%。NVIDIA的"机密计算"完全是垃圾,此外根据NVIDIA自己的《NVIDIA Secure AI with Blackwell and Hopper GPUs》白皮书,Hopper的机密计算也存在完全未加密的NVLink。
推理行业动态部署/工程
07:16
Chubby♨️@kimmonismus
58
Anthropic估值突破1万亿美元 Party

Polymarket: JUST IN: Anthropic's private valuation has officially surpassed $1,000,000,000,000.00.

Anthropic行业动态
06:20
🚨 AI News | TestingCatalog@testingcatalog
60
Microsoft ❤️ NVIDIA > NVIDIA GTC 主题演讲将于6月1日举行 > Microsoft Build 主题演讲活动将于6月2日举行 > Windows和NVIDIA的账号都预告了即将发布的公告,称"PC的新时代"。 新的Windows硬件即将到来 👀

Microsoft: Loud and clear. #MSBuild kicks off on June 2.

Microsoft端侧行业动态
06:16
Rohan Paul@rohanpaul_ai
64
今日简报已发布

本期简报要点如下:Anthropic发布了Claude Opus 4.8模型,并宣布完成650亿美元融资,投后估值达到9650亿美元。KogAI展示了其在特定硬件上的性能:使用8块AMD MI300X GPU时处理速度达3000 tokens/s,使用8块NVIDIA H200 GPU时达2100 tokens/s(FP16精度,无推测解码),模型参数为20亿。此外,Datacurve推出了更具挑战性的编程基准测试DeepSWE,旨在更清晰地评估顶尖模型的性能差异。

Anthropic推理模型发布行业动态
06:16
Rohan Paul@rohanpaul_ai
68
麦肯锡报告:AI技能在欧洲就业市场持续升温

根据麦肯锡报告,近五分之一的欧洲职业现已要求AI相关技能,这一比例是2023年的三倍多。增长最快的技能是AI流畅度,即在实际工作中应用、提示、管理和核查AI系统的能力。该技能的需求从2023年覆盖的190万员工跃升至2025年的940万,增长了5倍。相比之下,技术性AI技能需求仅增长1.7倍,表明欧洲对AI用户的需求远大于工程师。当前75%的需求集中在计算机、管理和商业金融领域,但已开始向物流、人力资源、合规及技术工种扩散。

McKinsey Global Institute: Demand for AI-related skills is growing across the European workforce. MGI research shows the share of occupations requi...

数据/训练行业动态
05:16
Rohan Paul@rohanpaul_ai
71
Bessemer Venture Partners的@bdeeter谈Anthropic "我们在商业史上从未见过这样的公司。他们一直以每年10倍的速度增长,今年年底可能达到1000亿美元的年化收入。 仅在第一季度,他们的年化收入就增长了80倍。"
Anthropic行业动态
05:01
Replit ⠕@Replit
37
在AI、数据与建筑环境的交叉领域工作,很少有人能像@refikanadol那样塑造AI驱动艺术的语言。 请看他在Vibecon第二天与@pirroh同台演讲。 纽约,6月17-18日。 购票请访问 http://vibecon.ai
行业动态
04:46
Chubby♨️@kimmonismus
65
NVIDIA 将四个开放模型系列迁移至 OpenMDW 框架

NVIDIA 宣布将其四个开放模型系列(Cosmos、Isaac GR00T、Ising、Nemotron)迁移至 Linux 基金会的 OpenMDW-1.1 框架下。此举旨在解决当前开放模型因许可杂乱和附加限制导致的法律审查负担。OpenMDW 框架为模型权重、代码、文档和数据提供了统一的宽松许可证,使得开发者和企业从多次审查简化为一次。这符合 NVIDIA 以算力为核心的业务逻辑,能够促进更多人部署和微调其开放模型。

NVIDIA AI: We're adopting the Linux Foundation's OpenMDW framework across our open model families. This helps make open model licen...

开源生态行业动态
01:45
Chubby♨️@kimmonismus
41
2026年的这次合作,我完全没料到。

NVIDIA AI: A new era of PC. 25.0528, 121.5990

端侧行业动态
01:40
Runway@runwayml
27
参加我们6月4日在丹佛举办的年度CVPR朋友晚宴的最后机会,届时将有交流、鸡尾酒和小食。 请通过下方链接报名。
行业动态
5月29日
22:56
Orange AI@oran_ge
47
也许会有一种新的软件商业模式 第一版免费 后续更新每次都收费 毕竟 AI Coding 第一版是最简单的… 维护是很费心力的… 或者 agent 自己迭代的版本免费 人类迭代的版本收费
大佬观点行业动态
22:45
Chubby♨️@kimmonismus
61
字节跳动自研推理芯片曝光,设计旨在绕过美国限制

据报道,字节跳动正在开发基于 Groq LPU 架构的自研推理芯片。该架构将模型保存在片上 SRAM 中,跳过了受美国对华出口管制最严格限制的组件——高带宽内存。字节跳动的内存合作伙伴 InnoStar 在台积电的成熟制程节点进行生产,这些节点也处于管制之外。这一系列设计选择均旨在规避美国的限制,而正是同一架构,Nvidia 刚刚花费约200亿美元获得了其授权。

推理行业动态部署/工程
20:34
AYi@AYi_AInotes
63
史上最贵的一觉:CEO醒了,欠了Anthropic 5亿美元

Polymarket: NEW: AI consultant reveals a client accidentally spent $500,000,000.00 in a single month after failing to set employee l...

Anthropic行业动态
18:49
Peter Steinberger 🦞@steipete
37
非常高兴Vince加入。🦞 很少有人理解软件构建的新方式。他理解。 【引用 @vincent_koc】:我已加入🦞@openclaw基金会,担任首席架构师!很兴奋能与@steipete和世界级团队一起推动智能体计算的未来。 在后claw时代,AI正从编码领域扩展到我们的个人生活。@nvidia Computex和@Microsoft Build上将有重大发布!

Vincent Koc: I've joined the🦞@openclaw Foundation as Chief Architect! Excited to propel the future of agentic computing with @steipe...

智能体行业动态
17:49
Peter Steinberger 🦞@steipete
25
我闻到了关停的气息,3…2…1 https://clawd.rip/
行业动态
17:13
Alibaba Cloud@alibaba_cloud
41
加入阿里云和Appnovation的战略简报,了解通义千问(Qwen)如何帮助企业重新思考AI性能与成本的平衡。了解全球领先企业为何选择Qwen,以及您的团队需要了解哪些信息以保持竞争力。 📅 6月9日星期二 | 太平洋时间上午11:00 / 东部时间下午2:00 | 55分钟 | 线上 立即注册:https://lnkd.in/gHEyw6EQ
开源生态行业动态
16:49
Kling AI@Kling_ai
25
自然的每一种想象都以全新的形式焕发生机。 感谢Kling创作者的灵感,万物皆在绽放。💚
行业动态视频
16:15
Chubby♨️@kimmonismus
47
所以OpenAI昨天确实想发布更大的更新,但不得不推迟。

Tibo: @giordanorandone @OpenAI Nah. The only thing that caught us off guard was a bug we discovered last minute. And we decide...

OpenAI行业动态
16:10
meng shao@shao__meng
32
帮转!又一个 A 厂付费用户被禁的案例,希望看到妥善解决!

Guohao Li 🐫: Impressed by Anthropic's customer service. We paid for one year subscription for the team plan. Our org was disabled for...

Anthropic行业动态
15:39
SenseTime@SenseTime_AI
28
AI视频工具正在重塑内容行业。 商汤AIGC副总裁、#Seko总经理王梓彬表示,业余创作者仅需一到两周就能制作AI短片--这正引发一波新的创作浪潮。 听听他的分享,并亲自体验我们的AI视频创作智能体Seko。🎬
图像生成行业动态视频
15:34
Berryxia.AI@berryxia
24
用小米赠送的Token实测MiMo-2.5-Pro调用能力

作者分享使用小米赠送的模型token,对MiMo-2.5-Pro进行实测。其计划将该模型接入自己的AI智能体环境,专门评估其在实际调用场景下的表现,并表示将在后续分享测试结果。

智能体行业动态
15:10
小互@xiaohu
48
Anthropic 的估值时间线 2025年底,也就是Claude Code 爆火后 Anthropic开启了🚀模式…
Anthropic行业动态
14:39
SenseTime@SenseTime_AI
27
SenseTime高管:香港有条件成可信AI中心,已与警方合作

SenseTime高管Lewis Fung表示,香港凭借先进基础设施、多模态基础模型和生态伙伴合作,有条件成为可信AI创新中心。他近日出席数码港与警方智能 policing 联合 AI 实验室启动活动,分享了AI在网络安全、公共安全与智慧城市方面的应用。SenseTime将继续与伙伴合作推动可信AI发展,打造更智慧安全的香港。

多模态行业动态
‹ 上一页
1…2627282930…50
下一页 ›