AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2289 条
全部一手资讯X论文
标签「行业动态」清除
Rohan Paul@rohanpaul_ai · 7天前67

IBM debuts world’s first sub-1 nanometer chip. They just announced a 0.7nm chip technology. (0.7nm is about 100,000 times thinner than a human hair, only a few atoms across as a technology marker,) It stops treating smaller chips as a flat-layout problem and starts stacking transistors upward through a new nanostack architecture. A chip node no longer means every feature has that exact size, but 7 angstroms means IBM is pushing transistor design into a scale where individual atoms start to shape the engineering limits. Traditional scaling packs more switches side by side, while nanostack vertically staggers nanosheet transistors, letting each layer use different materials for speed or lower power instead of forcing one transistor recipe across the chip. IBM says the design can fit nearly 100B transistors on a fingernail-sized chip, deliver up to 50% more performance or 70% better energy efficiency than its 2nm node, and shrink SRAM by 40%, which is huge because AI chips constantly wait on memory. Practically it means future chips that can run bigger AI models, phones, laptops, servers, and cloud systems faster while using much less power, because more compute and memory can fit into the same tiny chip area. --- newsroom. ibm. com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology

译IBM推出0.7nm芯片技术,采用新型nanostack架构将晶体管垂直堆叠,取代传统平面缩放。指甲盖大小面积可容纳近1000亿个晶体管,性能较其2nm节点提升50%,能效提升70%,SRAM缩小40%。该技术突破原子尺度工程极限,有望让AI芯片、手机、服务器等更快更省电。

Rohan Paul@rohanpaul_ai · 7天前53

FT published a piece "Anthropic has hired an economist with . . .  interesting views on human survival" Stanford economist Chad Jones joined Antropic this week. Jones’s NBER paper showed advanced AI as a bargain between faster invention and existential risk, where smarter systems may speed research but may also create losses no economy can repair. His most jarring result uses log utility, an economics assumption that each extra gain helps less than the last, and says a 1% annual extinction risk for 40 years leaves about a 67% survival chance.

译Anthropic 本周雇佣了斯坦福经济学家 Chad Jones。Jones 的 NBER 论文认为,先进 AI 是加速发明与存在风险之间的权衡——更智能的系统可能加速研究,但也可能造成经济无法修复的损失。其结论使用对数效用假设:若每年有 1% 的灭绝风险持续 40 年,生存概率约为 67%。

OpenAI@OpenAI · 7天前30

Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to do work that is more complex, longer-running, and increasingly cross-functional. Our internal usage offers an early look at how agentic tools may reshape work as they become more capable and broadly available.

译OpenAI 的工作正在被智能体改变,在每个部门。 整个公司里,人们正在使用 Codex

宝玉@dotey · 7天前42

帮转,DeepSeek 招多模态方向工程师研究员

译DeepSeek 正在招聘多模态方向的全职/实习岗位,包括多模态数据工程师(预训练数据工程师)以及多模态理解数据/算法研究员(图像与视频方向)。应聘者可通过私信或发送简历至 talent@deepseek.com 联系。

Chubby♨️@kimmonismus · 7天前60

Apple is making one of its biggest Mac silicon strategy shifts yet. According to Bloomberg, Apple plans to launch a base M6 chip as early as this year, but skip the usual M6 Pro and M6 Max variants entirely. Instead, the company is reportedly moving its next high-end Mac chips directly to the M7 generation in 2027. The reason: Apple wants to fast-track more advanced on-device AI and graphics capabilities. The M6 is expected to bring higher memory bandwidth, an upgraded Neural Engine, improved CPU cores, better video encoding and decoding, and a redesigned GPU with up to 12 graphics cores. Memory bandwidth is becoming one of the key specs for AI workloads. The M6 is reportedly targeting around 200 GB/s, up from about 153 GB/s on M5. The base M7 could push that to around 240 GB/s. Apple is also still planning an M5 Ultra for a new Mac Studio, with around 36 CPU cores, 80 GPU cores, and support tested for up to 768 GB of memory. Apple seems to be reorganizing its Mac silicon strategy around a very clear assumption: on-device AI will require much more memory bandwidth, stronger local inference, and better graphics performance than the current Mac roadmap was originally built for. really excited for the m7 chips. My assumption: primarily because the new CEO John Ternus was the significant reason for Apple's shift towards its own M-chips and is now placing an even stronger focus on them.

译据彭博社报道,苹果计划最早今年推出基础M6芯片,但跳过M6 Pro和M6 Max,直接于2027年进入M7代。主因是加速设备端AI和图形能力。M6将带来更高内存带宽(约200 GB/s,M5约153 GB/s)、升级神经引擎、改进CPU核心、增强视频编解码及全新GPU(最多12核心)。M7内存带宽或达约240 GB/s。同时计划推出M5 Ultra用于新Mac Studio,配置约36 CPU、80 GPU核心,支持最高768 GB内存。苹果认为设备端AI需要更高带宽、更强本地推理和图形性能。

Anthropic@AnthropicAI · 7天前51

We're joining @raiseus_ai as a founding partner. RAISE US is a nonprofit coalition working to strengthen the American workforce through employer-led action, AI-enabled training, and policy innovation to support the transition to transformative AI.

译Anthropic宣布以创始合伙人身份加入RAISE US。RAISE US是一个非营利联盟,由前美国商务部长Gina Raimondo和Eric Holcomb共同主持,联合各州州长、雇主和教育工作者,旨在通过雇主主导行动、AI赋能培训和政策创新,为美国劳动力建立AI时代的 "人员战略",帮助工人培训、转型和发展,弥补当前仅有AI技术战略、缺乏人员战略的空白。

Chubby♨️@kimmonismus · 7天前58

Google is reorganizing its AI coding strike team as it tries to close the gap with Anthropic in one of the most lucrative parts of the AI market. According to The Information, the months-old team is being expanded into a more formal "midtraining" group, sitting between pretraining and post-training. The goal is to improve Gemini’s coding abilities and extend those capabilities into broader business tasks like creating presentations. The move comes after two major departures: Noam Shazeer reportedly left for OpenAI after changes to his compute access, while Nobel Prize winner John Jumper is heading to Anthropic after recently being moved to the coding strike team. That is the uncomfortable part for Google. It has world-class researchers, TPUs, Gemini, Cloud, Search, YouTube, and enormous distribution. But coding has become the clearest monetization layer in AI, and Anthropic has turned that advantage into massive revenue momentum. Google now seems to be admitting that strong base models alone are not enough. Coding needs specialized training, dedicated compute, and a much sharper product loop.

译Google将数月前成立的AI编码突击队扩展为更正式的“midtraining”小组,位于预训练与后训练之间,旨在提升Gemini编码能力,并延伸至创建演示文稿等商业任务。此前,Noam Shazeer因计算资源变动转投OpenAI,Nobel奖得主John Jumper调至该团队后也加入Anthropic。Google承认,仅靠强大基座模型不够,编码已成为AI最明确的变现层,Anthropic借此获得收入增长。Google需专用训练、计算和更清晰的产品闭环来追赶。

Yuchen Jin@Yuchenj_UW · 7天前35

You may have heard that GLM-5.2 at 328 token/s is cool, How about 392? Databricks is now #1 in inference speed for GLM-5.2 on Artificial Analysis. It's a great model, and we did a lot of optimizations.

译你可能听说过 GLM-5.2 每秒 328 token 很酷, 那么每秒 392 呢? Databricks 在 Artificial Analysis 上 GLM-5.2 的推理速度现排名第一。这是个很棒的模型,我们做了大量优化。

elvis@omarsar0 · 7天前20

Running agents these days shouldn't be too hard. But local agents are tricky to operate. @hyperagentapp gives every agent its own dedicated cloud machine. Handles infra for you so it runs whether your laptop is on or not.

译Hyperagent 为每个 AI 智能体提供专用云端机器,托管基础设施,无需笔记本常开也能持续运行。针对 OpenClaw 等本地框架常见的问题(每日崩溃、泄露秘密、频繁监控),Hyperagent 提供稳定安全替代方案。限时优惠:注册即获 $100 推理积分,迁移首个智能体再获 $500。

AYi@AYi_AInotes · 7天前54

Gemini Pro现在只要$1.99一个月了, Google开始卷价格了?

Chubby♨️@kimmonismus · 7天前52

This is an interesting update that Anthropic published in their official letter. But in short: they apparently haven't managed to stop the distillation. It's continuing almost seamlessly, just like before.

译这是Anthropic在其官方信件中发布的一个有趣更新。 但简而言之:他们显然未能阻止蒸馏。蒸馏几乎无缝地继续,和以前一样。

Chubby♨️@kimmonismus · 7天前43

Everyone's teaching AI agents to shop. Almost nobody is solving the boring part: letting them move the money, pay across borders, keep the books, stay compliant. That's the gap Airwallex is going after, with Airi (faster agent checkout today, a real wallet in the works) and T:0 (an AI-native platform for the finance back office, still in beta). The interface gets all the attention. The money layer is what decides whether agents can do the work, and Airwallex already owns the rails for it. It’s great that the important aspects are now also being addressed with the help of AI agents.

译Airwallex 正在解决 AI 智能体金融中资金转移、跨境支付、记账与合规等“无聊部分”。他们推出 Airi(当前提供更快的智能体结账,正在开发真实钱包)和 T:0(AI 原生财务后台平台,仍处于测试版)。Airwallex 已拥有支付轨道,现在此基础上构建智能层。此前,Airwallex 宣布完成 3.2 亿美元融资,估值 110 亿美元,由 Addition 领投。公司指出团队更小、全球化、更多使用智能体是趋势,并用 10 年建设了适配这一世界的金融基础设施。

Berryxia.AI@berryxia · 7天前11

这几天有空把这个制作流程开源给大家,看看搞一个skills什么都行不行! 如果你感兴趣就一键三连啊~

译个人开发者Berry Xia在X上宣布,计划将其制作流程开源,并询问能否用该流程生成“Skills”(可能指Claude等AI Agent的技能包)。其此前曾表示“太卷了……先做个垃圾出来”,暗示这是一个快速实验性项目。感兴趣者可“一键三连”关注后续。目前未公布具体模型、版本或参数细节。

🚨 AI News | TestingCatalog@testingcatalog · 7天前36

Anthropic is serving “0 traffic” to Fable 5 at this moment despite the earlier reports, as confirmed by Sam. But we still all waiting patiently 👀

译Anthropic 目前向 Fable 5 提供的“流量为 0”,尽管此前已有相关报道,据 Sam 证实。 但我们仍在耐心等待 👀

meng shao@shao__meng · 7天前36

据说 GLM-5.5 八月份发布? 大概率是真的,这回真的热闹了,GLM-5.5 能跟 Claude Fable 5、GPT-5.6 正面抗衡吗,很期待!

Chubby♨️@kimmonismus · 7天前41

Correction: Anthropic states that the apparent access to Fable 5 is likely attributable to a UI bug.

译更正:Anthropic 表示,Fable 5 的可见访问很可能是由 UI bug 导致的。

Chubby♨️@kimmonismus · 7天前49

It looks like Fable 5 might actually be available again. But there's a major caveat: It's only for US citizens and businesses. That would really change everything and leave Europe completely behind.

译看起来 Fable 5 可能确实再次可用了。 但有一个重大限制:仅限美国公民和企业。 这将彻底改变一切,把欧洲完全抛在后面。

OpenBMB@OpenBMB · 7天前22

🎉 Congratulations to @aia_gh on hosting this fantastic hands-on AI workshop! 👏 We're truly honored that you chose our open-source MiniCPM-V models.❤️ Looking forward to more collaborations in the future!🤗

译🎉 祝贺 @aia_gh 举办这场精彩的动手AI工作坊!👏 我们非常荣幸您选择了我们的开源 MiniCPM-V 模型。❤️ 期待未来更多合作!🤗

PixVerse@PixVerse_ · 7天前25

the pacing on this is great! camera keeps up with the action the whole way through. nice work pushing the chase format

译这个节奏很棒!镜头全程跟上动作。在推进追车格式方面做得很不错。

meng shao@shao__meng · 7天前59

A 社指控阿里千问 25000 个伪装账号来蒸馏 Claude 这个数量比之前指控 DeepSeek、MiniMax 和 Kimi 加起来好像都多 懂了,都传出去:Qwen 3.8 值得期待 😂 A 社的蒸馏账号报告,也是一种 Benchmark。。。

译Anthropic 指控阿里千问用 25000 个伪装账号来蒸馏 Claude 这个数量比之前指控 DeepSeek、MiniMax 和 Kimi 加起来好像都多 懂了,都传出去:Qwen 3.8 值得期待 😂 Anthropic 的蒸馏账号报告,也是一种 Benchmark。。。

Alibaba Cloud@alibaba_cloud · 7天前28

⏳ 1 Day to Go! Flink Forward Asia 2026 — Main Forum Agenda Revealed! FFA2026 brings together world-class tech leaders to showcase the full picture of real-time data intelligence — from Alibaba Cloud's Agent-native to AI-native evolution, and from automotive to embodied AI industry scenarios. 📅 June 26–27 | InterContinental Shenzhen OCT, Shenzhen ⚡ Limited seats available — don't miss out! https://hd.aliyun.com/form/8369 📝 Note: All sessions will be conducted in Mandarin Chinese. #FlinkForwardAsia #FFA2026 #ApacheFlink #RealTimeData #DataAI #AIAgent #AgenticAI #StreamingData #OpenSource #AlibabaCloud #EmbodiedAI #DataEngineering

译距开幕1天,阿里云正式公布Flink Forward Asia 2026主论坛议程。大会聚焦实时数据智能,展现从Agent-native到AI-native的阿里云演进路径,并覆盖汽车、具身AI等产业场景。会议将于6月26-27日在深圳华侨城洲际酒店举行,所有演讲均以中文进行。席位有限,需提前报名。

DogeDesigner@cb_doge · 7天前31

BREAKING: Grokipedia just surpassed ~50 million visits. • Over 420,000 backlinks • Over 10,000 referring domains More people are shifting to @Grokipedia Keep sharing Grokipedia links on your websites and blogs. This is how we can beat Wokipedia.

译BREAKING: Grokipedia 刚刚突破约 5000 万次访问。 • 超过 42 万条反向链接 • 超过 1 万个引用域名 越来越多人转向 @Grokipedia 继续在你的网站和博客上分享 Grokipedia 链接。 这就是我们击败 Wokipedia 的方法。

Chubby♨️@kimmonismus · 7天前31

Some users can (re)select Fable 5 in the Claude Code model selector, while others say they were able to select it despite Fable 5 being taken down. I deleted the post about it because I was too unsure and didn't want to spread false information. But regardless, it seems things are happening, and Fable 5 is within reach again!

译部分用户可以在 Claude Code 模型选择器中(重新)选择 Fable 5,而另一些用户表示,尽管 Fable 5 已被下架,他们仍能选中它。 我删除了相关帖子,因为不太确定,不想传播错误信息。但无论如何,事情似乎在推进,Fable 5 再次触手可及!

Chubby♨️@kimmonismus · 7天前55

Fable 5 watch Claude Fable 5 is showing again in AWS Bedrock docs/model cards. AWS lists the model lifecycle as Active, with Bedrock IDs including `anthropic.claude-fable-5` and `global.anthropic.claude-fable-5`. The data-retention docs also show it as ` status: "available"` when `provider_data_share` is enabled. Not calling it fully “back online” until successful invocations are confirmed / status page clears, ofc but this looks like good movement. We might be back boys

译AWS Bedrock 文档和模型卡片中再次出现 Claude Fable 5 模型。AWS 将其生命周期标记为 Active,并列出 Bedrock ID 为 `anthropic.claude-fable-5` 和 `global.anthropic.claude-fable-5`。数据保留文档在启用 `provider_data_share` 时显示该模型状态为 `"available"`。目前尚未确认成功调用以证明模型完全恢复在线,但迹象积极。

Yuchen Jin@Yuchenj_UW · 7天前44

I didn’t realize Denny Zhou, who led the Gemini Reasoning Team, left Google 4 months ago for Meta’s TBD Lab. A lot of people left Google recently. I’m still waiting for Gemini to catch up in coding. Time for Sergey to pull a Code Red.

译我没意识到Denny Zhou——曾领导Gemini推理团队——已在4个月前离开Google,加入Meta的TBD Lab。 最近很多人离开了Google。我仍在等待Gemini在编码方面赶上。是时候让Sergey启动Code Red了。

OpenClaw🦞@openclaw · 7天前14

Check out episode 1 of The Clawcast, our official OpenClaw podcast, with @hrudolph, @Pat_Erichsen, and @GosuCoder! Great convo around skills, Clawhub, securing OpenClaw deployments, and more. https://youtu.be/IfJJnR1LIE0?si=ruSYAHPE-QqYxoTR

译收看 The Clawcast 第一集,我们的官方 OpenClaw 播客,嘉宾 @hrudolph、@Pat_Erichsen 和 @GosuCoder! 围绕技能、Clawhub、保障 OpenClaw 部署等话题的精彩对话。 https://youtu.be/IfJJnR1LIE0?si=ruSYAHPE-QqYxoTR

meng shao@shao__meng · 7天前38

Liblib 可能是我唯二看不懂的 AI 应用团队,另一个是 GenSpark 他们好像除了让自己跑的足够快,能在模型的夹缝中一直领先一个身位,没有任何其他路径可走 而这种夹缝中的窒息、对速度的要求又都太高了,团队除了往前跑似乎做不了其他事情,任何影响速度的 side project、research 等等都会和速度形成矛盾,从而产生人与人之间的矛盾 看不懂,这两个团队的未来会走向哪里?会一路狂奔在夹缝中撞线?还是会终于在某个点被模型的速度碾过去? https://elsewhere.news/zh/elsewhere/liblib

译邵猛评论称,Liblib与GenSpark是他唯二看不懂的AI应用团队。它们似乎只能在模型发展的夹缝中依靠速度保持领先,没有其他路径可选。这种对速度的极致要求,使得团队无法分心做任何影响速度的side project或研究,内部也可能因此产生矛盾。邵猛对这两个团队的未来表示困惑:是持续狂奔在夹缝中撞线,还是终将被模型本身的速度超越?

宝玉@dotey · 6月25日72

Anthropic 今天正式致信美国参议院银行委员会和白宫,指控阿里巴巴旗下的通义千问(Qwen)AI 实验室对 Claude 发动了迄今为止规模最大的蒸馏攻击。 根据 CNBC 和 Reuters 获取的信件内容,通义千问关联方在 4 月 22 日到 6 月 5 日期间,通过大约 25,000 个虚假账号与 Claude 进行了超过 2880 万次交互。攻击的目标很明确:Claude 最核心的软件工程和 Agent 推理能力。 这个数字放到上下文里才知道有多夸张。今年 2 月,Anthropic 公开点名过 DeepSeek、MiniMax 和 Moonshot AI 三家,说它们用大约 24,000 个假账号总共产生了 1600 万次交互。阿里巴巴一家的量,接近之前三家加起来的两倍。 所谓蒸馏攻击(adversarial distillation),简单说就是拿别人家的顶级模型当老师,大规模喂它问题,收集回答,再用这些回答训练自己的模型。这样做的好处是可以跳过数百万甚至数十亿美元的独立研发成本,快速接近对手的能力水平。Claude 在中国是不可用的,所以这些操作本身就违反了 Anthropic 的服务条款和地域限制。 Anthropic 在信中写道,这些蒸馏攻击是系统性的、工业化规模的,目的是收割美国 AI 能力,然后重新包装成自己的产品。阿里巴巴对此未予置评。 这件事的时机很微妙。Anthropic 现在跟特朗普政府的关系并不好。就在 6 月 12 日,商务部以国家安全为由下令 Anthropic 停止向所有外国人提供其最新的 Fable 5 和 Mythos 5 模型的访问权限,包括 Anthropic 自己的外籍员工。Anthropic 不得不在全球范围内关闭这两个模型,到现在还没恢复。Anthropic 公开表示不同意这一决定,认为一个"狭窄的潜在越狱漏洞"不应该成为召回已部署给数亿用户的商业模型的理由。 所以 Anthropic 现在的处境相当拧巴:一边在跟华盛顿说中国公司在偷我们的技术,请帮忙,一边在跟同一个政府争论你不该限制我们的模型。 不过国会两党在这件事上倒是有共识。参议员 Bill Hagerty(共和党)和 Andy Kim(民主党)计划在必须通过的国防授权法案中提出修正案,对被发现非法获取美国 AI 模型输出的中国公司实施制裁或列入黑名单。Anthropic、OpenAI 和 Google 三家也已经联合起来,共享蒸馏攻击的情报信息。 Anthropic 目前估值 9650 亿美元,本月已秘密提交了 IPO 申请,最早可能今年秋天上市。蒸馏攻击对一家即将上市的公司来说是实打实的商业威胁,中国竞争对手用极低的成本复制出接近的产品,直接侵蚀市场空间。

译Anthropic 致信美国参议院银行委员会和白宫,指控阿里通义千问(Qwen)关联方在 4 月 22 日至 6 月 5 日通过约 25,000 个虚假账号与 Claude 产生超 2880 万次交互,实施蒸馏攻击,目标锁定软件工程和 Agent 推理能力。此前 2 月 Anthropic 曾点名 DeepSeek、MiniMax、Moonshot AI 三家共 1600 万次交互。同时美国商务部以国家安全为由限制其 Fable 5 和 Mythos 5 模型对外国人提供。国会两党计划在国防授权法中提出修正案,对非法获取美国 AI 模型输出的中国公司实施制裁。Anthropic 估值 9650 亿美元,已秘密提交 IPO 申请。

Alibaba Cloud@alibaba_cloud · 6月25日31

AI is reshaping how businesses connect with customers. Join Salesforce & Alibaba Cloud at the Annual Summit Shanghai to explore how enterprises are moving from AI pilots to real business transformation. Highlights: • AI + CRM trends and innovations • Building an Agentic Enterprise at scale • AI in Sales & Service • Industry Cloud innovations • China-to-Global strategies • Customer stories & live demos 📍 Shanghai 📅 15 July 2026 | 2:00–5:30 PM 💬 Sessions in Chinese Register now: https://www.fotounity.com/checkin/salesforce_202605/index.html#/index?channel=-13 #Salesforce #AlibabaCloud #CRM #AI #AgenticEnterprise #EnterpriseAI #DigitalTransformation #ChinaAI

译阿里云联手Salesforce在年度峰会上探讨企业从AI试点到实际业务转型。重点涵盖AI+CRM趋势与创新、规模化构建智能体企业、AI在销售与服务中的应用、行业云创新、中国出海策略及客户案例和现场演示。活动于2026年7月15日下午2:00-5:30在上海举办,中文主讲,现已开放注册。

ginobefun@hongming731 · 6月25日32

BestBlogs 英文早报

Berryxia.AI@berryxia · 6月25日68

笑死!Anthropic 紧急给美国白宫提交申请,说阿里巴巴在疯狂的蒸馏他们的模型。 1️⃣创建了近 25,000 个假账户 2️⃣与 Claude 进行了 28.8 百万次对话 3️⃣在2026 年 4 月 22 日至 6 月 5 日之间 这种蒸馏的方法就是用你竞争对手模型的回答来训练你自己的模型。 Anthropic 已将 Claude 在中国屏蔽。 阿里巴巴还是找到了绕过它的方法。 话说你A社不蒸馏其他模型和别的数据,那你中国的数据哪里来的哈哈哈😂 真的是会哭的孩子有奶吃! 一天天就是block这个,那个。

译Anthropic 向美国白宫提交申请,指控阿里巴巴通过创建近 25,000 个假账户,在 2026 年 4 月 22 日至 6 月 5 日期间与 Claude 进行了约 2,880 万次对话,以提取模型能力用于知识蒸馏(即用竞争对手模型的输出来训练自己的模型)。Anthropic 已在中国屏蔽 Claude,但阿里巴巴仍找到了绕过方法。推文同时质疑 Anthropic 自身训练数据的来源。

Berryxia.AI@berryxia · 6月25日58

MayBe 这只是开始,Gemini 这一波真的是损失惨重了。 相继应该有4-5 位核心人物离开,一般核心人物离开后,可能还会带着自己的部下相继离开。

译据Bloomberg报道,Google DeepMind旗下Gemini团队两位核心成员Jonas Adler和Alexander Pritzel将加盟Anthropic。Adler曾负责AI coding项目,参与AlphaFold及Gemini 1.5;Pritzel是2014年加入的老兵,参与AlphaFold 2/3及Gemini训练体系。此前Gemini已有4-5位核心人物离开,后续可能带动下属离职,团队前景堪忧。

Orange AI@oran_ge · 6月25日45

我还记得去年 lovart 的投资人问我们 你们做生图这个方向怎么跟 lovart 打 今天看文章才知道,lovart 的初始整个团队都走光了 世界变化真快

ginobefun@hongming731 · 6月25日43

http://x.com/i/article/2069928325951401985 # BestBlogs 早报 · 06-25|OpenAI 联手 Broadcom 出芯片,Anthropic 谈人机协作,阿里代码评审 CLI 揽星 5k 在线阅读本期早报 BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容,如果你希望它基于你的兴趣和阅读习惯整理,可以体验「我的早报」。 ## 导语 今天的三条精讲分别站在 AI 全栈竞争的三个不同层面:芯片、协作模式、代码质量。 OpenAI 与 Broadcom 联手把推理芯片的研发周期压缩到九个月,AI 行业的竞争正卷入硬件层。 Anthropic 罕见公开内部协作经验,给「人类与多智能体共享工作台」这种新协作模式立了规矩。 另一边,阿里把验证两年的代码评审 CLI 开源即揽星 5k,提醒我们 AI 写代码和 AI 审代码远不是同一种能力。 三条精讲合在一起看,正好勾勒出一条完整的链路:底层算力越来越便宜,协作方式从单人变成多人多智能体,但生产出来的代码质量仍需要专门工具来兜底,每一层都在同步进化,缺一不可。 速览部分还覆盖了 Flutter 渲染机制、Gemini 3.5 Flash 的计算机操作能力、Qwen 的语言世界模型、Cisco 零日漏洞复盘、智能体记忆构建方法,以及一段 Gemini 对抗 DeepSeek 的幕后故事;补充阅读部分则提供了围绕今天三条精讲的更多一线信源和延伸视角。 ## ★ 精讲一:OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 背景:过去两年,AI 行业的竞争主线一直是模型能力和应用层产品,芯片更多被当作「买来的基础设施」。OpenAI 这次直接下探到芯片设计层,和 Broadcom(NASDAQ: AVGO)联合发布了 Jalapeño——OpenAI 第一款定制 LLM 推理芯片,也是双方多代计算平台合作的第一颗芯片。芯片由 Broadcom 总裁兼 CEO Hock Tan、总裁 Charlie Kawwas 当面交付给 OpenAI CEO Sam Altman 和总裁 Greg Brockman,象征意义大于一次普通的供应商发布会。 关键事实:Jalapeño 从设计到流片仅用九个月,团队称这是高性能芯片史上最快的 ASIC 研发周期之一,而这个研发过程本身就由 OpenAI 自家模型加速完成——形成了「用模型设计芯片,再用芯片跑模型」的闭环。芯片围绕 OpenAI 对 LLM 推理需求的深度理解从零设计,设计阶段就充分参考了模型路线图、推理 kernel、服务系统和产品需求,并联合 Broadcom、Celestica 在芯片实现、板级与机柜系统集成、高性能网络、可扩展生产系统等环节实现工业化落地。工程样片已经在实验室以量产目标频率和功耗运行真实负载,包括 GPT‑5.3‑Codex‑Spark。早期测试显示,Jalapeño 的能效比(performance per watt)显著优于当前最先进水平,详细技术报告将在未来几个月公布。架构层面的核心思路是减少数据搬运、平衡计算/内存/网络资源,让实际利用率更接近理论峰值;Broadcom 的芯片实现能力和包括 Tomahawk 网络芯片在内的网络技术,则负责把这套平台真正落地到大规模生产环境,并计划从 2026 年起与 Microsoft 等数据中心伙伴一起以吉瓦级规模部署。OpenAI 硬件项目负责人 Richard Ho 提到,团队围绕对前沿模型最重要的 kernel、内存搬运、网络和服务模式优化架构,让 Jalapeño 在执行最重要的负载时能更接近硬件理论极限;Broadcom CEO Hock Tan 则把这次合作定义为面向未来十年 AI 物理基础设施扩张的「多代路线图的开端」。 为什么重要:这标志着 OpenAI 的全栈战略从「模型 + 产品」正式下探到「芯片」这一层,构建出「模型反哺芯片设计、芯片支撑更便宜推理」的飞轮。Brockman 把这称为「计算驱动的经济」——通过自己设计更多层级的技术栈,用更高效率提供更多智能,让先进 AI 的访问成本持续走低,并能被用于解决更重要的问题。对于依赖云端推理成本的开发者和企业来说,这条芯片自研路线如果跑通,意味着未来几年大模型调用价格还有进一步下降空间;而对芯片产业来说,OpenAI 以「模型公司」身份亲自下场定制芯片,本身也是对英伟达等传统芯片供应商话语权的一次结构性挑战。 与今日其他精讲的关系:如果说精讲一是 AI 竞争卷入硬件层的信号,精讲三里阿里开源的代码评审 CLI 则提醒我们,硬件红利最终还是要靠软件工程能力消化——芯片更快不代表代码质量自动变好,AI 写代码与 AI 审代码仍是两种需要分别打磨的能力。 阅读建议:如果你关注 AI 基础设施和芯片产业链,这篇官方发布值得通读,重点看架构设计思路和量产时间线;如果只关心应用层,知道「推理成本可能继续下降」这一个结论即可,不必深究芯片实现细节。 详见:OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 ## ★ 精讲二:Anthropic 关于构建高效人机协作团队的经验 | Claude 背景:过去和 AI 协作基本是「一人对一个聊天窗口」的单机模式——一个人面对一个智能体完成单点任务。随着智能体能处理编码、研究、财务分析这类复杂长周期工作,使用形态也在变化,但本质上仍是「单人」体验。Claude Tag 这类工具的发布打破了这个边界:人类和智能体现在可以共处同一个工作空间,为团队共同目标协作,工作形态从「单机游戏」变成了「多人游戏」——人类团队设定策略,Claude 执行具体工作。 关键事实:Anthropic 在文章中把能与多个不同人类同时协作的 AI 模型称为「多智能体(multiplayer agents)」。这类智能体需要三项基础能力:持久记忆(记住目标并据此调整执行)、不绑定个人的独立身份凭证(在安全可预期的边界内运作)、对组织信息的持续广泛访问权限(理解组织运作方式并据此行动)。文中举了一个具体场景:人类团队和智能体在 Slack 同一个频道里一起分析数据集,智能体能跟进对话上下文、调用工具、给出分析结果,整个过程就像团队里多了一名常驻成员,而不是临时被叫来回答一个问题就消失的助手。但 Anthropic 强调,光有技术基础还不够,团队还需要建立新的工作方式和共同规范,文章总结了四条经验:信息默认公开(团队内部尽量公开透明,因为智能体只能从可搜索的文本——Slack、代码、文档、会议记录——构建对世界的理解,私聊和口头沟通对智能体而言「不存在」,与其逐条决定哪份文档能给智能体看,不如直接设定工作空间级别的安全边界,让信息在边界内对人和智能体一视同仁地流动);人和智能体各有清晰角色分工,避免责任边界模糊导致互相甩锅或重复劳动;由人类设定北极星目标,智能体负责执行细节,团队设定战略方向,Claude 执行具体工作,这种分工让人类可以专注在更高层的判断上;按可验证程度逐步放权,而不是一开始就给智能体完全自主权——风险越低、越容易验证结果的任务,越适合早期放权,高风险决策仍需人类把关。 为什么重要:这是 Anthropic 少见的公开内部协作实践,相当于把「团队级智能体协作」这件事从概念阶段直接给出了一套可复制的治理框架。对正在把 AI 智能体引入团队协作流程的公司来说,这四条经验提供了具体的边界设计参考,而不只是停留在「智能体很强大」的宏观叙事,也回应了很多团队在引入智能体协作时最容易卡住的两个问题——信息要不要全量开放给智能体、放权节奏怎么把控。 与今日其他精讲的关系:精讲一讲的是 AI 全栈竞争卷入硬件层,精讲二则是软件协作范式的进化——两者共同指向同一个趋势:AI 正在从「被使用的工具」变成「被设计进组织结构里的协作者」,无论是芯片层还是团队协作层,都需要重新设计底层架构来适配这种变化。 阅读建议:如果你的团队已经或准备让多个智能体参与协作流程,这四条经验值得逐条对照自己的实践,尤其是「信息默认公开」和「按可验证程度放权」这两条最容易在落地时被简化掉;如果只是单人使用 AI 工具,可以重点看「信息默认公开」这一条,它对个人知识管理同样有参考价值。 详见:Anthropic 关于构建高效人机协作团队的经验 | Claude ## ★ 精讲三:阿里开源 Open Code Review:一周揽下 5k star,更专业的代码评审 CLI 背景:AI 每天生成的代码量已经远超人工评审的承载上限——以前一天 review 几百行,现在动辄几千甚至几万行,代码评审正在成为研发效率新的质量瓶颈。Open Code Review 的前身是阿里集团内部官方 AI 代码评审助手,过去两年在内部服务了数万开发者、识别了数百万个代码缺陷,经过大规模生产验证后被孵化为开源项目,向社区开放。 关键事实:文章直接点出了用通用 Agent(比如 Claude Code + Skills)做代码评审的三个常见痛点:覆盖不全(变更较大时 Agent 倾向于「偷懒」,选择性评审部分文件,导致遗漏)、位置漂移(报告的问题与实际代码位置经常对不上,出现行号或文件偏移)、效果不稳定(纯自然语言驱动的 Skills 难以调试,评审质量因提示词的细微差异大幅波动)。这些问题的根源在于纯语言驱动的架构缺乏对评审流程的强约束。Open Code Review 的解法是「确定性工程 + Agent」混合架构:精准的文件筛选(明确哪些文件需要评审、哪些应当过滤,确保重要改动一个不漏)、智能文件打包(把关联文件归并为同一评审单元,每个包作为独立 subagent 任务,上下文互相隔离,超大变更场景下更稳定也天然支持并发)、精细化规则匹配(针对不同文件特征匹配对应评审规则,用模板引擎而非语言模型保证规则匹配的稳定性和可预期性)、外挂的定位与反思组件(独立的评论定位模块和反思模块,系统性提升 AI 反馈的位置准确性和内容准确性),这些「不能出错」的环节全部交给工程逻辑负责的强约束环节;Agent 只负责动态决策和上下文召回这类真正需要推理的部分,包括场景化提示词调优和场景化工具集沉淀。 阿里内部数据显示:月活用户 2 万、累计执行 370 万次真实评审任务、用户采纳率超过 30%、有效 AI 评论占比全集团范围内近 80%、评论位置准确率超过 97%。基于 50 个热门开源仓库、200 个真实 PR、覆盖 10 种编程语言、80+ 资深工程师交叉标注的开源评测集显示:Open Code Review 各模型组合准确率在 25%–38% 之间,远高于 Claude Code 的 7%–16%(以 Claude-4.6-Opus 为例,OCR 产出 889 条评论命中 301 个真实问题,准确率 33.90%;Claude Code 产出 5980 条评论命中 435 个真实问题,准确率仅 7.23%);但 Claude Code 在召回率上更具优势,CC + Claude-4.6-Opus 以 28.90% 的召回率位居所有组合之首,比 OCR 最优组合多发现约 45% 的真实问题,CC + Qwen3.7-Max 和 CC + GLM-5.1 的召回率同样超过 OCR 多数组合,这对安全审计这类「宁可多查、不可遗漏」的场景仍有不可替代的价值。综合 F1 指标,Open Code Review 在准确率与召回率之间取得了更均衡的表现(最优 25.10% vs Claude Code 最优 14.13%),资源消耗也更低(Token 消耗 352K–743K,耗时 1–6 分钟,远低于 Claude Code 的 2,062K–5,664K Token、5–14 分钟)。文章还指出一个有意思的现象:更新的 Claude-4.8-Opus 在两个工具上都表现出「更精确但更保守」的特征,准确率最高但召回率明显低于上一代 Claude-4.6-Opus,说明模型代际升级不一定带来评审效果的全面提升。 为什么重要:这组对比数据揭示了一个容易被忽视的事实——AI 写代码与 AI 审代码是两种截然不同的能力,即便是最强的编码 Agent,也需要专业的评审 Agent 来兜底。Open Code Review 团队甚至用 Claude Code 从零以 Go 语言重写了这个开源项目本身,再用 Open Code Review 反过来评审每一次变更,106 次代码变更中累计发现 145 个有效问题,涵盖严重 Bug、安全问题、错误处理不当、命名错误、代码重复、性能问题等多种类型,这个「自证」过程本身就是对工具能力的真实验证。 与今日其他精讲的关系:精讲一和精讲二分别讲了 AI 在硬件层和团队协作层的进化,精讲三则把视角拉回最基础的软件工程环节——再快的芯片、再高效的人机协作,最终生产出来的代码质量仍然需要专门的工程化方案去把关,这是当前通用 Agent 普遍存在的短板。 阅读建议:如果你的团队已经在用 AI 大量生成代码,这篇文章里「确定性工程 + Agent」的架构思路和评测数据值得细读,尤其是文件打包和定位反思组件的设计可以直接借鉴;如果只是想知道结论,记住一句话即可——通用 Agent 评审代码目前还不如专门工具准,但召回更全,两者可以搭配使用。 详见:阿里开源 Open Code Review:一周揽下 5k star,更专业的代码评审 CLI ## 速览 [说好的艺术家呢?—— AI 时代,内容工业的三次死亡与创作者的重生](https://www.bestblogs.dev/podcast/e1238ff) 这是「屠龙之术」作者在 AEIS-AI 娱乐内容产业峰会上一场 40 分钟演讲的录制版本,围绕当前 AI 多模态领域的发展现状展开。文章深入剖析了 AI 如何从素材生产、生产流程、版权归属三个层面接连冲击传统内容工业,并指出创作者唯有放弃旧有的生产者身份、构建全新的价值愿景,依靠人类独有的直觉、品味与信任关系,才能在技术碾压之下实现真正的「重生」,而不是在旧赛道里继续被替代。演讲本身带有明显的行业一线视角,时间线里穿插了多个具体案例,适合从业者对照自己所在的细分赛道判断冲击程度和应对节奏。 [Flutter 底层渲染解析:BuildContext 与 Element Tree 详解](https://www.bestblogs.dev/article/c7c34649) 文章从一句常见的报错「Looking up a deactivated widget's ancestor is unsafe」讲起,深入剖析 Flutter 内部的三棵树结构——Widget Tree、Element Tree、RenderObject Tree——以及 BuildContext 究竟是什么、setState 调用之后框架内部到底发生了什么。比起照搬 Stack Overflow 答案,这篇文章更适合想真正理解 Flutter 渲染原理、从根上修复上下文相关错误的开发者。 [在 Gemini 3.5 Flash 中推出计算机操作功能](https://www.bestblogs.dev/article/16a75c47) Google 宣布计算机操作(computer use)现已成为 Gemini 3.5 Flash 的内置工具,此前这项能力只在独立的 Gemini 2.5 computer use 模型中提供。Gemini 在函数调用和搜索/地图等内置工具调用上本就表现不错,这次原生整合计算机操作能力之后,开发者可以直接用主力 Flash 模型构建能与浏览器、移动端、桌面环境交互的智能体,不再需要额外接入专门模型,开发链路更简洁。 [Qwen-AgentWorld 开源:让 Agent 学会“先预测,再行动”](https://www.bestblogs.dev/article/8810d85f) 通义实验室开源了 Qwen-AgentWorld,号称首个原生语言世界模型——核心思路是让 Agent 不再只在真实环境里反复试错(搭建沙箱成本高、危险操作可能直接搞崩环境),而是先学会「预测环境会发生什么」。环境建模从继续预训练阶段就作为训练目标,贯穿 CPT、SFT、RL 全流程,而不是对通用大语言模型的事后适配;单一模型同时覆盖 MCP、Search、Terminal、SWE 等文本类环境与 Web、OS、Android 等 GUI 类环境,实现跨领域知识迁移,在 AgentWorldBench 上超过了 GPT-5.4 等前沿模型。文章还展示了可控模拟和跨任务泛化两种应用范式,适合关注 Agent 训练方法论演进的读者。 [Cisco SD-WAN 管理器零日漏洞遭利用获取 Root 权限全过程](https://www.bestblogs.dev/article/bcfc7fba) Mandiant 详细复盘了一起真实攻击事件:威胁行为者在拿到某服务商的 SD-WAN 基础设施初始访问权限后,利用 Cisco Catalyst SD-WAN Manager 中的零日权限提升漏洞 CVE-2026-20245,通过文件上传功能缺乏校验的缺陷,把一个受限的管理员账号一路提权到 root 权限。拿到 root 之后,攻击者并未止步于横向移动,而是进行了大量针对性的反取证清理,试图抹去入侵痕迹,这也增加了事后溯源的难度。这篇分析对安全团队理解真实世界的零日利用链条、文件上传类漏洞的危害边界以及事后取证排查很有参考价值,建议运维和安全团队结合自己的 SD-WAN 部署情况核对补丁状态。 [如何为 AI 智能体构建记忆](https://www.bestblogs.dev/article/35c6d909) LangChain 这篇文章给出了一套构建智能体记忆的结构化方法:通过「捕获、分析、更新」三步循环的闭环,让智能体能从之前的交互中学习,避免用户每次都要重复纠正同样的问题。文章还结合 LangSmith 讲解了具体的可观测性、记忆引擎和上下文管理实现方式,适合正在给自己的 Agent 加记忆能力的开发者参考落地细节。 [40 天不睡、5 人死磕:DeepMind 主管爆料 Gemini 大战 DeepSeek 内幕](https://www.bestblogs.dev/article/87f785ef) 这篇编译自 Gemini 预训练主管 Vlad Feinberg 的播客访谈,讲述了 Gemini 2.0 Flash 背后只有 5 个人的团队、在硅谷和巴黎两地 24 小时倒班、连续 40 天不眠不休训练模型的真实故事,揭开了「顶尖实验室天天搞颠覆性算法」这种想象背后更朴素的工程真相——团队真正的日常是调整编译器和超参数、解决显存溢出、把微调任务硬塞进一堆老旧 TPU 卡里。文章还谈到预训练研究、量化、推理协同设计,以及程序员在 AI 时代应该往哪个方向转型,对关心大模型训练一线工作方式、想了解「干脏活」式工程贡献如何被认可的读者很有意思。 ## 补充阅读 [GitHub - BrightbeamAI/chap:协作人机交互协议(CHAP)](https://www.bestblogs.dev/article/c077a653):一个开放协议,专门用于规范人类与 AI 智能体之间结构化、可审计的协作,把人工覆写行为记录为结构化数据,方便追溯决策过程和持续改进提示词,适合关注人机协作协议标准化的读者。 [从表单到 Agent:得物社区活动搭建的 AI 实践之路](https://www.bestblogs.dev/article/16cf7e6c):得物技术团队分享了把社区活动搭建流程从「填表单」逐步演进到「AI 驱动 + 人工确认」两阶段 Agent 架构的实践过程,包含关键的取舍和架构设计细节,适合做内部工具 Agent 化改造的团队参考。 [超越 CLEAN 与 MVP:在 Android 中构建离线优先的响应式数据层](https://www.bestblogs.dev/article/4f0d0408):介绍了响应式数据层架构(RDLA),通过强制分离公共 API 数据定义与私有实现数据源,解决响应式 UI 框架与移动端存储限制之间的矛盾,重点是离线优先和去耦同步,适合 Android 架构方向的工程师。 [Greg Brockman 宣布 OpenAI 推出全新 LLM 推理芯片 Jalapeño](https://www.bestblogs.dev/status/2069809298612621629):OpenAI 总裁本人发布 Jalapeño 推理芯片的第一时间动态,可以作为精讲一官方公告的一线信源补充。 [OpenAI 发布首款 AI 芯片:Jalapeño](https://www.bestblogs.dev/status/2069770172802773292):OpenAI 官方账号同步发布的芯片公告,与上面 Brockman 的个人动态相互印证,适合想看官方第一反应的读者。 [阿里重磅开源!Open Code Review:一周 5k star,为你的代码保驾护航](https://www.bestblogs.dev/article/ea5f8bff):另一篇视角介绍 Open Code Review 开源始末,公开了更多评测数据细节和具体使用方式,适合看完精讲三还想了解上手步骤的读者。 ## 今日阅读路径 如果今天时间有限,建议按这个顺序读: 1. 精讲三 · Open Code Review —— 信息密度最高,「AI 写代码 vs AI 审代码」的结论对几乎所有用 AI 编程的团队都有直接参考价值。 1. 精讲一 · OpenAI 与 Broadcom 推理芯片 —— 了解 AI 行业竞争正在卷入硬件层这个大趋势,判断未来推理成本走向。 1. 精讲二 · Anthropic 人机协作经验 —— 如果你的团队已经或即将引入多智能体协作,这四条经验能帮你少踩一些治理上的坑。 其余内容可以按兴趣挑选:关注移动端开发看 Flutter 渲染解析,关注 Agent 工程看 Qwen-AgentWorld 和智能体记忆构建,关注安全看 Cisco 零日漏洞复盘,关注行业幕后故事看 Gemini 对抗 DeepSeek 那篇。 BestBlogs 是 AI 驱动的私人阅读助手,帮助你发现真正适合你的高质量内容,欢迎体验。

译OpenAI与Broadcom发布首款定制LLM推理芯片Jalapeño,九个月流片,工程样片已跑GPT‑5.3‑Codex‑Spark,能效比显著领先,计划2026年吉瓦级部署。Anthropic公开多智能体协作经验,提出需持久记忆、独立凭证、广泛信息访问,总结信息公开、角色分工、人类定目标、按可验证程度放权四条规范。阿里开源内部代码评审CLI——Open Code Review,一周5k星,采用“确定性工程+Agent”混合架构解决覆盖不全、位置漂移、效果不稳定问题。

ginobefun@hongming731 · 6月25日46

BestBlogs 早报 · 06-25 # OpenAI / Jalapeño / Claude Tag / Open Code Review / Broadcom [1] ★ 精讲|OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 OpenAI 与 Broadcom 联合发布首款定制 LLM 推理芯片 Jalapeño,从设计到流片仅用九个月,号称高性能芯片史上最快的 ASIC 研发周期,且过程本身由 OpenAI 自家模型加速完成。这标志着 OpenAI 从模型、产品全面下探到芯片层,构建「模型反哺芯片设计、芯片支撑更便宜推理」的全栈飞轮,意在让先进 AI 的访问成本持续走低。 来源:OpenAI News https://www.bestblogs.dev/article/41ff73d7 [2] ★ 精讲|Anthropic 关于构建高效人机协作团队的经验 | Claude Anthropic 罕见公开内部实践:随着 Claude Tag 让智能体直接进驻团队协作空间,工作正从「一人一智能体」的单机模式,变成人类与多个智能体共享同一工作台的「多人游戏」。文章总结四条经验——信息默认公开、人和智能体各有清晰角色、由人类设定北极星目标、按可验证程度逐步放权——为团队级智能体协作给出一套可复制的治理框架。 来源:Claude Blog https://www.bestblogs.dev/article/4929a2db [3] ★ 精讲|阿里开源 Open Code Review:一周揽下 5k star,更专业的代码评审 CLI 阿里把内部验证两年、服务数万开发者的 AI 代码评审助手 Open Code Review 开源,一周揽下 5k star。它用「确定性工程 + Agent」混合架构解决通用 Agent 评审常见的覆盖不全、位置漂移、效果不稳定三大痛点:工程逻辑负责文件筛选与定位,Agent 只负责动态推理。实测准确率 25%-38%,远超 Claude Code 的 7%-16%,但召回率略逊,揭示「AI 写代码」与「AI 审代码」是两种截然不同的能力。 来源:阿里技术 https://www.bestblogs.dev/article/3732f5a7 [4] 说好的艺术家呢?—— AI 时代,内容工业的三次死亡与创作者的重生 [播客] 演讲深度剖析 AI 如何从素材、流程、版权三个层面「杀死」传统内容工业,并指出创作者唯有构建全新愿景,以人类的直觉、品味与信任,才能在技术碾压下实现「重生」。 来源:屠龙之术 https://www.bestblogs.dev/podcast/e1238ff [5] Flutter 底层渲染解析:BuildContext 与 Element Tree 详解 本文深入剖析 Flutter 的渲染内部机制,详解三棵树(Widget、Element、RenderObject)、BuildContext 的本质以及 setState 的逐步工作原理,帮助开发者理解和修复常见的上下文相关错误。 来源:freeCodeCamp https://www.bestblogs.dev/article/c7c34649 [6] 在 Gemini 3.5 Flash 中推出计算机操作功能 Google 宣布,计算机操作现已成为 Gemini 3.5 Flash 的内置能力,使开发者能够构建与浏览器、移动和桌面环境交互的智能体。 来源:Google DeepMind News https://www.bestblogs.dev/article/16a75c47 [7] Qwen-AgentWorld 开源:让 Agent 学会「先预测,再行动」 通义实验室开源 Qwen-AgentWorld,首个原生语言世界模型,从继续预训练阶段即开始环境建模,在 AgentWorldBench 上超越 GPT-5.4 等前沿模型,并展示可控模拟与跨任务泛化两种应用范式。 来源:通义实验室 https://www.bestblogs.dev/article/8810d85f [8] Cisco SD-WAN 管理器零日漏洞遭利用获取 Root 权限全过程 本分析详细描述了某威胁行为者利用 Cisco Catalyst SD-WAN Manager 中的零日权限提升漏洞 CVE-2026-20245,在通过恶意对等连接实现初始入侵后获取 root 权限,随后进行了广泛的抗取证清理。 来源:Google Cloud Blog https://www.bestblogs.dev/article/bcfc7fba [9] 如何为 AI 智能体构建记忆 本文来自 LangChain,介绍了一种为 AI 智能体构建记忆的结构化方法,涵盖概念框架、三步循环(捕获、分析、更新),以及使用 LangSmith 的可观测性、引擎和上下文中心的具体实现。 来源:LangChain Blog https://www.bestblogs.dev/article/35c6d909 [10] 40 天不睡、5 人死磕:DeepMind 主管爆料 Gemini 大战 DeepSeek 内幕 本文编译自 DeepMind Gemini 预训练主管 Vlad Feinberg 的播客访谈,曝光 Gemini 2.0 Flash 由 5 人团队 40 天不眠不休训练的幕后故事,并深入讨论了预训练研究、量化、推理协同设计以及程序员在 AI 时代的转型路径。 来源:CSDN https://www.bestblogs.dev/article/87f785ef --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手,帮助你发现真正适合你的高质量内容,欢迎体验。 在线阅读:https://www.bestblogs.dev/explore/brief/2026-06-25

译OpenAI 与 Broadcom 发布首款定制 LLM 推理芯片 Jalapeño,设计到流片仅九个月,过程由自家模型加速。Anthropic 公开内部实践:Claude Tag 让多智能体进驻协作空间,梳理信息公开、角色清晰、北极星目标、逐步放权四条经验。阿里开源代码评审工具 Open Code Review,采用“确定性工程+Agent”混合架构,准确率 25%-38%,远超 Claude Code 的 7%-16%,召回率略逊。

MiniMax (official)@MiniMax_AI · 6月25日40

M3 is now the default builder model in Kimchi Coding by @cast_ai not every coding task should go through the same model. Kimchi routes work based on complexity, cost, and deployment needs. that makes it a natural fit for M3: open weights, 1M context, and strong coding performance with more control. article in the comments. #MiniMaxM3 #AICoding

译M3 现在已成为 @cast_ai 旗下 Kimchi Coding 的默认构建模型。 并非所有编码任务都应使用同一个模型。Kimchi 根据复杂度、成本及部署需求来路由任务。 这使得 M3 成为自然之选:开放权重、1M 上下文、更强的编码性能且更可控。 文章见评论。 #MiniMaxM3 #AICoding

Artificial Analysis@ArtificialAnlys · 6月25日28

We’re excited to announce speakers from Google, NVIDIA, and Z AI for our Intelligence Index event in San Francisco on Monday, June 29. Join us for a curated evening of conversations on AI intelligence benchmarks, including insights on our Artificial Analysis Intelligence Index v4.1 update and our new long-horizon knowledge work benchmark, AA-Briefcase. Featuring: - Ivan Leo (@ivanleomk) @ Google DeepMind - Venkat Srinivasan @ NVIDIA - Zixuan Li (@ZixuanLi_)@ Z AI - Micah Hill-Smith (@_micah_h) @ Artificial Analysis - George Cameron (@grmcameron) @ Artificial Analysis RSVP below https://luma.com/qdl9mr2e

译Artificial Analysis 宣布将于 6 月 29 日(周一)在旧金山举办 Intelligence Index 活动。演讲嘉宾来自 Google DeepMind、NVIDIA 和 Z AI。活动将介绍 AI Intelligence Index v4.1 更新以及新推出的长时知识工作基准 AA-Briefcase。

Chubby♨️@kimmonismus · 6月25日68

Anthropic claims: Alibaba continues to distill Claude on a large scale to train Qwen. Via Bloomberg Anthropic is accusing Alibaba-linked operators of running a massive campaign to illicitly access Claude through nearly 25,000 fraudulent accounts. According to Bloomberg, Anthropic claims the campaign generated 28.8 million Claude exchanges between April and June, targeting capabilities like software engineering and agentic reasoning. The company says this is part of a broader pattern of “adversarial distillation,” where Chinese labs allegedly harvest outputs from US frontier models to train rival systems at a fraction of the cost. Lets see how good Qwen 3.8 will be, probably FABLEous good.

译Anthropic通过Bloomberg指控,与阿里巴巴相关的运营方利用近25,000个欺诈账户非法访问Claude,在4月至6月期间生成了2880万次Claude交互,目标聚焦于软件工程和智能体推理能力。Anthropic称这是“对抗性蒸馏”模式的一部分,中国企业实验室据称以极低成本从美国前沿模型获取输出以训练竞品系统。该指控矛头直指Qwen系列模型的训练来源。

Chubby♨️@kimmonismus · 6月25日63

Google DeepMind is facing another high-profile talent hit: Bloomberg reports that Jonas Adler and Alexander Pritzel, two key contributors to Gemini, are planning to leave for Anthropic. Their exits follow John Jumper’s move to Anthropic and Noam Shazeer’s move to OpenAI, adding pressure on Google in the AI talent war. Startups like Anthropic and OpenAI can offer researchers a shot at major upside before a potential IPO. For Google, the question is whether its massive research bench can offset the growing pull of frontier AI startups that now look like the place where top researchers can shape the next platform shift. Really curious for Google handling it.

译Bloomberg报道,Google DeepMind两位Gemini关键贡献者Jonas Adler和Alexander Pritzel计划离职,加入Anthropic。此前已有John Jumper转向Anthropic、Noam Shazeer加入OpenAI,进一步加剧Google在AI人才争夺中的压力。初创公司Anthropic与OpenAI因潜在IPO能为研究人员提供更高财务回报。Google需应对的问题是:其庞大研究团队能否抵御前沿AI初创公司对顶尖人才的吸引力。

jason@jxnlco · 6月25日14

please upvote your favourites here: https://codex-billboard.vercel.app/gallery

译请在此为你最爱的作品投票: https://codex-billboard.vercel.app/gallery [引用 @jxnlco]:发布你最好的 Codex Billboard 作品

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月26日
01:53
Rohan Paul@rohanpaul_ai
67
IBM发布全球首款0.7nm芯片技术

IBM推出0.7nm芯片技术,采用新型nanostack架构将晶体管垂直堆叠,取代传统平面缩放。指甲盖大小面积可容纳近1000亿个晶体管,性能较其2nm节点提升50%,能效提升70%,SRAM缩小40%。该技术突破原子尺度工程极限,有望让AI芯片、手机、服务器等更快更省电。

行业动态部署/工程
01:53
Rohan Paul@rohanpaul_ai
53
Anthropic 雇佣经济学家 Chad Jones,探讨 AI 生存风险

Anthropic 本周雇佣了斯坦福经济学家 Chad Jones。Jones 的 NBER 论文认为,先进 AI 是加速发明与存在风险之间的权衡——更智能的系统可能加速研究,但也可能造成经济无法修复的损失。其结论使用对数效用假设:若每年有 1% 的灭绝风险持续 40 年,生存概率约为 67%。

Anthropic安全/对齐行业动态
01:25
OpenAI@OpenAI
30
OpenAI 的工作正在被智能体改变,在每个部门。 整个公司里,人们正在使用 Codex
智能体OpenAI行业动态
01:21
宝玉@dotey
42
DeepSeek 正在招聘多模态方向的全职/实习岗位,包括多模态数据工程师(预训练数据工程师)以及多模态理解数据/算法研究员(图像与视频方向)。应聘者可通过私信或发送简历至 talent@deepseek.com 联系。

Xingchao Liu: 🚀 我们组在招(全职/实习都可以): -多模态数据工程师(属于预训练数据工程师) -多模态理解数据/算法研究员(图像 & 视频方向) DM 已开,直接带CV发消息给我,或者带CV发邮件到 talent@deepseek.com

DeepSeek多模态行业动态
01:05
Chubby♨️@kimmonismus
60
苹果调整Mac芯片策略:M6基础版先行,跳过Pro/Max直入M7

据彭博社报道,苹果计划最早今年推出基础M6芯片,但跳过M6 Pro和M6 Max,直接于2027年进入M7代。主因是加速设备端AI和图形能力。M6将带来更高内存带宽(约200 GB/s,M5约153 GB/s)、升级神经引擎、改进CPU核心、增强视频编解码及全新GPU(最多12核心)。M7内存带宽或达约240 GB/s。同时计划推出M5 Ultra用于新Mac Studio,配置约36 CPU、80 GPU核心,支持最高768 GB内存。苹果认为设备端AI需要更高带宽、更强本地推理和图形性能。

端侧行业动态
00:45
Anthropic@AnthropicAI
51
Anthropic宣布以创始合伙人身份加入RAISE US。RAISE US是一个非营利联盟,由前美国商务部长Gina Raimondo和Eric Holcomb共同主持,联合各州州长、雇主和教育工作者,旨在通过雇主主导行动、AI赋能培训和政策创新,为美国劳动力建立AI时代的 "人员战略",帮助工人培训、转型和发展,弥补当前仅有AI技术战略、缺乏人员战略的空白。

RAISE US: Today, we're launching RAISE US. America has a technology strategy for AI. It doesn't have a people strategy yet. We're ...

Anthropic政策/监管行业动态
6月25日
23:35
Chubby♨️@kimmonismus
58
Google重组AI编码突击队为"midtraining"小组,缩小与Anthropic差距

Google将数月前成立的AI编码突击队扩展为更正式的“midtraining”小组,位于预训练与后训练之间,旨在提升Gemini编码能力,并延伸至创建演示文稿等商业任务。此前,Noam Shazeer因计算资源变动转投OpenAI,Nobel奖得主John Jumper调至该团队后也加入Anthropic。Google承认,仅靠强大基座模型不够,编码已成为AI最明确的变现层,Anthropic借此获得收入增长。Google需专用训练、计算和更清晰的产品闭环来追赶。

AnthropicGoogleOpenAI编码
23:26
Yuchen Jin@Yuchenj_UW
35
你可能听说过 GLM-5.2 每秒 328 token 很酷, 那么每秒 392 呢? Databricks 在 Artificial Analysis 上 GLM-5.2 的推理速度现排名第一。这是个很棒的模型,我们做了大量优化。
推理行业动态
23:24
elvis@omarsar0
20
Hyperagent 为每个 AI 智能体提供专用云端机器,托管基础设施,无需笔记本常开也能持续运行。针对 OpenClaw 等本地框架常见的问题(每日崩溃、泄露秘密、频繁监控),Hyperagent 提供稳定安全替代方案。限时优惠:注册即获 $100 推理积分,迁移首个智能体再获 $500。

Andrew Busse: If OpenClaw feels more like babysitting, you're not alone. Skip the daily crashes, leaked secrets, and constant monitori...

智能体行业动态部署/工程
23:14
AYi@AYi_AInotes
54
Gemini Pro现在只要$1.99一个月了, Google开始卷价格了?

AYi: http://x.com/i/article/2069352641423896576

Google行业动态
22:35
Chubby♨️@kimmonismus
52
这是Anthropic在其官方信件中发布的一个有趣更新。 但简而言之:他们显然未能阻止蒸馏。蒸馏几乎无缝地继续,和以前一样。

Sam: Anthropic's letter accusing Alibaba of distillation.

Anthropic数据/训练行业动态
22:35
Chubby♨️@kimmonismus
43
Airwallex 推出 Airi 与 T:0,攻克 AI 智能体金融"无聊"环节

Airwallex 正在解决 AI 智能体金融中资金转移、跨境支付、记账与合规等“无聊部分”。他们推出 Airi(当前提供更快的智能体结账,正在开发真实钱包)和 T:0(AI 原生财务后台平台,仍处于测试版)。Airwallex 已拥有支付轨道,现在此基础上构建智能层。此前,Airwallex 宣布完成 3.2 亿美元融资,估值 110 亿美元,由 Addition 领投。公司指出团队更小、全球化、更多使用智能体是趋势,并用 10 年建设了适配这一世界的金融基础设施。

Jack Zhang: We've raised $320M at an $11B valuation, led by Addition. AI is changing how companies are built. Teams are smaller, glo...

智能体行业动态
22:19
Berryxia.AI@berryxia
11
个人开发者Berry Xia在X上宣布,计划将其制作流程开源,并询问能否用该流程生成"Skills"(可能指Claude等AI Agent的技能包)。其此前曾表示"太卷了……先做个垃圾出来",暗示这是一个快速实验性项目。感兴趣者可"一键三连"关注后续。目前未公布具体模型、版本或参数细节。

Berryxia.AI: 太卷了,不学习进步都被00后淘汰了。 Demo Go ... 不管他,先做个垃圾出来😂

行业动态
22:14
🚨 AI News | TestingCatalog@testingcatalog
36
Anthropic 目前向 Fable 5 提供的"流量为 0",尽管此前已有相关报道,据 Sam 证实。 但我们仍在耐心等待 👀

sam mcallister: @kimmonismus We are currently serving exactly 0 traffic to Fable 5. This could be a UI bug though, will track it down.

Anthropic行业动态
21:21
meng shao@shao__meng
36
据说 GLM-5.5 八月份发布? 大概率是真的,这回真的热闹了,GLM-5.5 能跟 Claude Fable 5、GPT-5.6 正面抗衡吗,很期待!
推理行业动态
21:05
Chubby♨️@kimmonismus
41
更正:Anthropic 表示,Fable 5 的可见访问很可能是由 UI bug 导致的。

Chubby♨️: Fable 5 is back - and now there's video proof. Not just showing up in the model selector. People are actually using the ...

Anthropic行业动态
20:35
Chubby♨️@kimmonismus
49
看起来 Fable 5 可能确实再次可用了。 但有一个重大限制:仅限美国公民和企业。 这将彻底改变一切,把欧洲完全抛在后面。

Chetaslua: Fable 5 approved for return currently invokeable on AWS but not for everyone you need : → US identity verification → upl...

Anthropic行业动态
20:12
OpenBMB@OpenBMB
22
🎉 祝贺 @aia_gh 举办这场精彩的动手AI工作坊!👏 我们非常荣幸您选择了我们的开源 MiniCPM-V 模型。❤️ 期待未来更多合作!🤗

Artificial Intelligence Association of Ghana: We're running hands-on AI workshops in Ghana using @OpenBMB's free MiniCPM-V models 🇬🇭 Submit an image (e.g. receipt,c...

开源生态行业动态
18:45
PixVerse@PixVerse_
25
这个节奏很棒!镜头全程跟上动作。在推进追车格式方面做得很不错。

VaL greGory: Tried making a more advanced chase sequence this time The fast-paced camera movement and continuous action make it feel ...

行业动态视频
17:21
meng shao@shao__meng
59
Anthropic 指控阿里千问用 2.5 万账号蒸馏 Claude

Anthropic 指控阿里千问用 25000 个伪装账号来蒸馏 Claude 这个数量比之前指控 DeepSeek、MiniMax 和 Kimi 加起来好像都多 懂了,都传出去:Qwen 3.8 值得期待 😂 Anthropic 的蒸馏账号报告,也是一种 Benchmark。。。

Polymarket: BREAKING: Anthropic accuses Alibaba of using nearly 25,000 fraudulent accounts to extract Claude AI model capabilities.

Anthropic数据/训练行业动态
16:54
Alibaba Cloud@alibaba_cloud
28
Flink Forward Asia 2026 主论坛议程公布

距开幕1天,阿里云正式公布Flink Forward Asia 2026主论坛议程。大会聚焦实时数据智能,展现从Agent-native到AI-native的阿里云演进路径,并覆盖汽车、具身AI等产业场景。会议将于6月26-27日在深圳华侨城洲际酒店举行,所有演讲均以中文进行。席位有限,需提前报名。

开源生态数据/训练行业动态
16:21
DogeDesigner@cb_doge
31
BREAKING: Grokipedia 刚刚突破约 5000 万次访问。 • 超过 42 万条反向链接 • 超过 1 万个引用域名 越来越多人转向 @Grokipedia 继续在你的网站和博客上分享 Grokipedia 链接。 这就是我们击败 Wokipedia 的方法。
xAI搜索行业动态
16:05
Chubby♨️@kimmonismus
31
部分用户可以在 Claude Code 模型选择器中(重新)选择 Fable 5,而另一些用户表示,尽管 Fable 5 已被下架,他们仍能选中它。 我删除了相关帖子,因为不太确定,不想传播错误信息。但无论如何,事情似乎在推进,Fable 5 再次触手可及!
Anthropic模型发布行业动态
15:35
Chubby♨️@kimmonismus
55
AWS Bedrock 文档和模型卡片中再次出现 Claude Fable 5 模型。AWS 将其生命周期标记为 Active,并列出 Bedrock ID 为 `anthropic.claude-fable-5` 和 `global.anthropic.claude-fable-5`。数据保留文档在启用 `provider_data_share` 时显示该模型状态为 `"available"`。目前尚未确认成功调用以证明模型完全恢复在线,但迹象积极。

Chris: 🚨 Fable 5 watch Claude Fable 5 is showing again in AWS Bedrock docs/model cards. AWS lists the model lifecycle as Activ...

Anthropic行业动态
12:23
Yuchen Jin@Yuchenj_UW
44
我没意识到Denny Zhou--曾领导Gemini推理团队--已在4个月前离开Google,加入Meta的TBD Lab。 最近很多人离开了Google。我仍在等待Gemini在编码方面赶上。是时候让Sergey启动Code Red了。
GoogleMeta推理行业动态
11:47
OpenClaw🦞@openclaw
14
收看 The Clawcast 第一集,我们的官方 OpenClaw 播客,嘉宾 @hrudolph、@Pat_Erichsen 和 @GosuCoder! 围绕技能、Clawhub、保障 OpenClaw 部署等话题的精彩对话。 https://youtu.be/IfJJnR1LIE0?si=ruSYAHPE-QqYxoTR
编码行业动态
11:21
meng shao@shao__meng
38
邵猛谈Liblib与GenSpark:夹缝中狂奔的AI应用团队

邵猛评论称,Liblib与GenSpark是他唯二看不懂的AI应用团队。它们似乎只能在模型发展的夹缝中依靠速度保持领先,没有其他路径可选。这种对速度的极致要求,使得团队无法分心做任何影响速度的side project或研究,内部也可能因此产生矛盾。邵猛对这两个团队的未来表示困惑:是持续狂奔在夹缝中撞线,还是终将被模型本身的速度超越?

大佬观点行业动态
11:21
宝玉@dotey
72
Anthropic 指控阿里 Qwen 发动史上最大蒸馏攻击,涉 2880 万次交互

Anthropic 致信美国参议院银行委员会和白宫,指控阿里通义千问(Qwen)关联方在 4 月 22 日至 6 月 5 日通过约 25,000 个虚假账号与 Claude 产生超 2880 万次交互,实施蒸馏攻击,目标锁定软件工程和 Agent 推理能力。此前 2 月 Anthropic 曾点名 DeepSeek、MiniMax、Moonshot AI 三家共 1600 万次交互。同时美国商务部以国家安全为由限制其 Fable 5 和 Mythos 5 模型对外国人提供。国会两党计划在国防授权法中提出修正案,对非法获取美国 AI 模型输出的中国公司实施制裁。Anthropic 估值 9650 亿美元,已秘密提交 IPO 申请。

Chubby♨️: Anthropic claims: Alibaba continues to distill Claude on a large scale to train Qwen. Via Bloomberg Anthropic is accusin...

Anthropic政策/监管数据/训练行业动态
10:24
Alibaba Cloud@alibaba_cloud
31
阿里云与Salesforce联合AI峰会即将在上海举办

阿里云联手Salesforce在年度峰会上探讨企业从AI试点到实际业务转型。重点涵盖AI+CRM趋势与创新、规模化构建智能体企业、AI在销售与服务中的应用、行业云创新、中国出海策略及客户案例和现场演示。活动于2026年7月15日下午2:00-5:30在上海举办,中文主讲,现已开放注册。

行业动态
10:19
ginobefun@hongming731
32
BestBlogs 英文早报

BestBlogs: http://x.com/i/article/2069929090266898432

行业动态
10:18
Berryxia.AI@berryxia
68
Anthropic 指控阿里用 2.5 万假账户蒸馏 Claude

Anthropic 向美国白宫提交申请,指控阿里巴巴通过创建近 25,000 个假账户,在 2026 年 4 月 22 日至 6 月 5 日期间与 Claude 进行了约 2,880 万次对话,以提取模型能力用于知识蒸馏(即用竞争对手模型的输出来训练自己的模型)。Anthropic 已在中国屏蔽 Claude,但阿里巴巴仍找到了绕过方法。推文同时质疑 Anthropic 自身训练数据的来源。

Polymarket: BREAKING: Anthropic accuses Alibaba of using nearly 25,000 fraudulent accounts to extract Claude AI model capabilities.

安全/对齐数据/训练行业动态
10:18
Berryxia.AI@berryxia
58
据Bloomberg报道,Google DeepMind旗下Gemini团队两位核心成员Jonas Adler和Alexander Pritzel将加盟Anthropic。Adler曾负责AI coding项目,参与AlphaFold及Gemini 1.5;Pritzel是2014年加入的老兵,参与AlphaFold 2/3及Gemini训练体系。此前Gemini已有4-5位核心人物离开,后续可能带动下属离职,团队前景堪忧。

Max For AI: Gemini又有两位核心人物离开。 据 Bloomberg报道,Gemini 的两位关键贡献者 Jonas Adler @JonasAAdler 和 Alexander Pritzel @AlexPritzel 将离开 Google Dee...

AnthropicGoogle行业动态
09:19
Orange AI@oran_ge
45
我还记得去年 lovart 的投资人问我们 你们做生图这个方向怎么跟 lovart 打 今天看文章才知道,lovart 的初始整个团队都走光了 世界变化真快
图像生成行业动态
08:19
ginobefun@hongming731
43
BestBlogs 早报·06-25|OpenAI联合Broadcom推推理芯片Jalapeño;Anthropic公开人机协作四条规范;阿里开源代码评审CLI揽星5k

OpenAI与Broadcom发布首款定制LLM推理芯片Jalapeño,九个月流片,工程样片已跑GPT‑5.3‑Codex‑Spark,能效比显著领先,计划2026年吉瓦级部署。Anthropic公开多智能体协作经验,提出需持久记忆、独立凭证、广泛信息访问,总结信息公开、角色分工、人类定目标、按可验证程度放权四条规范。阿里开源内部代码评审CLI——Open Code Review,一周5k星,采用“确定性工程+Agent”混合架构解决覆盖不全、位置漂移、效果不稳定问题。

OpenAI产品更新推理模型发布
08:19
ginobefun@hongming731
46
BestBlogs 6月25日早报

OpenAI 与 Broadcom 发布首款定制 LLM 推理芯片 Jalapeño,设计到流片仅九个月,过程由自家模型加速。Anthropic 公开内部实践:Claude Tag 让多智能体进驻协作空间,梳理信息公开、角色清晰、北极星目标、逐步放权四条经验。阿里开源代码评审工具 Open Code Review,采用“确定性工程+Agent”混合架构,准确率 25%-38%,远超 Claude Code 的 7%-16%,召回率略逊。

ginobefun: http://x.com/i/article/2069928325951401985

DeepMindOpenAI开源生态行业动态
07:10
MiniMax (official)@MiniMax_AI
40
M3 现在已成为 @cast_ai 旗下 Kimchi Coding 的默认构建模型。 并非所有编码任务都应使用同一个模型。Kimchi 根据复杂度、成本及部署需求来路由任务。 这使得 M3 成为自然之选:开放权重、1M 上下文、更强的编码性能且更可控。 文章见评论。 #MiniMaxM3 #AICoding
开源/仓库编码行业动态
06:17
Artificial Analysis@ArtificialAnlys
28
Artificial Analysis 举办 Intelligence Index 活动,发布 v4.1 与新基准

Artificial Analysis 宣布将于 6 月 29 日(周一)在旧金山举办 Intelligence Index 活动。演讲嘉宾来自 Google DeepMind、NVIDIA 和 Z AI。活动将介绍 AI Intelligence Index v4.1 更新以及新推出的长时知识工作基准 AA-Briefcase。

Google行业动态
04:35
Chubby♨️@kimmonismus
68
Anthropic指控阿里巴巴大规模蒸馏Claude训练Qwen

Anthropic通过Bloomberg指控,与阿里巴巴相关的运营方利用近25,000个欺诈账户非法访问Claude,在4月至6月期间生成了2880万次Claude交互,目标聚焦于软件工程和智能体推理能力。Anthropic称这是“对抗性蒸馏”模式的一部分,中国企业实验室据称以极低成本从美国前沿模型获取输出以训练竞品系统。该指控矛头直指Qwen系列模型的训练来源。

Anthropic安全/对齐数据/训练行业动态
04:05
Chubby♨️@kimmonismus
63
Google DeepMind再失两员Gemini关键贡献者,将加入Anthropic

Bloomberg报道,Google DeepMind两位Gemini关键贡献者Jonas Adler和Alexander Pritzel计划离职,加入Anthropic。此前已有John Jumper转向Anthropic、Noam Shazeer加入OpenAI,进一步加剧Google在AI人才争夺中的压力。初创公司Anthropic与OpenAI因潜在IPO能为研究人员提供更高财务回报。Google需应对的问题是:其庞大研究团队能否抵御前沿AI初创公司对顶尖人才的吸引力。

Ed Ludlow: Bloomberg reporting that two more leading AI names are due to leave Google for Anthropic: Jonas Adler and Alexander Prit...

AnthropicGoogle行业动态
03:42
jason@jxnlco
14
请在此为你最爱的作品投票: https://codex-billboard.vercel.app/gallery 【引用 @jxnlco】:发布你最好的 Codex Billboard 作品

jason: Post your best codex billboard

OpenAI行业动态
‹ 上一页
1…56789…50
下一页 ›