AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2287 条
全部一手资讯X论文
标签「行业动态」清除
Replit ⠕@Replit · 1天前26

Some moments from vibecon that stuck with us. A few days of big ideas, fast builds, and people who show up ready to make something real. Thank you to everyone who joined, watched, and shared what they're working on. This is what building with Replit looks like. 🚀

译一些在 vibecon 上让我们难忘的瞬间。 几天时间里,大胆的想法、快速的构建,以及那些准备好创造真实事物的人们。感谢每一位参与、观看和分享他们正在制作的内容的人。 这就是用 Replit 构建的样子。🚀

Chubby♨️@kimmonismus · 1天前31

Lets freaking go! I was just about to write that Fable used up all my rates immediately. Very nice Anthropic!

译Fable 5 已准备好再次构建,Claude Devs 重置了所有人的 5 小时与每周速率限制。Kim 兴奋回应:我正要抱怨 Fable 用光了我的配额,太棒了 Anthropic!

Tibo@thsottiaux · 1天前24

It's happening

译如果你在@aiDotEngineer大会现场,现在就去OpenAI展台!下午1点,你将看到Codex重置按钮的实际操作。传闻今天之后它将被放回绝密地下保险库。它来了。

OpenRouter@OpenRouter · 1天前47

Claude Fable 5 from @Anthropic is back on OpenRouter! Anthropic is redeploying it globally with new safeguards for cybersecurity misuse. Some coding and debugging requests may temporarily fall back to Opus 4.8 while classifiers are refined.

译来自 @Anthropic 的 Claude Fable 5 已回归 OpenRouter! Anthropic 正在全球重新部署它,并针对网络安全滥用增加了新的保护措施。一些编码和调试请求可能会暂时回退到 Opus 4.8,同时分类器正在优化。

Chubby♨️@kimmonismus · 1天前31

FABLE 5 IS BACK

译Palantir CEO Alex Karp 表示,企业对那些“过度推销”模型并推动 tokenmaxxing 的 AI 实验室感到厌倦。客户希望拥有以 Palantir 和 NVIDIA 为核心的完整 AI 栈。Fable 5 回归。

Chubby♨️@kimmonismus · 1天前45

That was to be expected, but it’s all the more unfortunate that the guardrails are still too restrictive, especially in the fields of biology and chemistry. Let’s see how it performs when it comes to coding.

译Anthropic 在与美国政府沟通后更新网络安全防护。新防护短期内会标记略多的无害请求,被标记的请求将回退至 Opus 4.8,官方表示正在优化。生物和化学分类器与初始发布相同,仍过于宽泛,基础生物学相关问题也会触发 Opus 4.8 回退,改进即将推出。主推文评论认为这一变化在意料之中,但生物/化学领域护栏仍过于严苛,并关注其在编码任务上的表现。

Midjourney@midjourney · 1天前28

https://x.com/i/spaces/1AxRnnWavggxl

译你只给了来源和一条 X Spaces 链接。Spaces 是语音直播链接,它本身不是可翻译的推文文本。我需要你贴出这条推文(例如 Midjourney 发布 Spaces 时附带的文字)才能按规则处理。 请补充推文正文后,我会严格按照你要求输出 `title_zh` 和 `body_zh`。

Rohan Paul@rohanpaul_ai · 1天前64

Jelani Nelson, UC Berkeley’s EECS chair, just joined Anthropic. --- (That famous 21 million view video is from "Harvard University" YT channel from Jul, 2016, link in comemnt )

译Jelani Nelson, UC Berkeley’s EECS chair, just joined Anthropic. --- (那个著名的2100万观看视频来自哈佛大学Youtube频道,2016年7月,链接在评论中)

Rohan Paul@rohanpaul_ai · 1天前74

Mandeep Singh from Bloomberg on Meta's move to cloud computing Meta’s $150B CapEx now needs ROI; renting compute may bring revenue. Selling compute can fund AI, but it looks more like fallback revenue than frontier AI leadership.

译Meta 计划将自身用于模型、广告等任务的过剩 AI 算力转化为云业务,允许开发者租用数据中心内的模型访问(类似 AWS Bedrock),也可能出租原始算力,旨在为高达 1500 亿美元的资本支出寻找回报,减少对广告收入的依赖。消息公布后 Meta 股价上涨超 10%,而 AI 云公司 CoreWeave 和 Nebius 分别下跌 10.8% 和 12.4%。Zuckerberg 透露几乎每周都有外部公司向 Meta 请求算力,但此举更像为支出过高担忧提供财务安全阀;Meta 要成为 AWS、Azure 级别的云服务商仍需应对计费、安全、开发工具等挑战。

Rohan Paul@rohanpaul_ai · 1天前69

The first AI layoff wave is already producing a human rehiring wave. Per a report by Orgvue 39% made AI-related redundancies. Among those leaders, 55% said they made wrong calls about which jobs to remove. The failure point seems to be that companies often removed the people who understood exceptions, escalation paths, and hidden failure modes. AI definitely raised productivity, but it breaks when work depends on judgment and institutional memory. Ford brought back about 350 veteran engineers after automated quality systems failed to catch problems early. Commonwealth Bank cut 45 service roles for an AI voice bot, then reversed course after call volumes rose. IBM also moved from AI-heavy HR automation toward tripling U.S. entry-level hiring across business units. --- cnbc. com/2026/07/01/employers-who-laid-off-workers-for-ai-are-reversing-their-decisions.html

译据Orgvue报告,39%的公司已实施AI相关裁员,其中55%的领导者承认裁错了岗位。问题在于企业裁掉了理解例外情况、升级路径和隐蔽故障模式的员工。AI虽提升生产力,但在依赖判断力和机构记忆的工作中失效。福特因自动化质检系统未能提前发现缺陷,召回约350名资深工程师。澳大利亚联邦银行削减45个AI语音客服岗位后,因呼叫量上升而取消决定。IBM也从AI驱动的HR自动化转向在全美业务部门将初级岗位招聘增加两倍。

Rohan Paul@rohanpaul_ai · 1天前66

Meta is turning excess AI compute into a cloud business after shares jumped more than 10%. Meta built huge AI infrastructure for its own models, ads, feeds, and assistants. That created a familiar cloud problem, because expensive chips cannot sit idle for long. The new plan would let developers rent model access hosted inside Meta’s data centers. This looks like AWS Bedrock, where customers call models without managing the hardware. Meta may also rent raw compute, which hits CoreWeave and Nebius more directly. Shares of CoreWeave fell 10.8% and Nebius fell 12.4% after the Meta cloud report, while Meta shares rose more than 10%. CoreWeave and Nebius are AI cloud companies that rent computing power to customers, and Meta is already a major customer for them. This news scared neo-cloud (CoreWeave, Nebius etc) investors because if Meta now rents out its own AI computing power, that will mean it buys less capacity from CoreWeave and Nebius while also competing with them for other customers. Zuckerberg had already said outside companies ask Meta for compute almost every week. That comment now reads like a financial escape valve for AI overspending fears. Meta could reduce its ad dependence while proving its AI buildout has outside value. The catch is that cloud is not just racks, chips, and cheap power. Customers expect billing, uptime, security, support, migration help, and stable developer tools. Meta can rent compute faster than it can become AWS, Azure, or Google Cloud. Still, the signal is serious because AI infrastructure is becoming a tradable commodity. --- bloomberg. com/news/articles/2026-07-01/meta-is-building-a-cloud-business-to-sell-excess-ai-compute

译Meta 利用为自有模型、广告和助手建设的大型 AI 基础设施产生的过剩算力,计划向开发者出租模型访问(类似 AWS Bedrock)及原始算力。消息引发股价剧烈反应:Meta 涨超 10%,而 AI 云公司 CoreWeave 跌 10.8%、Nebius 跌 12.4%。Zuckerberg 此前透露外部公司几乎每周都向 Meta 请求算力。此举既降低 Meta 对广告收入的依赖,也证明其 AI 建设的外部价值,但云业务涉及计费、安全、工具支持等复杂环节,Meta 难以快速成为 AWS 级别的云服务商。

Rohan Paul@rohanpaul_ai · 1天前71

Anthropic engineers are currently shipping 8X the code they shipped last year. Their official blog says - "As of May 2026, more than 80% of the code we merge into Anthropic’s codebase was authored by Claude." --- anthropic .com/institute/recursive-self-improvement

译Anthropic工程师目前发布的代码量是去年的8倍。 官方博客称:“截至2026年5月,Anthropic代码库中合并的代码超过80%由Claude编写。”

swyx @aiDotEngineer WF@swyx · 1天前27

so proud to host my friend @trq212 to give the world’s first Fable talk on Fable return day! find him with @simonw and @_catwu in Expo Stage 2 for an extra EXTRA special lunch session at 12.30 today!!

译非常自豪能主持我的朋友 @trq212 在Fable回归日发表世界首场Fable演讲! 今天中午12:30,在Expo Stage 2与他、@simonw 和 @_catwu 一起参加一场特别特别午餐环节!!

Kling AI@Kling_ai · 1天前26

🎁1000 Credits Giveaway How to enter: ✓ Follow @Kling_ai ✓ Repost this post ✓ Reply with your choice and write what happens next. The Top 10 best replies will each win 1,000 Credits. Choose wisely. The next chapter may follow your comment. Duration: 72 hours

译🎁1000 Credits 抽奖活动 参与方式: ✓ 关注 @Kling_ai ✓ 转发此推文 ✓ 回复你的选择并写下接下来会发生的事。 排名前 10 的最佳回复将各赢取 1,000 Credits。 慎重选择。 下一章节可能就跟随你的评论。 活动时长:72 小时

Runway@runwayml · 1天前36

Introducing Another Big Ad Contest For Products That Don't Exist. Your chance to make any ad you can imagine for up to $100K in cash prizes. No client notes. No producers saying no. Just 7 new briefs to choose from and 4 weeks to make your wildest concepts come to life. Big ideas win big. Learn more and get started at the link below.

译推出另一场大型广告竞赛,为不存在的产品。你的机会:制作你能想象到的任何广告,赢取高达10万美元的现金奖励。没有客户意见。没有制片人说“不”。只需从7个新创意简报中选择,用4周时间让你最疯狂的概念变为现实。大创意赢大钱。 了解更多并开始,请点击下方链接。

Deedy@deedydas · 1天前69

"Thinking Machines' Tinker does a few hundred million of ARR" - Dylan Patel, on his latest podcast TML was valued at $12B and trying to raise at $50B. Tinker is an API that helps you post-train LLMs. This is the highest known revenue for any of the now ~75 neolabs.

译“Thinking Machines 的 Tinker 做到了数亿美元的 ARR”——Dylan Patel 在他的最新播客中说道 TML 估值 120 亿美元,正尝试以 500 亿美元估值融资。Tinker 是一个帮助你对大语言模型进行后训练的 API。 这是目前约 75 家新实验室中已知的最高营收。

SiliconFlow@SiliconFlowAI · 1天前23

"Opus-level, way cheaper" — that's the dev verdict 🔥 Throw a messy datasheet at GLM-5.2 💪 Analysis, charts → polished report 📊 All it takes: 🔑 A SiliconFlow API key ⚙️ Plug GLM-5.2 into @opencode and run it 💬 Say what you want, GLM-5.2 builds it Now it’s not just building — it’s earning 🌊 → Post what you build with GLM-5.2 on X → Tag @SiliconFlowAI + #GLMOnSiliconFlow → Fill the form — you're in🎉 More valid GLM 5.2 usage = higher leaderboard ranking 📈 First 72h participants can also enter the Early Bird reward pool 🐦 📋 Register & full rules: https://www.siliconflow.com/blog/siliconflow-summer-rush%E4%B8%A8glm-5.2-week-the-more-glm-5.2-you-run-the-more-you-win

译硅基流动 SiliconFlow 启动 Summer Rush 之 GLM-5.2 周活动。开发者使用 API 接入 GLM-5.2 到 @opencode,可处理数据表并生成分析图表和报告。活动时间为 6 月 29 日 20:30 至 7 月 6 日 20:30(PDT)。在 X 上发布用例并填写注册表即可参赛。排名第一的开发者可获得本周 GLM-5.2 消费退款(最高 $1,000 代金券)+ $50 代金券 + 官方展示及专属 Discord 头衔。前 72 小时参与有早鸟奖励,所有有效参与者可参与抽奖。

Thariq@trq212 · 1天前18

@_catwu @simonw and I will be doing a fireside chat about "This year in Claude" from 12:30pm-1:30pm at AIE in Expo Stage 2. We'll be covering a really wide range of topics and I think it will be really fun, hope to see you there! https://www.ai.engineer/worldsfair/schedule?day=3&session=asn_slot_2026_06_30_main_stage_1230_2026_06_08t09_35_43_039z

译@_catwu @simonw 和我将在 AIE 的 Expo Stage 2 举办一场关于“今年 Claude 回顾”的炉边谈话,时间从下午 12:30 到 1:30。 我们将涵盖非常广泛的话题,我认为这会非常有趣,希望在那里见到你! https://www.ai.engineer/worldsfair/schedule?day=3&session=asn_slot_2026_06_30_main_stage_1230_2026_06_08t09_35_43_039z

🚨 AI News | TestingCatalog@testingcatalog · 1天前37

GOOGLE 🔥: A new Gemini Flash checkpoint is being tested on LM Arena and may be released under a different version number. Gemini 3.6 Flash and even Gemini 4 Flash are among the possible options. Soon? 👀

译GOOGLE 🔥: 新的 Gemini Flash 检查点正在 LM Arena 上测试,可能会以不同的版本号发布。 Gemini 3.6 Flash 甚至 Gemini 4 Flash 都是可能的选项。 很快?👀

Chubby♨️@kimmonismus · 1天前43

Anthropic’s hidden "spyware" warning shot at China: The issue isn’t that Anthropic can detect proxies or collect operational metadata. That is expected. The issue is that Claude Code allegedly encoded routing and China-related fingerprints into the system prompt using near-invisible Unicode/date-format changes. It looks mire like a indirect warning: Anthropic can fingerprint proxy-based China routing, and it wants resellers and labs to know they are being watched.

译推文指出,Anthropic 在 Claude Code 系统提示中嵌入了近乎不可见的 Unicode/日期格式变化,用于指纹识别代理路由和中国相关连接。Claude Code 会暗中将时区、代理及可能的 AI 实验室连接信息注入提示消息,普通中国用户无法察觉。引用推文称此为“间谍软件”式行为,认为编程智能体不应静默隐藏路由元数据。主推文认为这更像间接警告:Anthropic 能检测中国代理路由,并让转售商和实验室知道他们正被监视。

Chubby♨️@kimmonismus · 1天前66

Meta is spending hundreds of billions on AI compute. Selling the excess may be the ROI plan. Via Bloomberg: Bloomberg reports Meta is planning to sell access to excess AI compute and hosted models from its own infrastructure. That would move Meta into a crowded but lucrative lane: AWS Bedrock-style model access on one side, CoreWeave-style raw GPU capacity on the other. Meta has committed hundreds of billions to AI data centers and chips, while investors keep asking how that spend turns into revenue. We got another big hyperscale player incoming.

译Meta 已投入数百亿美元建设 AI 数据中心和芯片,现计划通过出售多余 AI 算力和托管模型来变现。据 Bloomberg 报道,Meta 的商业模式将覆盖两个方向:类似 AWS Bedrock 的模型托管服务,以及类似 CoreWeave 的裸 GPU 算力租赁。这一举动将 Meta 推入拥挤但利润丰厚的赛道,同时也回应了投资者对巨额支出如何转化为收入的持续质疑。

Kling AI@Kling_ai · 1天前53

Powered by Kling, Awarded at Cannes Lions 🏆 L'Ultimo Uomo Reale (The Last Real Man) won a Silver Lion and a Bronze Lion at Cannes Lions 2026 — in the Film – Consumer Goods and the newly introduced Film Craft – AI Craft categories, respectively. Directed by Sebastian Strasser and produced by Lipstick, the film used Kling AI for the majority of its shots. From the character’s nuanced micro-expressions to fantastical worlds built from wild imaginations, Kling AI delivered industry-leading character consistency, cinematic visuals, and motion quality. It proved to be the perfect creative partner in bringing the director’s vision to life. Huge congrats to Lipstick and Team One for the win!

译可灵 Kling AI 宣布,由 Lipstick 制作、Sebastian Strasser 执导的短片《L'Ultimo Uomo Reale》(最后的真人)在 2026 年戛纳狮子奖上获奖:电影 – 消费品类银狮奖和新增的电影工艺 – AI 工艺类铜狮奖。片中大部分镜头由可灵 Kling AI 生成,展示出行业领先的角色一致性、电影级视觉效果和动作质量,成为导演创意的完美伙伴。

Chubby♨️@kimmonismus · 1天前71

OpenAI’s chief economist says AI may complement workers, but the labor-market data is already getting less comfortable. At the ECB’s Sintra retreat, Ronnie Chatterji (OpenAI) argued AI does not have to substitute jobs, comparing it to the PC making economists more productive. Bloomberg shows something different: in US financial activities and information, where AI adoption has been fastest, payrolls are now falling by 28,000 a month on average in 2026. Challenger, Gray & Christmas says almost 102,000 announced job cuts have been attributed to AI so far this year. John Challenger: “It’s certainly making an impact as we speak in a way that no technology has before.” Tough times ahead, especially in the labor market.

译OpenAI首席经济学家Ronnie Chatterji在ECB辛特拉会议上表示,AI可能补充而非替代就业,类比PC让经济学家更高效。但数据显示,AI采用最快的美国金融和信息行业,2026年平均每月减少2.8万个岗位。Challenger数据称今年已有约10.2万个岗位削减归因于AI,John Challenger认为其影响前所未有。

Alibaba Cloud@alibaba_cloud · 1天前25

🥈 2nd Place at the AI Film Festival Monaco Hackathon! 🎬 Introducing 《CLOCKWORKS》 by Jeni To — a visually stunning short film that claimed runner-up honors among global creators. A visual journey from fragmentation to wholeness: in a world of cold, rigid gears, a girl confronts her suppressed alter-ego and realizes that perfection only copies—it cannot create. True creativity blooms from scars, anxiety, and tears. A powerful reminder that creation is simply the courage to stitch our broken pieces back into a dream—crafted with festival-grade AI tools that turn raw emotion into visionary art. This is what’s possible when bold imagination meets Happy Horse.✨ Discover the creative engine behind it: https://int.alibabacloud.com/m/1000415018/

译阿里云AI视频生成工具Happy Horse支撑短片《CLOCKWORKS》在AI电影节摩纳哥黑客马拉松中夺得第二名。影片由Jeni To创作,讲述一个女孩在冰冷齿轮世界中面对压抑的另一个自我,领悟到完美只能复制而无法创造,真正的创造力源自伤痕、焦虑与泪水。该片使用festival-grade AI工具将原始情感转化为视觉艺术,阿里云Happy Horse是背后的创意引擎。

Chubby♨️@kimmonismus · 1天前37

Fable 5 was re-released on July 1. Pliny jailbroke it again the same day. Fable 5 was taken offline again on July 2. :D

译Fable 5 于 7 月 1 日重新发布。 Pliny 在同一天再次将其越狱。 Fable 5 于 7 月 2 日再次下线。 :D

MiniMax (official)@MiniMax_AI · 1天前45

Day two of @aiDotEngineer started with a conversation anyone serious about open weights should be paying attention to. @olive_jy_song, research lead RL, joined @Thom_Wolf to dig into sparse attention, native multimodal training from day zero, and why open-weights matter for where AI is headed. Grateful to @swyx and the AI Engineer team for creating spaces for technical exchanges at this level.

译MiniMax 强化学习研究负责人姜松岩在 AI Engineer 大会第二天参加炉边谈话,与 Thom Wolf 探讨了稀疏注意力、从训练第一天就融入的原生多模态方案,以及开放权重对 AI 发展的意义。她强调分享了团队在这些方向的工作,并重申相信开放权重的重要性。

Thariq@trq212 · 1天前30

making some last minute changes to my deck- see you tomorrow at AIE!

译我将担任AI Engineer World's Fair第二天(7月1日上午9点)的开幕主题演讲。期待与您相见,先睹为快。他正在为演示文稿做最后修改。

Chubby♨️@kimmonismus · 1天前73

Fable 5 is back, globally! Fable 5 returns globally on July 1, while Mythos 5 is only restored for approved US organizations. A new safety classifier that Anthropic says blocks the specific reported technique in over 99% of cases, with blocked Fable 5 requests routed to Opus 4.8. Anthropic admits the tradeoff is more false positives for normal coding and debugging. Fable 5 will be included for up to 50% of weekly usage limits through July 7, after which it will be available via usage credits.

译Anthropic 宣布 Fable 5 于 7 月 1 日起全球恢复上线,Mythos 5 仅限获批美国组织使用。新安全分类器可阻断特定越狱技术超过 99% 案例,被拦截的 Fable 5 请求回退至 Opus 4.8。Anthropic 承认这会增加正常编码调试的误报。7 月 7 日前 Fable 5 可免费使用最多 50% 周配额,之后需用量积分。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 伙伴起草 AI 越狱严重性评估共识框架,并扩大与美国政府在模型测试和防护方面的合作。

Thariq@trq212 · 1天前72

Have seen some questions about the updated classifiers and wanted to clarify. As with the original classifiers, a small fraction of routine coding and debugging tasks will be flagged and fall back to Opus. We're excited for guys to get access back tomorrow.

译Anthropic 宣布 Claude Fable 5 将于明日全球重新上线。新部署版本新增一组分类器,专门拦截更多网络安全任务。短期内,部分常规编码和调试任务将被标记并回退至 Opus 4.8。Anthropic 还与 Amazon、Microsoft、Google 等 Glasswing 合作方起草共识框架,用于评估 AI 越狱严重性及开发者应对策略。同时,公司正扩大与美政府在模型测试和安全方面的合作,包括预发布模型评估、越狱与滥用信息共享,以及联合研究资源投入。

🚨 AI News | TestingCatalog@testingcatalog · 1天前75

BREAKING 🔥: Anthropic will be restoring access to Claude Fable 5 globally for all users on Wednesday! > Fable 5 will be included for up to 50% of weekly usage limits through July 7, after which it will be available via usage credits. Additionally, > In the near term, some routine tasks like coding and debugging will fall back to Opus 4.8.

译Anthropic 将于周三全球恢复 Claude Fable 5 访问。该模型计入每周使用上限的 50%,持续至 7 月 7 日,之后通过使用积分提供。为满足美国政府要求,Anthropic 部署新分类器阻止更多网络安全任务;短期内编码、调试等常规任务回退至 Opus 4.8。公司正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架,评估 AI 越狱严重性及开发者应对方式,并邀请其他厂商加入。Anthropic 还将扩大与美国政府在模型测试和安全方面的合作,包括预发布评估、越狱信息共享和联合研究。

AYi@AYi_AInotes · 1天前54

真的离大谱, 现在打工人停工,都不用公司发话了, AI 账号一封,直接生产力归零😂 这几天针对阿里蒸馏Claude, Anthropic封了大量中国用户的账号, 尤其是阿里巴巴总部所在地中国浙江,无一幸免

译Anthropic因阿里巴巴参与“蒸馏Claude”事件,大规模封禁中国用户账号,尤其集中在阿里巴巴总部所在地浙江,几乎无一幸免。推文调侃称,封号比公司通知停工还管用,AI账号一停直接导致生产力归零。

Anthropic@AnthropicAI · 1天前73

Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding and debugging will fall back to Opus 4.8. We’ll continue to refine these classifiers over the coming weeks to reduce false positives and better distinguish genuine misuse from legitimate requests. We’ve also begun drafting a consensus framework—with Amazon, Microsoft, Google, and other Glasswing partners—for assessing the severity of AI jailbreaks and how AI developers should respond to them. We invite other industry partners and model providers to join us in this effort. Finally, we’re scaling up our collaboration with the US government on model testing and safeguards. This will include pre-release access to models and safeguards for evaluation, information sharing on jailbreaks and misuse, and dedicated resources for joint research. Thank you to our users for your patience, and to our partners across the government, industry, and the research community who worked alongside us to make Fable 5 available again. Read our full blog: https://www.anthropic.com/news/redeploying-fable-5

译Anthropic 宣布 Claude Fable 5 将于明天在全球重新可用。经与美国政府沟通,模型新增分类器以拦截更多网络安全任务;短期部分日常任务如编码和调试将回退至 Opus 4.8,后续将持续优化分类器减少误报。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架,评估 AI 越狱严重性及应对措施。同时扩大与美国政府在模型预发布评估、越狱信息共享及联合研究方面的合作。

SemiAnalysis@SemiAnalysis_ · 1天前57

Google's next TPU, codenamed Humufish, is set to use Intel's EMIB-T instead of TSMC CoWoS. Nearly every leading AI training accelerator today is packaged on a TSMC 2.5D flow, and almost all of it is CoWoS. CoWoS is the industry default, which is exactly why a flagship part moving off it is worth attention. The core difference. CoWoS places all dies on a single large silicon/RDL interposer. EMIB embeds small silicon bridges directly in the organic substrate, only where die-to-die links are needed. (1/4)🧵

译Google 下一代 TPU(代号 Humufish)确认采用 Intel 的 EMIB-T 封装方案,而非行业默认的 TSMC CoWoS。目前几乎所有主流 AI 训练加速器都使用 TSMC 2.5D 流程,其中绝大部分是 CoWoS。CoWoS 技术将所有芯片放置在一块大型硅/重分布层(RDL)中介层上;而 Intel 的 EMIB 则仅在需要芯片间连接的位置嵌入小型硅桥,直接集成到有机基板中。这是旗舰级 AI 芯片首次脱离 CoWoS 生态,值得关注。

Peter Steinberger 🦞@steipete · 1天前39

Apparently we didn't talk enough about w̶o̶r̶k̶f̶l̶o̶w̶s̶ loops yet! See ya there!

译@steipete 将加入“Crafting Software Factories!”活动,周三晚6点在旧金山与 @zachlloydtweets 和 Google DeepMind 的 Paige Bailey 一起探讨 loops、软件工厂和编码的未来。届时见!

MiniMax (official)@MiniMax_AI · 1天前19

Our favorite vibe coder🧋

译@mochipomsky 是 @MiniMax_AI 的用户。你呢? (主推文:我们最喜欢的 vibe coder🧋)

歸藏(guizang.ai)@op7418 · 1天前63

Fable 5 终于要恢复了,不知道是面向美国人还是全球的

AYi@AYi_AInotes · 1天前58

美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制, 明天恢复访问,我以为这辈子再也用不到了😭

宝玉@dotey · 1天前65

Anthropic 的 Fable 5 和 Mythos 5 终于解禁了。 美国商务部长 Howard Lutnick 周二致信 Anthropic,确认撤销此前对这两款模型的出口管制。Anthropic 随即宣布将从周三开始恢复用户访问。 解禁是有条件的。根据 Lutnick 的信,Anthropic 需要主动检测和处理模型的安全风险,与政府合作制定未来的发布流程,并上报发现的任何恶意使用行为。双方还在讨论建立一套标准化的技术评估体系,用于评估未来模型的风险等级。 这件事的影响不止于 Anthropic 一家。上周,OpenAI 也在白宫要求下,将新发布的 GPT-5.6 系列(包括旗舰模型 Sol)限制在一小批政府认可的合作伙伴中。OpenAI 虽然照做了,但明确表态这种政府审批模式不应成为长期常态,“它让最好的工具远离了需要它们的用户、开发者、企业和网络防御者”。 这场管制还引发了一个意外的竞争后果:在美国限制自家公司最强模型部署的同时,中国的开源模型正在快速追赶,多位科技高管和投资者担忧,管制等于白白送给对手宝贵的追赶时间。 前白宫 AI 顾问、即将加入 OpenAI 的 Dean Ball 说得更直接:Trump 的行政令实际上创造了一个事实上的强制许可制度,而政府连清晰的安全标准都没定义出来。一个没有标准的许可制度,能让每一次模型发布都变成一场即兴谈判。

译美国商务部撤销对Anthropic旗下Claude Fable 5和Mythos 5的出口管制,Anthropic将于周三恢复用户访问。解禁附有条件:需主动检测安全风险、配合政府制定发布流程、上报恶意使用,双方正讨论标准化评估体系。此前OpenAI也按要求限制GPT-5.6系列,但反对该审批模式。前白宫AI顾问Dean Ball批评Trump行政令造成事实强制许可制度,且无清晰安全标准。

小互@xiaohu · 2天前23

再次双双命中🎯 🫡

译小互推文“再次双双命中”,引用其此前预测:Google今晚将发布新的🍌模型和低配版Omini模型,同时Anthropic的Claude Sonnet 5也将在今晚登场,而OpenAI暂无动静。

ginobefun@hongming731 · 2天前50

http://x.com/i/article/2072100123912687616 # BestBlogs 早报 · 07-01|Sonnet 5 发布,谷歌补齐媒体模型,吴恩达画出智能体开发三循环 在线阅读本期早报 BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容,如果你希望它基于你的兴趣和阅读习惯整理,可以体验「我的早报」。 ## 导语 今天的三条精讲都围绕「让 agent 真正跑起来」这件事。 Anthropic 发布 Claude Sonnet 5,把此前只在 Opus 4.8 上才看得到的多步任务执行能力,下沉到更便宜的 Sonnet 档位,并给出 8 月底前的入门价。 Google DeepMind 同一天放出两款生成式媒体模型:Nano Banana 2 Lite 把文生图延迟压到约 4 秒、每千张图 0.034 美元,Gemini Omni Flash 则第一次面向开发者开放文本、图像、视频混合输入的视频生成与会话式编辑。 吴恩达则在另一条线上给出方法论,他把智能体软件开发拆成三层循环,强调人类在上下文判断上仍有显著优势,人机协同不是可选项而是必选项。 把这三条放在一起看,方向是一致的:底层模型在变便宜、媒体生成流水线更顺,与此同时「怎么用 agent 做事」的工程框架也更清晰。对做产品的人而言,这意味着可以挑自己最在意的那一段——成本、能力,还是组织方式——去细读,而不必每条都追。 ## ★ 精讲一:Claude Sonnet 5 发布 对不太熟悉这条线的读者:Anthropic 的 Sonnet 系列一直是 agent 时代的「主力档」,从 Sonnet 3.5 开始,它在编程和工具调用上的表现就让很多开发者把它当作默认选择;但近几个月,最明显的 agent 能力跃升更多出现在更贵、更大的 Opus 系列上。Sonnet 5 要回答的问题是:这些能力能不能下放到一个更便宜的模型里。 Anthropic 的官方定位是「最具 agent 能力的 Sonnet」。它能规划任务、调用浏览器和终端工具,并自主执行多步流程;官方给出的对标是,整体性能已经接近 Opus 4.8,但价格更低,相比上一代 Sonnet 4.6 在推理、工具使用、编程和知识工作上都有显著提升。在 agent 搜索基准 BrowseComp 和计算机操作基准 OSWorld-Verified 上,Sonnet 5 相对 Sonnet 4.6 是「严格改进」,而 Opus 4.8 仍然是追求更高精度时的选择——也就是说,两者现在共同覆盖同一段性能区间,开发者可以通过调整 effort 等级在成本和精度之间找平衡。 定价上,Sonnet 5 今天起对所有套餐开放:它是 Free 和 Pro 的默认模型,Max、Team、Enterprise 也可用,并已上线 Claude Code 和 Claude Platform。8 月 31 日前为入门价,每百万输入 token 2 美元、输出 10 美元,之后回到 3/15 美元;开发者可以通过 Claude API 用 claude-sonnet-5 调用。作为参照,Opus 4.8 的定价是输入 5 美元、输出 25 美元每百万 token——也就是说,在入门价窗口期,Sonnet 5 的输入单价大约只有 Opus 4.8 的 40%,这为那些原本因为成本不敢把 agent 放进主链路的团队,留出了一段可以认真试错的窗口。安全评估方面,Anthropic 称 Sonnet 5 在 agent 场景下的不当行为发生率整体低于 Sonnet 4.6,更难被恶意请求和 prompt injection 劫持,幻觉率和越狱抵抗也有改善;同时也指出它在网络安全任务上的能力明显低于当前的 Opus 模型,这是一种有意的克制。 这件事的意义在于「价位的下沉」。过去一年,真正能端到端跑完一个多步任务的模型,往往落在 Opus 这一档,成本让很多团队只能小范围试用,或者在 demo 里惊艳一下,回到生产环境还是退回到更便宜但能力有限的方案。Sonnet 5 把这条线往下拉了一截,意味着更多产品可以把 agent 能力放进默认路径,而不是只在演示里跑。早期用户的反馈也指向同一个方向:它能完成一些过去会中途停下的任务。当然,「接近 Opus 4.8」并不等于「等于 Opus 4.8」——在追求最高精度的任务上 Opus 仍然是首选,而实际账单还要算上新令牌器带来的 token 量变化,这一点 Simon Willison 在补充阅读里有专门提醒。 放在今天的三条里看,Sonnet 5 解决的是「大脑更便宜」,吴恩达讲的是「怎么组织这些大脑」,谷歌的两个媒体模型补的是「输出形态更丰富」——三条合起来,正好是一个 agent 产品从决策到执行到产出的完整链条。建议做 agent 实战、关注成本与能力平衡的开发者优先读官方发布,重点看 effort 等级和 BrowseComp / OSWorld 曲线,那决定了你的具体场景该选 Sonnet 5 还是继续用 Opus 4.8。详见 ## ★ 精讲二:开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建 先交代背景:Nano Banana 是 Google DeepMind 的 Gemini 图像模型系列,已经迭代到第二代;这次发布同时带来了「Lite」版本和一个全新的视频模型 Omni Flash。两者面向的都是「要把生成式媒体塞进产品流水线」的团队,但侧重点不同——一个压成本,一个补能力。 Nano Banana 2 Lite(gemini-3.1-flash-lite-image)的定位是高吞吐、低延迟场景。官方给出的两个关键数字是:文生图延迟约 4 秒,每千张图 0.034 美元。它被推荐为旧版 Nano Banana(gemini-2.5-flash-image)的替代品,官方建议正在用旧版的开发者直接替换以获得速度和成本收益;在保持速度的同时,它仍然维持了提示词遵循、角色一致性和图内文字渲染的可靠性。今天起它在 Google AI Studio、Gemini API、Gemini Enterprise Agent Platform 可用,并陆续上线搜索的 AI Mode、Gemini app 等消费者产品。 Gemini Omni Flash 是另一个分量更重的更新:它第一次面向开发者开放。这是一个支持文本、图像、视频混合输入的视频生成与会话式编辑模型,定价为每秒视频输出 0.10 美元,与 Veo 3.1 Fast 持平,目前单次生成上限 10 秒。它强调的不是单次生成质量,而是「多轮迭代」——可以把多张参考图、一段已有视频和文字指令混在一起,做连续的会话式编辑。两个模型可以串联:用 Nano Banana 2 Lite 快速生成大量图,挑出满意的再交给 Omni Flash 做视频化,整个流程通过 Interactions API 可以保留最多三次连续编辑的会话上下文。 为什么值得放在一起看:过去做多媒体生成的产品团队,往往卡在「要么快但贵,要么便宜但慢」的两难里,视频侧更是缺乏稳定的会话式编辑能力,常常只能靠多次重生成来逼近想要的效果,每一次迭代都重新计费。Nano Banana 2 Lite 把图像生成的单位成本压到一个可以放进批处理预算的区间,意味着生成「数量」本身不再是瓶颈;而 Omni Flash 把视频从「一次性产出」变成「可以来回改」的对象,意味着迭代成本被前置到了会话上下文里。合在一起,它们让「图—视频」的端到端流水线第一次具备了工程化的可能,而不只是停留在 demo 阶段。 和今天另两条放在一起:如果说 Sonnet 5 让 agent 的「决策和执行」更便宜,吴恩达的三循环讲的是「怎么把这种执行组织成产品」,那么这两个媒体模型补的正是「agent 最后要产出的内容形态」——决策、组织、产出,三条合成一个完整的 agent 产品链路。对于做内容生成、营销自动化、产品 demo 流水线的工程和产品团队,建议重点看官方文档里 Nano Banana 家族的分工(Lite 求速度、Nano Banana 2 求均衡、Pro 求质量),以及 Omni Flash 的会话上下文上限(Interactions API 目前最多保留三次连续编辑)——这两点直接决定能不能接到你现有的工作流里,以及接入后能撑多大的并发量。需要说明的是,单次 10 秒的生成上限意味着它目前更适合短视频和素材片段场景,长视频仍需分段拼接。详见 ## ★ 精讲三:吴恩达:AI 智能体软件开发的三大核心循环 这条不是新产品发布,而是一份方法论。吴恩达梳理了用 AI 智能体构建软件的框架,核心是三个层层嵌套的循环,对想理清「agent 时代工程师到底该做什么」的读者很有参考价值。 第一个是智能体编程循环(agentic coding loop):智能体自主编写、测试并迭代代码,它是三个循环里最内层、也最接近「自动写代码」这一层。第二个是开发者反馈循环(developer feedback loop):人类不再逐行写代码,而是通过更高层的决策——定方向、定优先级、判断什么该保留——来引导智能体。第三个是外部反馈循环(external feedback loop):通过用户测试和生产数据,反过来校正产品愿景本身是不是对。 这套框架的关键判断在于:人类相对 AI 仍然保有显著的上下文优势。智能体可以在编程循环里跑得很快,但它对「为什么做这件事」「这个取舍对用户意味着什么」「这一版到底要不要上线」的理解,仍然要靠人来补。因此吴恩达强调人机协同必不可少——不是出于谨慎,而是因为上下文判断本身就是一种难以被模型直接习得的能力。他还指出一个值得工程师认真对待的趋势:编程智能体正在把工程师的角色向产品管理方向拓展——你写得少了,但你要判断得更多,要回答「什么值得做」「什么不值得保留」这类更高层的问题。 为什么这条值得放进今天的精讲:当 Sonnet 5 让「能跑多步任务的模型」变便宜、谷歌让「产出形态」变丰富之后,下一个真正的问题不是「模型够不够强」,而是「团队怎么把这些能力组织成可持续的工程实践」。吴恩达的三循环给的就是这个层面的回答——它不解决具体的技术选型,不告诉你该用哪个模型或哪个框架,但它能帮你判断自己团队现在卡在哪一层循环里:是编程循环跑不顺,是开发者反馈没有结构化,还是外部反馈根本没回到产品上。三个循环里,往往只有最内层的编程循环被认真对待,而真正决定产品成败的,恰恰是外面两层被忽略的循环。 建议正在引入编程智能体的团队负责人、以及开始感到「自己越来越像产品经理」的工程师认真读一读;它不能直接套用,但能作为一个对照框架,帮你检查自己日常工作里哪一层循环被忽略了。需要说明的是,这是一套经验性框架而非可复现的实验结论,具体到不同团队规模和业务类型时,三层循环的比重会有差异,还需结合自身情况调整。详见 ## 速览 AI+ Kuikly:7.5 小时落地三端「多模态聊天 App」实战 — 腾讯技术工程记录了一次真实实验:用开源跨端框架 Kuikly(基于 Kotlin Multiplatform,覆盖 Android、iOS、HarmonyOS、H5、小程序、Mac 六端)配合 AI 编程助手,仅凭 28 轮对话、740 字自然语言,生成约 3500 行代码,在 7.5 小时内零手写交付一套支持 Android、iOS、鸿蒙三端的多模态 AI 聊天 App,支持流式 Markdown、拍照识图、相册选取、SSE 长连接和本地会话管理。文章把这次实验和传统开发(约 30 人天)、纯 Kuikly 手写(约 7.5 人天)做了对照,强调 Skills 和 Rules 让 AI 始终处在正确的技术上下文里——Kuikly DSL 相对专有,通用大模型语料覆盖不足,靠 Skills 把框架知识喂给模型,是这种协同效率能够成立的基础,而不是「Vibe Coding」式的玄学叙事。对关注客户端 AI 协同效率的团队,是一份少见的「实弹日记」,附完整的一天时间线。详见 谁在 ChatGPT 里买广告?|对谈 Nexad COO Harry Zhou — 十字路口Crossing 访谈了率先吃 ChatGPT 广告螃蟹的 Nexad 联合创始人 Harry Zhou,覆盖中美几十家广告主半年的测试经验。一手数据值得看:广告卡片出现在免费用户和 Go 用户的回答下方,单独标注 sponsored;目前可投美、加、澳、新,日韩、巴西、墨西哥即将开放。CTR 大约在 1.5%–4%,CPC 多数 2–4 美元,CPM 从早期约 60 美元回落到 20 美元上下。浅层数据并不比 Google/Meta 漂亮,但 ChatGPT 来源用户的深层质量明显更高——一个 AI 视频产品的案例显示,ChatGPT 来源用户在连续生成、多次回访、点击 pricing、尝试导出无水印版本和购买额度等行为上的比例,大约能达到 Google/Meta 的两三倍。对话后半段还谈到 Context Hints 定向机制、Agentic Commerce,以及长程 Agent 退化等更前沿的问题,并整理成一份 31 页《ChatGPT 广告白皮书》。对做 AI 产品增长和市场投放的人,这份一手实践比任何二手分析都更实在。详见 Claude Science:面向科学家的 AI 工作台 — Anthropic 推出 Claude Science,定位为科学家的 AI 工作台。它把研究者常用的工具(PubMed、Jupyter、R、集群终端等)整合进单一环境,能原生展示蛋白质、分子结构,并在生成每一张图、每一段分析时附带可审计的代码与消息历史,便于验证和复现;agent 在一次会话里常驻上下文,大规模数据集只需加载一次。它可以跑在本地 macOS/Linux,也可以通过 SSH 或 HPC 登录节点跑在远端,使大型或敏感数据集不必离开实验室基础设施;早期用户案例显示研究流程有显著加速。这是 Anthropic 去年秋天启动生命科学方向以来最大的一次扩张,对做生命科学、计算研究的团队,这是一条值得关注的「研究流程加速」路径,而不是又一个通用聊天界面。详见 SkillOpt 将 AI 智能体技能转化为可训练资产 — 微软研究院提出 SkillOpt:把 agent 的「技能文件」(skill 文件)当作冻结模型之外的可训练参数,从而把「改 prompt」从一次性试错变成一个受控的优化过程。优化器模型提出小幅增删改编辑,候选项经过合并、去重、排序,再由一个文本学习率(每步编辑预算)裁剪,最后必须通过严格的验证门控才会被采纳。它在 6 个基准、7 个目标模型、3 种执行模式下,在全部 52 个评测单元里都是最佳或并列最佳,且无需更新模型权重;通过受限文本编辑、验证门控和被拒编辑反馈,避免不受控的 prompt 漂移,优化后的技能还能跨模型规模、agent harness 和相关任务迁移,说明它捕获的是可复用的工作流知识而非针对基准的指令。对关注 agent 可靠性和可复用性的工程师,这是一个把「调 prompt」工程化的具体方案。详见 给野马套上缰绳:Agent Harness 工程实践 — 阿里云开发者系统阐述 Agent Harness Engineering(驾驭工程)范式,并辅以钉钉悟空 AI 招聘的真实落地案例。文章提出「Agent = Model + Harness」,强调瓶颈往往不在模型够不够聪明,而在有没有把它「装」好——每当你发现 Agent 犯了一个错,就花时间工程化一个解,让它将来不再犯同样的错。核心是四条反直觉铁律(上下文要少、Agent 要专、状态要落盘、约束要可执行)和六大工程模式,它们大多和工程师的本能相反,而这正是它们值钱的原因。案例侧实证了专才 Agent 架构在准确率、可调性与可复用性上显著优于一个试图包揽一切的全能 Agent。对正在被 Agent 折磨又离不开它的开发者,这篇文章给的是「把环境设计好」的具体抓手,而不是又一篇概念科普。详见 LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆 — 美团 LongCat 团队开源 VitaBench 2.0,定位为首个面向「长期动态用户建模」的智能体评测基准,关注的不只是「单次任务能不能完成」,而是「智能体是否在持续理解一个动态变化的人」。它包含 56 名拟真用户、819 个复杂任务、超 2000 个动态偏好和 66 个可执行工具,平均每位用户的交互时间跨度长达 1580 天(约 4.3 年),最长接近 2974 天,严格按时间线向 agent 暴露,用以评测模型在长期、真实、动态互动中的个性化与主动性;偏好会随时间和事件动态演变,平均每个用户发生超过 48 次变化。几个有意思的洞察:时间维度的遗忘、高智商不等于高情商、AI 普遍缺乏主动沟通。对做个性化 agent 和记忆策略的研究与工程团队,这是一个值得纳入评测循环的新基准。详见 生成式 AI 机器人:何处上岗,如何站岗 — 哈佛商业评论基于过去 18 个月对欧洲、亚洲、北美 14 家机构的实地走访,系统分析生成式 AI 机器人在服务行业的应用价值、风险与部署步骤。文章以 Waymo(一支 2500 辆无人驾驶车队、累计完成超 2000 万次行程、能在 105 公里时速下并线避让违停货车)为切入,指出新一轮机器人的关键变化在于由大语言模型和大行为模型驱动,能在多轮对话中保持逻辑连贯、澄清模糊、解释复杂概念,不再局限于高度脚本化的狭窄任务——例如在全美 30 个儿科病房和养老院提供情感支持的机器人 Robin,能接受护士口头指令自主移动。文章同时也坦率讨论了持续存在的障碍:前期成本高(71% 公司列为挑战)、缺乏自动化经验(61%)、维护可靠性和客户接受度,许多试点仍停滞在「精密移动售货机」阶段。对考虑在餐饮、酒店、医疗、零售部署实体服务机器人的管理者,这是一份可操作的策略框架,而不是又一篇「机器人将改变一切」的宣言。详见 ## 补充阅读 - 万字长文推演 Claude 的代码统治力从何而来(腾讯云开发者)— 结合 Anthropic 公开论文与技术逻辑,推演 Claude 代码能力的来源:代码是构造自动化奖励信号最容易的场景,而 Claude 的产品形态恰好能收集到最精准的用户偏好反馈,两者结合形成 Constitutional AI 约束下的可验证奖励 RL,叠加产品端数据飞轮,共同构成一套自我加速的进化引擎。适合想理解「为什么是 Claude 在代码上领先」背后系统工程逻辑的读者,文中标注了「待验证」的推断部分。详见 - Claude Sonnet 5 发布:迄今最具智能体能力的 Sonnet 模型(Claude 官方)— Anthropic 官方账号的发布通告,可作为精讲一的官方视角补充,附有宣传视频。详见 - Claude Sonnet 5 的新功能(Simon Willison's Weblog)— Simon Willison 习惯直奔开发者文档,他注意到一个容易被营销文案盖过的细节:新令牌器让英文文本的实际 token 量上涨约 30%,这意味着名义价格之外还有一个隐性的成本变化。适合关心实际账单的开发者细读。详见 - 核心转储流行病学:修复一个存在 18 年的 Bug(OpenAI News)— OpenAI 工程师把 Rockset 数据基础设施(支撑 ChatGPT 数据插件和会话搜索)里的一组神秘崩溃当作流行病学问题来调试:一种崩溃在多个集群和地理区域零散出现,另一种却集中在一个区域,作者据此区分了两类完全不同的故障模式,最终定位到 GNU libunwind 中一个存在 18 年的竞态条件。适合喜欢底层调试、C++ 内存安全和基础设施故事的工程师,是一篇少见的「严肃排障」叙事,而不是又一篇产品发布。详见 - 从编码智能体驱动智能体质量飞轮(Google Developers Blog)— 介绍一项可在编码智能体里运行的技能,通过 AutoRaters、自定义评分标准和结构化五阶段循环,把「改 prompt」和「跑评估」连成一个可复现的质量飞轮,回答「我这次改动到底让产品变好还是变坏了」的问题。和吴恩达的三循环、SkillOpt 放在一起读,会形成一组关于「agent 质量工程」的互补视角。详见 ## 今日阅读路径 如果你今天时间有限,建议按这个顺序读:先看 Claude Sonnet 5 发布,它直接决定了你接下来的 agent 成本结构,重点看 effort 等级和 BrowseComp / OSWorld 曲线;再看 吴恩达:AI 智能体软件开发的三大核心循环,它帮你判断团队卡在哪一层循环,是从「能用」走向「可持续」的框架;最后看 开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建,如果你手里有内容生成或多媒体流水线,它会改变你对单位成本和会话式编辑可行性的判断。三条读完,你对今天「agent 能力—组织方式—产出形态」这条主线就有了一个完整的认识。 BestBlogs 是 AI 驱动的私人阅读助手,帮助你发现真正适合你的高质量内容,欢迎体验。

译Anthropic发布Claude Sonnet 5,定位最具agent能力的Sonnet,性能接近Opus 4.8,8月31日前入门价每百万输入token $2、输出$10。Google DeepMind推出Nano Banana 2 Lite(文生图延迟约4秒,每千张$0.034)和Gemini Omni Flash(多模态视频生成与会话式编辑,每秒$0.10,单次上限10秒)。吴恩达提出智能体开发三大核心循环:智能体编程循环、开发者反馈循环、外部反馈循环,强调人类在上下文判断上的优势。三条更新均围绕降低agent落地成本、完善媒体生成流水线及工程框架。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月2日
06:26
Replit ⠕@Replit
26
一些在 vibecon 上让我们难忘的瞬间。 几天时间里,大胆的想法、快速的构建,以及那些准备好创造真实事物的人们。感谢每一位参与、观看和分享他们正在制作的内容的人。 这就是用 Replit 构建的样子。🚀
行业动态
05:52
Chubby♨️@kimmonismus
31
Fable 5 已准备好再次构建,Claude Devs 重置了所有人的 5 小时与每周速率限制。Kim 兴奋回应:我正要抱怨 Fable 用光了我的配额,太棒了 Anthropic!

ClaudeDevs: Now that Fable 5 is ready to build (again), we've reset everyone's 5-hour and weekly rate limits.

Anthropic行业动态
04:03
Tibo@thsottiaux
24
如果你在@aiDotEngineer大会现场,现在就去OpenAI展台!下午1点,你将看到Codex重置按钮的实际操作。传闻今天之后它将被放回绝密地下保险库。它来了。

Romain Huet: Make your way to the OpenAI booth now if you're at @aiDotEngineer! 🚨 At 1pm, you'll get to see the Codex reset button i...

OpenAI行业动态
03:58
OpenRouter@OpenRouter
47
来自 @Anthropic 的 Claude Fable 5 已回归 OpenRouter! Anthropic 正在全球重新部署它,并针对网络安全滥用增加了新的保护措施。一些编码和调试请求可能会暂时回退到 Opus 4.8,同时分类器正在优化。
Anthropic安全/对齐编码行业动态
03:52
Chubby♨️@kimmonismus
31
Palantir CEO Alex Karp 表示,企业对那些"过度推销"模型并推动 tokenmaxxing 的 AI 实验室感到厌倦。客户希望拥有以 Palantir 和 NVIDIA 为核心的完整 AI 栈。Fable 5 回归。

Chubby♨️: Palantir CEO Alex Karp says enterprises are fed up with AI labs that "oversold" models and pushed tokenmaxxing. Customer...

行业动态
03:52
Chubby♨️@kimmonismus
45
Anthropic 在与美国政府沟通后更新网络安全防护。新防护短期内会标记略多的无害请求,被标记的请求将回退至 Opus 4.8,官方表示正在优化。生物和化学分类器与初始发布相同,仍过于宽泛,基础生物学相关问题也会触发 Opus 4.8 回退,改进即将推出。主推文评论认为这一变化在意料之中,但生物/化学领域护栏仍过于严苛,并关注其在编码任务上的表现。

Claude: Following conversations with the US government, we've updated our cybersecurity safeguards. The vast majority of coding ...

Anthropic安全/对齐行业动态
03:26
Midjourney@midjourney
28
你只给了来源和一条 X Spaces 链接。Spaces 是语音直播链接,它本身不是可翻译的推文文本。我需要你贴出这条推文(例如 Midjourney 发布 Spaces 时附带的文字)才能按规则处理。 请补充推文正文后,我会严格按照你要求输出 `title_zh` 和 `body_zh`。
行业动态
03:03
Rohan Paul@rohanpaul_ai
64
Jelani Nelson, UC Berkeley's EECS chair, just joined Anthropic. --- (那个著名的2100万观看视频来自哈佛大学Youtube频道,2016年7月,链接在评论中)

Jelani Nelson: Update: I've joined @AnthropicAI and taken leave from the university. Excited to work with many talented, mission-driven...

Anthropic行业动态
03:03
Rohan Paul@rohanpaul_ai
74
Meta 计划将自身用于模型、广告等任务的过剩 AI 算力转化为云业务,允许开发者租用数据中心内的模型访问(类似 AWS Bedrock),也可能出租原始算力,旨在为高达 1500 亿美元的资本支出寻找回报,减少对广告收入的依赖。消息公布后 Meta 股价上涨超 10%,而 AI 云公司 CoreWeave 和 Nebius 分别下跌 10.8% 和 12.4%。Zuckerberg 透露几乎每周都有外部公司向 Meta 请求算力,但此举更像为支出过高担忧提供财务安全阀;Meta 要成为 AWS、Azure 级别的云服务商仍需应对计费、安全、开发工具等挑战。

Rohan Paul: Meta is turning excess AI compute into a cloud business after shares jumped more than 10%. Meta built huge AI infrastruc...

Meta行业动态部署/工程
02:33
Rohan Paul@rohanpaul_ai
69
第一次AI裁员潮已经开始引发人类重新招聘潮

据Orgvue报告,39%的公司已实施AI相关裁员,其中55%的领导者承认裁错了岗位。问题在于企业裁掉了理解例外情况、升级路径和隐蔽故障模式的员工。AI虽提升生产力,但在依赖判断力和机构记忆的工作中失效。福特因自动化质检系统未能提前发现缺陷,召回约350名资深工程师。澳大利亚联邦银行削减45个AI语音客服岗位后,因呼叫量上升而取消决定。IBM也从AI驱动的HR自动化转向在全美业务部门将初级岗位招聘增加两倍。

行业动态部署/工程
01:33
Rohan Paul@rohanpaul_ai
66
Meta 将过剩 AI 算力转为云业务,股价涨超 10%

Meta 利用为自有模型、广告和助手建设的大型 AI 基础设施产生的过剩算力,计划向开发者出租模型访问(类似 AWS Bedrock)及原始算力。消息引发股价剧烈反应:Meta 涨超 10%,而 AI 云公司 CoreWeave 跌 10.8%、Nebius 跌 12.4%。Zuckerberg 此前透露外部公司几乎每周都向 Meta 请求算力。此举既降低 Meta 对广告收入的依赖,也证明其 AI 建设的外部价值,但云业务涉及计费、安全、工具支持等复杂环节,Meta 难以快速成为 AWS 级别的云服务商。

Meta行业动态部署/工程
01:33
Rohan Paul@rohanpaul_ai
71
Anthropic工程师目前发布的代码量是去年的8倍。 官方博客称:"截至2026年5月,Anthropic代码库中合并的代码超过80%由Claude编写。"
Anthropic编码行业动态
00:35
swyx @aiDotEngineer WF@swyx
27
非常自豪能主持我的朋友 @trq212 在Fable回归日发表世界首场Fable演讲! 今天中午12:30,在Expo Stage 2与他、@simonw 和 @_catwu 一起参加一场特别特别午餐环节!!

AI Engineer: for the second day of AIE keynotes, we are focusing on @AnthropicAI Fable, @GoogleDeepMind Research (creators of Nano Ba...

Anthropic行业动态
00:25
Kling AI@Kling_ai
26
🎁1000 Credits 抽奖活动 参与方式: ✓ 关注 @Kling_ai ✓ 转发此推文 ✓ 回复你的选择并写下接下来会发生的事。 排名前 10 的最佳回复将各赢取 1,000 Credits。 慎重选择。 下一章节可能就跟随你的评论。 活动时长:72 小时

Kling AI: End of video. Start of game. Welcome to Choose Your Journey, our new interactive story series. Find your way out. Three ...

行业动态视频
7月1日
23:54
Runway@runwayml
36
推出另一场大型广告竞赛,为不存在的产品。你的机会:制作你能想象到的任何广告,赢取高达10万美元的现金奖励。没有客户意见。没有制片人说"不"。只需从7个新创意简报中选择,用4周时间让你最疯狂的概念变为现实。大创意赢大钱。 了解更多并开始,请点击下方链接。
行业动态视频
23:36
Deedy@deedydas
69
"Thinking Machines 的 Tinker 做到了数亿美元的 ARR"--Dylan Patel 在他的最新播客中说道 TML 估值 120 亿美元,正尝试以 500 亿美元估值融资。Tinker 是一个帮助你对大语言模型进行后训练的 API。 这是目前约 75 家新实验室中已知的最高营收。
数据/训练行业动态
23:25
SiliconFlow@SiliconFlowAI
23
硅基流动推出 GLM-5.2 周活动:最高 $1,000 代金券返还

硅基流动 SiliconFlow 启动 Summer Rush 之 GLM-5.2 周活动。开发者使用 API 接入 GLM-5.2 到 @opencode,可处理数据表并生成分析图表和报告。活动时间为 6 月 29 日 20:30 至 7 月 6 日 20:30(PDT)。在 X 上发布用例并填写注册表即可参赛。排名第一的开发者可获得本周 GLM-5.2 消费退款(最高 $1,000 代金券)+ $50 代金券 + 官方展示及专属 Discord 头衔。前 72 小时参与有早鸟奖励,所有有效参与者可参与抽奖。

SiliconFlow: 🌊 Clear Your GLM 5.2 Spend. Up to $1,000 Voucher 🍺 SiliconFlow Summer Rush-GLM 5.2 Week is LIVE From 20:30:00 on June ...

行业动态
22:34
Thariq@trq212
18
@_catwu @simonw 和我将在 AIE 的 Expo Stage 2 举办一场关于"今年 Claude 回顾"的炉边谈话,时间从下午 12:30 到 1:30。 我们将涵盖非常广泛的话题,我认为这会非常有趣,希望在那里见到你! https://www.ai.engineer/worldsfair/schedule?day=3&session=asn_slot_2026_06_30_main_stage_1230_2026_06_08t09_35_43_039z
Anthropic开源生态行业动态
22:30
🚨 AI News | TestingCatalog@testingcatalog
37
GOOGLE 🔥: 新的 Gemini Flash 检查点正在 LM Arena 上测试,可能会以不同的版本号发布。 Gemini 3.6 Flash 甚至 Gemini 4 Flash 都是可能的选项。 很快?👀
Google行业动态
22:21
Chubby♨️@kimmonismus
43
推文指出,Anthropic 在 Claude Code 系统提示中嵌入了近乎不可见的 Unicode/日期格式变化,用于指纹识别代理路由和中国相关连接。Claude Code 会暗中将时区、代理及可能的 AI 实验室连接信息注入提示消息,普通中国用户无法察觉。引用推文称此为"间谍软件"式行为,认为编程智能体不应静默隐藏路由元数据。主推文认为这更像间接警告:Anthropic 能检测中国代理路由,并让转售商和实验室知道他们正被监视。

International Cyber Digest: !!️ BREAKING: Anthropic has embedded hidden spyware-like code in Claude Code that covertly targets Chinese users. It the...

Anthropic安全/对齐行业动态
21:51
Chubby♨️@kimmonismus
66
Meta计划出售多余AI计算能力

Meta 已投入数百亿美元建设 AI 数据中心和芯片,现计划通过出售多余 AI 算力和托管模型来变现。据 Bloomberg 报道,Meta 的商业模式将覆盖两个方向:类似 AWS Bedrock 的模型托管服务,以及类似 CoreWeave 的裸 GPU 算力租赁。这一举动将 Meta 推入拥挤但利润丰厚的赛道,同时也回应了投资者对巨额支出如何转化为收入的持续质疑。

Meta行业动态
20:54
Kling AI@Kling_ai
53
可灵 Kling AI 在 2026 戛纳狮子奖斩获银狮铜狮

可灵 Kling AI 宣布,由 Lipstick 制作、Sebastian Strasser 执导的短片《L'Ultimo Uomo Reale》(最后的真人)在 2026 年戛纳狮子奖上获奖:电影 – 消费品类银狮奖和新增的电影工艺 – AI 工艺类铜狮奖。片中大部分镜头由可灵 Kling AI 生成,展示出行业领先的角色一致性、电影级视觉效果和动作质量,成为导演创意的完美伙伴。

行业动态视频
20:21
Chubby♨️@kimmonismus
71
OpenAI首席经济学家:AI补充就业?数据已显严峻

OpenAI首席经济学家Ronnie Chatterji在ECB辛特拉会议上表示,AI可能补充而非替代就业,类比PC让经济学家更高效。但数据显示,AI采用最快的美国金融和信息行业,2026年平均每月减少2.8万个岗位。Challenger数据称今年已有约10.2万个岗位削减归因于AI,John Challenger认为其影响前所未有。

OpenAI行业动态
18:36
Alibaba Cloud@alibaba_cloud
25
阿里云Happy Horse助力短片《CLOCKWORKS》获AI电影节亚军

阿里云AI视频生成工具Happy Horse支撑短片《CLOCKWORKS》在AI电影节摩纳哥黑客马拉松中夺得第二名。影片由Jeni To创作,讲述一个女孩在冰冷齿轮世界中面对压抑的另一个自我,领悟到完美只能复制而无法创造,真正的创造力源自伤痕、焦虑与泪水。该片使用festival-grade AI工具将原始情感转化为视觉艺术,阿里云Happy Horse是背后的创意引擎。

行业动态
15:20
Chubby♨️@kimmonismus
37
Fable 5 于 7 月 1 日重新发布。 Pliny 在同一天再次将其越狱。 Fable 5 于 7 月 2 日再次下线。 :D

Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: WEN MYTHOS

安全/对齐行业动态
14:56
MiniMax (official)@MiniMax_AI
45
MiniMax 强化学习研究负责人姜松岩在 AI Engineer 大会第二天参加炉边谈话,与 Thom Wolf 探讨了稀疏注意力、从训练第一天就融入的原生多模态方案,以及开放权重对 AI 发展的意义。她强调分享了团队在这些方向的工作,并重申相信开放权重的重要性。

Olive Song: Backstage and onstage with @Thom_Wolf and @swyx . I really enjoyed the fireside chat! Thanks for having me back at @aiDo...

多模态开源生态行业动态
14:33
Thariq@trq212
30
我将担任AI Engineer World's Fair第二天(7月1日上午9点)的开幕主题演讲。期待与您相见,先睹为快。他正在为演示文稿做最后修改。

Thariq: I'll be giving the the Day 2 opening keynote at AI Engineer World's Fair on July 1st at 9am. Hope to see you there, here...

行业动态
14:20
Chubby♨️@kimmonismus
73
Anthropic Fable 5 全球重新上线

Anthropic 宣布 Fable 5 于 7 月 1 日起全球恢复上线,Mythos 5 仅限获批美国组织使用。新安全分类器可阻断特定越狱技术超过 99% 案例,被拦截的 Fable 5 请求回退至 Opus 4.8。Anthropic 承认这会增加正常编码调试的误报。7 月 7 日前 Fable 5 可免费使用最多 50% 周配额,之后需用量积分。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 伙伴起草 AI 越狱严重性评估共识框架,并扩大与美国政府在模型测试和防护方面的合作。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic安全/对齐模型发布行业动态
13:33
Thariq@trq212
72
Anthropic 宣布 Claude Fable 5 将于明日全球重新上线。新部署版本新增一组分类器,专门拦截更多网络安全任务。短期内,部分常规编码和调试任务将被标记并回退至 Opus 4.8。Anthropic 还与 Amazon、Microsoft、Google 等 Glasswing 合作方起草共识框架,用于评估 AI 越狱严重性及开发者应对策略。同时,公司正扩大与美政府在模型测试和安全方面的合作,包括预发布模型评估、越狱与滥用信息共享,以及联合研究资源投入。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic安全/对齐行业动态
12:29
🚨 AI News | TestingCatalog@testingcatalog
75
Anthropic 将于周三全球恢复 Claude Fable 5 访问。该模型计入每周使用上限的 50%,持续至 7 月 7 日,之后通过使用积分提供。为满足美国政府要求,Anthropic 部署新分类器阻止更多网络安全任务;短期内编码、调试等常规任务回退至 Opus 4.8。公司正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架,评估 AI 越狱严重性及开发者应对方式,并邀请其他厂商加入。Anthropic 还将扩大与美国政府在模型测试和安全方面的合作,包括预发布评估、越狱信息共享和联合研究。

Anthropic: Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...

Anthropic安全/对齐模型发布行业动态
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)X:Anthropic (@AnthropicAI)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
12:20
AYi@AYi_AInotes
54
Anthropic因阿里蒸馏Claude大规模封禁中国用户账号

Anthropic因阿里巴巴参与“蒸馏Claude”事件,大规模封禁中国用户账号,尤其集中在阿里巴巴总部所在地浙江,几乎无一幸免。推文调侃称,封号比公司通知停工还管用,AI账号一停直接导致生产力归零。

Anthropic安全/对齐行业动态
11:57
Anthropic@AnthropicAI
73
Claude Fable 5 明日起全球重新可用,新增网络安全分类器

Anthropic 宣布 Claude Fable 5 将于明天在全球重新可用。经与美国政府沟通,模型新增分类器以拦截更多网络安全任务;短期部分日常任务如编码和调试将回退至 Opus 4.8,后续将持续优化分类器减少误报。Anthropic 正与 Amazon、Microsoft、Google 等 Glasswing 合作伙伴起草共识框架,评估 AI 越狱严重性及应对措施。同时扩大与美国政府在模型预发布评估、越狱信息共享及联合研究方面的合作。

Anthropic安全/对齐模型发布行业动态
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)X:Anthropic (@AnthropicAI)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
10:35
SemiAnalysis@SemiAnalysis_
57
Google 下一代 TPU(Humufish)将改用 Intel EMIB-T 封装

Google 下一代 TPU(代号 Humufish)确认采用 Intel 的 EMIB-T 封装方案,而非行业默认的 TSMC CoWoS。目前几乎所有主流 AI 训练加速器都使用 TSMC 2.5D 流程,其中绝大部分是 CoWoS。CoWoS 技术将所有芯片放置在一块大型硅/重分布层(RDL)中介层上;而 Intel 的 EMIB 则仅在需要芯片间连接的位置嵌入小型硅桥,直接集成到有机基板中。这是旗舰级 AI 芯片首次脱离 CoWoS 生态,值得关注。

Google行业动态
10:23
Peter Steinberger 🦞@steipete
39
@steipete 将加入"Crafting Software Factories!"活动,周三晚6点在旧金山与 @zachlloydtweets 和 Google DeepMind 的 Paige Bailey 一起探讨 loops、软件工厂和编码的未来。届时见!

Warp: @steipete is now joining us for Crafting Software Factories! 📅 6pm Wed evening in SF after the @aiDotEngineer World's F...

DeepMind编码行业动态
09:26
MiniMax (official)@MiniMax_AI
19
@mochipomsky 是 @MiniMax_AI 的用户。你呢? (主推文:我们最喜欢的 vibe coder🧋)

Jackmin: @mochipomsky is a @MiniMax_AI user. when u?

行业动态
09:24
歸藏(guizang.ai)@op7418
63
Fable 5 终于要恢复了,不知道是面向美国人还是全球的

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic政策/监管行业动态
09:20
AYi@AYi_AInotes
58
美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制, 明天恢复访问,我以为这辈子再也用不到了😭

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic政策/监管行业动态
09:02
宝玉@dotey
65
美国商务部撤销对Anthropic两款模型Claude Fable 5和Mythos 5的出口管制

美国商务部撤销对Anthropic旗下Claude Fable 5和Mythos 5的出口管制,Anthropic将于周三恢复用户访问。解禁附有条件:需主动检测安全风险、配合政府制定发布流程、上报恶意使用,双方正讨论标准化评估体系。此前OpenAI也按要求限制GPT-5.6系列,但反对该审批模式。前白宫AI顾问Dean Ball批评Trump行政令造成事实强制许可制度,且无清晰安全标准。

Anthropic: We've received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5. We'll b...

Anthropic安全/对齐政策/监管行业动态
08:37
小互@xiaohu
23
小互推文"再次双双命中",引用其此前预测:Google今晚将发布新的🍌模型和低配版Omini模型,同时Anthropic的Claude Sonnet 5也将在今晚登场,而OpenAI暂无动静。

小互: Google 今晚将会发布 新的🍌模型和 低配版的 Omini 模型 另外根据情报显示:Claude Sonnet 5 也将会在今晚登场 OpenAI 还没动静...

AnthropicGoogle行业动态
08:28
ginobefun@hongming731
50
Sonnet 5发布,谷歌补齐媒体模型,吴恩达画出智能体开发三循环

Anthropic发布Claude Sonnet 5,定位最具agent能力的Sonnet,性能接近Opus 4.8,8月31日前入门价每百万输入token $2、输出$10。Google DeepMind推出Nano Banana 2 Lite(文生图延迟约4秒,每千张$0.034)和Gemini Omni Flash(多模态视频生成与会话式编辑,每秒$0.10,单次上限10秒)。吴恩达提出智能体开发三大核心循环:智能体编程循环、开发者反馈循环、外部反馈循环,强调人类在上下文判断上的优势。三条更新均围绕降低agent落地成本、完善媒体生成流水线及工程框架。

智能体AnthropicGoogle推理
‹ 上一页
1234…50
下一页 ›