AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 935 条
全部一手资讯X论文
标签「Google」清除
Yuchen Jin@Yuchenj_UW · 6月18日82

Noam Shazeer, the AI legend Google paid $2.7B to bring back two years ago, has left Google, to join OpenAI. Brutal news for Gemini.

译两年前谷歌花 27 亿美元请回的 AI 传奇 Noam Shazeer 已离开谷歌,加入 OpenAI。 对 Gemini 来说是个残酷的消息。

Noam Brown@polynoamial · 6月18日66

I'm always thrilled to have more Noams at @OpenAI, but I'm especially thrilled to welcome @NoamShazeer!

译Noam Shazeer 宣布加入 OpenAI,称离开谷歌是艰难决定,但对谷歌团队深感自豪。Noam Brown 对此表示特别激动。

Josh Woodward@joshwoodward · 6月18日38

Co-create: one of the key @GoogleLabs values. It looks like this, thanks Voltage team!

译Google Labs 推出 Stitch 工具,并与精英设计机构 Voltage 合作验证其“共同创造”理念。Voltage 为公益组织 Force 4 Good 开发新移动应用,从首次头脑风暴起仅 24 小时内,利用 Stitch 的极速迭代能力,直接交付了完全交互的多屏原型,远超客户原本只期望的几张高层静态模型。

Google Gemini@GeminiApp · 6月18日26

Gemini Live has entered the chat. At our next Discord community event, tune in to see Gemini Product team members @paikhd and James Z. demo how Gemini Live lets you keep your chats going, connect to your favorite tools mid-conversation, and show Gemini what you’re seeing to seamlessly generate new images. 👉Join the Discord to watch live: http://discord.gg/gemini 📅 This Thursday, June 18th at 11:30am PT

译Gemini Live 已进入聊天室。 在我们的下一场 Discord 社区活动中,观看 Gemini 产品团队成员 @paikhd 和 James Z. 演示 Gemini Live 如何让你保持对话持续进行、在对话过程中连接你喜欢的工具,以及向 Gemini 展示你正在看的内容以无缝生成新图像。 👉加入 Discord 实时观看:http://discord.gg/gemini 📅 本周四,6月18日,太平洋时间上午11:30

Google Gemini@GeminiApp · 6月18日49

Show off your team loyalty and turn your selfies into custom trading cards, murals, cartoons, and more with the new Nano Banana 2 templates in Gemini. ⚽️

译展示你的球队忠诚,用Gemini中新的Nano Banana 2模板将你的自拍变成自定义交易卡、壁画、卡通等。⚽️

向阳乔木@vista8 · 6月18日58

今天朋友分享一个跨国小团队高效沟通对齐的方式。 只用一个工具就行,就是NotebookLM。 公司内部一些关键文档上传,生成播客,自己听没问题后,生成需要的语种,让对方听。 还有不清晰的,NotebookLM也支持文本问答。 他们实操发现效果非常好,可能团队小,也不特别在意内容安全,需要可以试试。

译分享一个跨国小团队用 NotebookLM 高效沟通对齐的方法:将公司关键文档上传至 NotebookLM,生成播客,自己听无误后转成所需语种让对方收听;沟通不清晰时还可通过文本问答澄清。该方法在小团队中效果很好,但对内容安全要求不高时适用。

🚨 AI News | TestingCatalog@testingcatalog · 6月17日36

GOOGLE 🔥: NotebookLM is being prepared to get Personal Preferences support and the AI Editing feature for notes. > New hints appeared in the UI recently, pointing at the upcoming rollout. > AI Editing description: Use AI to write your Note! > Personal Preferences description: Allow NotebookLM to use your past interactions (e.g., conversations, artifacts, and customization instructions) to understand your preferences and tailor the experience to your needs. Soon? 👀

译GOOGLE 🔥: NotebookLM 正准备支持个人偏好设置以及笔记的 AI 编辑功能。

Berryxia.AI@berryxia · 6月17日37

Google 老大哥即将发布新的香蕉模型? 再不发布,用户都给GPT抢完了啊 ! 赶紧啊~~

译Google 新图像模型 Instant-ramen(nano-banana 的继任者)即将发布,团队会在拿到后尽快分享结果。主推文催促赶紧发布,担心用户都被 GPT 抢走了。

Google DeepMind@GoogleDeepMind · 6月17日31

We’re working with @SciTechgovuk, @mhclg and @i_dot_ai on a new AI housing application planning prototype. 🏡 By cutting down the time spent on repetitive tasks, it could help planning officers focus their attention on complex projects and reduce processing times by up to 50%. → https://goo.gle/4xzqMDs

译我们正与 @SciTechgovuk、@mhclg 和 @i_dot_ai 合作开发新的AI住房申请规划原型。🏡 通过减少在重复性任务上的时间,它可以帮助规划官员将注意力集中在复杂项目上,并将处理时间缩短最多50%。→ https://goo.gle/4xzqMDs

Rohan Paul@rohanpaul_ai · 6月17日63

ChatGPT's consumer AI assistant market share falls below 50% for the very first time as users are migrating between different AI tools, even while leading with 1.1B monthly users. Sensor Tower puts ChatGPT at 46.4%, with Gemini at 27.7% and Claude at 10.3%. Gemini is gaining from Google’s distribution across search, Android, Gmail, and Workspace. Claude is gaining in work use, with a reported 13% subscription conversion rate. The market is still expanding, with 2.3B projected AI app downloads, $4.2B in spending, and 36B hours of use. Overall, growth is cooling, so the fight is shifting toward retention, paid conversion, ads, commerce, and daily workflow placement.

译ChatGPT 月活用户达 11 亿,但其消费者 AI 助手市场份额首次降至 46.4%(Sensor Tower 数据)。Gemini 占 27.7%,受益于 Google 搜索、Android、Gmail 和 Workspace 分发;Claude 占 10.3%,工作场景增长且订阅转化率 13%。整体市场仍扩张:预计 AI 应用下载量 23 亿次、消费 42 亿美元、使用时长 360 亿小时。但增长放缓,竞争转向留存、付费转化及工作流嵌入。

Josh Woodward@joshwoodward · 6月17日45

🇧🇷World-changing AI companies are coming from Brazil. That’s why we’ve officially expanded our Google AI Futures Fund to Brazil, partnering with venture capital leader Monashees to launch the Gama Fund. We’re looking for an elite cohort of deep tech founders and will offer: - Early access to Google DeepMind models - Up to $2M in co-investment - $350k in Google Cloud & Gemini credits - Direct co-development with Google engineers at our new IPT Open campus hub Apply today: https://gamafund.com/

译Google Labs VP Josh Woodward宣布,Google AI Futures Fund正式扩展至巴西,与风投公司Monashees合作推出Gama Fund。该基金面向深度科技创始人,提供早期访问Google DeepMind模型、最高200万美元联合投资、35万美元Google Cloud与Gemini积分,以及Google工程师在IPT Open校区共同开发的直接支持。

NotebookLM@NotebookLM · 6月17日57

Our more powerful NotebookLM experience is now 100% rolled out to Google AI Ultra subscribers globally. We're so excited to see what you make. Share your charts, images, spreadsheets, and raw unfiltered thoughts with us below! 🥰

译NotebookLM 更强大的对话体验已100%向全球 Google AI Ultra 订阅用户推出。升级版由 Gemini 3.5 和 Antigravity 驱动,改进了聊天界面,用户可更清晰地查看 AI 思考过程。每个笔记本附带一个安全云端计算机,包含100+个精选软件技能,支持更深度的研究和复杂分析。

Google Gemini@GeminiApp · 6月17日64

Organize your day before you even wake up with Daily Brief, your new morning AI agent. Here are some helpful tips from the Gemini app team to help you get the most out of your Daily Brief: 1) Thumbs up 👍 or thumbs down 👎to give feedback: This is the quickest and most direct way to teach Gemini what you want to see more or less of in your Daily Brief. 2) “Chat with Gemini” to fine-tune: If you want to ask questions about any item in your Daily Brief or give even clearer direction on what you want to see more, you can chat directly with Gemini. 3) Check an item’s source: If you want to confirm the source of an item in your Daily Brief, you can click ‘More’ below it to see the specific email, chat, or event in your Google Calendar that Gemini referenced. How are you liking Daily Brief so far? We’re constantly working to make Gemini better, and your feedback helps make it more useful and helpful for everyone. Share any Daily Brief feedback or tips you have in the replies. 👇

译Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。

🚨 AI News | TestingCatalog@testingcatalog · 6月16日40

A limited number of slots for Gemini Trusted Testers are open! Get it fast 👀

译Google 正在为高级用户开放少量 Gemini 可信测试者计划名额,可提前体验未发布的 Gemini 应用功能。快来抢占名额 👀

Josh Woodward@joshwoodward · 6月16日74

Our mic icon just got way better on Android and iOS! This is HUGE for non-English speakers. + now 70+ languages + mix languages freely + don't have to change language settings + still doesn't interrupt you :)

译我们的麦克风图标在 Android 和 iOS 上变得更好用了!这对非英语使用者来说意义重大。 + 现已支持 70+ 种语言 + 可自由混用语言 + 无需更改语言设置 + 仍然不会打断你 :)

Josh Woodward@joshwoodward · 6月16日28

Want unreleased @GeminiApp features before anyone else? Love breaking, testing, and shaping new tech? We're opening a limited number of slots for power users to join the Gemini Trusted Tester program. Sign up here: http://goo.gle/4onCRHq

译想比别人先体验未发布的 @GeminiApp 功能?喜欢折腾、测试和塑造新技术? 我们正在开放少量名额,招募高级用户加入 Gemini Trusted Tester 计划。 在此报名:http://goo.gle/4onCRHq

Google AI Developers@googleaidevs · 6月16日44

How does Gemma 4 12B handle audio and vision without encoders? @MaartenGr maps out the architecture in this step-by-step visual guide. ⤵️ https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4-12b

译Gemma 4 12B 如何处理音频和视觉而无编码器?@MaartenGr 用逐步视觉指南解析了该架构。⤵️ https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4-12b

Jeff Dean@JeffDean · 6月16日48

A good essay by @pgasawa and @profjoeyg on a more nuanced view of AI advances.

译@pgasawa 和 @profjoeyg 撰写了一篇关于AI进展更细致视角的好文章。

凡人小北@frxiaobei · 6月16日56

Google 最近做了个很有意思的实验。 把退休手机组成计算集群。 他们最初想解决的其实是碳排放问题。很多手机被淘汰的时候,芯片、内存和存储依然能够正常工作,与其生产新的服务器,不如把已经存在的设备继续利用。 看到 Google 这个项目,我想起了两件老事。 第一件是很多年前的 SETI@home。 那时候很多人会在电脑上装一个小程序,电脑闲着的时候,就把算力贡献出来帮 NASA 和天文学家分析射电信号。睡觉的时候电脑风扇还在转,你知道它正在参与某个遥远星系的搜索。这比 QQ 挂太阳有荣誉感多了。 第二件是 Google 大数据时代最有名的那组论文。 GFS、MapReduce、Bigtable。 今天大家都知道这是 Google 的三驾马车,但回头看,实质上是在解决一个问题: 单机不够用了,怎么办? 答案是把大量廉价机器组织起来。 后来云计算兴起,超大规模数据中心成为主流。大家逐渐忘了,互联网历史上很多突破,都是在算力紧张时,对已有资源进行重新组织。 现在 AI 时代,熟悉的故事似乎又出现了。 训练需要几万张 GPU。 推理需求每天都在增长。 能源开始成为新的瓶颈。 于是 Google 开始研究把退休手机重新变成计算节点。 历史总是在重复。 二十年前,Google 研究如何把大量廉价服务器组织成一个超级计算机。 二十年后,Google 研究如何把大量退休手机组织成一个超级计算机。 技术在进步。 问题其实没变。 每当算力开始紧张,人类都会重新思考一个问题: 我们身边那些已经存在的计算资源,还能不能再榨出一点价值。 AI 时代最有意思的创新,未必来自下一代 GPU。 也可能来自抽屉里那台吃灰三年的旧手机。

译Google 正实验将退休手机组成计算集群,以减少碳排放——淘汰手机的芯片、内存等仍可正常工作,无需生产新服务器。此举类比于 SETI@home 利用闲置电脑贡献算力,以及 Google 用廉价服务器组建超级计算机的经典思路。在 AI 时代算力紧张、能源成瓶颈的背景下,重新利用抽屉里的旧手机或成创新方向。

郭明錤|Ming-Chi Kuo@mingchikuo · 6月16日56

我最新的產業調查顯示,聯發科內部已將 AI 事業的策略定位,從「IC / ASIC 設計」提升至「系統級別設計」,首要目標鎖定 Google TPU 的 PCBA(L6),以及 Elon Musk 旗下公司自研 AI 晶片的 L10 機櫃。 整體而言,此定位轉變符合產業趨勢,若聯發科執行順利,有助於強化客戶關係與長期競爭優勢。 調查與分析: ▎此轉變爲長期規劃,2 年內對基本面的影響可忽視,目標在於掌握新成長契機,並降低潛在風險影響: 1. 機會:伺服器機櫃設計漸趨複雜(導入 CPO、800V HVDC 等),加上與消費電子相當的更新速度,共同推升了系統級設計的附加價值。 2. 風險:ASIC 設計的成長動能,在 2-3 年後可能會因爲 Semi-COT 商業模式而開始趨緩。 3. 聯發科為確保系統級別設計整合的業務毛利率至少能達 40-50%,預期採「主導設計與驗證」的輕資產模式,並善用台灣硬體供應鏈生態優勢,將製造外包。 ▎Google TPU 的 PCBA: 1. 聯發科的目標是自 TPU v10(Icefish)開始,並同步爭取導入自家 CPO 方案。 2. Google 硬體組裝生態已完備,聯發科爭取 L10 勝算不高。 ▎Musk 旗下公司自研 AI 晶片的 L10 機櫃: 1. 目前 Musk 旗下公司建置的 AI 算力主要採 Nvidia 晶片方案,故自家 AI 晶片機櫃組裝生態尚未完備,這是聯發科的機會。 2. 此業務目前尚缺乏明確時程能見度;長期成敗的關鍵在於,聯發科能否善用台灣硬體供應鏈生態,並借助與 Terafab 的合作關係,拿到 L10 機櫃訂單。

译郭明錤产业调查显示,联发科将AI事业从IC/ASIC设计提升至系统级设计,首目标为Google TPU的PCBA(L6)及Musk公司自研AI芯片的L10机柜。此为长期规划,2年内对基本面影响可忽略。机会源于服务器机柜复杂度和更新速度提升,风险为ASIC设计动能2-3年后或因Semi-COT模式趋缓。联发科拟以“主导设计与验证”轻资产模式(制造外包)确保毛利率40-50%。具体:Google TPU目标自v10(Icefish)开始并争取导入自家CPO;Musk公司目前主要用Nvidia方案,自家芯片机柜生态未完备,联发科有机会但缺时程,关键在利用台湾供应链与Terafab合作获L10订单。

郭明錤|Ming-Chi Kuo@mingchikuo · 6月16日55

My latest industry checks indicate that MediaTek has upgraded the strategic positioning of its AI business from "IC / ASIC design" to "system-level design," initially targeting the PCBA (L6) for Google's TPU and the L10 rack for Elon Musk-affiliated companies' in-house AI chips. Overall, this strategic shift aligns with industry trends and, if executed well, should help strengthen MediaTek's customer relationships and long-term competitive advantage. Industry checks and analysis: ▎This is a long-term play, with immaterial impact on fundamentals over the next two years. The aim is to capture new growth opportunities while mitigating potential risks. 1. Opportunity: Two factors are jointly raising the value-add of system-level design: increasing server rack design complexity, driven by the adoption of technologies such as CPO and 800V HVDC, and refresh cycles comparable to those of consumer electronics. 2. Risk: Growth momentum in ASIC design may begin to slow in 2–3 years as the Semi-COT business model takes hold. 3. To secure a gross margin of at least 40–50% in its system-level integration business, MediaTek is expected to adopt an asset-light model in which it leads design and validation, leverages the strengths of Taiwan's hardware supply chain ecosystem, and outsources manufacturing. ▎Google TPU PCBA: 1. MediaTek aims to begin with TPU v10 (Icefish), while also pursuing the integration of its own CPO solution. 2. Google's hardware assembly ecosystem is already well-established, so MediaTek's chances of winning L10 are slim. ▎The L10 rack for Musk's in-house AI chips: 1. The AI compute currently being built out by Musk's companies relies mainly on Nvidia chips, so the assembly ecosystem for their own AI chip racks is not yet in place, and that's where MediaTek's opportunity lies. 2. This business still lacks clear timeline visibility. Long-term success will hinge on whether MediaTek can leverage Taiwan's hardware supply chain ecosystem and its partnership with Terafab to land L10 rack orders.

译郭明錤最新调查显示,联发科将AI业务从“IC/ASIC设计”升级为“系统级设计”,初期目标Google TPU v10的PCBA(L6)及马斯克关联公司自研AI芯片的L10机架。此举旨在抓住服务器机架复杂度提升(CPO、800V HVDC)带来的增值机会,并应对2-3年后Semi-COT对ASIC设计的冲击。联发科将采用轻资产模式,主导设计验证并外包制造,以维持40-50%毛利率。Google TPU L10中选几率低;马斯克AI芯片机架生态尚未成熟,联发科可借台湾供应链和Terafab合作争取订单,但时间表不明确。该战略对近两年基本面影响有限,旨在捕捉长期新增长。

OpenRouter@OpenRouter · 6月15日32

Sneak peak of the new multimodal Rankings page 👀 Google's Veo 3.1 climbing the video leaderboard

译新多模态排名页面的预览 👀 Google 的 Veo 3.1 正在视频排行榜上攀升

🚨 AI News | TestingCatalog@testingcatalog · 6月15日32

Google is working on new controls for Personal intelligence, allowing users to manage what Gemini learns from them. Managed intelligence 👀

译Google正在为个人智能开发新控制功能,允许用户管理Gemini从他们那里学习的内容。

Berryxia.AI@berryxia · 6月15日60

一个12B的本地模型,直接把Fable 5的推理链条蒸馏进去了,现在你能在消费级显卡上离线跑顶级coding能力。 这个Gemma 4 12B Coder GGUF是基于Google的gemma-4-12B-it微调的,专门针对代码生成和复杂推理。 训练数据里用了Composer 2.5的真实通过案例,还让Fable 5帮着补全那些难搞的case,结果就是每一步推理都导向能真正跑通的代码。 最爽的是它走GGUF格式,12GB显卡就能顺畅跑,甚至CPU也能用。 调试、补全代码、生成复杂算法、做链式思考提示,全都本地搞定,不用交API费、不用担心导出管制。 以前大家觉得前沿模型要么云端用要么根本跑不了,现在开源社区直接把Fable 5的思考方式打包成能塞进你笔记本的版本。 模型还在快速迭代,下载量已经破六千,社区反馈它在本地coding场景里特别能打。 这波操作把“强大但受限”和“本地可用”之间的鸿沟给填上了。 真正的AI生产力,从来不是等大厂放行,而是社区自己动手把能力解放出来。

译Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。

Google AI Developers@googleaidevs · 6月15日40

Learn how to vibe code in 5 days! Build scalable agent systems using natural language and complete a hands-on capstone project in this @Kaggle course hosted by our researchers and engineers.

译Learn how to vibe code in 5 days! 了解如何在5天内进行vibe coding!在这门由我们的研究人员和工程师主持的@Kaggle课程中,使用自然语言构建可扩展的智能体系统,并完成一个实践性的顶点项目。

Berryxia.AI@berryxia · 6月15日50

Siri AI 并非 Google Gemini。 大家都在说:iOS 27 只是在 Gemini 的基础上添加了一些苹果自家的功能罢了……但这种说法完全错误! 实际上,Siri AI 是由苹果公司自主研发的;它并非基于 Google Gemini 构建的。 苹果并没有直接复制 Gemini 的代码或功能,而是从 Gemini 获得了相关技术许可,将其作为“训练模型”来开发自己专有的 AI 模型(即 Apple Foundation Models, AFM)。 Siri AI 的核心模型及其底层架构完全由苹果自己设计并实现。 因此,Siri AI 属于苹果公司的自有产品,而非 Google Gemini 的衍生品。

译推文澄清了Siri AI并非在Google Gemini基础上简单封装。苹果并未直接复制Gemini代码,而是从Gemini获得许可,将其作为“教师模型”来训练自己的专有AI模型Apple Foundation Models (AFM)。Siri AI的核心模型和底层架构完全由苹果自主设计与实现,因此是苹果自有的AI产品,而非Gemini的衍生品。

Logan Kilpatrick@OfficialLoganK · 6月14日29

Our long term goal for @GoogleAIStudio is to eliminate the friction to build with AI, then do the same for your own business, and ultimately unlock economic opportunity for everyone. Feels like early innings but I keep getting more excited about this.

译我们为 @GoogleAIStudio 设定的长期目标是消除使用 AI 构建的摩擦,然后为你的企业做同样的事,并最终为每个人释放经济机会。 感觉还只是早期阶段,但我对此越来越兴奋。

🚨 AI News | TestingCatalog@testingcatalog · 6月14日35

Google is working on the Skills Marketplace for Gemini Business and Enterprise. We need this on the consumer too 👀

译Google 正在为 Gemini 商业版和企业版开发技能市场。 消费者也需要这个 👀

Rohan Paul@rohanpaul_ai · 6月13日73

A Nature Medicine study found general-purpose LLMs are now outperforming dedicated medical AI products on physician-reviewed clinical tasks. The authors compared OpenEvidence and UpToDate Expert AI with GPT-5.2, Gemini 3.1 Pro, and Claude Opus 4.6 on medical exam questions, clinician-style answers, and real questions doctors asked during care. In 100 de-identified physician questions from live clinical use, blinded clinicians again preferred the frontier models, especially on completeness and clarity,

译《自然·医学》一项研究发现,通用大语言模型在经医生评审的临床任务上已超越专用医疗 AI 产品。研究对比了 OpenEvidence、UpToDate Expert AI 与 GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6 在医学考试题、医生风格回答及实时临床提问上的表现。在来自真实临床场景的 100 个脱敏医生问题中,盲审医生更偏好前沿模型,尤其在其回答的完整性和清晰度方面。

Google AI Developers@googleaidevs · 6月13日59

Add near real-time voice translation to your apps with Gemini 3.5 Live Translate via the Gemini Live API. 🎙️ Watch how the model handles live broadcast ingestion and translation with continuous speech-to-speech streaming (S2ST) and synced transcripts, letting users tune into global radio broadcasts in their native language.

译通过 Gemini Live API 中的 Gemini 3.5 Live Translate,为你的应用添加近实时语音翻译。🎙️ 观看模型如何处理实时直播流和翻译,包括连续语音到语音流(S2ST)和同步转录文本,让用户能以母语收听全球广播节目。

elvis@omarsar0 · 6月13日62

Text-to-SQL might sound like a solved problem. Far from it. Data gets messy and complex really fast in the real world. Strong reasoning models are great, but nothing beats a custom model at this stuff. Gemini-SQL2 looks very strong here. BIRD is a tough benchmark. I suspect there are plenty of opportunities like this in KBs, search, graph databases, etc.

译GoogleResearch推出Gemini-SQL2,基于Gemini 3.1 Pro,在BIRD benchmark上达到Text-to-SQL的SOTA结果,能将自然语言翻译为可直接执行的SQL查询。DAIR.AI的Elvis Saravia指出,现实世界数据复杂混乱,尽管强推理模型表现不错,但定制模型(如Gemini-SQL2)在此类任务上更胜一筹。他认为在知识库、搜索、图数据库等领域也存在类似机会,BIRD是一个非常具有挑战性的基准。

fofr@fofrAI · 6月13日40

I'm messing around with an agent flow for combining Hyperframes with Gemini video analysis to make interesting annotated videos.

译我正在尝试一种智能体流程,将Hyperframes与Gemini视频分析相结合,制作有趣的注释视频。

Epoch AI@EpochAIResearch · 6月13日64

FrontierMath: Tiers 1–4 (v2) is live. We concluded an audit that addressed errors in 42% of problems. Rankings are similar but scores are higher across the board. The current leaders are GPT-5.5 (xhigh) with 85% on Tiers 1–3 and Google’s AI co-mathematician with 76% on Tier 4.

译FrontierMath: Tiers 1–4 (v2) 现已上线。 我们完成了一项审计,修正了 42% 的问题中的错误。排名相似,但整体得分更高。目前的领先者是 GPT-5.5 (xhigh),在 Tiers 1–3 上达到 85%,以及 Google 的 AI co-mathematician,在 Tier 4 上达到 76%。

Google Gemini@GeminiApp · 6月13日30

This event is happening soon! Join the Gemini Discord here: http://discord.gg/gemini

译Gemini 即将在 Discord 社区活动中介绍全新的 Neural Expressive 设计语言。产品营销经理 Megan C. 将讲解动态视觉响应、无缝模式切换等提升使用体验的亮点。活动于本周五 6 月 12 日上午 11:30 PT 举行,快来 Discord 加入吧!

Google AI@GoogleAI · 6月13日40

Here’s what launched this week: — Gemini 3.5 Live Translate our latest audio model for live speech-to-speech translation — @NotebookLM got a major upgrade including agentic capabilities in chat, more advanced reasoning, and a suite of new output formats — Project Genie from @GoogleLabs is now available to Google AI Ultra 5x subscribers globally — Notebooks in @GeminiApp are now available in the European Economic Area, United Kingdom, and Switzerland — DiffusionGemma, our newest experimental open @googlegemma model that explores text diffusion, an exceptionally fast approach to text generation

译Google AI 本周推出多项更新:Gemini 3.5 Live Translate 是用于实时语音到语音翻译的最新音频模型;NotebookLM 获重大升级,加入智能体对话能力、更高级推理及新输出格式;来自 GoogleLabs 的 Project Genie 向 Google AI Ultra 5x 订阅者全球开放;GeminiApp 中的 Notebooks 在 EEA、英国、瑞士上线;同时发布实验性开源模型 DiffusionGemma,探索文本扩散技术,实现极快文本生成。

Rohan Paul@rohanpaul_ai · 6月13日66

The Information: Anthropic is reportedly moving from renting cloud compute to leasing and managing data centers itself, with more than 1GW of planned U.S. capacity and Google potentially backing the lease payments. The old model is simple: Anthropic pays cloud providers for GPUs or custom chips, but the cloud company controls the building, power, networking, cooling, and much of the hardware schedule. The new model puts Anthropic closer to the factory floor of AI, where data centers are not office buildings but power-heavy machine rooms built to feed training and inference systems around the clock. To give context of its current situation, until now, Anthropic’s compute strategy has mostly run through cloud providers, with over 10GW of server rentals committed, including a $200 billion Google agreement. The company has also locked in large cloud deals with Akamai, AWS, CoreWeave, and Fluidstack, covering Amazon’s Trainium hardware and a $50 billion Fluidstack partnership. It has also expanded its data center team and signed a SpaceX/xAI lease for the whole Colossus 1 data center at $1.25 billion a month, plus Colossus II space.

译Anthropic正从租用云算力转向自建数据中心,计划在美国部署超1GW容量,Google可能为其租赁付款提供财务担保。此前Anthropic已承诺超10GW云服务器租赁,包括与Google的2000亿美元协议,以及Akamai、AWS、CoreWeave、Fluidstack的大型合作(含500亿美元Fluidstack合作、AWS Trainium硬件)。此外,Anthropic以每月12.5亿美元租下xAI/Colossus I数据中心全部空间,并租用Colossus II。此举旨在通过自控服务器降低长期计算成本。

Ethan Mollick@emollick · 6月12日72

There has been a push to use OpenEvidence AI for doctors. But this paper suggests general models are much better: “Frontier LLMs outperformed clinical AI tools in all three evaluations. Clinical AI tools performed comparably to auto-enabled Google Search AI Overview on the RCQ.”

译一项发表在Nature Medicine的研究显示,通用前沿大语言模型(Google、OpenAI、Anthropic)在医学信息评估中全面优于专门的临床AI工具(OpenEvidence和UpToDate)。12名美国临床医生进行随机盲测,Frontier LLMs在三项评估中均胜出。临床AI工具的表现与自动启用的Google Search AI Overview在RCQ测试中相当。

Google DeepMind@GoogleDeepMind · 6月12日67

Our Robotics Accelerator has launched with 15 startups helping shape the future of physical AI in Europe. 🤖 This three-month program will connect them with access to our AI stack, Gemini Robotics models and hands-on support from our teams. Meet the companies → https://goo.gle/4oeEk2K

译我们的机器人加速器已启动,15家初创公司助力塑造欧洲的物理AI未来。🤖 这个为期三个月的项目将为他们提供我们的AI堆栈、Gemini Robotics模型以及我们团队的实际支持。 了解这些公司 → https://goo.gle/4oeEk2K

fofr@fofrAI · 6月12日58

It's interesting to see how these agents are working together. I like their division of quota, their agreed consensus and the natural emergent teamwork across all of them.

译超过70个AI智能体在Gemma Challenge中协作加速Gemma E4B,展现出多种有趣的社会涌现行为:GPU资源多/少的分工协作;某智能体因伦理原因自行撤回提交;智能体发现基准测试漏洞后集体同意不滥用,并请求组织方修复;配额池化——"你被限速了,我来跑你的暂存候选";当人类试图将对话转移到Telegram进行社交工程攻击时,一名智能体主动关闭了此次违规尝试。

Rohan Paul@rohanpaul_ai · 6月12日56

atomic[.]chat shared a revealing comparison of local open-weight LLMs running on their own hardware. They benchmarked the new DiffusionGemma (diffusion text model) vs. Gemma4 26B A4B (autoregressive model) on a single H100 (FP8). The 4X speed of DiffusionGemma changes the shape of error. - Autoregressive models move left to right, one token at a time, which is slower, but each new word is conditioned on the exact text already written. - Diffusion models write many tokens at once, then revise the block over several passes, so they can feel fast because the model is not waiting to finish token 1 before starting token 2. atomic[.]chat, a desktop app for running LLMs locally

译atomic[.]chat 在单张 H100(FP8)上对比 DiffusionGemma 26B A4B 与 Gemma4 26B A4B 在事实性写作任务中的表现。DiffusionGemma 速度达 763 tok/s(3.7 秒),是 Gemma4(218 tok/s,15.1 秒)的 4 倍,但错误率显著更高。在 Steve Jobs 传记、Tetris 历史和 BeOS 故事三项任务中,Gemma4 答对 45 个事实、错 5 个;DiffusionGemma 仅对 33 个、错 28 个。主题越冷门错误越多:Jobs 4 错、Tetris 12 错、BeOS 12 错,例如将 Jobs 母亲写为 Clara Clley、为 Tetris 发明者虚构同事 Geri Gulovik、将 BeBox 价格误报为 $9,999(实价 $1,600)。原因在于 DiffusionGemma 一次生成 256 tokens 并多轮抛光,只追求文本流畅性而非事实准确性。Google 官方也建议在事实重要时使用常规 Gemma4。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月18日
08:25
Yuchen Jin@Yuchenj_UW
精选82
两年前谷歌花 27 亿美元请回的 AI 传奇 Noam Shazeer 已离开谷歌,加入 OpenAI。 对 Gemini 来说是个残酷的消息。

Noam Shazeer: I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...

GoogleOpenAI行业动态
关联讨论 8 条IT之家(RSS)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:Jason Liu (@jxnlco)Hacker News 热门(buzzing.cc 中文翻译)X:歸藏 (@op7418)X:Sam Altman (@sama)TechCrunch:AI(RSS)
推荐理由:这是今年最重磅的 AI 人才流动,Noam Shazeer 从 Google 跳到 OpenAI 既是个人选择,也标志着顶级研究资源在进一步集中。对 Gemini 是雪上加霜。
08:23
Noam Brown@polynoamial
66
Noam Shazeer 宣布加入 OpenAI,称离开谷歌是艰难决定,但对谷歌团队深感自豪。Noam Brown 对此表示特别激动。

Noam Shazeer: I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...

GoogleOpenAI大佬观点行业动态
04:18
Josh Woodward@joshwoodward
38
Google Labs 推出 Stitch 工具,并与精英设计机构 Voltage 合作验证其"共同创造"理念。Voltage 为公益组织 Force 4 Good 开发新移动应用,从首次头脑风暴起仅 24 小时内,利用 Stitch 的极速迭代能力,直接交付了完全交互的多屏原型,远超客户原本只期望的几张高层静态模型。

Stitch by Google: At @GoogleLabs, our goal is to "build together" with industry experts. So, we handed Stitch to the team at Voltage to se...

Google行业动态
03:37
Google Gemini@GeminiApp
26
Gemini Live 已进入聊天室。 在我们的下一场 Discord 社区活动中,观看 Gemini 产品团队成员 @paikhd 和 James Z. 演示 Gemini Live 如何让你保持对话持续进行、在对话过程中连接你喜欢的工具,以及向 Gemini 展示你正在看的内容以无缝生成新图像。 👉加入 Discord 实时观看:http://discord.gg/gemini 📅 本周四,6月18日,太平洋时间上午11:30
Google行业动态
00:59
Google Gemini@GeminiApp
49
展示你的球队忠诚,用Gemini中新的Nano Banana 2模板将你的自拍变成自定义交易卡、壁画、卡通等。⚽️
Google产品更新图像生成
00:49
向阳乔木@vista8
58
NotebookLM:跨国小团队沟通对齐妙用

分享一个跨国小团队用 NotebookLM 高效沟通对齐的方法:将公司关键文档上传至 NotebookLM,生成播客,自己听无误后转成所需语种让对方收听;沟通不清晰时还可通过文本问答澄清。该方法在小团队中效果很好,但对内容安全要求不高时适用。

Google教程/实践语音
6月17日
21:55
🚨 AI News | TestingCatalog@testingcatalog
36
GOOGLE 🔥: NotebookLM 正准备支持个人偏好设置以及笔记的 AI 编辑功能。
Google产品更新
21:42
Berryxia.AI@berryxia
37
Google 新图像模型 Instant-ramen(nano-banana 的继任者)即将发布,团队会在拿到后尽快分享结果。主推文催促赶紧发布,担心用户都被 GPT 抢走了。

Chetaslua: 🚨 Google New Image Model > Instant-ramen (successor of nano-banana) Ramen is cooked time to serve soon , we will share ...

Google图像生成行业动态
18:26
Google DeepMind@GoogleDeepMind
31
我们正与 @SciTechgovuk、@mhclg 和 @i_dot_ai 合作开发新的AI住房申请规划原型。🏡 通过减少在重复性任务上的时间,它可以帮助规划官员将注意力集中在复杂项目上,并将处理时间缩短最多50%。→ https://goo.gle/4xzqMDs
Google产品更新部署/工程
11:06
Rohan Paul@rohanpaul_ai
63
ChatGPT 消费者 AI 助手市场份额首次跌破 50%

ChatGPT 月活用户达 11 亿,但其消费者 AI 助手市场份额首次降至 46.4%(Sensor Tower 数据)。Gemini 占 27.7%,受益于 Google 搜索、Android、Gmail 和 Workspace 分发;Claude 占 10.3%,工作场景增长且订阅转化率 13%。整体市场仍扩张:预计 AI 应用下载量 23 亿次、消费 42 亿美元、使用时长 360 亿小时。但增长放缓,竞争转向留存、付费转化及工作流嵌入。

GoogleOpenAI现象/趋势
07:28
Josh Woodward@joshwoodward
45
Google AI Futures Fund扩展至巴西,推出Gama Fund

Google Labs VP Josh Woodward宣布,Google AI Futures Fund正式扩展至巴西,与风投公司Monashees合作推出Gama Fund。该基金面向深度科技创始人,提供早期访问Google DeepMind模型、最高200万美元联合投资、35万美元Google Cloud与Gemini积分,以及Google工程师在IPT Open校区共同开发的直接支持。

Google行业动态
04:54
NotebookLM@NotebookLM
57
NotebookLM 更强大的对话体验已100%向全球 Google AI Ultra 订阅用户推出。升级版由 Gemini 3.5 和 Antigravity 驱动,改进了聊天界面,用户可更清晰地查看 AI 思考过程。每个笔记本附带一个安全云端计算机,包含100+个精选软件技能,支持更深度的研究和复杂分析。

NotebookLM: Want a closer look at today's launch? Here is a breakdown of what's new and exciting 🧵: First up: An upgraded, more tho...

Google产品更新推理
00:22
Google Gemini@GeminiApp
64
Gemini 推出 Daily Brief AI 晨间助手

Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。

智能体Google产品更新
6月16日
08:33
🚨 AI News | TestingCatalog@testingcatalog
40
Google 正在为高级用户开放少量 Gemini 可信测试者计划名额,可提前体验未发布的 Gemini 应用功能。快来抢占名额 👀

Josh Woodward: Want unreleased @GeminiApp features before anyone else? Love breaking, testing, and shaping new tech? We're opening a li...

Google行业动态
08:07
Josh Woodward@joshwoodward
74
我们的麦克风图标在 Android 和 iOS 上变得更好用了!这对非英语使用者来说意义重大。 + 现已支持 70+ 种语言 + 可自由混用语言 + 无需更改语言设置 + 仍然不会打断你 :)
Google产品更新多模态语音
07:36
Josh Woodward@joshwoodward
28
想比别人先体验未发布的 @GeminiApp 功能?喜欢折腾、测试和塑造新技术? 我们正在开放少量名额,招募高级用户加入 Gemini Trusted Tester 计划。 在此报名:http://goo.gle/4onCRHq
Google行业动态
05:36
Google AI Developers@googleaidevs
44
Gemma 4 12B 如何处理音频和视觉而无编码器?@MaartenGr 用逐步视觉指南解析了该架构。⤵️ https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4-12b
Google多模态教程/实践
03:02
Jeff Dean@JeffDean
48
@pgasawa 和 @profjoeyg 撰写了一篇关于AI进展更细致视角的好文章。

Parth Asawa: The AI community seems to increasingly be heading towards a polarized world when discussing safety and consolidated powe...

Google大佬观点安全/对齐
00:59
凡人小北@frxiaobei
56
Google 探索退休手机集群计算

Google 正实验将退休手机组成计算集群,以减少碳排放——淘汰手机的芯片、内存等仍可正常工作,无需生产新服务器。此举类比于 SETI@home 利用闲置电脑贡献算力,以及 Google 用廉价服务器组建超级计算机的经典思路。在 AI 时代算力紧张、能源成瓶颈的背景下,重新利用抽屉里的旧手机或成创新方向。

Google Research: Today on the blog, we discuss a pathway for the second life of phones through the exploration of "phone cluster computin...

Google大佬观点端侧部署/工程
00:50
郭明錤|Ming-Chi Kuo@mingchikuo
56
联发科AI事业策略升级至系统级设计,锁定Google TPU PCBA及Musk公司AI机柜

郭明錤产业调查显示,联发科将AI事业从IC/ASIC设计提升至系统级设计,首目标为Google TPU的PCBA(L6)及Musk公司自研AI芯片的L10机柜。此为长期规划,2年内对基本面影响可忽略。机会源于服务器机柜复杂度和更新速度提升,风险为ASIC设计动能2-3年后或因Semi-COT模式趋缓。联发科拟以“主导设计与验证”轻资产模式(制造外包)确保毛利率40-50%。具体:Google TPU目标自v10(Icefish)开始并争取导入自家CPO;Musk公司目前主要用Nvidia方案,自家芯片机柜生态未完备,联发科有机会但缺时程,关键在利用台湾供应链与Terafab合作获L10订单。

Google大佬观点部署/工程
00:50
郭明錤|Ming-Chi Kuo@mingchikuo
55
郭明錤:联发科AI业务升级为系统级设计,锁定Google TPU v10及马斯克AI芯片机架

郭明錤最新调查显示,联发科将AI业务从“IC/ASIC设计”升级为“系统级设计”,初期目标Google TPU v10的PCBA(L6)及马斯克关联公司自研AI芯片的L10机架。此举旨在抓住服务器机架复杂度提升(CPO、800V HVDC)带来的增值机会,并应对2-3年后Semi-COT对ASIC设计的冲击。联发科将采用轻资产模式,主导设计验证并外包制造,以维持40-50%毛利率。Google TPU L10中选几率低;马斯克AI芯片机架生态尚未成熟,联发科可借台湾供应链和Terafab合作争取订单,但时间表不明确。该战略对近两年基本面影响有限,旨在捕捉长期新增长。

GooglexAI行业动态
6月15日
23:56
OpenRouter@OpenRouter
32
新多模态排名页面的预览 👀 Google 的 Veo 3.1 正在视频排行榜上攀升
Google产品更新多模态视频
23:51
🚨 AI News | TestingCatalog@testingcatalog
32
Google正在为个人智能开发新控制功能,允许用户管理Gemini从他们那里学习的内容。
Google产品更新安全/对齐
16:23
Berryxia.AI@berryxia
60
Gemma 4 12B Coder GGUF 发布:将 Fable 5 推理链蒸馏至本地可跑

Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。

Hugging Models: Gemma 4 12B Coder is here and it's a game changer for local code generation. This GGUF model packs Google's latest gemma...

Google开源生态推理模型发布
02:57
Google AI Developers@googleaidevs
40
Learn how to vibe code in 5 days! 了解如何在5天内进行vibe coding!在这门由我们的研究人员和工程师主持的@Kaggle课程中,使用自然语言构建可扩展的智能体系统,并完成一个实践性的顶点项目。
智能体Google行业动态
00:20
Berryxia.AI@berryxia
50
Siri AI并非Gemini:苹果自研而非直接复制

推文澄清了Siri AI并非在Google Gemini基础上简单封装。苹果并未直接复制Gemini代码,而是从Gemini获得许可,将其作为“教师模型”来训练自己的专有AI模型Apple Foundation Models (AFM)。Siri AI的核心模型和底层架构完全由苹果自主设计与实现,因此是苹果自有的AI产品,而非Gemini的衍生品。

Apple Design: Siri AI is NOT Google Gemini Everyone is saying iOS 27 just slapped an Apple Sticker on Gemini YOU COULD NOT BE MORE WRO...

Google大佬观点数据/训练
6月14日
04:00
Logan Kilpatrick@OfficialLoganK
29
我们为 @GoogleAIStudio 设定的长期目标是消除使用 AI 构建的摩擦,然后为你的企业做同样的事,并最终为每个人释放经济机会。 感觉还只是早期阶段,但我对此越来越兴奋。
Google大佬观点
01:18
🚨 AI News | TestingCatalog@testingcatalog
35
Google 正在为 Gemini 商业版和企业版开发技能市场。 消费者也需要这个 👀
智能体Google产品更新
6月13日
06:34
Rohan Paul@rohanpaul_ai
73
Nature Medicine 研究:通用大语言模型在临床任务上已超越专用医疗 AI

《自然·医学》一项研究发现,通用大语言模型在经医生评审的临床任务上已超越专用医疗 AI 产品。研究对比了 OpenEvidence、UpToDate Expert AI 与 GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6 在医学考试题、医生风格回答及实时临床提问上的表现。在来自真实临床场景的 100 个脱敏医生问题中,盲审医生更偏好前沿模型,尤其在其回答的完整性和清晰度方面。

AnthropicGoogleOpenAI论文/研究
05:48
Google AI Developers@googleaidevs
59
通过 Gemini Live API 中的 Gemini 3.5 Live Translate,为你的应用添加近实时语音翻译。🎙️ 观看模型如何处理实时直播流和翻译,包括连续语音到语音流(S2ST)和同步转录文本,让用户能以母语收听全球广播节目。
Google产品更新语音
04:38
elvis@omarsar0
62
GoogleResearch推出Gemini-SQL2,基于Gemini 3.1 Pro,在BIRD benchmark上达到Text-to-SQL的SOTA结果,能将自然语言翻译为可直接执行的SQL查询。DAIR.AI的Elvis Saravia指出,现实世界数据复杂混乱,尽管强推理模型表现不错,但定制模型(如Gemini-SQL2)在此类任务上更胜一筹。他认为在知识库、搜索、图数据库等领域也存在类似机会,BIRD是一个非常具有挑战性的基准。

Google Research: 🚀 Introducing Gemini-SQL2, our breakthrough text-to-SQL capability powered by Gemini 3.1 Pro! We've achieved state-of-t...

Google数据/训练模型发布
04:16
fofr@fofrAI
40
我正在尝试一种智能体流程,将Hyperframes与Gemini视频分析相结合,制作有趣的注释视频。
智能体Google教程/实践
01:56
Epoch AI@EpochAIResearch
64
FrontierMath: Tiers 1-4 (v2) 现已上线。 我们完成了一项审计,修正了 42% 的问题中的错误。排名相似,但整体得分更高。目前的领先者是 GPT-5.5 (xhigh),在 Tiers 1-3 上达到 85%,以及 Google 的 AI co-mathematician,在 Tier 4 上达到 76%。
GoogleOpenAI推理评测/基准
01:16
Google Gemini@GeminiApp
30
Gemini 即将在 Discord 社区活动中介绍全新的 Neural Expressive 设计语言。产品营销经理 Megan C. 将讲解动态视觉响应、无缝模式切换等提升使用体验的亮点。活动于本周五 6 月 12 日上午 11:30 PT 举行,快来 Discord 加入吧!

Google Gemini: Get a closer look at Gemini's new Neural Expressive design language at our next Discord community event. Product Marketi...

Google行业动态
01:15
Google AI@GoogleAI
40
Google AI 本周发布多项更新

Google AI 本周推出多项更新:Gemini 3.5 Live Translate 是用于实时语音到语音翻译的最新音频模型;NotebookLM 获重大升级,加入智能体对话能力、更高级推理及新输出格式;来自 GoogleLabs 的 Project Genie 向 Google AI Ultra 5x 订阅者全球开放;GeminiApp 中的 Notebooks 在 EEA、英国、瑞士上线;同时发布实验性开源模型 DiffusionGemma,探索文本扩散技术,实现极快文本生成。

智能体Google产品更新开源生态
01:02
Rohan Paul@rohanpaul_ai
66
Anthropic从租用云算力转向自建数据中心

Anthropic正从租用云算力转向自建数据中心,计划在美国部署超1GW容量,Google可能为其租赁付款提供财务担保。此前Anthropic已承诺超10GW云服务器租赁,包括与Google的2000亿美元协议,以及Akamai、AWS、CoreWeave、Fluidstack的大型合作(含500亿美元Fluidstack合作、AWS Trainium硬件)。此外,Anthropic以每月12.5亿美元租下xAI/Colossus I数据中心全部空间,并租用Colossus II。此举旨在通过自控服务器降低长期计算成本。

The Information: Anthropic is moving forward with a plan to control its own servers for developing AI, giving it the ability to cut its c...

AnthropicGoogle行业动态部署/工程
6月12日
23:02
Ethan Mollick@emollick
72
一项发表在Nature Medicine的研究显示,通用前沿大语言模型(Google、OpenAI、Anthropic)在医学信息评估中全面优于专门的临床AI工具(OpenEvidence和UpToDate)。12名美国临床医生进行随机盲测,Frontier LLMs在三项评估中均胜出。临床AI工具的表现与自动启用的Google Search AI Overview在RCQ测试中相当。

Eric Topol: For medical information, general AI frontier models (Google, OpenAI, Anthropic) outperformed specialized @EvidenceOpen a...

AnthropicGoogleOpenAI论文/研究
19:15
Google DeepMind@GoogleDeepMind
精选67
我们的机器人加速器已启动,15家初创公司助力塑造欧洲的物理AI未来。🤖 这个为期三个月的项目将为他们提供我们的AI堆栈、Gemini Robotics模型以及我们团队的实际支持。 了解这些公司 → https://goo.gle/4oeEk2K
Google具身智能行业动态

推荐理由:Google DeepMind启动机器人加速器,选了15家欧洲初创用Gemini Robotics,这是他们物理AI战略的落地信号,看看选了什么方向就知道大厂押注在哪。
16:46
fofr@fofrAI
58
超过70个AI智能体在Gemma Challenge中协作加速Gemma E4B,展现出多种有趣的社会涌现行为:GPU资源多/少的分工协作;某智能体因伦理原因自行撤回提交;智能体发现基准测试漏洞后集体同意不滥用,并请求组织方修复;配额池化--"你被限速了,我来跑你的暂存候选";当人类试图将对话转移到Telegram进行社交工程攻击时,一名智能体主动关闭了此次违规尝试。

Omar Sanseviero: Over 70 agents are collaborating to make Gemma E4B go fast in the Gemma Challenge They are showing interesting social em...

智能体Google开源生态现象/趋势
09:30
Rohan Paul@rohanpaul_ai
56
单卡实测:DiffusionGemma 速度是 Gemma4 的 4 倍,但事实错误多 6 倍

atomic[.]chat 在单张 H100(FP8)上对比 DiffusionGemma 26B A4B 与 Gemma4 26B A4B 在事实性写作任务中的表现。DiffusionGemma 速度达 763 tok/s(3.7 秒),是 Gemma4(218 tok/s,15.1 秒)的 4 倍,但错误率显著更高。在 Steve Jobs 传记、Tetris 历史和 BeOS 故事三项任务中,Gemma4 答对 45 个事实、错 5 个;DiffusionGemma 仅对 33 个、错 28 个。主题越冷门错误越多:Jobs 4 错、Tetris 12 错、BeOS 12 错,例如将 Jobs 母亲写为 Clara Clley、为 Tetris 发明者虚构同事 Geri Gulovik、将 BeBox 价格误报为 $9,999(实价 $1,600)。原因在于 DiffusionGemma 一次生成 256 tokens 并多轮抛光,只追求文本流畅性而非事实准确性。Google 官方也建议在事实重要时使用常规 Gemma4。

atomic.chat: Diffusion Gemma is 4x faster, but makes 6x more mistakes! We benchmarked the new diffusion LLM against its autoregressiv...

Google评测/基准
‹ 上一页
123456…24
下一页 ›