AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 936 条
全部一手资讯X论文
标签「Google」清除
Berryxia.AI@berryxia · 5月5日66

兄弟们!Anthropic刚刚把“用AI建一家公司”的完整蓝图正式公开了。 画面直接炸裂: CEO只有1个人(而且可以去睡觉), 剩下的全部员工都是AI。 它们自己分配任务、自己决策、自己推进项目, 人类只需要设定目标,剩下的全交给AI团队自动跑。 这不是科幻,这是Anthropic联合Google Cloud刚刚发布的《Agent Stack》官方指南。 核心就是一套完整的“AI企业操作系统”: - ADK(Agent Development Kit):开源框架,3个文件就能跑起第一个AI员工(http://agent.py + .env + __init__.py),几分钟出结果。 - MCP协议:让AI能无缝调用任何外部工具(搜索、代码执行、内部数据库…),两行代码就搞定。 - Vertex AI Agent Engine:生产级部署神器,一键把AI扔进云端,自动监控、自动扩容、自动日志,彻底告别手动搭服务器的痛苦。 - A2A(Agent-to-Agent)协议:让不同框架的AI也能互相沟通,像真正的公司部门协作一样。 更狠的是工作流模式: - Sequential(串行)→ 一步接一步 - Parallel(并行)→ 同时干好几件事 - Loop(循环)→ 直到达成目标才停 - 再加上Session(短期记忆)+ Memory(长期记忆),AI不再是每次都失忆的机器人,而是真正“认识你”的长期员工。 实际案例已经跑通: 客服自动处理→内部数据分析→代码生成+PR提交… 以前要几小时甚至几天的事,现在AI几秒到几分钟就搞定。 Anthropic这次直接把“AI替你上班”这件事,从概念变成了可复制的工程模板。 工作真的在死去吗? 至少传统“一个人干一摊活”的模式,正在被“一个人类指挥一群AI”彻底取代。 当AI能24小时不睡觉、不休息、不抱怨地给你干活, 你还愿意继续用老方式工作吗? 这个蓝图值得每一个想用AI放大自己产能的人立刻存下来。 完整线程值得反复看。 你准备好让AI替你组建团队了吗?

译Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。

Google Gemini@GeminiApp · 5月5日45

Help us build the I/O countdown! Using Gemini Canvas, vibe code your most creative idea and send it to us by May 6th at the link below. Game? Fluid simulator? Playable synthesizer? The only rule is it has to feature a large number between 1 and 10. The most interesting creations will be featured on the big screen at Google I/O 2026! For more info and to submit your creation, head here: https://io.google/2026/codethecountdown Check the replies for some sample projects to get you started ⬇️

译帮助我们打造I/O倒计时! 使用Gemini Canvas,用代码挥洒你最富创意的想法,并在5月6日前通过下方链接发送给我们。 游戏?流体模拟器?可演奏合成器?唯一的规则是必须包含一个1到10之间的大数字。 最有趣的创作将在Google I/O 2026的大屏幕上展示! 获取更多信息并提交作品,请访问:https://io.google/2026/codethecountdown 查看回复中的示例项目以获取灵感⬇️

小互@xiaohu · 5月4日56

据传Google将在本月的Google I/O 大会上发布一个全新的模型 将 Gemini 从“聊天助手”推向“全模态生产力入口” 一个名为Omni 的疑似新模型泄露 它可能会承担更深的视频与多模态生成能力,甚至让 Gemini 原生支持视频输出,而不只是文字、图片和调用外部视频模型。 如果这个方向成立,Gemini 接下来真正要拼的就不只是模型分数,而是“一个入口完成多种内容生产”:写作、图片、视频、长上下文记忆、复杂任务流,全部都在 Gemini 里打通。 同时,Gemini 3.2、3.5 也被传正在测试,重点可能会放在更快、更高效的推理体验上。 Ultra 版本则可能继续往长上下文、重记忆、多步骤工作流方向演进,服务那些需要连续执行、反复调用上下文的高价值任务。

译据传谷歌将在I/O大会发布名为“Omni”的新模型,旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出,超越现有的Veo 3.1。同时,Gemini 3.2/3.5版本或专注于提升推理速度与效率,而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型。

Chubby♨️@kimmonismus · 5月4日51

This SVG surfaced in an AI Studio A/B test window, and it’s hard to believe it’s actually vector-generated. likely from Google’s new Flash/Pro model. So freaking hyped for Google i/o! 2 weeks to go!

译这个SVG在AI Studio的A/B测试窗口中浮现,很难相信它实际上是矢量生成的。很可能来自谷歌的新Flash/Pro模型。 对谷歌I/O大会超级兴奋!还有两周!

Ethan Mollick@emollick · 5月4日52

Poems that ChatGPT, Claude, and Gemini all seem to "like" when you ask for poetry related to being/making LLMs: Rilke's "Archaic Torso of Apollo" Stevens' "Idea of Order at Key West" Borges's "The Golem" (or "The Other Tiger") Pessoa's "Autopsychography" Pretty apt choices!

译当你向ChatGPT、Claude和Gemini索要与大型语言模型存在/创作相关的诗歌时,它们似乎都"偏爱"这几首: 里尔克的《阿波罗的躯干》 史蒂文斯的《基韦斯特的秩序观》 博尔赫斯的《假人》(或《另一只老虎》) 佩索阿的《自心理学》 相当贴切的选择!

TestingCatalog News 🗞@testingcatalog · 5月4日52

Google is working on Figma and GitHub import options for AI Studio Build. h/t @Thomas16937378

译Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378

TestingCatalog News 🗞@testingcatalog · 5月4日48

GOOGLE 🚨: A new design for Gemini on iOS has been spotted! Sleeeeeeeeeeeek! 👀

译GOOGLE 🚨: 在iOS上发现了Gemini的新设计! 丝滑流畅!👀

Berryxia.AI@berryxia · 5月4日51

Google CEO 桑达尔表示,AI 不会被一家公司或少数几家公司控制! 这个领域变化太快,大型实验室、初创公司、开源模型和政府都将成为这场竞赛的一部分 “AI 与以往任何技术都不一样”!

Chubby♨️@kimmonismus · 5月3日42

Rumors so far: - Google Gemini Flash 3.2/3.5 (already being tested) - New Omni Model, maybe even updated Veo in competition to Seedance - "spark Robin" - new visual model?

译目前的传闻: - Google Gemini Flash 3.2/3.5(已在测试中) - 新的Omni模型,甚至可能推出更新的Veo来与Seedance竞争 - "spark Robin"——新的视觉模型?

TestingCatalog News 🗞@testingcatalog · 5月3日45

Google is working on a new Flow app for Android. It is a native Flow experience optimised for mobile use. Beta testing is limited to 1000 testers for now.

译Google 正在开发一款新的 Android 版 Flow 应用。 这是针对移动使用优化的原生 Flow 体验。目前 Beta 测试仅限 1000 名测试者。

Chubby♨️@kimmonismus · 5月3日45

Google Omni model incoming. Probably being prepared for google i/o. However i assume they will launch a new video model with it instead of Veo 3.1 since Seedance jumped to the top a few months ago

译据泄露信息显示,谷歌可能正在为其Gemini平台测试一款全新的Omni模型,专注于视频生成功能,其界面标语为“由Omni驱动”。该模型的内部代号接近当前基于Veo的视频工具“Toucan”。分析指出,若谷歌正式发布名为Gemini Omni的视频生成模型,其性能很可能超越现有的Veo 3.1版本。此举若成真,Gemini将成为首个具备视频输出能力的顶级Omni模型,相关进展或于即将到来的Google I/O大会上正式公布。

TestingCatalog News 🗞@testingcatalog · 5月3日58

GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template. Powered by Omni." > This is a new leaked headline from the video generation tab on Gemini. > Omni appears close to "Toucan", an internal name of the current video generation tool powered by Veo. > If Google plans to release Gemini Omni for video generation, it would likely outperform Veo 3.1. > If true (as it is still highly speculative), Gemini will be the first top-tier Omni model with video output! Google I/O 2026 will be hot 🔥

译谷歌正在其Gemini平台测试一款名为“Omni”的新模型,专注于视频生成功能。泄露信息显示,该模型的界面提示用户“从一个想法开始或尝试一个模板”,并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关,后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni,其性能很可能超越当前的Veo 3.1版本。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型,这标志着谷歌在视频生成领域的重大技术进展,并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。

Ethan Mollick@emollick · 5月2日29

(Sorry, after seeing so many of these, could not resist): 🚨 BREAKING: Google just dropped a NEW paper that completely deletes RNNs from existence. No recurrence. No convolutions. Nothing. Just one mechanism. And it’s destroying every translation benchmark on the planet. The title alone is a flex: “Attention Is All You Need” Vaswani. Shazeer. Parmar. Uszkoreit. Jones. Gomez. Kaiser. Polosukhin. 8 researchers. 1 architecture. The entire field of NLP will never be the same. Here’s why this is INSANE → LSTMs took DAYS to train. This thing trains in 12 hours on 8 GPUs. 🤯 → 28.4 BLEU on English-to-German. That’s not an improvement. That’s a MASSACRE. They beat the previous SOTA by over 2 points. → English-to-French? 41.8 BLEU. At a FRACTION of the training cost of every model that came before it. → They called it the “Transformer.” The name alone tells you they knew. But here’s the part nobody is talking about 👇 They threw out sequential processing ENTIRELY. Every other model on Earth processes words one at a time. This thing looks at the ENTIRE sentence simultaneously and figures out what matters. It’s called “self-attention” and it’s basically the model asking itself: “which words should I care about right now?” Every. Single. Token. In parallel. Do you understand what this means? Training that used to take WEEKS now takes HOURS. Models that couldn’t scale past a few layers? This thing stacks 6 encoders and 6 decoders like it’s nothing. And the multi-head attention? 8 attention heads running at once, each learning DIFFERENT relationships in the data. I’m not being dramatic when I say this paper just rewrote the rulebook. RNNs are cooked. 💀 LSTMs are cooked. 💀 The future is attention. And attention is ALL you need. Follow for more 🔔

译谷歌研究团队在论文《Attention Is All You Need》中提出全新的Transformer模型,完全摒弃了RNN和LSTM等传统循环与卷积结构,仅依赖自注意力机制并行处理整个句子。该模型在机器翻译任务上取得突破性性能:英德翻译达到28.4 BLEU分,以超过2分的优势超越先前最佳模型;英法翻译达41.8 BLEU分,且训练成本极低。仅用8块GPU在12小时内即可完成训练,其多注意力头机制能同时学习数据中的不同关系。这一成果标志着NLP领域的根本性范式转变。

Rohan Paul@rohanpaul_ai · 5月2日79

US military reaches deal with 7 biggest AI labs to use their AI on classified systems Pentagon expands classified-network AI agreements to seven to eight firms — Google, Microsoft, AWS, NVIDIA, OpenAI, Reflection, and SpaceX — with Anthropic explicitly excluded. AI now its core infrastructure. The Pentagon said AI would now be used for any "lawful operational use". "GenAI[.]mil, the War Department's official AI platform, is already demonstrating the scale and impact of this acceleration. Over 1.3 million Department personnel have used the platform, generating tens of millions of prompts and deploying hundreds of thousands of agents in only five months. " --- war .gov/News/Releases/Release/Article/4475177/classified-networks-ai-agreements/

译美国国防部已与七至八家领先AI公司达成协议,将其AI技术整合进机密网络系统。合作方包括谷歌、微软、AWS、英伟达、OpenAI、Reflection和SpaceX,而Anthropic被明确排除在外。五角大楼将AI定位为核心基础设施,允许其用于任何“合法的作战用途”。官方平台GenAI.mil上线五个月内,已有超130万国防部人员使用,生成了数千万次提示并部署了数十万个AI智能体,展现了该计划的规模与影响力。

Chubby♨️@kimmonismus · 5月2日51

Nice! Google is preparing for I/o. New models soon

译不错!Google 正在为 I/O 大会做准备。新模型即将推出

TestingCatalog News 🗞@testingcatalog · 5月2日66

GOOGLE 🚨: A new Gemini Flash model has been spotted on LM Arena. Besides that, Vertex AI customers who still use Gemini Flash 2 received an email that it will be distributed soon. > Transition to Gemini 3.1 Flash Lite - Generaly Available soon! Soon 🔜 h/t @hishtadlut

译谷歌新的Gemini Flash模型已在LM Arena上出现。同时,Vertex AI客户收到邮件,Gemini 3.1 Flash Lite即将正式发布。引用推文指出,虽然模型在竞技场中仍显示为“Gemini 3 Flash”,但其输出质量已跃升两个层级,性能更接近当前的Gemini 3.1 Pro,是一次重大升级,实际版本可能是3.1、3.2或3.5 Flash。

Berryxia.AI@berryxia · 5月2日35

Gemini 中可以直接选择NotebookLM 也确实方便很多,学习笔记做个互动笔记网页什么的就挺好。

Demis Hassabis@demishassabis · 5月2日67

Really enjoyed this conversation - thanks again @garrytan for hosting!

译DeepMind创始人Demis Hassabis在访谈中回顾了从国际象棋神童到获得诺贝尔化学奖的生涯,并探讨了实现AGI仍需解决的关键挑战,如记忆、推理与持续学习。他分析了小模型能力提升、多模态Gemini设计以及推理成本下降的趋势,强调AI已成为科学研究的强大工具,从蛋白质预测扩展到虚拟细胞研究。Hassabis还为创业者提供了前瞻性建议,指出在AGI到来前应关注的方向及AI驱动科学发现的潜力。

Chubby♨️@kimmonismus · 5月2日56

Google's CEO just named three companies as TPU customers on the Alphabet earnings call. Problem: Two of the three don't actually use TPUs. A Google Cloud spokesperson confirmed this to @erinkwoo but declined to explain how the error occurred. Even better: one of those companies, Thinking Machines Lab (Mira Muratis company, ex OpenAI CTO), is actually running NVIDIA GB300 NVL72 on Google Cloud. Per Google's own press release from April 22. So Google's best example of a TPU customer… is an NVIDIA GPU customer. NVIDIA and Google Cloud have partnered for over a decade across infrastructure, libraries, and managed services. That partnership is clearly paying off, just not for TPUs. Very interesting.

译谷歌CEO在财报电话会上点名三家TPU客户,但其中两家实际上并未使用TPU,谷歌云发言人已确认此错误但未解释原因。更值得注意的是,被点名的Thinking Machines Lab(由前OpenAI CTO创立)实际上在谷歌云上运行的是NVIDIA GB300 NVL72 GPU。这显示NVIDIA与谷歌云的长达十年的合作伙伴关系正在取得成效,但并非体现在TPU的推广上。

Google Gemini@GeminiApp · 5月2日61

Give the topics you chat about most their own homes. 🗂️ Swipe to learn how you can stay organized with notebooks in Gemini and let us know how you’re using them in the replies.

译为你最常聊的话题安个家。🗂️ 滑动了解如何在Gemini中使用记事本保持条理,并在回复中告诉我们你如何使用它们。

Google AI Developers@googleaidevs · 5月2日22

📣 We want to showcase what you’ve created this week! Drop your Gemini Embedding 2, Lyria 3, and Gemma 4 builds below ↓

译📣 我们想展示您本周的创作成果! 请在下方分享您基于 Gemini Embedding 2、Lyria 3 和 Gemma 4 构建的作品 ↓

Google Gemini@GeminiApp · 5月2日16

Speed recognizes speed. ⚡️ @sonic_hedgehog made a pit stop at the Gemini Paddock at @McLarenF1 Racing Live: Miami

译速度识别速度。⚡️ @sonic_hedgehog 在迈凯伦F1赛车现场直播迈阿密站的Gemini维修区做了短暂停留

Google Gemini@GeminiApp · 5月2日40

Speed recognizes speed. ⚡️ @sonicthehedgehog made a pit stop at the Gemini Paddock at @McLarenF1 Racing Live: Miami

译速度识别速度。⚡️ @sonicthehedgehog 在 @McLarenF1 赛车现场迈阿密站的 Gemini 维修区稍作停留

Google DeepMind@GoogleDeepMind · 5月2日61

Think your vibe coding and creativity could be on the #GoogleIO main stage? Show us. As we countdown to the start of the show, the best ideas built with @GeminiApp or @GoogleAIStudio will be featured – think protein simulators, physics engines, or math-based art. 🔢

译认为你的氛围编程和创意能登上#GoogleIO主舞台吗?展示给我们看。 随着我们进入节目开始的倒计时,使用@GeminiApp或@GoogleAIStudio构建的最佳创意将被重点展示——比如蛋白质模拟器、物理引擎或基于数学的艺术。🔢

Google AI@GoogleAI · 5月2日41

I/O is less than 3 weeks away 🤯 We want YOU to help us create the countdown that will play before the keynote begins. Using @GoogleAIStudio or Canvas in @GeminiApp vibe code your most creative countdown concept and send it to us by May 6th. The only rule is that your build has to feature a large number between 1 and 10. Check the replies in this thread for sample projects to draw inspiration from or remix. You can find more info and directions on how to submit your builds here: http://goo.gle/codethecountdown

译谷歌I/O开发者大会即将在不到三周后举行,官方现面向公众征集创意倒计时视频。参与者需使用Google AI Studio或Gemini应用中的Canvas功能,通过代码创作一个包含1到10之间大数字的倒计时概念,并在5月6日前提交。官方在推文回复中提供了示例项目以供参考或混音创作,更多提交信息可通过指定链接获取。

Google AI Developers@googleaidevs · 5月2日50

Bring your code to the I/O stage ⭐️ Help us vibe code the keynote countdown using @GoogleAIStudio. Submit your creation for a chance to be featured on the big stage.

译将你的代码带上 I/O 舞台 ⭐️ 帮助我们使用 @GoogleAIStudio 为 keynote 倒计时营造编程氛围。提交你的创作,即有机会在大型舞台上展示。

ginobefun@hongming731 · 5月1日56

@addyosmani 最近写的关于「长效运行的智能体」非常硬核且启发性十足。 随着我们在全栈软件开发和技术架构上的不断探索,单次对话式的 AI 辅助已经逐渐显露出明显的局限性。当我们尝试通过编写详尽的系统文档和接口规范来驱动 AI 替我们完成复杂的工程任务时,经常会发现模型会遗忘早期的上下文,或者在任务只完成了一小部分时就草率宣告结束。这篇文章正好为我们指明了下一个重要的技术演进方向,也就是「长效运行」的 AI 智能体。 这篇文章的核心观点非常清晰。过去两年,大家对 AI 的普遍认知基本停留在聊天窗口和一问一答的简单循环中。你输入一个目标,看着代码一行行生成,当上下文完全填满时,这个工作流就被迫终止了。这种模式的天花板非常明显。行业未来的趋势是那些能够跨越多个会话、多个执行沙盒,甚至持续运行数天到数周的智能体。它们具备极强的系统韧性,能够从失败中自动恢复,留下结构化的工作成果,并在下次启动时完美接续之前的进度。想象一下,当一个智能体可以持续自主运行 30 个小时,独立完成一个复杂的全栈代码迁移项目时,这种经济价值的跨越将彻底改变我们评估技术投入的方式。 构建这样的长效智能体面临着三面难以逾越的高墙。 - 首先是上下文窗口的物理限制。即使是拥有 100 万 token 的超大窗口,在长时间的运行中也会出现上下文腐烂的现象,导致模型性能严重下降。 - 其次是缺乏持久化状态。如果没有外部记忆机制,每次会话重启就像是全新的实习生入职,完全不知道上一个班次发生了什么。 - 最后是自我验证的天然缺陷。模型在评估自己的工作时往往盲目自信,极其缺乏客观独立的质量把控机制。 为了翻越这些高墙,行业内的头部团队给出了各自的解法,并且底层的技术思路高度一致。 - Anthropic 提出了大脑、双手与会话彻底解耦的架构理念。他们将负责逻辑推理的模型、负责执行代码的沙盒环境,以及记录所有操作的事件日志完全分离开来。这样一来,即便执行环境意外崩溃,全新的容器也能通过读取底层事件日志完美恢复之前的状态。 - Cursor 在长效编码场景中,采用了规划者、执行者和裁判的明确角色分工模式。不同的角色由不同尺寸的模型来担任,并且支持将耗时较长的重构任务推送到云端后台静默运行。 - Google 更是将其全面平台化,推出了包含运行时环境、会话管理和持久化记忆库的企业级服务,将复杂的工程挑战转化成了开箱即用的云平台标准化组件。 文章还精准提炼了将这些前沿概念落地到生产环境的 5 种核心设计模式。 - 我们可以把智能体当作常驻的后台服务来看待,定期将中间状态写入磁盘以实现断点续传。在遇到关键的业务决策节点时,智能体可以暂时挂起并保留完整的推理链条,等待人类审查通过后实现毫秒级的瞬间恢复。 - 我们还可以像管理微服务架构一样去精细化管理智能体的记忆库,或者利用多智能体编排技术,让不同的专家级智能体在严格的权限隔离下分工协作。 - 另外还有一种无监督的环境处理模式,智能体可以全天候监听数据流并根据独立的策略网关持续做出响应。 对于每天都在实践由系统规范驱动开发的我们来说,这篇文章给出了极具操作性的工程建议。在启动长效任务之前,必须通过物理文件写下硬性且明确的完成条件。这就要求我们在让 AI 真正动手写代码之前,提供清晰且具备可测试性的需求规格文档,防止智能体在漫长的运行中途悄悄篡改最初设定的目标。此外,绝对不能让执行代码的智能体自己去验收结果,系统架构中必须引入物理隔离的独立评估机制。我们还需要在事件日志的建设上投入更多精力,确保智能体在过去 24 小时内的所有行为都是结构化、可随时追溯并且可重演的。 目前长效智能体依然面临着 API 成本极易失控、沙盒安全攻击面扩大以及目标对齐严重偏移等现实挑战。想要人工审核一天一夜的机器自主操作日志,也需要耗费极大的心力。现在的技术重点已经从单纯追求大模型的智商,转移到了外围的工程基建层面。我们需要将绝大部分精力投入到状态管理、会话持久化以及结构化的任务交接机制上。 这篇深度长文非常值得大家抽时间细细品味。

译文章探讨了超越单次对话的“长效运行”AI智能体,其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦(如Anthropic)、角色分工(如Cursor)与平台化服务(如Google)应对。生产落地需关注明确任务定义、独立评估机制及结构化日志,技术重点已转向状态管理与会话持久化等工程基建。

Berryxia.AI@berryxia · 5月1日54

Gemini Embedding 2 已正式发布! RAG 知识库的应用又可以支持的更好了。

Rohan Paul@rohanpaul_ai · 5月1日74

Alphabet shares surged roughly 9%, adding approximately $420 billion in market cap—the largest single-day gain on record. Alphabet is now within ~6% of Nvidia’s market cap. Google Cloud’s 63% growth outpaced recent quarters for AWS and Azure. Key driver: enterprise adoption of AI solutions built on Gemini models and custom TPUs

译Alphabet股价大涨约9%,市值单日增加约4200亿美元,创下历史最大单日涨幅纪录。其市值目前仅比全球市值最高的上市公司Nvidia低约6%。这一强劲表现的核心驱动力来自Google Cloud,其营收实现了63%的增长,增速超过了近期AWS和Azure的表现。增长主要得益于企业客户广泛采用基于Gemini模型和定制TPU构建的AI解决方案。

Ethan Mollick@emollick · 5月1日47

Forget goblins, things that GPT-5.5 really likes in its fiction: lighthouses, the ocean, maps, bells, clock towers with bells that ring impossible times, Mira Vale, resonances and echoes (Claude and Gemini love them too), secret third things (not night/day, not high/low)...

译忘掉妖精吧,GPT-5.5在其虚构作品中真正喜欢的东西是:灯塔、海洋、地图、钟声、敲响不可能时刻的钟楼、米拉谷、共振与回声(Claude和Gemini也喜欢这些)、秘密的第三事物(不是白天/黑夜,不是高/低)...

Google Gemini@GeminiApp · 5月1日31

See how @anyma_eva partnered with Gemini and @googledeepmind to dissolve the distance between imagining and creating. 🧵

译看看 @anyma_eva 如何与 Gemini 和 @googledeepmind 合作,消弭想象与创造之间的距离。🧵

Rohan Paul@rohanpaul_ai · 5月1日56

Time published a piece. Google’s AI position came from a long series of early bets by Sundar Pichai on DeepMind, TPUs, cloud infrastructure, and AI products, not from a last-minute reaction to ChatGPT. Google’s biggest strength in AI is its full-stack control of research, chips, cloud, products, and distribution across billions of users. "Critics once underestimated CEO Sundar Pichai. Now, critics wonder if he’s made Google too powerful" Google just secured absolute architectural control over the AI landscape by merging its custom physical silicon manufacturing directly with a single unified research laboratory. Competitors pay steep financial premiums for external chips while Google seamlessly executes complex neural calculations on its proprietary Tensor Processing Units. Building internal hardware allows engineers to aggressively scale pretraining, the critical phase where models ingest massive datasets, without facing crushing financial overhead. --- time .com/collection/time100-most-influential-companies/2026/saudi-aramco/

译《时代》杂志指出,谷歌在人工智能领域的领先地位,源于CEO桑达尔·皮查伊早期对DeepMind、TPU芯片、云基础设施及AI产品的一系列长期投资,而非对ChatGPT的仓促反应。其核心优势在于对研究、芯片、云服务、产品和覆盖数十亿用户的分发渠道实现全栈控制。通过将定制芯片制造与统一的研究实验室深度融合,谷歌获得了对AI架构的绝对控制权,能利用自研TPU高效执行复杂计算,同时让工程师得以低成本大规模扩展模型预训练,而无需像竞争对手那样承受高昂的外部芯片采购成本。

Google AI@GoogleAI · 5月1日69

Last week, we made Gemini Embedding 2, our first natively multimodal embedding model, available to the general public. Since then, developers have used it to build video analysis tools, visual shopping assistants, and more. But you might be wondering... what is an embedding model? 🤔 Let’s break it down! 1. What is it? Think of an embedding model as a "universal translator." It takes text, images, video, and audio data and turns them into a long string of numbers, like a unique digital fingerprint. 2. How does it work? Historically, search has been text only. Now, instead of just matching data by keyword, Gemini Embedding 2 maps multiple modalities in the same space based on meaning. It "feels" the connection between a video of a soccer goal and the words "game-winning shot" without needing tags. For example, "ocean" and "waves" are placed close together, but "ocean" and "toaster" are miles apart. 3. How can you use it? Developers have been using it to incorporate smarter search functionality into their builds. This means creating tools where you can snap a photo of a product and type "find this in yellow," or search through thousands of hours of video by describing what happens in a scene. 4. Ready to try it out for yourself? You can start using it today via the Gemini API or the Gemini Enterprise Agent Platform.

译谷歌上周正式向公众发布了其首个原生多模态嵌入模型Gemini Embedding 2。该模型如同“通用翻译器”,能将文本、图像、视频和音频数据转化为独特的数字向量。其核心突破在于不再依赖关键词匹配,而是基于语义将不同模态的数据映射到同一空间,从而理解内容间的深层联系。开发者已利用该模型构建视频分析工具、视觉购物助手等应用,实现通过拍照或描述场景进行智能搜索的功能。模型现可通过Gemini API或Gemini Enterprise Agent平台使用。

NotebookLM@NotebookLM · 5月1日64

Notebooks in @GeminiApp are officially available to Free and Paid users on mobile! 🥳 (Coming soon to additional countries in Europe!)

译Gemini App中的Notebooks功能现已正式在移动端向免费和付费用户开放,并计划很快扩展至更多欧洲国家。此次更新标志着NotebookLM与Gemini的深度集成,用户现可直接在Gemini App内访问所有个人未共享的笔记本,并能将Gemini的聊天记录用作新笔记本或现有笔记本的资料来源。功能推出将分阶段进行:首先面向网页版的Google AI Ultra、Pro和Plus订阅用户,未来几周将逐步覆盖移动端用户、更多欧洲地区以及免费用户。

Google AI Developers@googleaidevs · 5月1日58

Now that Gemini Embedding 2 is GA, let’s explore what the model unlocks — from agentic multimodal RAG to visual search — as it maps text, images, video, audio, and documents into a unified embedding space.

译既然Gemini Embedding 2已正式发布,让我们探索该模型解锁的功能——从智能多模态RAG到视觉搜索——因为它能将文本、图像、视频、音频和文档映射到统一的嵌入空间。

NotebookLM@NotebookLM · 5月1日64

Notebooks in @GeminiApps are officially available to Free and Paid users on mobile! 🥳 (Coming soon to additional countries in Europe!)

译Google的Gemini应用正式向移动端免费和付费用户推出Notebooks功能,并即将扩展至更多欧洲国家。该功能允许用户在Gemini应用内直接访问所有个人未共享的笔记本,并能将与该AI的对话内容作为新笔记本或现有笔记本的资料来源。此次发布首先面向网页端的Google AI Ultra、Pro和Plus订阅用户,后续将逐步推广至移动端、更多欧洲地区及免费用户。

Google DeepMind@GoogleDeepMind · 4月30日47

AI co-clinician is our new research initiative to help explore how multimodal agents could better support healthcare workers and patients. 🩺 Here’s a snapshot of our progress 🧵

译AI协同临床医生是我们新的研究计划,旨在探索多模态智能体如何更好地支持医护人员和患者。🩺 以下是我们进展的概览🧵

Chubby♨️@kimmonismus · 4月30日62

Cloud revenue explodes, stocks still tumble: Meta, Amazon, Alphabet and Microsoft earnings: All four tech giants reported Q1 2026 earnings on the same day, and every single one beat Wall Street expectations. Alphabet led the pack with $109.9 billion in revenue, up 22% year over year, as Google Cloud exploded 63% to cross $20 billion for the first time. Microsoft posted $82.9 billion in revenue with Azure growing 40%, while Meta surged 33% to $56.3 billion in revenue and Amazon hit $181.5 billion with AWS growing 28%, its fastest pace in 15 quarters. But here's the number that shook markets: combined 2026 capex across the four hyperscalers is on track to exceed $650 billion!! Alphabet raised its full year 2026 capex guidance to $180 billion to $190 billion, Microsoft guided $190 billion for calendar year 2026, and Meta bumped its range to $125 billion to $145 billion. Amazon's capex reached $44.2 billion in Q1 alone. The revenue beats were massive, but so was the market's anxiety: Meta slid 6% and Microsoft dropped 2.5% after hours, even as Alphabet shares rose 7% in after-hours trading, on course to open at a record market value. The hyperscalers are collectively spending more on AI infrastructure than the GDP of most nations, completely reshaping the global economy around compute. Whether this bet generates returns proportional to its scale will define tech investing for the next decade, at least thats for sure.

译Meta、亚马逊、Alphabet和微软2026年第一季度营收均超预期,云业务增长强劲,其中Google Cloud收入暴涨63%首次突破200亿美元。然而,四家超大规模企业2026年资本开支总额预计将超过6500亿美元,巨额AI基础设施投资引发市场焦虑,导致Meta和微软股价在盘后下跌。这些巨头在计算领域的投入规模正重塑全球经济,其投资能否带来相应回报将定义未来十年的科技投资格局。

Demis Hassabis@demishassabis · 4月30日16

Not bad at all… 😀🚀

译相当不错… 😀🚀

Ethan Mollick@emollick · 4月30日33

I think the Gemini chatbot has all the pieces to be a useful tool, but struggles to put it all together. It still doesn't seem to know what files it can create or how its tools work together. It also seems to get "discouraged" a lot, giving up rather than finding new solutions.

译我认为Gemini聊天机器人具备了成为有用工具的所有要素,但难以将其整合起来。它似乎仍然不清楚自己能创建哪些文件,也不明白其工具之间如何协同工作。 它还经常显得“气馁”,宁愿放弃而不是寻找新的解决方案。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月5日
01:14
Berryxia.AI@berryxia
66
Anthropic发布《Agent Stack》蓝图:构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。

智能体AnthropicGoogleMCP/工具
00:28
Google Gemini@GeminiApp
45
帮助我们打造I/O倒计时! 使用Gemini Canvas,用代码挥洒你最富创意的想法,并在5月6日前通过下方链接发送给我们。 游戏?流体模拟器?可演奏合成器?唯一的规则是必须包含一个1到10之间的大数字。 最有趣的创作将在Google I/O 2026的大屏幕上展示! 获取更多信息并提交作品,请访问:https://io.google/2026/codethecountdown 查看回复中的示例项目以获取灵感⬇️
Google行业动态
5月4日
21:24
小互@xiaohu
56
传谷歌I/O将发布Omni模型,Gemini或升级为全模态生产力入口

据传谷歌将在I/O大会发布名为“Omni”的新模型,旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出,超越现有的Veo 3.1。同时,Gemini 3.2/3.5版本或专注于提升推理速度与效率,而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频
16:46
Chubby♨️@kimmonismus
51
这个SVG在AI Studio的A/B测试窗口中浮现,很难相信它实际上是矢量生成的。很可能来自谷歌的新Flash/Pro模型。 对谷歌I/O大会超级兴奋!还有两周!

Chubby♨️: Rumors so far: - Google Gemini Flash 3.2/3.5 (already being tested) - New Omni Model, maybe even updated Veo in competit...

Google图像生成多模态行业动态
12:51
Ethan Mollick@emollick
52
当你向ChatGPT、Claude和Gemini索要与大型语言模型存在/创作相关的诗歌时,它们似乎都"偏爱"这几首: 里尔克的《阿波罗的躯干》 史蒂文斯的《基韦斯特的秩序观》 博尔赫斯的《假人》(或《另一只老虎》) 佩索阿的《自心理学》 相当贴切的选择!
AnthropicGoogle大佬观点
02:51
TestingCatalog News 🗞@testingcatalog
52
Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378
Google产品更新编码
00:51
TestingCatalog News 🗞@testingcatalog
48
GOOGLE 🚨: 在iOS上发现了Gemini的新设计! 丝滑流畅!👀
Google产品更新
00:13
Berryxia.AI@berryxia
51
Google CEO 桑达尔表示,AI 不会被一家公司或少数几家公司控制! 这个领域变化太快,大型实验室、初创公司、开源模型和政府都将成为这场竞赛的一部分 "AI 与以往任何技术都不一样"!
Google大佬观点现象/趋势
5月3日
20:15
Chubby♨️@kimmonismus
42
目前的传闻: - Google Gemini Flash 3.2/3.5(已在测试中) - 新的Omni模型,甚至可能推出更新的Veo来与Seedance竞争 - "spark Robin"--新的视觉模型?
Google多模态行业动态视频
17:21
TestingCatalog News 🗞@testingcatalog
45
Google 正在开发一款新的 Android 版 Flow 应用。 这是针对移动使用优化的原生 Flow 体验。目前 Beta 测试仅限 1000 名测试者。

Lance Adams X: @FlowbyGoogle dropped a beta for an Android app yesterday and I didn't see it anywhere Capped at 1000 (already full) rig...

Google产品更新
16:45
Chubby♨️@kimmonismus
45
据泄露信息显示,谷歌可能正在为其Gemini平台测试一款全新的Omni模型,专注于视频生成功能,其界面标语为"由Omni驱动"。该模型的内部代号接近当前基于Veo的视频工具"Toucan"。分析指出,若谷歌正式发布名为Gemini Omni的视频生成模型,其性能很可能超越现有的Veo 3.1版本。此举若成真,Gemini将成为首个具备视频输出能力的顶级Omni模型,相关进展或于即将到来的Google I/O大会上正式公布。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频
06:50
TestingCatalog News 🗞@testingcatalog
58
谷歌I/O动态:Gemini测试用于视频生成的新Omni模型

谷歌正在其Gemini平台测试一款名为“Omni”的新模型,专注于视频生成功能。泄露信息显示,该模型的界面提示用户“从一个想法开始或尝试一个模板”,并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关,后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni,其性能很可能超越当前的Veo 3.1版本。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型,这标志着谷歌在视频生成领域的重大技术进展,并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。

Google多模态模型发布视频
5月2日
22:50
Ethan Mollick@emollick
29
谷歌提出革命性Transformer架构:仅需注意力机制,彻底改变NLP领域

谷歌研究团队在论文《Attention Is All You Need》中提出全新的Transformer模型,完全摒弃了RNN和LSTM等传统循环与卷积结构,仅依赖自注意力机制并行处理整个句子。该模型在机器翻译任务上取得突破性性能:英德翻译达到28.4 BLEU分,以超过2分的优势超越先前最佳模型;英法翻译达41.8 BLEU分,且训练成本极低。仅用8块GPU在12小时内即可完成训练,其多注意力头机制能同时学习数据中的不同关系。这一成果标志着NLP领域的根本性范式转变。

Google现象/趋势
18:11
Rohan Paul@rohanpaul_ai
精选79
美国军方与多家顶尖AI公司达成协议,将在机密网络部署其人工智能技术

美国国防部已与七至八家领先AI公司达成协议,将其AI技术整合进机密网络系统。合作方包括谷歌、微软、AWS、英伟达、OpenAI、Reflection和SpaceX,而Anthropic被明确排除在外。五角大楼将AI定位为核心基础设施,允许其用于任何“合法的作战用途”。官方平台GenAI.mil上线五个月内,已有超130万国防部人员使用,生成了数千万次提示并部署了数十万个AI智能体,展现了该计划的规模与影响力。

GoogleOpenAI行业动态部署/工程

推荐理由:美军把AI正式拉进机密作战系统,排除Anthropic是个强烈信号——AI军事化已不可逆,安全派的克制在真实战场需求面前不堪一击。
15:44
Chubby♨️@kimmonismus
51
不错!Google 正在为 I/O 大会做准备。新模型即将推出

can: 🚨 Google updated Gemini 3 Flash in arena It still has the same name "Gemini 3 Flash". However, output quality is two ti...

Google模型发布评测/基准
13:49
TestingCatalog News 🗞@testingcatalog
66
谷歌新的Gemini Flash模型已在LM Arena上出现。同时,Vertex AI客户收到邮件,Gemini 3.1 Flash Lite即将正式发布。引用推文指出,虽然模型在竞技场中仍显示为"Gemini 3 Flash",但其输出质量已跃升两个层级,性能更接近当前的Gemini 3.1 Pro,是一次重大升级,实际版本可能是3.1、3.2或3.5 Flash。

can: 🚨 Google updated Gemini 3 Flash in arena It still has the same name "Gemini 3 Flash". However, output quality is two ti...

Google模型发布评测/基准
09:11
Berryxia.AI@berryxia
35
Gemini 中可以直接选择NotebookLM 也确实方便很多,学习笔记做个互动笔记网页什么的就挺好。
Google教程/实践
03:50
Demis Hassabis@demishassabis
精选67
DeepMind创始人Demis Hassabis在访谈中回顾了从国际象棋神童到获得诺贝尔化学奖的生涯,并探讨了实现AGI仍需解决的关键挑战,如记忆、推理与持续学习。他分析了小模型能力提升、多模态Gemini设计以及推理成本下降的趋势,强调AI已成为科学研究的强大工具,从蛋白质预测扩展到虚拟细胞研究。Hassabis还为创业者提供了前瞻性建议,指出在AGI到来前应关注的方向及AI驱动科学发现的潜力。

Y Combinator: Demis Hassabis (@demishassabis) has had one of the most extraordinary careers in tech. He started as a chess prodigy and...

Google大佬观点
关联讨论 1 条X:Demis Hassabis (@demishassabis)
推荐理由:Demis 这次没聊虚的,直接把 AGI 的瓶颈摊开讲——记忆、推理、持续学习,每个点都是创业者的机会清单,做 Agents 的可以反复看。
03:14
Chubby♨️@kimmonismus
56
谷歌CEO点名TPU客户出错,两公司实未使用

谷歌CEO在财报电话会上点名三家TPU客户,但其中两家实际上并未使用TPU,谷歌云发言人已确认此错误但未解释原因。更值得注意的是,被点名的Thinking Machines Lab(由前OpenAI CTO创立)实际上在谷歌云上运行的是NVIDIA GB300 NVL72 GPU。这显示NVIDIA与谷歌云的长达十年的合作伙伴关系正在取得成效,但并非体现在TPU的推广上。

Erin Woo: ONE MORE INTERESTING TIDBIT from Google earnings yesterday: Google named three customers using TPUs. However, two of the...

Google现象/趋势
02:19
Google Gemini@GeminiApp
61
为你最常聊的话题安个家。🗂️ 滑动了解如何在Gemini中使用记事本保持条理,并在回复中告诉我们你如何使用它们。
Google产品更新
02:10
Google AI Developers@googleaidevs
22
📣 我们想展示您本周的创作成果! 请在下方分享您基于 Gemini Embedding 2、Lyria 3 和 Gemma 4 构建的作品 ↓
Google行业动态
01:49
Google Gemini@GeminiApp
16
速度识别速度。⚡️ @sonic_hedgehog 在迈凯伦F1赛车现场直播迈阿密站的Gemini维修区做了短暂停留
Google行业动态
00:49
Google Gemini@GeminiApp
40
速度识别速度。⚡️ @sonicthehedgehog 在 @McLarenF1 赛车现场迈阿密站的 Gemini 维修区稍作停留
Google行业动态
00:20
Google DeepMind@GoogleDeepMind
61
认为你的氛围编程和创意能登上#GoogleIO主舞台吗?展示给我们看。 随着我们进入节目开始的倒计时,使用@GeminiApp或@GoogleAIStudio构建的最佳创意将被重点展示--比如蛋白质模拟器、物理引擎或基于数学的艺术。🔢
Google行业动态
00:19
Google AI@GoogleAI
41
谷歌征集创意倒计时,为I/O大会暖场

谷歌I/O开发者大会即将在不到三周后举行,官方现面向公众征集创意倒计时视频。参与者需使用Google AI Studio或Gemini应用中的Canvas功能,通过代码创作一个包含1到10之间大数字的倒计时概念,并在5月6日前提交。官方在推文回复中提供了示例项目以供参考或混音创作,更多提交信息可通过指定链接获取。

Google行业动态
00:09
Google AI Developers@googleaidevs
50
将你的代码带上 I/O 舞台 ⭐️ 帮助我们使用 @GoogleAIStudio 为 keynote 倒计时营造编程氛围。提交你的创作,即有机会在大型舞台上展示。
Google行业动态
5月1日
22:11
ginobefun@hongming731
56
长效运行AI智能体的趋势、挑战与设计模式

文章探讨了超越单次对话的“长效运行”AI智能体,其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦(如Anthropic)、角色分工(如Cursor)与平台化服务(如Google)应对。生产落地需关注明确任务定义、独立评估机制及结构化日志,技术重点已转向状态管理与会话持久化等工程基建。

智能体AnthropicGoogle大佬观点
08:10
Berryxia.AI@berryxia
54
Gemini Embedding 2 已正式发布! RAG 知识库的应用又可以支持的更好了。
Google检索增强模型发布
04:09
Rohan Paul@rohanpaul_ai
精选74
Alphabet股价大涨约9%,市值单日增加约4200亿美元,创下历史最大单日涨幅纪录。其市值目前仅比全球市值最高的上市公司Nvidia低约6%。这一强劲表现的核心驱动力来自Google Cloud,其营收实现了63%的增长,增速超过了近期AWS和Azure的表现。增长主要得益于企业客户广泛采用基于Gemini模型和定制TPU构建的AI解决方案。

The Kobeissi Letter: BREAKING: Alphabet, $GOOGL, has added +$420 billion in market cap today and is now just 6% away from surpassing Nvidia a...

Google行业动态

推荐理由:Alphabet 一天涨出 4200 亿美元,云业务靠着 Gemini 和 TPU 追上来,这是 AI 商业化第一次在财报里这么清晰,科技巨头座次可能真要重排。
03:15
Ethan Mollick@emollick
47
忘掉妖精吧,GPT-5.5在其虚构作品中真正喜欢的东西是:灯塔、海洋、地图、钟声、敲响不可能时刻的钟楼、米拉谷、共振与回声(Claude和Gemini也喜欢这些)、秘密的第三事物(不是白天/黑夜,不是高/低)…
AnthropicGoogleOpenAI大佬观点
02:15
Google Gemini@GeminiApp
31
看看 @anyma_eva 如何与 Gemini 和 @googledeepmind 合作,消弭想象与创造之间的距离。🧵
DeepMindGoogle多模态行业动态
02:09
Rohan Paul@rohanpaul_ai
56
谷歌AI领先优势源于长期战略投资,非仓促应对ChatGPT

《时代》杂志指出,谷歌在人工智能领域的领先地位,源于CEO桑达尔·皮查伊早期对DeepMind、TPU芯片、云基础设施及AI产品的一系列长期投资,而非对ChatGPT的仓促反应。其核心优势在于对研究、芯片、云服务、产品和覆盖数十亿用户的分发渠道实现全栈控制。通过将定制芯片制造与统一的研究实验室深度融合,谷歌获得了对AI架构的绝对控制权,能利用自研TPU高效执行复杂计算,同时让工程师得以低成本大规模扩展模型预训练,而无需像竞争对手那样承受高昂的外部芯片采购成本。

DeepMindGoogle大佬观点搜索
01:45
Google AI@GoogleAI
精选69
谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

谷歌上周正式向公众发布了其首个原生多模态嵌入模型Gemini Embedding 2。该模型如同“通用翻译器”,能将文本、图像、视频和音频数据转化为独特的数字向量。其核心突破在于不再依赖关键词匹配,而是基于语义将不同模态的数据映射到同一空间,从而理解内容间的深层联系。开发者已利用该模型构建视频分析工具、视觉购物助手等应用,实现通过拍照或描述场景进行智能搜索的功能。模型现可通过Gemini API或Gemini Enterprise Agent平台使用。

Google多模态搜索模型发布

推荐理由:Google 第一个原生多模态嵌入模型,把文本、图像、视频拉到同一个向量空间,做跨模态搜索的开发者可以不用再手动打标签了,但离「无感理解」还有距离。
01:39
NotebookLM@NotebookLM
精选64
Gemini App中的Notebooks功能现已正式在移动端向免费和付费用户开放,并计划很快扩展至更多欧洲国家。此次更新标志着NotebookLM与Gemini的深度集成,用户现可直接在Gemini App内访问所有个人未共享的笔记本,并能将Gemini的聊天记录用作新笔记本或现有笔记本的资料来源。功能推出将分阶段进行:首先面向网页版的Google AI Ultra、Pro和Plus订阅用户,未来几周将逐步覆盖移动端用户、更多欧洲地区以及免费用户。

NotebookLM: Last year, we integrated into the @GeminiApp by allowing you to upload your notebooks as sources. Now, we're taking our ...

Google产品更新

推荐理由:NotebookLM的笔记功能终于彻底住进了Gemini App,免费用户也能用。这一步让Google AI助理从“外脑”变成了“内脑”,虽然不算惊天动地,但整合的体验提升是实打实的。
01:39
Google AI Developers@googleaidevs
58
既然Gemini Embedding 2已正式发布,让我们探索该模型解锁的功能--从智能多模态RAG到视觉搜索--因为它能将文本、图像、视频、音频和文档映射到统一的嵌入空间。
Google检索增强多模态模型发布
00:09
NotebookLM@NotebookLM
精选64
Google的Gemini应用正式向移动端免费和付费用户推出Notebooks功能,并即将扩展至更多欧洲国家。该功能允许用户在Gemini应用内直接访问所有个人未共享的笔记本,并能将与该AI的对话内容作为新笔记本或现有笔记本的资料来源。此次发布首先面向网页端的Google AI Ultra、Pro和Plus订阅用户,后续将逐步推广至移动端、更多欧洲地区及免费用户。

NotebookLM: Last year, we integrated into the @GeminiApp by allowing you to upload your notebooks as sources. Now, we're taking our ...

Google产品更新

推荐理由:NotebookLM 正式成为 Gemini 的原生笔记,聊天记录能直接纳入知识库,这步整合让 Gemini 从一个对话工具开始走向个人知识中枢,Google 生态用户应该高兴。
4月30日
23:14
Google DeepMind@GoogleDeepMind
47
AI协同临床医生是我们新的研究计划,旨在探索多模态智能体如何更好地支持医护人员和患者。🩺 以下是我们进展的概览🧵
智能体DeepMindGoogle多模态
19:11
Chubby♨️@kimmonismus
62
四大科技巨头云收入激增,资本开支飙升引市场担忧

Meta、亚马逊、Alphabet和微软2026年第一季度营收均超预期,云业务增长强劲,其中Google Cloud收入暴涨63%首次突破200亿美元。然而,四家超大规模企业2026年资本开支总额预计将超过6500亿美元,巨额AI基础设施投资引发市场焦虑,导致Meta和微软股价在盘后下跌。这些巨头在计算领域的投入规模正重塑全球经济,其投资能否带来相应回报将定义未来十年的科技投资格局。

GoogleMicrosoft数据/训练行业动态
12:39
Demis Hassabis@demishassabis
16
相当不错… 😀🚀

Logan Kilpatrick: Google is the best company in the world

Google其他
12:09
Ethan Mollick@emollick
33
我认为Gemini聊天机器人具备了成为有用工具的所有要素,但难以将其整合起来。它似乎仍然不清楚自己能创建哪些文件,也不明白其工具之间如何协同工作。 它还经常显得"气馁",宁愿放弃而不是寻找新的解决方案。
Google大佬观点
‹ 上一页
1…1718192021…24
下一页 ›