AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 934 条
全部一手资讯X论文
标签「Google」清除
🚨 AI News | TestingCatalog@testingcatalog · 4天前52

Google vs Meta 🤖 > Google introduces restrictions on Meta's use on Gemini amid capacity shortage, according to the Financial Times. > Reportedly, this negatively affected internal projects at Meta related to customer support and content moderation, causing delays. I bet token efficiency will be a huge market in the long run, with a very transparent and predictable business model.

译Google vs Meta 🤖 > 据《金融时报》报道,Google因容量短缺对Meta使用Gemini施加限制。 > 据报道,这负面影响了Meta内部与客户支持和内容审核相关的项目,导致项目延期。 我敢打赌,从长远来看,token效率将成为一个巨大的市场,其商业模式非常透明且可预测。

fofr@fofrAI · 4天前20

Gemini 3.5 Flash is a great workhorse model, especially for subagents. Determined, fast, gets jobs done.

译Gemini 3.5 Flash 是一个很棒的工作马模型,尤其适合子智能体。它坚定、快速,能完成任务。

Berryxia.AI@berryxia · 4天前56

Google Research在2024年悄悄开源了一个时间序列模型。 除了做预测的人,没人注意到。这是一个错误。 这个模型叫TimesFM。 论文发在ICML 2024,标题是"一个用于时间序列预测的解码器架构基础模型"。 核心思路直接借鉴语言模型:先在海量数据上预训练,然后用同一个模型预测任何新序列,不需要重新训练。 过去几十年,时间序列预测一直是一个数据集一套模型的模式。 你收集某个问题的数据,选一个模型架构。 在这个数据上训练,验证。如果问题变了,从头来过。 每个数据集都是一个独立项目。 每个场景都是一条独立流水线。 TimesFM改变了这件事,它在大量跨领域、跨频率的时间序列数据上预训练。 训练完成后,面对任何新的时间序列都能直接预测,零样本预测。 2025年9月,Google发布了2.5版本。 参数从500M降到200M,上下文从2048拉到16K。 加了一个30M的分位数预测头,能同时输出点预测和10%到90%的置信区间。 更小的模型。更长的上下文。 更好的结果。这很少见。 实际影响很具体,200M参数跑一张GPU就行。 16K上下文意味着你可以喂五年日数据,模型能抓住年度季节性。 分位数预测头意味着你不只有一个预测值,还有不确定性范围。 Google内部已经在用了。BigQuery ML里用SQL直接调。Google Sheets的Connected Sheets里内置了。Vertex AI提供了Docker端点。 开源版本免费,两行Python。 加载模型,调用forecast。输入numpy数组,输出预测结果。 2026年4月,Google加了通过HuggingFace Transformers和PEFT用LoRA微调的能力。 这意味着你可以用少量领域数据把预训练模型适配到你的具体场景。 时间序列预测不是一个光鲜的领域。没有病毒式传播的演示。没有十亿美元的消费产品。 但每个管理库存、预测需求、监控设备、交易金融工具的企业都依赖它。 TimesFM把这个行业最好的工具变成了pip install就能用的东西。 地址见评论区👇🏻

译Google Research 于2024年开源时序预测基础模型TimesFM(ICML 2024),采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M,上下文窗口扩展至16K,新增30M分位数预测头,可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行,16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中,开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调,便于领域适配。

Ethan Mollick@emollick · 4天前27

Is Gemini 3.5 Pro being export controlled? Because if not...

译Gemini 3.5 Pro 是否受到出口管制?因为如果没有……

Rohan Paul@rohanpaul_ai · 5天前58

The U.S. AI buildout is running into a harder constraint than GPUs: permission. The Information’s new map finds 300+ state and local data-center bans or moratoriums since 2023, with 275+ passed this year and 75+ still under consideration; resistance is strongest in the Midwest and South, exactly where hyperscalers want cheap land and megawatt-scale power. But the backlash against data centers is outrunning the facts. The most current datacenter is increasingly designed to solve the two biggest fears: water and power bills. Start with water. Microsoft’s next-generation AI data centers use chip-level, closed-loop cooling that consumes zero water for cooling and can avoid more than 125 million liters per year per site. Its fleetwide water-use efficiency has already improved 39% since 2021, to 0.30 liters per kWh. Google reports that 86% of its freshwater withdrawals come from low- or medium-risk sources, and its global data-center fleet runs at a 1.09 PUE versus a 1.56 industry average—meaning far less wasted overhead energy. Electric bills are not automatically shifted to households, either. A recent causal study of U.S. retail rates from 2015–2024 found data centers modestly lowered average rates by spreading fixed grid costs across more electricity sales. And “bring your own power” is already the new trend - e.g. Google’s 500 MW nuclear deal, Microsoft’s 835 MW Three Mile Island agreement, and Meta’s 1,121 MW nuclear contract.

译美国AI基础设施建设最大瓶颈已从GPU变为许可。《The Information》地图显示2023年以来有300多项州级和地方数据中心禁令或暂停,今年通过275项,还有75项在审,中西部和南部抵制最强。但现实数据反超担忧:微软新一代AI数据中心采用芯片级闭环冷却,每站每年避免超1.25亿升水,全舰队用水效率自2021年提升39%至0.30升/kWh;谷歌86%淡水来自低中风险源,全球PUE 1.09(行业均值1.56)。2015–2024年研究表明数据中心通过分摊固定电网成本适度降低了居民平均电价。趋势已转为“自带电源”:谷歌500 MW核电、微软835 MW三哩岛、Meta 1121 MW核电协议。

🚨 AI News | TestingCatalog@testingcatalog · 5天前27

Google is working on Collections support for NotebookLM. > Users will be able to group multiple notebooks into a single collection. > Collections will appear in a separate tab in the NotebookLM main menu. Since Notebooks now also function as "projects" in Gemini, this may help users organize them more effectively.

译Google 正在为 NotebookLM 开发 Collections(集合)支持。 > 用户可以将多个笔记本分组到一个集合中。 > 集合将出现在 NotebookLM 主菜单的一个单独标签页中。 由于笔记本现在在 Gemini 中也作为“项目”运行,这可能有助于用户更有效地组织它们。

Logan Kilpatrick@OfficialLoganK · 5天前47

In the last month, almost 200,000 apps built in @GoogleAIStudio were successfully deployed and shared with the world (totally for free). Everyone should be able to bring their idea to life!

译上个月,在 Google AI Studio 中构建的近 20 万个应用成功部署并分享给世界(完全免费)。 每个人都应该能将自己的想法变为现实!

Logan Kilpatrick@OfficialLoganK · 6天前60

Say hello to design variations in @GoogleAIStudio, make an app, iterate on it, then explore variations to take your idea in new directions : )

译向 @GoogleAIStudio 中的设计变体说声你好,制作一个应用,迭代它,然后探索变体,将你的想法引向新方向 : )

🚨 AI News | TestingCatalog@testingcatalog · 6天前71

Google released Design Variations for AI Studio! This feature would generate several design proposals when selected, so users can apply them to their Build apps. Themes support planned as well 👀

译Google 为 AI Studio 发布了设计变体功能! 选中后,该功能会生成多个设计提案,用户可将其应用于自己的 Build 应用。 主题支持也在计划中👀

Rohan Paul@rohanpaul_ai · 6天前75

AI chatbots show left-wing bias, Washington Post report finds, with ChatGPT giving left-leaning answers 80% of time The test used a structured set of political questions from a Dartmouth and Stanford research study. The test asked each model about roughly 30 policy issues, including taxes, health care, immigration, guns, affirmative action, and the death penalty. GPT-5.5 gave only the left-leaning position in 80% of answers, both sides in 17%, and only the right-leaning position in 3%. Gemini 3.1 Pro looked very different, giving both sides in 93% of answers and left-only answers in 7%. Claude Opus 4.8 gave both sides in 57%, while Grok 4.3 was the only model with a large right-only share at 33%. The deeper point is not whether one answer sounds liberal or conservative, but whether a model compresses a political dispute into one moral frame before the user sees the tradeoff. This test suggests chatbot behavior is shaped less by raw facts than by ranking choices, refusal rules, training feedback, and default answer style.

译《华盛顿邮报》报道,基于达特茅斯和斯坦福研究的测试显示,AI聊天机器人在约30项政策议题(税收、医保、移民等)上存在左翼偏见。GPT-5.5仅给出左倾立场占80%,双方立场17%,右倾3%;Gemini 3.1 Pro则93%给出双方立场,左倾仅7%;Claude Opus 4.8双方立场占57%;Grok 4.3是唯一右倾占33%的模型。文章指出,问题不在于答案倾向,而在于模型在展现权衡前已用单一道德框架压缩政治分歧,其行为更多受排序选择、拒绝规则、训练反馈和默认回答风格影响。

Google Gemini@GeminiApp · 6天前47

From creating images in real-time with your voice to new ways to support your small business, here’s a look at this month’s Gemini Drops 🧵

译从用语音实时创建图像,到支持小企业的新方式,以下是本月 Gemini Drops 的内容 🧵

🚨 AI News | TestingCatalog@testingcatalog · 6天前44

Google has a hidden MCP integration config on Gemini for macOS but it is yet unclear if MCPs will ever become available over there. Tbh, I am not getting why it is that challenging to simply enable MCPs across Gemini products. It is quite an essential feature that opens up a ton of use cases. It would also let Google to get more data about tool use for training. Why? 👀

译Google 在 Gemini for macOS 上有一个隐藏的 MCP 集成配置,但目前尚不清楚 MCP 是否会在该平台上可用。 说实话,我不明白为什么在 Gemini 产品中直接启用 MCP 如此困难。 这是一个非常重要的功能,可以开启大量用例。 它也能让 Google 获取更多关于工具使用的数据用于训练。 为什么?👀

Google AI Developers@googleaidevs · 7天前55

When we hit 2 million apps, we have to build the real statue, right?

译AI Studio 原生 Android 应用构建功能于 2026 年 5 月宣布,目前已有超过 100 万款 Android 应用在 AI Studio 中创建。主推文调侃:等达到 200 万时,是不是该建一座真雕像?

elvis@omarsar0 · 7天前73

Love it that there are more ways to learn with agents. I still like the idea of a dynamic learning hub as we built here: https://x.com/omarsar0/status/2069797099814682638?s=20 More dropping on this soon.

译Google 宣布在 Gemini App 中推出 "study notebooks"(学习笔记本),这是一个交互式学习空间,旨在将好奇心转化为真正的理解。该功能免费且面向全球用户开放,支持所有语言。Elvis Saravia(DAIR.AI)对此表示赞赏,认为这是一种通过 AI 智能体学习的新方式,并提及他之前构建的 "动态学习中心" 概念,后续将有更多相关分享。

🚨 AI News | TestingCatalog@testingcatalog · 7天前41

GOOGLE 🔥: Gemini app for macOS will get Computer Use support and will be able to operate other desktop devices remotely. Users will have an option to "Connect another Mac" from the attachment menu on the prompt bar. Closing feature gaps 🤖

译GOOGLE 🔥: macOS 版 Gemini 应用将获得 Computer Use 支持,并能远程操控其他桌面设备。 用户可从提示栏的附件菜单中选择“连接另一台 Mac”。 缩小功能差距 🤖

Logan Kilpatrick@OfficialLoganK · 7天前61

Gemma 4... intelligence for everyone on device!

译Gemma 4... 为每个人带来设备端智能!

Google DeepMind@GoogleDeepMind · 7天前63

Gemini 3.5 Flash now supports native computer use. This built-in tool lets developers build custom agents that can see and take action across browser, mobile, and desktop interfaces. Find out more → https://goo.gle/4f4sNQA

译Gemini 3.5 Flash 现支持原生计算机使用。 这一内置工具让开发者能够构建可跨浏览器、移动和桌面界面进行观察和操作的自定义 AI 智能体。 了解更多 → https://goo.gle/4f4sNQA

Google AI Developers@googleaidevs · 7天前73

The Computer Use tool is now available for Gemini 3.5 Flash 🛠️ Build agents that see and take action across browser, mobile, and desktop environments to seamlessly handle long-horizon tasks. Here’s what’s new: - Built-in support for mobile and desktop operating systems - Intent arguments for all function calls - Customizable client-side functions to easily support human-in-the-loop (HITL) takeover - Prompt injection detection and configurable action-level safety policies to fit your app’s needs Learn how you can use 3.5 Flash to automate QA testing, business processes, and more in the blog: https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/

译Google AI 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用,支持构建能观察并操作浏览器、移动端和桌面环境的 AI 智能体,可处理长期任务。新特性包括:内置移动与桌面操作系统支持;所有函数调用配备 intent arguments;可定制的客户端函数实现人工接管(HITL);提示词注入检测及可配置的 action-level 安全策略。可用于自动化 QA 测试、业务流程等场景。

Chubby♨️@kimmonismus · 7天前58

Google is reorganizing its AI coding strike team as it tries to close the gap with Anthropic in one of the most lucrative parts of the AI market. According to The Information, the months-old team is being expanded into a more formal "midtraining" group, sitting between pretraining and post-training. The goal is to improve Gemini’s coding abilities and extend those capabilities into broader business tasks like creating presentations. The move comes after two major departures: Noam Shazeer reportedly left for OpenAI after changes to his compute access, while Nobel Prize winner John Jumper is heading to Anthropic after recently being moved to the coding strike team. That is the uncomfortable part for Google. It has world-class researchers, TPUs, Gemini, Cloud, Search, YouTube, and enormous distribution. But coding has become the clearest monetization layer in AI, and Anthropic has turned that advantage into massive revenue momentum. Google now seems to be admitting that strong base models alone are not enough. Coding needs specialized training, dedicated compute, and a much sharper product loop.

译Google将数月前成立的AI编码突击队扩展为更正式的“midtraining”小组,位于预训练与后训练之间,旨在提升Gemini编码能力,并延伸至创建演示文稿等商业任务。此前,Noam Shazeer因计算资源变动转投OpenAI,Nobel奖得主John Jumper调至该团队后也加入Anthropic。Google承认,仅靠强大基座模型不够,编码已成为AI最明确的变现层,Anthropic借此获得收入增长。Google需专用训练、计算和更清晰的产品闭环来追赶。

AYi@AYi_AInotes · 7天前54

Gemini Pro现在只要$1.99一个月了, Google开始卷价格了?

Berryxia.AI@berryxia · 7天前39

Grok 现在制作这种视频真的好方便,而且基本可以一次性搞定,而Google Omni 就触发版权问题。

fofr@fofrAI · 7天前20

I love this

译这个 Chrome 扩展让你在浏览器中录制操作,再由 Gemini 3.1 Flash Lite 自动将这些任务转换为 Skills。DOM 中的动作会补充视频,从而获得非常精细的指令。我喜爱这个。

向阳乔木@vista8 · 7天前36

已经彻底从Dia换回原生的Chrome了。 Ask Gemini 侧边栏除了加载慢一点,整体也是可用。 主要不想被某个 AI 浏览器绑架,Chrome兼容又是最好的。 比如任何一条 X 帖子,都可以让 Gemini 总结要点,分析用户情绪倾向,非常方便。

译用户从Dia浏览器换回原生Chrome,认为Ask Gemini侧边栏整体可用(仅加载稍慢),且Chrome兼容性最好。举例:可直接让Gemini总结X帖子要点并分析用户情绪倾向。避免被特定AI浏览器绑架是主要原因。

Yuchen Jin@Yuchenj_UW · 7天前44

I didn’t realize Denny Zhou, who led the Gemini Reasoning Team, left Google 4 months ago for Meta’s TBD Lab. A lot of people left Google recently. I’m still waiting for Gemini to catch up in coding. Time for Sergey to pull a Code Red.

译我没意识到Denny Zhou——曾领导Gemini推理团队——已在4个月前离开Google,加入Meta的TBD Lab。 最近很多人离开了Google。我仍在等待Gemini在编码方面赶上。是时候让Sergey启动Code Red了。

向阳乔木@vista8 · 7天前49

谷歌六月参考AK的LLM wiki思路推出了一个规范:Open Knowledge Format 核心思路:用一组 Markdown ,加 YAML frontmatter,把知识变成可读、可版本控制、可被 Agent 直接消费的文件包。 让Codex读取这篇文章,它把codex做过的项目整理成了OKF格式,添加到系统记忆索引中。 文章见评论区

译谷歌于六月推出Open Knowledge Format(OKF)规范,参考AK的LLM wiki思路。核心是用Markdown加YAML frontmatter将知识组织为可读、可版本控制、可直接被AI智能体(Agent)消费的文件包。示例中,Codex读取该文章后,将自身做过的项目整理为OKF格式并添加到系统记忆索引中。文章见评论区。

Berryxia.AI@berryxia · 7天前58

MayBe 这只是开始,Gemini 这一波真的是损失惨重了。 相继应该有4-5 位核心人物离开,一般核心人物离开后,可能还会带着自己的部下相继离开。

译据Bloomberg报道,Google DeepMind旗下Gemini团队两位核心成员Jonas Adler和Alexander Pritzel将加盟Anthropic。Adler曾负责AI coding项目,参与AlphaFold及Gemini 1.5;Pritzel是2014年加入的老兵,参与AlphaFold 2/3及Gemini训练体系。此前Gemini已有4-5位核心人物离开,后续可能带动下属离职,团队前景堪忧。

Artificial Analysis@ArtificialAnlys · 6月25日28

We’re excited to announce speakers from Google, NVIDIA, and Z AI for our Intelligence Index event in San Francisco on Monday, June 29. Join us for a curated evening of conversations on AI intelligence benchmarks, including insights on our Artificial Analysis Intelligence Index v4.1 update and our new long-horizon knowledge work benchmark, AA-Briefcase. Featuring: - Ivan Leo (@ivanleomk) @ Google DeepMind - Venkat Srinivasan @ NVIDIA - Zixuan Li (@ZixuanLi_)@ Z AI - Micah Hill-Smith (@_micah_h) @ Artificial Analysis - George Cameron (@grmcameron) @ Artificial Analysis RSVP below https://luma.com/qdl9mr2e

译Artificial Analysis 宣布将于 6 月 29 日(周一)在旧金山举办 Intelligence Index 活动。演讲嘉宾来自 Google DeepMind、NVIDIA 和 Z AI。活动将介绍 AI Intelligence Index v4.1 更新以及新推出的长时知识工作基准 AA-Briefcase。

🚨 AI News | TestingCatalog@testingcatalog · 6月25日60

Google Flow Agent can now use Google Maps Street View grounding to generate images and videos. Only works with US locations at this moment. > "Your Google Flow Agent can now generate images and videos grounded in Google Maps Street View, giving your scenes real-world details and accuracy, whether you are placing characters in a local scene, stylizing a city landmark, or reimagining your favorite neighborhood." > "To use the feature, enable Agent mode and use a named location or a street address in your prompt. This feature is available globally, but currently only for US locations."

译Google Flow Agent 新增 Google Maps Street View 实景锚定功能,支持根据用户提示中的地名或街道地址,为图片和视频生成提供真实世界细节。用户需启用 Agent 模式并在提示词中包含具体地点。目前该功能仅限美国街景位置可用。

Chubby♨️@kimmonismus · 6月25日63

Google DeepMind is facing another high-profile talent hit: Bloomberg reports that Jonas Adler and Alexander Pritzel, two key contributors to Gemini, are planning to leave for Anthropic. Their exits follow John Jumper’s move to Anthropic and Noam Shazeer’s move to OpenAI, adding pressure on Google in the AI talent war. Startups like Anthropic and OpenAI can offer researchers a shot at major upside before a potential IPO. For Google, the question is whether its massive research bench can offset the growing pull of frontier AI startups that now look like the place where top researchers can shape the next platform shift. Really curious for Google handling it.

译Bloomberg报道,Google DeepMind两位Gemini关键贡献者Jonas Adler和Alexander Pritzel计划离职,加入Anthropic。此前已有John Jumper转向Anthropic、Noam Shazeer加入OpenAI,进一步加剧Google在AI人才争夺中的压力。初创公司Anthropic与OpenAI因潜在IPO能为研究人员提供更高财务回报。Google需应对的问题是:其庞大研究团队能否抵御前沿AI初创公司对顶尖人才的吸引力。

elvis@omarsar0 · 6月25日43

This is a cool release from Google. I've started to rely a lot on computer use for agentic loops/long-running tasks, and I'm in need of more capable computer use models while keeping costs low. Not sure about efficiency of Gemini 3.5 Flash, but I appreciate alternatives.

译这是 Google 的一次酷发布。 我开始在智能体循环/长时间运行任务中大量依赖计算机使用,并且需要更强大的计算机使用模型,同时保持低成本。不确定 Gemini 3.5 Flash 的效率如何,但我感谢有替代方案。

Ethan Mollick@emollick · 6月25日57

Gemini 3 Pro was the first model to achieve at least 23% on ARC-AGI-2, which it did in November, 2025 (it actually scored 31%). So the 8-12 month gap between closed and open weights models still seems to hold. But they are also more jagged, better at some tasks, worse at others.

译Gemini 3 Pro 是首个在 ARC-AGI-2 上达到至少 23% 的模型,它在 2025 年 11 月就做到了(实际得分 31%)。 所以闭源与开源模型之间 8-12 个月的差距似乎仍然存在。但它们也更参差不齐,有些任务表现更好,有些则更差。

🚨 AI News | TestingCatalog@testingcatalog · 6月25日66

Google released Computer Use capability for Gemini 3.5 Flash, scoring 78.4 on OSWorld-Verified. > Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks.

译Google 为 Gemini 3.5 Flash 新增 Computer Use 能力,作为内置工具支持智能体计算机操作任务。该模型在 OSWorld-Verified 基准上取得 78.4 分,为谷歌迄今最佳性能。Computer Use 可跨浏览器、移动和桌面环境推理与执行,自动化工单提交等工作流程。

Berryxia.AI@berryxia · 6月25日57

兄弟们,Google 现在只能玩别人玩剩下的了 !能成吗? Google Gemini桌面版要直接入侵macOS了。 新功能“Speak to Window”让你在任意窗口按住fn键,对着Gemini说话就能让它帮你写邮件、写文档、生成图片,而且是直接在你当前的应用里操作。 另一个“Magic Pointer”则允许你圈选屏幕上任意信息,然后让Gemini理解上下文并执行编辑、总结或创建任务。 这已经不是简单的聊天工具了,把Gemini变成系统级的上下文感知助手。 它能看到你正在看的任何窗口内容,并根据你的语音指令直接行动。 Google这次明显在加速把大模型推向桌面操作系统层,试图和Apple Intelligence、以及各种第三方agent工具抢占工作流入口。

译Google Gemini桌面版新增两大功能:Speak to Window允许用户在任意窗口按住fn键语音指挥Gemini写邮件、写文档、生成图片,操作在当前应用内完成;Magic Pointer可圈选屏幕信息,让Gemini理解上下文后执行编辑、总结或创建任务。目标是把Gemini变成系统级上下文感知助手,抢占工作流入口。

🚨 AI News | TestingCatalog@testingcatalog · 6月25日31

As a part of the "Speak to Window" feature, Gemini desktop app will also get a "Magic Pointer", showcased earlier by Google. > Give Gemini the full picture: Help Gemini understand your goals from anywhere on your screen. Just highlight info in any open window, then tell Gemini what to edit, summarise or create.

译Gemini 桌面应用(macOS)将新增两项功能:一是 "Magic Pointer",用户可高亮任意窗口中的信息并指示 Gemini 编辑、总结或创建内容;二是 "Speak to Window" 语音听写功能,按住 fn 键即可用语音让 Gemini 起草邮件、撰写文档、生成图像等,无需切换应用。

🚨 AI News | TestingCatalog@testingcatalog · 6月24日32

GOOGLE 🔥: Gemini desktop app for macOS will get a new voice dictation feature called "Speak to Window" that works with any other app. > Create with just your voice: Meet Speak to Window. Hold the fn key in any open window and tell Gemini what you need. Watch it draft emails, write docs, and create images right where you're working. Gemini Voice Keyboard 👀

译GOOGLE 🔥: Gemini 桌面应用(macOS)将新增名为 "Speak to Window" 的语音听写功能,可在任意其他应用中使用。

Google DeepMind@GoogleDeepMind · 6月24日50

What happens when millions of AI agents start negotiating, transacting, and delegating to one another? @weballergy joined our podcast with @fryrsquared to explore the rise of agentic economies – and how we can diversify agent decision-making to avoid AI groupthink. Timecodes: 00:00 Intro 1:07 Defining AI agents 4:44 Agentic exploration in science and research 15:46 Delegation between agents 22:46 Agentic security and traps 29:31 Building an agentic economy 33:22 Cognitive monoculture 36:29 Distributed intelligence

译Google DeepMind 发布播客,由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖:AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化(群体思维)风险,以及分布式智能的解决方案。播客还设有详细时间戳分段,帮助听众聚焦不同话题。

Peter Steinberger 🦞@steipete · 6月24日56

Google fired the guy that made the google workspace cli, because he made the google workspace cli. Lucky me, Google can't fire me. https://gogcli.sh

译Peter Steinberger 嘲讽 Google 解雇了创建 Google Workspace CLI 的员工 @JPoehnelt,并发布自己的替代工具 gogcli.sh。据被解雇者称,两个月前他因开发该 CLI 被解雇;工具曾在 Hacker News 登顶 #1,数日内获数千 GitHub 星和大量用户。他分析解雇原因是 Workspace 内部对 AI 智能体颠覆现状的恐惧,讽刺的是被解雇前两天他刚得知 Google Cloud Next 将发布官方 Workspace CLI。

Google AI Developers@googleaidevs · 6月24日60

The Gemini Interactions API is your unified interface for text, multimodal inputs, tool use, and managed agents all in a single endpoint. Go from prompt to production faster than ever. Read the developer guide ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

译Gemini Interactions API 是您处理文本、多模态输入、工具使用和管理智能体的统一接口,所有这些都集成在一个端点上。从提示词到产品,比以往更快。 阅读开发者指南 ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

宝玉@dotey · 6月24日54

Google Workspace CLI 这项目当时我还转发过,没想到几个月过去,作者 Justin Poehnelt 因为这个项目被开除了。 Justin 在 Google 干了将近七年,岗位是 Workspace 开发者关系工程师。今年 3 月初,他用 Rust 写了一个 Google Workspace CLI,放在了 Google 官方 GitHub 组织下(http://github.com/googleworkspace/cli),可以用命令行操作 Gmail、Drive、Calendar 等所有 Workspace 服务,还内置了 MCP 服务器,AI agent 可以直接调用。 Addy Osmani 3 月 5 日发推介绍了这个项目。然后就爆了,Hacker News 第一名,GitHub star 数冲到两万多,几天之内就有了几千个实际用户。 Google 内部的反应是两极的:有总监和高管主动来问这个工具能教他们什么;同时法务开始盘问他,为什么项目上有 Google 的 logo 和品牌色。 4 月 22 日到 24 日的 Google Cloud Next 大会上,Google Workspace 官方博客宣布官方 Workspace CLI 即将推出。两天后,Justin 被开除了。 他怀疑是 Workspace 的某些管理层和项目害怕被 AI agent 颠覆,而这种恐惧不只是针对他的 CLI,是针对整个 agent 对 Workspace 意味着什么。 Hacker News 上对这件事的观点两极分化。一派认为这是 Google 官僚主义碾压创新的典型案例,七年老员工做了个用户真正想要的东西,然后被自己公司干掉了。另一派指出,Google 有一套非常明确的开源发布审批流程,用公司品牌发布未经批准的项目,在任何大公司都可能被开除。 Justin 本人在 Hacker News 回复里的说法是:作为 DevRel 工程师,开源发布审批本来就是他日常工作的一部分,而且这个流程文档不清楚,还一直在变。 这个项目本身还活着。最新一次更新是 6 月,GitHub 上 26000 多颗星,InfoQ 和 BetterStack 都有详细的教程。Justin 被开除后还在继续写技术博客,最近一篇是用 Claude Code 的 subagent 做 Gmail 分类。 对于正在用这个 Workspace CLI 的开发者来说,眼下倒不用太担心,项目还在 Google 的 GitHub 组织下正常维护。

译谷歌开发者关系工程师 Justin Poehnelt 今年 3 月初用 Rust 创建了 Google Workspace CLI,支持命令行操作 Gmail、Drive、Calendar 等服务并内置 MCP 服务器。项目发布后登顶 Hacker News,GitHub 获两万多星。谷歌内部反应两极:高管主动请教,法务质疑品牌色。4 月 22–24 日 Google Cloud Next 大会官方宣布即将推出官方 CLI,两天后 Justin 被开除。他怀疑管理层害怕被 AI agent 颠覆。项目仍在 Google GitHub 组织下正常维护(26000+ 星)。

Google AI Developers@googleaidevs · 6月24日62

🗣️We built Managed Agents in the Gemini API to handle the plumbing so you can focus on building smart, autonomous agents. With just a single prompt, see how the agent researches a topic and builds a radio show from scratch. Here’s how it works: - [Zero infrastructure setup] The API automatically spins up a secure, temporary Linux sandbox. - [Autonomous loops] The agent independently plans, self-corrects, and executes its own code. - [Multi-step logic] With instructions and tools defined via industry-standard agents.md and skills.md files, the agent uses its Gemini-optimized understanding to draft and produce a dynamic, back-and-forth audio dialogue, generate music, create album art and more, all in a single API call. https://x.com/_philschmid/status/2062908191634076056/video/1

译Google AI for Developers 宣布在 Gemini API 中推出 Managed Agents,开发者只需一条提示即可构建自主智能体。该智能体能自动研究主题并从头制作广播节目,包括生成对话音频、音乐、专辑封面等。核心特性:零基础设施设置——API 自动创建安全的临时 Linux 沙箱;自主循环——智能体独立规划、自我纠错并执行代码;多步逻辑——通过 agents.md 和 skills.md 文件定义指令和工具,Gemini 优化理解后在一次 API 调用内完成全部任务。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月28日
21:51
🚨 AI News | TestingCatalog@testingcatalog
52
Google vs Meta 🤖 > 据《金融时报》报道,Google因容量短缺对Meta使用Gemini施加限制。 > 据报道,这负面影响了Meta内部与客户支持和内容审核相关的项目,导致项目延期。 我敢打赌,从长远来看,token效率将成为一个巨大的市场,其商业模式非常透明且可预测。
GoogleMeta行业动态部署/工程
20:13
fofr@fofrAI
20
Gemini 3.5 Flash 是一个很棒的工作马模型,尤其适合子智能体。它坚定、快速,能完成任务。
智能体Google评测/基准
12:23
Berryxia.AI@berryxia
56
Google TimesFM 2.5:轻量化时序预测模型支持零样本与LoRA微调

Google Research 于2024年开源时序预测基础模型TimesFM(ICML 2024),采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M,上下文窗口扩展至16K,新增30M分位数预测头,可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行,16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中,开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调,便于领域适配。

Google开源生态教程/实践
11:51
Ethan Mollick@emollick
27
Gemini 3.5 Pro 是否受到出口管制?因为如果没有……
Google大佬观点
01:55
Rohan Paul@rohanpaul_ai
58
美国AI基础设施建设瓶颈从GPU转为许可:300多项数据中心禁令,但水耗与电费担忧被数据驳斥

美国AI基础设施建设最大瓶颈已从GPU变为许可。《The Information》地图显示2023年以来有300多项州级和地方数据中心禁令或暂停,今年通过275项,还有75项在审,中西部和南部抵制最强。但现实数据反超担忧:微软新一代AI数据中心采用芯片级闭环冷却,每站每年避免超1.25亿升水,全舰队用水效率自2021年提升39%至0.30升/kWh;谷歌86%淡水来自低中风险源,全球PUE 1.09(行业均值1.56)。2015–2024年研究表明数据中心通过分摊固定电网成本适度降低了居民平均电价。趋势已转为“自带电源”:谷歌500 MW核电、微软835 MW三哩岛、Meta 1121 MW核电协议。

GoogleMicrosoft政策/监管部署/工程
6月27日
21:17
🚨 AI News | TestingCatalog@testingcatalog
27
Google 正在为 NotebookLM 开发 Collections(集合)支持。 > 用户可以将多个笔记本分组到一个集合中。 > 集合将出现在 NotebookLM 主菜单的一个单独标签页中。 由于笔记本现在在 Gemini 中也作为"项目"运行,这可能有助于用户更有效地组织它们。
Google产品更新
11:23
Logan Kilpatrick@OfficialLoganK
47
上个月,在 Google AI Studio 中构建的近 20 万个应用成功部署并分享给世界(完全免费)。 每个人都应该能将自己的想法变为现实!
Google行业动态
08:23
Logan Kilpatrick@OfficialLoganK
60
向 @GoogleAIStudio 中的设计变体说声你好,制作一个应用,迭代它,然后探索变体,将你的想法引向新方向 : )
Google产品更新编码
06:17
🚨 AI News | TestingCatalog@testingcatalog
71
Google 为 AI Studio 发布了设计变体功能! 选中后,该功能会生成多个设计提案,用户可将其应用于自己的 Build 应用。 主题支持也在计划中👀

Google AI Studio: describing an aesthetic in a prompt can be tough, so we made a button for it introducing Design Variations instantly gen...

Google产品更新
00:53
Rohan Paul@rohanpaul_ai
精选75
华盛顿邮报报告:AI聊天机器人存在左翼偏见

《华盛顿邮报》报道,基于达特茅斯和斯坦福研究的测试显示,AI聊天机器人在约30项政策议题(税收、医保、移民等)上存在左翼偏见。GPT-5.5仅给出左倾立场占80%,双方立场17%,右倾3%;Gemini 3.1 Pro则93%给出双方立场,左倾仅7%;Claude Opus 4.8双方立场占57%;Grok 4.3是唯一右倾占33%的模型。文章指出,问题不在于答案倾向,而在于模型在展现权衡前已用单一道德框架压缩政治分歧,其行为更多受排序选择、拒绝规则、训练反馈和默认回答风格影响。

GoogleOpenAIxAI安全/对齐

推荐理由:邮报用 30 个政策问题的测试戳破了‘中立’幻觉,GPT-5.5 左倾回答占 80%,Gemini 低调得多但也不是中立。值得看的不是哪个模型左右,而是它们用单一框架替用户做了取舍。
00:11
Google Gemini@GeminiApp
47
从用语音实时创建图像,到支持小企业的新方式,以下是本月 Gemini Drops 的内容 🧵
Google产品更新多模态语音
6月26日
18:16
🚨 AI News | TestingCatalog@testingcatalog
44
Google 在 Gemini for macOS 上有一个隐藏的 MCP 集成配置,但目前尚不清楚 MCP 是否会在该平台上可用。 说实话,我不明白为什么在 Gemini 产品中直接启用 MCP 如此困难。 这是一个非常重要的功能,可以开启大量用例。 它也能让 Google 获取更多关于工具使用的数据用于训练。 为什么?👀
GoogleMCP/工具行业动态
04:45
Google AI Developers@googleaidevs
55
AI Studio 原生 Android 应用构建功能于 2026 年 5 月宣布,目前已有超过 100 万款 Android 应用在 AI Studio 中创建。主推文调侃:等达到 200 万时,是不是该建一座真雕像?

Google AI Studio: May 2026: we announced native Android app building in AI Studio Today: more than 1M Android apps have been created in AI...

Google产品更新端侧编码
01:55
elvis@omarsar0
73
Google 宣布在 Gemini App 中推出 "study notebooks"(学习笔记本),这是一个交互式学习空间,旨在将好奇心转化为真正的理解。该功能免费且面向全球用户开放,支持所有语言。Elvis Saravia(DAIR.AI)对此表示赞赏,认为这是一种通过 AI 智能体学习的新方式,并提及他之前构建的 "动态学习中心" 概念,后续将有更多相关分享。

Google: Today we're launching study notebooks in the @GeminiApp - an interactive space built to turn your natural curiosity into...

Google产品更新其他
01:44
🚨 AI News | TestingCatalog@testingcatalog
41
GOOGLE 🔥: macOS 版 Gemini 应用将获得 Computer Use 支持,并能远程操控其他桌面设备。 用户可从提示栏的附件菜单中选择"连接另一台 Mac"。 缩小功能差距 🤖
智能体Google产品更新
00:49
Logan Kilpatrick@OfficialLoganK
61
Gemma 4… 为每个人带来设备端智能!
Google模型发布端侧
00:40
Google DeepMind@GoogleDeepMind
63
Gemini 3.5 Flash 现支持原生计算机使用。 这一内置工具让开发者能够构建可跨浏览器、移动和桌面界面进行观察和操作的自定义 AI 智能体。 了解更多 → https://goo.gle/4f4sNQA
智能体Google产品更新
00:15
Google AI Developers@googleaidevs
同事件精选73
Gemini 3.5 Flash 的 Computer Use 工具正式可用

Google AI 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用,支持构建能观察并操作浏览器、移动端和桌面环境的 AI 智能体,可处理长期任务。新特性包括:内置移动与桌面操作系统支持;所有函数调用配备 intent arguments;可定制的客户端函数实现人工接管(HITL);提示词注入检测及可配置的 action-level 安全策略。可用于自动化 QA 测试、业务流程等场景。

智能体Google产品更新多模态
同一事件,精选展示《Gemini 3.5 Flash 引入 computer use 功能》
推荐理由:Computer Use 从浏览器扩展到移动和桌面,Google 正式把 agent 战场拉到全部界面。安全策略的加入说明不是 demo,而是认真考虑落地。
6月25日
23:35
Chubby♨️@kimmonismus
58
Google重组AI编码突击队为"midtraining"小组,缩小与Anthropic差距

Google将数月前成立的AI编码突击队扩展为更正式的“midtraining”小组,位于预训练与后训练之间,旨在提升Gemini编码能力,并延伸至创建演示文稿等商业任务。此前,Noam Shazeer因计算资源变动转投OpenAI,Nobel奖得主John Jumper调至该团队后也加入Anthropic。Google承认,仅靠强大基座模型不够,编码已成为AI最明确的变现层,Anthropic借此获得收入增长。Google需专用训练、计算和更清晰的产品闭环来追赶。

AnthropicGoogleOpenAI编码
23:14
AYi@AYi_AInotes
54
Gemini Pro现在只要$1.99一个月了, Google开始卷价格了?

AYi: http://x.com/i/article/2069352641423896576

Google行业动态
20:18
Berryxia.AI@berryxia
39
Grok 现在制作这种视频真的好方便,而且基本可以一次性搞定,而Google Omni 就触发版权问题。
GooglexAI多模态视频
17:38
fofr@fofrAI
20
这个 Chrome 扩展让你在浏览器中录制操作,再由 Gemini 3.1 Flash Lite 自动将这些任务转换为 Skills。DOM 中的动作会补充视频,从而获得非常精细的指令。我喜爱这个。

👩💻 Paige Bailey: 🎣 Made this @GoogleChrome extension with @antigravity that lets you record actions in the browser, then has Gemini 3.1 ...

智能体Google其他
15:07
向阳乔木@vista8
36
Gemini侧边栏在Chrome中的实用体验

用户从Dia浏览器换回原生Chrome,认为Ask Gemini侧边栏整体可用(仅加载稍慢),且Chrome兼容性最好。举例:可直接让Gemini总结X帖子要点并分析用户情绪倾向。避免被特定AI浏览器绑架是主要原因。

Google大佬观点现象/趋势
12:23
Yuchen Jin@Yuchenj_UW
44
我没意识到Denny Zhou--曾领导Gemini推理团队--已在4个月前离开Google,加入Meta的TBD Lab。 最近很多人离开了Google。我仍在等待Gemini在编码方面赶上。是时候让Sergey启动Code Red了。
GoogleMeta推理行业动态
11:37
向阳乔木@vista8
49
谷歌推出Open Knowledge Format规范

谷歌于六月推出Open Knowledge Format(OKF)规范,参考AK的LLM wiki思路。核心是用Markdown加YAML frontmatter将知识组织为可读、可版本控制、可直接被AI智能体(Agent)消费的文件包。示例中,Codex读取该文章后,将自身做过的项目整理为OKF格式并添加到系统记忆索引中。文章见评论区。

智能体Google产品更新
10:18
Berryxia.AI@berryxia
58
据Bloomberg报道,Google DeepMind旗下Gemini团队两位核心成员Jonas Adler和Alexander Pritzel将加盟Anthropic。Adler曾负责AI coding项目,参与AlphaFold及Gemini 1.5;Pritzel是2014年加入的老兵,参与AlphaFold 2/3及Gemini训练体系。此前Gemini已有4-5位核心人物离开,后续可能带动下属离职,团队前景堪忧。

Max For AI: Gemini又有两位核心人物离开。 据 Bloomberg报道,Gemini 的两位关键贡献者 Jonas Adler @JonasAAdler 和 Alexander Pritzel @AlexPritzel 将离开 Google Dee...

AnthropicGoogle行业动态
06:17
Artificial Analysis@ArtificialAnlys
28
Artificial Analysis 举办 Intelligence Index 活动,发布 v4.1 与新基准

Artificial Analysis 宣布将于 6 月 29 日(周一)在旧金山举办 Intelligence Index 活动。演讲嘉宾来自 Google DeepMind、NVIDIA 和 Z AI。活动将介绍 AI Intelligence Index v4.1 更新以及新推出的长时知识工作基准 AA-Briefcase。

Google行业动态
06:13
🚨 AI News | TestingCatalog@testingcatalog
60
Google Flow Agent 现可基于街景生成图片视频

Google Flow Agent 新增 Google Maps Street View 实景锚定功能,支持根据用户提示中的地名或街道地址,为图片和视频生成提供真实世界细节。用户需启用 Agent 模式并在提示词中包含具体地点。目前该功能仅限美国街景位置可用。

Google Flow: Google Flow 🤝 @GoogleMaps Street View Your agent in Google Flow can now generate images and videos grounded in @GoogleM...

Google产品更新图像生成多模态
04:05
Chubby♨️@kimmonismus
63
Google DeepMind再失两员Gemini关键贡献者,将加入Anthropic

Bloomberg报道,Google DeepMind两位Gemini关键贡献者Jonas Adler和Alexander Pritzel计划离职,加入Anthropic。此前已有John Jumper转向Anthropic、Noam Shazeer加入OpenAI,进一步加剧Google在AI人才争夺中的压力。初创公司Anthropic与OpenAI因潜在IPO能为研究人员提供更高财务回报。Google需应对的问题是:其庞大研究团队能否抵御前沿AI初创公司对顶尖人才的吸引力。

Ed Ludlow: Bloomberg reporting that two more leading AI names are due to leave Google for Anthropic: Jonas Adler and Alexander Prit...

AnthropicGoogle行业动态
03:53
elvis@omarsar0
43
这是 Google 的一次酷发布。 我开始在智能体循环/长时间运行任务中大量依赖计算机使用,并且需要更强大的计算机使用模型,同时保持低成本。不确定 Gemini 3.5 Flash 的效率如何,但我感谢有替代方案。

Google AI Studio: http://x.com/i/article/2069789657777225729

智能体Google产品更新
03:15
Ethan Mollick@emollick
57
Gemini 3 Pro 是首个在 ARC-AGI-2 上达到至少 23% 的模型,它在 2025 年 11 月就做到了(实际得分 31%)。 所以闭源与开源模型之间 8-12 个月的差距似乎仍然存在。但它们也更参差不齐,有些任务表现更好,有些则更差。

ARC Prize: GLM-5.2 from @Zai_org on ARC-AGI (Verified) - ARC-AGI-2: 22.8%, $0.25 - ARC-AGI-1: 77.0%, $0.19 Performance is comparabl...

GoogleOpenAI大佬观点开源生态
03:13
🚨 AI News | TestingCatalog@testingcatalog
66
Google 为 Gemini 3.5 Flash 新增 Computer Use 能力,作为内置工具支持智能体计算机操作任务。该模型在 OSWorld-Verified 基准上取得 78.4 分,为谷歌迄今最佳性能。Computer Use 可跨浏览器、移动和桌面环境推理与执行,自动化工单提交等工作流程。

Omar Sanseviero: Excited to introduce Computer Use support for Gemini 3.5 Flash!🔥 This enables Gemini to reason and act across platforms...

智能体Google产品更新
00:18
Berryxia.AI@berryxia
57
Google Gemini桌面版推出Speak to Window和Magic Pointer,将AI注入macOS系统层

Google Gemini桌面版新增两大功能:Speak to Window允许用户在任意窗口按住fn键语音指挥Gemini写邮件、写文档、生成图片,操作在当前应用内完成;Magic Pointer可圈选屏幕信息,让Gemini理解上下文后执行编辑、总结或创建任务。目标是把Gemini变成系统级上下文感知助手,抢占工作流入口。

智能体Google产品更新语音
00:13
🚨 AI News | TestingCatalog@testingcatalog
31
Gemini 桌面应用(macOS)将新增两项功能:一是 "Magic Pointer",用户可高亮任意窗口中的信息并指示 Gemini 编辑、总结或创建内容;二是 "Speak to Window" 语音听写功能,按住 fn 键即可用语音让 Gemini 起草邮件、撰写文档、生成图像等,无需切换应用。

🚨 AI News | TestingCatalog: GOOGLE 🔥: Gemini desktop app for macOS will get a new voice dictation feature called "Speak to Window" that works with ...

Google产品更新语音
6月24日
23:13
🚨 AI News | TestingCatalog@testingcatalog
32
GOOGLE 🔥: Gemini 桌面应用(macOS)将新增名为 "Speak to Window" 的语音听写功能,可在任意其他应用中使用。
Google产品更新语音
22:36
Google DeepMind@GoogleDeepMind
50
DeepMind 播客探索 AI 智能体经济与群体思维

Google DeepMind 发布播客,由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖:AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化(群体思维)风险,以及分布式智能的解决方案。播客还设有详细时间戳分段,帮助听众聚焦不同话题。

智能体DeepMindGoogle现象/趋势
09:35
Peter Steinberger 🦞@steipete
56
Peter Steinberger 嘲讽 Google 解雇了创建 Google Workspace CLI 的员工 @JPoehnelt,并发布自己的替代工具 gogcli.sh。据被解雇者称,两个月前他因开发该 CLI 被解雇;工具曾在 Hacker News 登顶 #1,数日内获数千 GitHub 星和大量用户。他分析解雇原因是 Workspace 内部对 AI 智能体颠覆现状的恐惧,讽刺的是被解雇前两天他刚得知 Google Cloud Next 将发布官方 Workspace CLI。

Justin Poehnelt: Two months ago I was fired by Google for creating the Google Workspace CLI. It went viral, hit #1 on Hacker News, gained...

Google开源生态行业动态
06:09
Google AI Developers@googleaidevs
60
Gemini Interactions API 是您处理文本、多模态输入、工具使用和管理智能体的统一接口,所有这些都集成在一个端点上。从提示词到产品,比以往更快。 阅读开发者指南 ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

Google AI Studio: http://x.com/i/article/2069439163758170112

智能体GoogleMCP/工具产品更新
05:46
宝玉@dotey
54
Google 工作近7年的工程师因创建 Workspace CLI 被开除

谷歌开发者关系工程师 Justin Poehnelt 今年 3 月初用 Rust 创建了 Google Workspace CLI,支持命令行操作 Gmail、Drive、Calendar 等服务并内置 MCP 服务器。项目发布后登顶 Hacker News,GitHub 获两万多星。谷歌内部反应两极:高管主动请教,法务质疑品牌色。4 月 22–24 日 Google Cloud Next 大会官方宣布即将推出官方 CLI,两天后 Justin 被开除。他怀疑管理层害怕被 AI agent 颠覆。项目仍在 Google GitHub 组织下正常维护(26000+ 星)。

Justin Poehnelt: Two months ago I was fired by Google for creating the Google Workspace CLI. It went viral, hit #1 on Hacker News, gained...

智能体Google开源生态行业动态
01:08
Google AI Developers@googleaidevs
62
Google AI for Developers 在 Gemini API 推出 Managed Agents

Google AI for Developers 宣布在 Gemini API 中推出 Managed Agents,开发者只需一条提示即可构建自主智能体。该智能体能自动研究主题并从头制作广播节目,包括生成对话音频、音乐、专辑封面等。核心特性:零基础设施设置——API 自动创建安全的临时 Linux 沙箱;自主循环——智能体独立规划、自我纠错并执行代码;多步逻辑——通过 agents.md 和 skills.md 文件定义指令和工具,Gemini 优化理解后在一次 API 调用内完成全部任务。

智能体GoogleMCP/工具产品更新
‹ 上一页
1234…24
下一页 ›