本文探讨了如何从无状态聊天机器人升级为生产级AI智能体,以管理长达数天或数周的企业工作流程(如HR入职)。通过引入Agent Development Kit(ADK),其架构核心采用持久状态机和持久化会话存储,确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制,实现在暂停期间“休眠”,并在唤醒后以高推理准确性恢复复杂任务,从而构建出具备韧性和可靠性的长时运行智能体系统。
本文探讨了如何从无状态聊天机器人升级为生产级AI智能体,以管理长达数天或数周的企业工作流程(如HR入职)。通过引入Agent Development Kit(ADK),其架构核心采用持久状态机和持久化会话存储,确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制,实现在暂停期间“休眠”,并在唤醒后以高推理准确性恢复复杂任务,从而构建出具备韧性和可靠性的长时运行智能体系统。
谷歌正与宏碁、华硕、戴尔、惠普和联想等多家OEM厂商合作,计划将Chromebook品牌升级为“Googlebook”。新产品将深度整合Gemini等AI服务,其中“魔术光标”功能可读取屏幕内容并利用Gemini理解上下文以提供信息说明。系统还支持Android手机跨平台协同操作。官方渲染图显示设备可能配备被称为“Glowbar”的RGB发光灯带。更多细节或将在近期活动中公布。
Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手,旨在帮助科研人员加速科学突破。它通过多智能体(multi-agent)的架构设计,作为研究人员的智能伙伴参与工作流程,以提升研究效率并推动创新发现。
谷歌在网页版中新增了Gemini Omni横幅,预示其将成为一个能整合文本、图像和视频的多模态AI代理。关键功能是允许用户将自身形象添加到不同场景中,这与即将登陆Gemini的AI数字形象功能高度关联。该“Likeness”功能很可能深度集成于移动应用,其运作方式曾应用于Sora。外界猜测它可能在今日的Android活动中亮相。
美国商务部官网已移除与谷歌、xAI和微软达成的AI模型安全测试协议细节。原公告链接失效,显示“抱歉,未找到该页面”,并重定向至人工智能标准与创新中心。此前,商务部于5月5日宣布这些企业需在新AI模型推出前提交政府检测,以排查网络攻击、军事滥用等潜在威胁。美国政府担忧如Anthropic的Mythos等强大AI系统的国家安全风险,但删除原因尚不清楚。
大家说Google 最近疯狂降智的时候,是不是要有大的要来了。 依稀记得Gemini3.1 发布前海外疯狂吹捧,但过后似乎没多少人真正使用。 这一波我觉得也该搞点东西出来了吧~~~ [引用 @testingcatalog]:Google keeps preparing its upcoming Gemini Omni models for the release. > Gemini Omni model will be available on APIs as well > The model will be considered as Agent, similarly to Deep Research on AI Studio Soon? 👀 P. S. Just a reminder that Nano Banana 1 wasn’t better than Imagen v4
Google keeps preparing its upcoming Gemini Omni models for the release. > Gemini Omni model will be available on APIs as...
科技媒体发现,谷歌正测试将Pixel Screenshots应用从手机拓展至桌面设备。该应用目前仅支持Pixel 9和10系列,利用端侧AI自动整理截图内容,构建可搜索的资料库。代码中出现了桌面版版本号及2026年的更新时间,表明开发已在进行中。预计其将登陆传闻中的谷歌桌面系统Aluminum OS,但目前仅完成底层适配,完整界面与交互尚未就绪。
谷歌可能即将推出新一代视频生成模型,暂称Veo 4或类似名称。该模型被描述为类似Sora 2.0的全能参考模型,支持对现有视频进行修改参考和内容替换等操作。在文字生成质量上,它被认为比Sora 2.0略有优势,清晰度和细节可能也稍有提升。据透露,这款即将到来的Gemini Omni视频模型在视频编辑功能上将更为先进,能够完成去除水印、替换视频内物体等复杂任务。谷歌预计会发布该模型的两个版本,包括一个性能更强的Pro变体,而目前展示的样本可能并非Pro版本。
GOOGLE 🔥: An upcoming Gemini Omni video model from Google is expected to be much more advanced in video editing, capabl...
谷歌威胁情报团队首次确认一起由AI参与开发的零日漏洞利用事件。攻击针对一款开源Web管理工具,旨在绕过双因素认证,其利用代码中发现了大量教学性注释和“幻觉”生成的CVSS评分,风格符合AI生成特征。谷歌指出,此类高层语义与业务逻辑漏洞正是AI擅长发现的类型。这表明攻击者正更多借助AI来寻找和武器化漏洞,大幅降低了攻击的技术与时间门槛,导致面向互联网的管理后台安全风险加剧。
谷歌披露,犯罪黑客利用人工智能技术发现并利用了一个重大的软件漏洞。该漏洞存在于广泛使用的开源软件中,可能导致大规模数据泄露或系统入侵。谷歌威胁分析小组追踪到此次攻击,并确认黑客借助AI工具显著提升了漏洞挖掘的效率与精准度。目前漏洞细节尚未公开,但相关软件维护方已发布安全更新。这一事件凸显了AI技术被恶意用于网络攻击的现实风险,对全球网络安全防御体系提出了新的挑战。
谷歌DeepMind与Coursera合作推出的“Gemini for Developers”专项课程现已开放注册。该课程旨在指导开发者利用Gemini模型构建可用于生产环境的AI解决方案。其核心涵盖三大模块:“推理与行动”使AI应用能推理并执行复杂任务;“连接与自动化”通过函数调用将Gemini与现实世界工具集成;“规模化与信心”则专注于构建、测试和部署可扩展的AI系统。课程强调超越单纯文本生成,实现实际任务的自动化与系统集成,助力开发者快速上手。
🫨Google is creating a new Omni model with good video editing. Veo4? The original is on the left. Edited right. The new ...
Holllllyyyyyyyy @GeminiApp cooked 😳😳 🚨 Gemini Omni: New video model Here is the first output and see the text coheren...
谷歌母公司Alphabet计划首次发行规模达数千亿日元的日元债券,为人工智能基础设施融资,发行条款预计本月敲定。此举标志着科技巨头正转向债券市场,以支持耗资巨大的AI布局。行业预计,今年全球科技企业在AI基础设施上的投入将超过7000亿美元。此外,亚马逊也正筹备首次发行瑞士法郎债券。近期,Alphabet已通过发行欧元和加元债券募资近170亿美元,并将其年度资本支出预期上调至1800亿至1900亿美元区间。
作者在体验Apple Health后,认为其数据可控性与生态开放性不足。新推出的Google Health API提供了31种健康数据点、Webhook实时推送和精细权限控制,在数据颗粒度与开放程度上优势显著,为开发者构建健康AI Agent或自动化工作流奠定了强大基础。作者计划将其接入现有系统作为核心数据源,并强调未来将优先选择接入此生态的海外健康终端以掌握数据主权,同时暗示国内生态在开放性上存在差距。
Google 把 Fitbit Air 的全新 Google Health API 直接开放了! 昨天 Fitbit Air 刚刚发布,但更重磅的是它自带了全新的 @googlehealth API,开发者现在可以直接在上面构建 AI Ag...
三星在美国为Bespoke AI Family Hub冰箱系列推送重大更新,核心是接入谷歌Gemini模型。此举显著提升了AI视觉食材识别能力,可识别更多生鲜及包装食品。升级后的Bixby助手能理解复杂语音指令,如自动制冰或根据室外温度调节设置。新增即时简报功能可提供个性化资讯与菜谱推荐。冰箱还能通过声纹识别区分用户,提供纪念日提醒、健康报告等专属服务。配备32英寸屏的机型已可更新,9英寸机型将于年内推送。
在Google I/O期间,Gemini移动应用中发现了即将推出的Gemini Omni视频模型的新证据。该模型被描述为“我们的新视频模型”,功能包括混剪视频、在聊天中直接编辑以及使用模板等。分析指出,这可能是基于Gemini的真正“Omni”模型,而非Veo。早期测试显示,该模型会快速消耗使用额度,且网络和移动端应用都将新增一个“使用情况”标签页来追踪用量。
Google Chrome 浏览器集成的 Gemini Nano 等最新 AI 功能,可能会在用户本地设备上占用高达 4GB 的存储空间。这些功能通过部署本地 AI 模型来提升浏览体验,但其模型文件是导致大量存储消耗的主要原因,可能影响存储空间有限设备的性能。此情况已引发科技社区的关注,在 Hacker News 等平台引发了广泛讨论。建议用户留意存储使用情况,并根据自身设备条件和需求,谨慎权衡是否启用这些 AI 特性。
谷歌在 Chrome 148 版本中,移除了此前版本关于设备端 AI 模型“无需将您的数据发送到谷歌服务器”的表述。此举引发了对数据处理方式是否改变的质疑。谷歌发言人澄清,此次仅为措辞修改,数据处理方式实际未变,相关数据仍在设备本地处理。公司解释称,修改是为了避免潜在混淆,因为在某些使用场景下,网站可能通过 Prompt API 看到模型的输入与输出,而这将由各网站自身的隐私政策管辖。
AI工具GPT Images 2和Gemini 3.1 Pro的出现,彻底颠覆了教育应用的开发模式。过去需多人团队、数月时间和高昂成本才能完成的3D教育应用,如今一个具备领域知识(如生物学)的普通人,仅用约48小时和不到10美元即可实现。这消除了对编程、3D建模等技术能力的依赖,使教师、家长等个体也能独立创造高质量互动教学工具。此举有望推动过去仅属于精英机构的教学资源(如虚拟实验室)普及,为缩小教育不平等提供了新的技术路径。
Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...
Gemini API 的文件搜索功能现已升级为多模态版本。此次更新允许开发者上传并搜索图像、PDF、PPT 和 Word 等多种格式的文件,突破了此前仅支持文本文件的限制。该功能基于检索增强生成技术,能同时处理文本和视觉信息,从上传的文档中提取关键内容以生成更准确的回答。这一变化旨在帮助开发者更高效地构建能理解和分析复杂多模态数据的应用程序。
Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点,支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。开发者可利用该 API 基于个人真实健康数据构建 AI Agent、MCP Server、CLI 或实时监控系统等应用,从而创建实用的个人健康自动化工作流。官方已发布包含首次调用教学的入门指南。
Yesterday Fitbit Air launched, but did you know it comes with a new @googlehealth API? You can build AI agents, MCP serv...
Google推出的“Preferred Sources”功能声称旨在提升搜索中的新闻质量,实则将责任转移至几乎无人使用的手动设置选项。这一举措使Google能够以“用户选择”为由应对用户和监管机构,同时继续边缘化开放网络,转而优先推广其自身的人工智能界面。该功能实质上为低质量内容进入搜索结果提供了便利,并未真正解决信息质量管控问题。
Holy sh*t! That jump! So the next model after Mythos will work a whole 8 hour work day at 80% success rate, I assume.
Some news: This week I am starting at @GoogleDeepMind as Director of AGI Economics on @shanelegg's team. I will be joini...
距离谷歌I/O大会仅11天,公司本周推出了一系列AI产品更新。Google Health应用集成Gemini,利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术,可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级,支持多模态、自定义元数据和页面引用,并加入Webhooks推送通知以替代轮询。此外,Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。
谷歌云新推出的 Fraud Defence 服务被指仅是现有技术 WEI 的重新包装,核心功能无实质性变化。这一批评在技术社区引发讨论,在 Hacker News 上获得123个点赞。分析认为,该服务只是换名不换内核,缺乏创新,反映了云安全领域可能存在的品牌重塑现象。
谷歌推出"The Small Brief"项目,邀请四位广告业偶像——Susan、David、Victoria和Penny,运用AI工具为本地企业创作广告。他们使用VideoFX、ImageFX等生成式AI技术,在48小时内为旧金山湾区四家小企业完成广告制作。数据显示,AI生成的广告在关键效果指标上表现优于传统广告,其中一家企业的广告效果提升达30%。该项目展示了AI如何降低创意门槛,让小企业也能获得高质量的广告内容。
谷歌正在美国部分团队试点新的软件工程师面试流程,允许候选人在“代码理解”环节使用获批的AI助手Gemini,以模拟生成式AI时代的真实工作环境。面试官将评估候选人的AI熟练度,包括提示词工程和输出验证能力。此外,面试改革还包括在行为面试轮加入技术设计讨论,以及对初级候选人采用开放式工程挑战。谷歌表示,此举旨在使面试更契合现代工程实践,目前公司内部75%的新代码由AI生成。