AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2607 条
全部一手资讯X论文
标签「产品更新」清除
TestingCatalog News 🗞@testingcatalog · 5月7日58

Code with Claude event is live 🔥

译Code with Claude 活动现已开始直播 🔥 ▪︎ 上午9:00 - 主题演讲 ▪︎ 上午10:30 - Claude Code 新功能 ▪︎ 上午11:15 - GitHub 规模下的 Claude 开发实践 ▪︎ 中午12:00 - 利用 Managed Agents 加速产品上线 以上均为太平洋时间。https://x.com/i/broadcasts/1qGoNegbnRNKv

Perplexity@perplexity_ai · 5月6日49

We’ve developed our own inference engine Runtime-Optimized Serving Engine (ROSE) to serve models ranging from embeddings to trillion-parameter LLMs. With CuTeDSL integrated into our inference engine, Perplexity can build the specialized GPU kernels faster to bring models up to peak performance on NVIDIA Hopper and Blackwell GPUs.

译我们开发了自有的推理引擎——运行时优化服务引擎(ROSE),可服务于从嵌入模型到万亿参数大语言模型的各种模型。 通过将CuTeDSL集成到推理引擎中,Perplexity能够更快构建专用GPU内核,使模型在NVIDIA Hopper和Blackwell GPU上达到峰值性能。

Perplexity@perplexity_ai · 5月6日71

Finance Search is now available in the Perplexity Agent API. In one tool call, developers can now retrieve licensed financial datasets, real-time market data, and cited web sources for agents that need current, verifiable financial answers.

译Perplexity Agent API 现已提供金融搜索功能。 开发者只需一次工具调用,即可为需要当前可验证金融答案的智能体获取授权金融数据集、实时市场数据和附引用的网络资源。

OpenAI@OpenAI · 5月6日54

We’ve partnered with @AMD, @Broadcom, @Intel, @Microsoft, and @NVIDIA, to release Multipath Reliable Connection (MRC), a new open networking protocol that helps large AI training clusters run faster and more reliably, with less wasted GPU time. https://openai.com/index/mrc-supercomputer-networking/

译我们已与@AMD、@Broadcom、@Intel、@Microsoft和@NVIDIA合作,推出多路径可靠连接(MRC)——这是一种全新的开放式网络协议,可帮助大型AI训练集群运行得更快更可靠,并减少GPU时间浪费。 https://openai.com/index/mrc-supercomputer-networking/

TestingCatalog News 🗞@testingcatalog · 5月6日53

Google is working on Screen Recording support and custom Agents for Antigravity. If Screen Recording is powered by Gemini Live, this feature may mimic AI Studio's functionality, allowing Gemini to see what's happening on your screen in real time. Will we get a real-time voice assistant too? 👀

译Google 正在为 Antigravity 开发屏幕录制支持和自定义智能体。 如果屏幕录制功能由 Gemini Live 驱动,该特性可能会模仿 AI Studio 的功能,使 Gemini 能够实时查看您屏幕上的动态。 我们是否也能获得实时语音助手呢?👀

TestingCatalog News 🗞@testingcatalog · 5月6日52

Google has started rolling out Personal Intelligence for Gemini in EU. Gemini Live will get it soon as well. > Gemini remembers your past chats so that you don't have to repeat yourself. Coming soon to Live.

译谷歌已开始在欧盟推出Gemini的个人智能。 Gemini Live也将很快获得此功能。 > Gemini记住你的过去聊天,这样你就不必重复自己。即将在Live中推出。

Alibaba Cloud@alibaba_cloud · 5月6日67

Elite cinematic motion doesn't need an elite price tag. HappyHorse delivers native A/V sync at a fraction of the cost. Build now on Alibaba Cloud Model Studio. 🐴✨ https://int.alibabacloud.com/m/1000412167/

译高端电影级动态无需高昂价格。 HappyHorse以极低成本实现原生音视频同步。 现已在阿里云Model Studio平台构建。🐴✨ https://int.alibabacloud.com/m/1000412167/

阿绎 AYi@AYi_AInotes · 5月6日28

http://x.com/i/article/2051958484304891904 # 我终于看懂AI API中转站越卷越疯的真相:根本不是赚差价 说个反直觉的事实,目前AI赛道里挤破头的API中转站生意,它的盈利模式根本不是赚那点API调用的token差价。 这个事我也是这几天才算明白,为啥AI赛道里做API中转站的人,都疯了一样往里面挤。 就拿前几天我朋友找我咨询的一个项目来说,他是做法律合同审查产品的,团队现在每天用Claude Opus 4.7跑深度推理,固定500万输入加200万输出tokens的量级。 我顺手按官方价格算了一遍,结果好家伙,光一个月就得花45000美元,一天一睁眼1500美元就没了,相当于一年下来54万美元,差不多快400万人民币,给我惊呆了。 他看着这个数字笑了一下说,现在你知道为啥中转站这个赛道,越卷越疯了吧。 说实话,官方定价贵到这种程度,很多团队每天醒来第一件事,就是查前一天烧了多少钱,所以这就是中转站这两年疯狂冒头的全部原因,卷到今天,比官方便宜早就不算啥新闻了,甚至很多卷到直接半价的,但最后做着做着就跑路了。 昨晚9点刚上线的这个产品,token比官方便宜30%,我一开始以为是又一个卷低价的玩家,直到翻完它的产品页,才发现它压根没把自己当中转站。 我给你们算笔账,跑一次Claude Opus的深度推理,大概要烧掉10万tokens,官方收你2.5美元左右,它只收1.75美元,一次省7毛听起来不多,但我朋友那个团队一天跑几千次,一年下来直接差出十几万美元,这钱都够多养两个资深工程师了。而且他们家全系列主流模型全线直接砍30%价格,还没有任何套路,支持 300+ 模型统一访问。 以下是2026年5月最新主流旗舰模型的官方 vs WorldRouter 对比(标准上下文,非长上下文 tier): > 数据来源:WorldRouter 官网 models 页(实时 Credits 定价)、Anthropic/OpenAI/Google 官方 API 定价。 WorldRouter 提供 约 30% 优惠(基于 Credits 系统,1 Credit ≈ $0.01 USD),这种便宜的中转站每年都有人做,只不过做着做着就跑路了。 让我多看了一眼的原因倒不是这个价格,主要是它官网首屏那行字吸引到我了。 Run hundreds of AI agents in one unified token hub。 兄弟们细品,它压根儿就没想在中转站这个红海里跟人卷价格。 它想做的,是整个Agent经济的token底座,讲真光凭这个认知差,就已经把它和所有同行拉开了非常大的差距。 我翻产品页的时候,看到一组App截图把我给惊讶到了,手机屏幕上的todo列表上有几条事项:回复Johnny的交易备忘录,本周五截止;AWS续费340刀,今天16点到期;Sarah明天生日,要不要订束花,底下对话框里,有个AI主动开口问:你这个月AWS成本涨了30%,要我帮你优化吗? 看到这我才反应过来,原来他们卖的根本不是便宜的API额度啊,最终想交付的是一个替你处理所有琐事的AI管家。 token价格便宜30%,只是先把你拉进来感受体验一下产品功能,后面还有系列大招,比如今年Q2 就要交付的云端Agent运行环境、Agent应用商店、自家的硬件终端, 还有支持USD1原生支付的AgentPay SDK。所以核心目标根本不是赚那点API差价。 他们这个项目叫WorldClaw,昨晚刚上线的叫WorldRouter,是worldlibertyfi的生态项目,worldlibertyfi是小特朗普 Donald Trump Jr. 深度参与、海外爆火的顶流 AI+Web3 标杆生态。 它的入场门槛分了四档,从9.9到9999美元覆盖所有人,每一档都算得明明白白: 1️⃣Lite档9.9美元,1000 credits加10 points,一锤子买卖无订阅,credits永久有效, 2️⃣Standard档99美元,10000 credits加100 points, 3️⃣Pro档999美元或者锁25万WLFI,10万credits加1500 points, 4️⃣Max档9999美元或者锁250万WLFI,100万credits加30000 points,还送2026 Q3的迷你主机,首批用户有机会和小特朗普在海湖庄园共进晚餐。 最狠的就是9.9美元的Lite档,两杯冰美式的钱,就能拿到这个AgentOS的早期入场券。 我已经先冲了这档,先跑两周看看手感,等Q2云端Agent环境和App上线,再决定要不要往上加。 你看,所有人都在卷那点token差价的时候,有人已经在做Agent时代的水电煤了。 WorldRouter昨晚9点已经正式上线了,想试试的直接去 worldclaw.ai,9.9美元买不了吃亏,说不定能赶上Agent时代的第一班车。

译AI API中转站并非依靠API调用差价盈利。核心在于官方API成本极高,迫使企业寻求廉价替代。WorldRouter以低于官方约30%的价格提供访问,但其根本目标是成为统一的AI Agent运行与支付平台(Token Hub),致力于提供云端Agent环境、应用商店等基础设施,旨在成为Agent时代的“水电煤”底座。该项目提供从9.9到9999美元的多档入场方案,低价旨在吸引用户体验其未来的Agent服务生态。

Alibaba Cloud@alibaba_cloud · 5月6日51

Alibaba Cloud Firewall launches Agentic NDR! 🚀 Powered by Multi-Agent Collaboration, it closes the loop from detection to response. With agents like OpenClaw, it covers asset inventory, traffic detection & semantic auditing. Now live—try it in the console! ☁️🛡️ #CloudSecurity #NDR #AlibabaCloud 🔗:https://int.alibabacloud.com/m/1000412700/

译阿里云防火墙推出智能NDR!🚀 依托多智能体协同技术,实现从检测到响应的闭环。借助OpenClaw等智能体,覆盖资产盘点、流量检测与语义审计。现已上线——欢迎在控制台体验!☁️🛡️ #云安全 #NDR #阿里云 🔗:https://int.alibabacloud.com/m/1000412700/

OpenClaw🦞@openclaw · 5月6日48

OpenClaw 2026.5.5 🦞 💬 Feishu, LINE, Telegram, Discord fixes 🖥️ Control UI/TUI stay responsive 🔌 Plugins update without losing SDK links 🛠️ Gateway status/restarts clearer Tiny bugfix release. Extremely tiny. https://github.com/openclaw/openclaw/releases/tag/v2026.5.5

译OpenClaw 2026.5.5 🦞 💬 Feishu, LINE, Telegram, Discord 修复 🖥️ 控制 UI/TUI 保持响应 🔌 插件更新不丢失 SDK 链接 🛠️ 网关状态/重启更清晰 微小 bug 修复发布。极其微小。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.5

小互@xiaohu · 5月6日63

一张图生成一个实时回应你的对话视频角色 Runway 推出 Runway Characters 你给它一张参考图,它就能生成一个可以和用户实时说话的视频角色。 • 角色能实时对话,官方称支持 HD、24fps • 它能看摄像头,也能看屏幕共享 • 声音、性格、开场白可以配置,也能生成或克隆自定义声音 • 可以接文本或 Markdown 知识库,让角色按资料回答 • 可以调用工具,比如高亮网页按钮、滚动页面、打开弹窗,或去后端查订单和库存 • 可以通过 API、React SDK、网页 Widget 接进自己的产品。 你可能觉得,这不就是“数字人”吗。上传一张脸,让它眨眼、张嘴、读稿,过去几年大家已经看过很多。 但 Runway Characters 不是在重复这件事。 它想把视频生成从“等模型出片”,往前推到“现场接话”。 用户不是等一段生成好的视频,而是在和屏幕里的角色说话。这个角色要能听懂你、看见你正在看的东西、按资料回答,还能在产品里做一点动作。

译Runway推出Runway Characters功能,用户上传参考图即可生成能实时对话的视频角色。该角色支持高清视频流,可注视摄像头或屏幕共享内容,并允许配置声音、性格与知识库。其核心突破在于将视频生成从预渲染推进至实时交互,使角色能理解对话、依据资料回答问题,并能调用工具执行网页操作或数据查询,支持通过API等方式集成至自有产品。

Peter Steinberger 🦞@steipete · 5月6日36

CodexBar 0.24 is live 🤖 New Windsurf, Codebuff + DeepSeek providers 👥 Copilot multi-account switching 🧹 Opt-in local storage breakdowns 🔋 Hung Codex RPC + redraw battery drain fixed Tiny menu bar, ridiculous changelog. https://github.com/steipete/CodexBar/releases/tag/v0.24

译CodexBar 0.24 已发布 🤖 新增 Windsurf、Codebuff + DeepSeek 提供商 👥 Copilot 多账户切换功能 🧹 可选本地存储详情查看 🔋 修复 Hung Codex RPC 及重绘导致的电量消耗问题 小巧的菜单栏,离谱的更新日志。 https://github.com/steipete/CodexBar/releases/tag/v0.24

Greg Brockman@gdb · 5月6日92

ChatGPT for Excel and Google Sheets:

译ChatGPT for Excel and Google Sheets: 它可以帮助分析杂乱数据、编写公式、更新电子表格,并在此过程中解释其操作——无需离开你的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/

小互@xiaohu · 5月6日69

釜底抽薪 OpenAI 搞了个 Migrate to Codex 功能 让你可以把其他编程工具,比如Claude Code、Cursor里里的配置,一键导入到 Codex 包括编程 Agent 里的配置、规则、技能、MCP、hooks、subagents、最近30天的所有会话等... 它会扫描用户级配置和项目级配置,把能自动映射的内容导入 Codex。比如 instruction files 会迁移到 AGENTS.md,settings.json 会迁移到 config.toml,MCP、hooks、skills、subagents 也都有对应入口。 更有意思的是,不能自动迁移的部分,Codex 会直接开一个新线程,让 Agent 继续帮你处理剩余迁移。

译OpenAI发布“Migrate to Codex”功能,允许用户将其他编程工具(如Claude Code、Cursor)的配置一键导入到Codex。该功能会扫描用户级和项目级配置,自动映射并迁移编程Agent的配置、规则、技能、MCP、hooks、子代理以及最近30天的所有会话等内容。对于无法自动迁移的部分,Codex会启动一个新线程,让Agent继续协助处理剩余迁移任务。

MiniMax (official)@MiniMax_AI · 5月6日48

Speed matters 🚀 Great to see M2.7 running fastest on SambaCloud - now available on both Enterprise & Dev tiers.

译速度至关重要 🚀 很高兴看到 M2.7 在 SambaCloud 上运行最快 - 现已面向企业版和开发版提供。

elvis@omarsar0 · 5月6日22

Wiki-Builder on Hacker News front page! Exciting! New updates coming soon with a cool way for everyone to build their LLM Wikis. Go check it out!

译Hacker News 首页上的 Wiki-Builder! 太棒了! 即将推出新更新,为大家提供一种构建个人 LLM Wiki 的酷炫方式。 快去看看吧!

宝玉@dotey · 5月6日33

帮转招聘

译这则推文转发了一则招聘信息,旨在寻找一位负责AI方向产品的设计师。职位核心要求包括熟练使用AI工具、拥有完整的移动端产品设计经验,并特别注重对女性用户体验的深刻洞察和独立审美创意。团队规模较小但发展空间广阔,招聘通过直接消息沟通进行,申请需提交作品集。

Berryxia.AI@berryxia · 5月6日67

兄弟们!A社看来是每个领域都想插上一棒子了! 前阵子各种设计工具整合,今天直接进入金融圈来一次“大杀四方了”! Claude 这次直接把金融行业的核心痛点,一键打包成了现成可用的 Agent 模板。 Anthropic 正式推出金融服务专属 Claude Agent 模板: - 自动生成 pitch deck(融资演示) - 完成估值审查(valuation review) - 月末结账(closing the books) - 以及更多高频金融流程…… 这些模板自带完整 connectors、skills 和 subagents,开箱即用,也能直接适配你公司的内部标准。 直接在 Claude Cowork 和 Claude Code 里作为插件安装, 或者用官方 cookbook 一键部署成生产级 Managed Agent。 以前金融人花几十个小时做的事,现在一个 Agent 就能接管。 这波更新,把“AI 辅助金融”直接升级成了“AI 直接替金融团队干活”。 金融圈的 Agent 时代,真的来了。 完整方案在这里👉 https://claude.com/solutions/financial-services 你觉得金融行业的下一波裁员要来?😱

译Anthropic正式发布面向金融服务的Claude Agent模板,将AI在金融领域的角色从“辅助”升级为“直接执行”。该模板针对融资演示、估值审查、月末结账等高频率、耗时的核心流程,提供开箱即用的解决方案。它集成了完整的连接器、技能和子代理,可直接适配公司内部标准,并支持在Claude协作与开发环境中安装插件,或通过官方指南一键部署为生产级托管Agent。此举意味着AI开始直接接管以往需金融人员耗费数十小时完成的任务,标志着金融行业Agent时代的实质性开启。

Berryxia.AI@berryxia · 5月6日67

这功能插件打工人必备啊!兄弟们! ChatGPT现在开始支持接入Excel和Google Sheet,直接可以让你可以更快速、方便的处理表格数据! 安装地址👇

Berryxia.AI@berryxia · 5月6日50

豆包收费,豆包姐姐这下真要造反了!!!

小互@xiaohu · 5月6日49

波士顿动力的 Atlas 最新展示 这动作有点牛P 平衡性、灵活性和柔韧度达到了前所未有的高度 不得不感叹这种设计确实是很超前,超越了所有的传统人形机器人...

Berryxia.AI@berryxia · 5月6日64

Google NotebookLM思维导图正在迎来只重大升级: 这些新功能今天开始推出: 🚗 自定义:通过特定用户提示词来引导你的MindMap 📂 组织:立即重命名并分享你的MindMap 🗺️ 导航:节点之间丝滑顺畅的过渡 告诉我们你的想法!

译Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

Berryxia.AI@berryxia · 5月6日65

Apple将在iOS 27 中支持用户接入自定义API或“中转站”了,就是为了解决可以给他们的AI应用Image PlayGround、Writing Tos等功能的不足和缺点。

Berryxia.AI@berryxia · 5月6日72

OpenAI这次居然主动把Agent的“控制权”彻底交给了开发者,而不是继续藏在黑盒里。 Agents SDK重磅升级,专为长时运行Agent量身打造三大杀手级能力: • 在受控沙箱里运行(支持Cloudflare、Vercel、Modal、E2B等多家提供商) • 可完全检查和自定义开源harness • 精准控制什么时候创建记忆、存在哪里 文件、凭证、执行状态全在你自己的环境里,模型只拿到经过批准的上下文。 这意味着: 以前Agent动不动就“失控”或“失忆”的时代,正式结束了。 从demo玩具到生产级基础设施,只差这一步。 OpenAI这次直接把Agent的工程化门槛又拉低了一大截。

译OpenAI对其Agents SDK进行重大升级,旨在为构建长时运行Agent提供更强的执行控制能力。核心在于将控制权交给开发者,打破黑盒状态。新功能包括:在受控沙箱环境中运行Agent,支持多家云服务商;允许完全检查和自定义开源harness;以及精准控制记忆的创建时机与存储位置。所有文件、凭证和执行状态均保留在开发者自有环境中,模型仅能访问经批准的上下文。此举解决了Agent易“失控”或“失忆”的问题,显著降低了工程化门槛,推动其从演示原型迈向生产级基础设施。

Luma@LumaLabsAI · 5月6日70

Introducing the Uni-1.1 API. It reasons through briefs, not just tokens. First-pass results that actually ship. No middleware, no prompt engineering required. Fashion tools. Architecture renderers. Manga pipelines. Cinematic quality across every vertical. Intelligence you can direct. Aesthetic you can ship. → http://lumalabs.ai/api

译推出Uni-1.1 API。 它通过简报进行推理,而不仅仅是处理标记。首次生成的结果即可实际交付。 无需中间件,无需提示工程。时尚工具。建筑渲染器。漫画制作流程。每个垂直领域都具备电影级品质。 可指挥的智能。可交付的审美。→ http://lumalabs.ai/api

TestingCatalog News 🗞@testingcatalog · 5月6日60

Maket AI released their Drawing from Scratch feature, allowing you to design any room, all for FREE! > Any designed space can be viewed in 3D instantly > 3D renders can be generated as well 🤯 > This is literally the work I've paid a couple of grands for, recently, since I am moving to a new place soon

译Maket AI发布了他们的Drawing from Scratch功能,让你可以设计任何房间,完全免费! > 任何设计好的空间都能立即以3D形式查看 > 还能生成3D渲染图 🤯 > 这简直就是我最近花了数千美元请人做的工作,因为我很快要搬新家了

Eric@ericmitchellai · 5月6日63

You can just do things (in ChatGPT)

译你可以直接做事(在 ChatGPT 中) [引用 @_simonsmith]:我一直专注于 Codex,以至于没意识到 ChatGPT 现在可以通过更新后的 Google Drive 连接器直接编辑 Google Drive 中的文件。我推测 Workspace Agents 也能做到这一点,这带来了许多新的机会。

ChatGPT@ChatGPTapp · 5月6日83

ChatGPT is now available as an add-on in Excel and Google Sheets. It can help analyze messy data, write formulas, update spreadsheets, and explain what it’s doing along the way—without leaving your spreadsheet. Powered by GPT-5.5. https://chatgpt.com/apps/spreadsheets/

译ChatGPT 现已作为插件在 Excel 和 Google Sheets 中使用。 它可以帮助分析杂乱的数据、编写公式、更新电子表格,并在此过程中解释其操作——无需离开您的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/

Luma@LumaLabsAI · 5月6日64

Say hello to the Uni-1.1 API. Intelligent enough to reason through a brief. Cultured enough to understand aesthetic context across every visual tradition. Directable enough to go exactly where you point it. Custom pipelines that actually reflect your brand's vision. Now accessible to every team building with image generation. Stop generating. Start shipping → http://lumalabs.ai/api

译向Uni-1.1 API打个招呼。 足够智能,能够推理简报。足够有文化,能理解每种视觉传统中的美学语境。足够可控,能精准到达您指定的方向。 真正反映您品牌愿景的定制流程。现在对所有使用图像生成的团队开放。 停止生成。开始交付 → http://lumalabs.ai/api

Rohan Paul@rohanpaul_ai · 5月6日69

So much of AI work is moving from chat boxes into computer-using agents. Sai just launched product which is basically a remote computer controlled by an AI agent, and you talk to it from your phone or laptop like you would talk to a teammate. Executes every step on a private remote desktop, navigating real apps, even while your laptop is closed. Gives the AI its own workspace, usually a VM, where it can open real apps, click buttons, type into fields, browse websites, inspect screens, and run workflows. For example, if someone sees “black text on a black button,” they can message Sai from iMessage instead of creating a full bug ticket. Sai can open the app in its VM, reproduce the issue, take screenshots, describe the broken state, and pass that verified task to Claude Code, which can then edit the code and open a PR. The big deal is not only “AI on your phone.” The big deal is that the phone becomes a remote control for real software work, while the heavy work happens inside an always-running computer in the background.

译AI工作正从聊天交互转向能直接操作计算机的智能体。Sai推出的新产品提供了一个由AI代理控制的远程计算机(通常是虚拟机),用户可通过手机或电脑与之交互。AI在私有远程桌面中自主操作真实应用程序,执行完整工作流。其核心突破在于手机成为真实软件工作的“遥控器”,繁重任务由后台持续运行的计算机完成。实际用例中,团队成员通过iMessage报告问题,Sai能在其虚拟机中复现问题、截图并交由Claude Code修改代码和提交PR,全程无需打开笔记本电脑,实现了在移动端发起并完成复杂工作。

NotebookLM@NotebookLM · 5月6日61

Source organization has officially ramped to 💯% of users!

译Source organization 已正式面向 💯% 用户全面升级! [引用 @NotebookLM]:资料越多越麻烦?现在不再如此: NotebookLM 现已推出自动标记与分类资料功能(当您拥有 5 个以上资料时),助您减少滚动时间,增加思考/学习/哲思等时间。 重命名、重组、个性化(表情符号!)随您心意定制。

TestingCatalog News 🗞@testingcatalog · 5月6日55

Google is rolling out customization feature for Mind Maps on NotebookLM, along with renaming & sharing options and updated animation. Users will be able to scope their Mind Maps to a specific topic or a source. Did you get it already? 👀

译Google正在为NotebookLM的思维导图功能推出重要更新。核心新增功能包括:用户可通过特定提示词定制思维导图,将其聚焦于特定主题或来源;支持即时重命名和分享导图;节点间切换的动画过渡更加流畅。这些更新旨在提升思维导图的个性化定制、组织管理和导航体验。

Luma@LumaLabsAI · 5月6日35

Interior studios. Fashion tools. Jewelry configurators. Storyboard generators. All of these are being built with the Uni-1.1 API right now. Whatever you're building, the intelligence layer is here. → http://lumalabs.ai/api

译室内设计工作室。时尚工具。珠宝配置器。故事板生成器。 所有这些都正在使用Uni-1.1 API构建。 无论你在构建什么,智能层已就位。→ http://lumalabs.ai/api

Rohan Paul@rohanpaul_ai · 5月6日49

Nvidia and Span is turning homes into small AI data centers, using spare household electrical capacity to run compute nodes while giving hosts cheaper power and internet. The idea starts with a mismatch: many homes are wired for 200 amps, but they often use far less than that, so Span wants its smart panel to measure unused capacity and feed an XFRA Node without overloading the house. Each node is serious hardware, with 16 Nvidia RTX Pro 6000 Blackwell GPUs, 4 AMD EPYC CPUs, and 3TB RAM, which means this is not a hobby server but a rented slice of AI infrastructure. The battery matters because AI workloads hate interruptions, so it buffers demand spikes, supports demand-response events, and shifts work away if a home loses power. The business claim is that distributed nodes can avoid the slowest part of data center growth: getting land, permits, utility approval, grid upgrades, and power access. Span plans a 100-node proof of concept in Q3-26, then aims for more than 1GW of annual capacity from 2027. --- pv-magazine-usa .com/2026/04/15/span-and-nvidia-to-develop-ai-data-centers-in-your-backyard-lowering-electric-bills/

译NVIDIA与Span计划利用家庭未充分利用的电力容量,将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点,并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证,目标是从2027年起实现年容量超过1吉瓦的分布式算力网络,同时为参与家庭降低电费成本。

Rohan Paul@rohanpaul_ai · 5月6日59

Just amazing. Boston Dynamics released a video of the new production version electric Atlas spinning its body while balancing on its arms. Note, that little jutter of the hand to keep balance.

译太惊人了。 Boston Dynamics 发布了新版量产电动 Atlas 的视频,展示其用手臂支撑平衡时旋转身体的动作。 注意,那是手部为保持平衡的小抖动。

TestingCatalog News 🗞@testingcatalog · 5月6日52

Perplexity released Perplexity Computer for Professional Finance with bootstrapped workflows and new data providers. Additionally, all responses are traceable back to the source!

译Perplexity发布了Perplexity Computer for Professional Finance,具备引导式工作流程和新的数据提供商。 此外,所有回答均可追溯至来源!

TestingCatalog News 🗞@testingcatalog · 5月6日67

Perplexity got a new tab for artifacts! It appears to be a list of all previously generated artifacts across Perplexity and Perplexity Computer. Pinning is possible too 👀

译Perplexity 新增了一个 artifacts 标签页!这里似乎列出了 Perplexity 和 Perplexity Computer 中所有先前生成的 artifacts。 还可以进行固定操作 👀

TestingCatalog News 🗞@testingcatalog · 5月6日66

Google released Pomelli Catalog, a new feature on Pomelli marketing agent experiment. Pomelli will generate a set of products based on your business DNA, so you can reuse them across your marketing campaigns. For TestingCatalog, it generated a Weekly Newsletter Subscription product and several others. I will package a new campaign soon 👀

译Google在其营销代理实验项目Pomelli中发布了新功能Pomelli Catalog。该功能允许企业添加产品或服务,随后Pomelli将基于企业的“商业DNA”自动生成一系列产品,例如周度通讯订阅产品,供用户在后续营销活动中复用。Pomelli Catalog能利用这些产品信息,为品牌生成个性化的营销活动和高质量宣传图片。目前该功能免费且全球可用。

OpenAI Developers@OpenAIDevs · 5月6日56

http://x.com/i/article/2051727987352141824 # April for OpenAI Developers April kept the changelog busy. Here’s what changed for developers building with OpenAI: It’s 5/5, so yes, GPT-5.5 gets the first slot: Our community is putting GPT-5.5 to work: Codex got more plugins to work with your go-to tools: Chronicle helps Codex pick up where you left off: Bring your setup and your team to Codex: The Agents SDK added more control for long-running agents: Building with TypeScript? We also talked to our sandbox partners @vercel, @CloudflareDev, and @modal about Agents SDK: WebSockets came to the Responses API: Symphony turns issue queues into agent workflows: Create and edit images in Codex and the API: People are turning gpt-image-2 into visual workflows: Build interactive voice apps: A lot has shipped, and the stack keeps moving. Follow @OpenAIDevs on X to stay up to date.

译OpenAI在四月份为开发者推出多项重要更新。核心是GPT-5.5的发布和广泛应用,社区已积极采用。Codex获得增强,支持更多插件集成、Chronicle上下文记忆功能以及团队协作。Agents SDK增加了对长时间运行智能体的控制,并新增TypeScript支持。API方面,Responses API引入WebSockets支持,Symphony功能可将问题队列转化为智能体工作流。图像创建与编辑功能已集成至Codex和API,同时支持构建交互式语音应用,推动开发者工具生态发展。

Google AI Developers@googleaidevs · 5月6日68

We’re expanding the Gemini API File Search tool 🔍 with 3 new updates that enable developers to more easily build multimodal RAG systems with enhanced precision: + Multimodal Support: By leveraging our Gemini Embedding 2 model, File Search can now reason across image and text simultaneously. + Custom Metadata Filtering: Bring structure to unstructured data by tagging files with custom key-value labels. This pre-filters your data and boosts search speed. + Exact citations: File Search can now capture and return the exact source (down to the page number) for every piece of information indexed. See multimodal File Search in action with our example app in @GoogleAIStudio. Chat with your entire image and doc library, ask questions, and trace answers back to the source: http://goo.gle/4tKSz1k

译Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月7日
00:09
TestingCatalog News 🗞@testingcatalog
58
Code with Claude 活动现已开始直播 🔥 ▪︎ 上午9:00 - 主题演讲 ▪︎ 上午10:30 - Claude Code 新功能 ▪︎ 上午11:15 - GitHub 规模下的 Claude 开发实践 ▪︎ 中午12:00 - 利用 Managed Agents 加速产品上线 以上均为太平洋时间。https://x.com/i/broadcasts/1qGoNegbnRNKv

ClaudeDevs: Code with Claude is happening now! ▪︎ 9:00AM - Keynote ▪︎ 10:30AM - What's new in Claude Code ▪︎ 11:15AM - Building on C...

AnthropicMCP/工具产品更新编码
5月6日
23:37
Perplexity@perplexity_ai
49
我们开发了自有的推理引擎--运行时优化服务引擎(ROSE),可服务于从嵌入模型到万亿参数大语言模型的各种模型。 通过将CuTeDSL集成到推理引擎中,Perplexity能够更快构建专用GPU内核,使模型在NVIDIA Hopper和Blackwell GPU上达到峰值性能。
产品更新部署/工程
22:37
Perplexity@perplexity_ai
精选71
Perplexity Agent API 现已提供金融搜索功能。 开发者只需一次工具调用,即可为需要当前可验证金融答案的智能体获取授权金融数据集、实时市场数据和附引用的网络资源。
产品更新搜索

推荐理由:Perplexity 把金融搜索拆成 API 端点,对于做金融 Agent 的开发者是实打实的生产力提升,属于‘一调即用’那种,可以跳过一堆数据集成工作。
22:04
OpenAI@OpenAI
54
我们已与@AMD、@Broadcom、@Intel、@Microsoft和@NVIDIA合作,推出多路径可靠连接(MRC)--这是一种全新的开放式网络协议,可帮助大型AI训练集群运行得更快更可靠,并减少GPU时间浪费。 https://openai.com/index/mrc-supercomputer-networking/
OpenAI产品更新开源生态部署/工程
20:38
TestingCatalog News 🗞@testingcatalog
53
Google 正在为 Antigravity 开发屏幕录制支持和自定义智能体。 如果屏幕录制功能由 Gemini Live 驱动,该特性可能会模仿 AI Studio 的功能,使 Gemini 能够实时查看您屏幕上的动态。 我们是否也能获得实时语音助手呢?👀
智能体Google产品更新多模态
19:07
TestingCatalog News 🗞@testingcatalog
52
谷歌已开始在欧盟推出Gemini的个人智能。 Gemini Live也将很快获得此功能。 > Gemini记住你的过去聊天,这样你就不必重复自己。即将在Live中推出。

OG Gabi Bartok: @testingcatalog @btibor91 perosnal context in europe

Google产品更新
18:58
Alibaba Cloud@alibaba_cloud
67
高端电影级动态无需高昂价格。 HappyHorse以极低成本实现原生音视频同步。 现已在阿里云Model Studio平台构建。🐴✨ https://int.alibabacloud.com/m/1000412167/
产品更新多模态
18:16
阿绎 AYi@AYi_AInotes
28
AI API中转站疯狂内卷的真相:并非赚取差价,而是构建Agent时代底座

AI API中转站并非依靠API调用差价盈利。核心在于官方API成本极高,迫使企业寻求廉价替代。WorldRouter以低于官方约30%的价格提供访问,但其根本目标是成为统一的AI Agent运行与支付平台(Token Hub),致力于提供云端Agent环境、应用商店等基础设施,旨在成为Agent时代的“水电煤”底座。该项目提供从9.9到9999美元的多档入场方案,低价旨在吸引用户体验其未来的Agent服务生态。

智能体产品更新
17:58
Alibaba Cloud@alibaba_cloud
51
阿里云防火墙推出智能NDR!🚀 依托多智能体协同技术,实现从检测到响应的闭环。借助OpenClaw等智能体,覆盖资产盘点、流量检测与语义审计。现已上线--欢迎在控制台体验!☁️🛡️ #云安全 #NDR #阿里云 🔗:https://int.alibabacloud.com/m/1000412700/
智能体产品更新
17:35
OpenClaw🦞@openclaw
48
OpenClaw 2026.5.5 🦞 💬 Feishu, LINE, Telegram, Discord 修复 🖥️ 控制 UI/TUI 保持响应 🔌 插件更新不丢失 SDK 链接 🛠️ 网关状态/重启更清晰 微小 bug 修复发布。极其微小。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.5
智能体产品更新部署/工程
16:37
小互@xiaohu
63
Runway推出可实时对话的视频角色生成功能

Runway推出Runway Characters功能,用户上传参考图即可生成能实时对话的视频角色。该角色支持高清视频流,可注视摄像头或屏幕共享内容,并允许配置声音、性格与知识库。其核心突破在于将视频生成从预渲染推进至实时交互,使角色能理解对话、依据资料回答问题,并能调用工具执行网页操作或数据查询,支持通过API等方式集成至自有产品。

智能体产品更新视频
12:34
Peter Steinberger 🦞@steipete
36
CodexBar 0.24 已发布 🤖 新增 Windsurf、Codebuff + DeepSeek 提供商 👥 Copilot 多账户切换功能 🧹 可选本地存储详情查看 🔋 修复 Hung Codex RPC 及重绘导致的电量消耗问题 小巧的菜单栏,离谱的更新日志。 https://github.com/steipete/CodexBar/releases/tag/v0.24
产品更新开源/仓库编码
11:29
Greg Brockman@gdb
精选92
ChatGPT for Excel and Google Sheets: 它可以帮助分析杂乱数据、编写公式、更新电子表格,并在此过程中解释其操作--无需离开你的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/

ChatGPT: ChatGPT is now available as an add-on in Excel and Google Sheets. It can help analyze messy data, write formulas, update...

OpenAI产品更新

推荐理由:ChatGPT 刚刚以插件形式进入 Excel 和 Google Sheets,背后是 GPT-5.5,能直接处理脏数据、写公式——这比任何通用聊天更新都更接地气,普通打工人明天就能用上。
11:06
小互@xiaohu
69
OpenAI推出Migrate to Codex功能,一键迁移编程工具配置

OpenAI发布“Migrate to Codex”功能,允许用户将其他编程工具(如Claude Code、Cursor)的配置一键导入到Codex。该功能会扫描用户级和项目级配置,自动映射并迁移编程Agent的配置、规则、技能、MCP、hooks、子代理以及最近30天的所有会话等内容。对于无法自动迁移的部分,Codex会启动一个新线程,让Agent继续协助处理剩余迁移任务。

智能体MCP/工具OpenAI产品更新
10:31
MiniMax (official)@MiniMax_AI
48
速度至关重要 🚀 很高兴看到 M2.7 在 SambaCloud 上运行最快 - 现已面向企业版和开发版提供。

SambaNova: MiniMax M2.7 is now running FASTEST on SambaCloud 🚀 Built for coding, OpenClaw, and self-evolving agent workflows. Avai...

智能体产品更新推理
10:29
elvis@omarsar0
22
Hacker News 首页上的 Wiki-Builder! 太棒了! 即将推出新更新,为大家提供一种构建个人 LLM Wiki 的酷炫方式。 快去看看吧!
产品更新
10:01
宝玉@dotey
33
这则推文转发了一则招聘信息,旨在寻找一位负责AI方向产品的设计师。职位核心要求包括熟练使用AI工具、拥有完整的移动端产品设计经验,并特别注重对女性用户体验的深刻洞察和独立审美创意。团队规模较小但发展空间广阔,招聘通过直接消息沟通进行,申请需提交作品集。

61: 找一位设计师,负责一款 AI 方向的产品 希望: - 会用 AI - 有完整移动端产品经验 - 对女性用户体验有洞察(很重要) - 有自己的审美和想法 团队不大,但空间很大。有兴趣欢迎 DM 沟通,带上作品集。

产品更新行业动态
09:17
Berryxia.AI@berryxia
67
Anthropic推出金融服务Claude Agent模板,AI直接接管核心金融流程

Anthropic正式发布面向金融服务的Claude Agent模板,将AI在金融领域的角色从“辅助”升级为“直接执行”。该模板针对融资演示、估值审查、月末结账等高频率、耗时的核心流程,提供开箱即用的解决方案。它集成了完整的连接器、技能和子代理,可直接适配公司内部标准,并支持在Claude协作与开发环境中安装插件,或通过官方指南一键部署为生产级托管Agent。此举意味着AI开始直接接管以往需金融人员耗费数十小时完成的任务,标志着金融行业Agent时代的实质性开启。

智能体Anthropic产品更新
09:17
Berryxia.AI@berryxia
67
这功能插件打工人必备啊!兄弟们! ChatGPT现在开始支持接入Excel和Google Sheet,直接可以让你可以更快速、方便的处理表格数据! 安装地址👇
OpenAI产品更新
09:17
Berryxia.AI@berryxia
50
豆包收费,豆包姐姐这下真要造反了!!!
产品更新端侧
08:36
小互@xiaohu
49
波士顿动力的 Atlas 最新展示 这动作有点牛P 平衡性、灵活性和柔韧度达到了前所未有的高度 不得不感叹这种设计确实是很超前,超越了所有的传统人形机器人…
产品更新具身智能
08:17
Berryxia.AI@berryxia
64
Google NotebookLM思维导图新增自定义、组织与导航功能

Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

Google产品更新搜索
08:17
Berryxia.AI@berryxia
65
Apple将在iOS 27 中支持用户接入自定义API或"中转站"了,就是为了解决可以给他们的AI应用Image PlayGround、Writing Tos等功能的不足和缺点。

Mark Gurman: NEW: Apple's iOS 27 will allow users to choose from a range of outside AI services to power features like Image Playgrou...

产品更新端侧
08:17
Berryxia.AI@berryxia
72
OpenAI将Agent控制权交予开发者,SDK升级赋能长时运行

OpenAI对其Agents SDK进行重大升级,旨在为构建长时运行Agent提供更强的执行控制能力。核心在于将控制权交给开发者,打破黑盒状态。新功能包括:在受控沙箱环境中运行Agent,支持多家云服务商;允许完全检查和自定义开源harness;以及精准控制记忆的创建时机与存储位置。所有文件、凭证和执行状态均保留在开发者自有环境中,模型仅能访问经批准的上下文。此举解决了Agent易“失控”或“失忆”的问题,显著降低了工程化门槛,推动其从演示原型迈向生产级基础设施。

OpenAI Developers: Build long-running agents with more control over agent execution. New capabilities in the Agents SDK: • Run agents in co...

智能体OpenAI产品更新开源/仓库
08:01
Luma@LumaLabsAI
70
推出Uni-1.1 API。 它通过简报进行推理,而不仅仅是处理标记。首次生成的结果即可实际交付。 无需中间件,无需提示工程。时尚工具。建筑渲染器。漫画制作流程。每个垂直领域都具备电影级品质。 可指挥的智能。可交付的审美。→ http://lumalabs.ai/api
产品更新图像生成视频
06:05
TestingCatalog News 🗞@testingcatalog
60
Maket AI发布了他们的Drawing from Scratch功能,让你可以设计任何房间,完全免费! > 任何设计好的空间都能立即以3D形式查看 > 还能生成3D渲染图 🤯 > 这简直就是我最近花了数千美元请人做的工作,因为我很快要搬新家了

Maket: Design ANY room for FREE 💥 Drawing from scratch lets you put your ideas right on the canvas. And it's now available on ...

产品更新
05:59
Eric@ericmitchellai
63
你可以直接做事(在 ChatGPT 中) 【引用 @_simonsmith】:我一直专注于 Codex,以至于没意识到 ChatGPT 现在可以通过更新后的 Google Drive 连接器直接编辑 Google Drive 中的文件。我推测 Workspace Agents 也能做到这一点,这带来了许多新的机会。

Simon Smith: I've been so focused on Codex that I didn't realize ChatGPT can now directly edit files in Google Drive via the updated ...

智能体OpenAI产品更新
05:34
ChatGPT@ChatGPTapp
精选83
ChatGPT 现已作为插件在 Excel 和 Google Sheets 中使用。 它可以帮助分析杂乱的数据、编写公式、更新电子表格,并在此过程中解释其操作--无需离开您的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/
OpenAI产品更新

推荐理由:直接在 Excel 里用 GPT-5.5 分析数据、写公式,不是新模型,但对每天和表格打交道的普通人来说比任何 benchmark 都实在。装个插件就能用。
05:31
Luma@LumaLabsAI
64
向Uni-1.1 API打个招呼。 足够智能,能够推理简报。足够有文化,能理解每种视觉传统中的美学语境。足够可控,能精准到达您指定的方向。 真正反映您品牌愿景的定制流程。现在对所有使用图像生成的团队开放。 停止生成。开始交付 → http://lumalabs.ai/api
产品更新图像生成
05:28
Rohan Paul@rohanpaul_ai
69
AI工作范式转变:从聊天框到可操作计算机的智能体

AI工作正从聊天交互转向能直接操作计算机的智能体。Sai推出的新产品提供了一个由AI代理控制的远程计算机(通常是虚拟机),用户可通过手机或电脑与之交互。AI在私有远程桌面中自主操作真实应用程序,执行完整工作流。其核心突破在于手机成为真实软件工作的“遥控器”,繁重任务由后台持续运行的计算机完成。实际用例中,团队成员通过iMessage报告问题,Sai能在其虚拟机中复现问题、截图并交由Claude Code修改代码和提交PR,全程无需打开笔记本电脑,实现了在移动端发起并完成复杂工作。

Sai: Been dogfooding Sai with Claude Code lately and the part that's actually stuck for us isn't just the responsiveness. It'...

智能体MCP/工具产品更新
04:26
NotebookLM@NotebookLM
61
Source organization 已正式面向 💯% 用户全面升级! 【引用 @NotebookLM】:资料越多越麻烦?现在不再如此: NotebookLM 现已推出自动标记与分类资料功能(当您拥有 5 个以上资料时),助您减少滚动时间,增加思考/学习/哲思等时间。 重命名、重组、个性化(表情符号!)随您心意定制。

NotebookLM: Mo sources mo problems? Not anymore: Rolling out now, NotebookLM can auto-label & categorize sources (when you have 5+),...

Google产品更新
04:02
TestingCatalog News 🗞@testingcatalog
55
Google正在为NotebookLM的思维导图功能推出重要更新。核心新增功能包括:用户可通过特定提示词定制思维导图,将其聚焦于特定主题或来源;支持即时重命名和分享导图;节点间切换的动画过渡更加流畅。这些更新旨在提升思维导图的个性化定制、组织管理和导航体验。

NotebookLM: Mind Maps are getting a major glow up 💅 These new features are rolling out today: 🚗Customization: Steer your map with ...

Google产品更新其他
04:01
Luma@LumaLabsAI
35
室内设计工作室。时尚工具。珠宝配置器。故事板生成器。 所有这些都正在使用Uni-1.1 API构建。 无论你在构建什么,智能层已就位。→ http://lumalabs.ai/api
产品更新多模态视频
03:57
Rohan Paul@rohanpaul_ai
49
NVIDIA与Span合作将住宅变为小型AI数据中心,利用家庭富余电力

NVIDIA与Span计划利用家庭未充分利用的电力容量,将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点,并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证,目标是从2027年起实现年容量超过1吉瓦的分布式算力网络,同时为参与家庭降低电费成本。

产品更新端侧部署/工程
03:57
Rohan Paul@rohanpaul_ai
59
太惊人了。 Boston Dynamics 发布了新版量产电动 Atlas 的视频,展示其用手臂支撑平衡时旋转身体的动作。 注意,那是手部为保持平衡的小抖动。
产品更新具身智能
03:32
TestingCatalog News 🗞@testingcatalog
52
Perplexity发布了Perplexity Computer for Professional Finance,具备引导式工作流程和新的数据提供商。 此外,所有回答均可追溯至来源!

Perplexity: Every output is traceable. Computer shows where the data came from and links directly to the source behind key numbers. ...

产品更新搜索
03:32
TestingCatalog News 🗞@testingcatalog
67
Perplexity 新增了一个 artifacts 标签页!这里似乎列出了 Perplexity 和 Perplexity Computer 中所有先前生成的 artifacts。 还可以进行固定操作 👀
产品更新搜索
03:32
TestingCatalog News 🗞@testingcatalog
66
Google在其营销代理实验项目Pomelli中发布了新功能Pomelli Catalog。该功能允许企业添加产品或服务,随后Pomelli将基于企业的"商业DNA"自动生成一系列产品,例如周度通讯订阅产品,供用户在后续营销活动中复用。Pomelli Catalog能利用这些产品信息,为品牌生成个性化的营销活动和高质量宣传图片。目前该功能免费且全球可用。

Pomelli By Google: Today, we're introducing Pomelli Catalog.📣✨ Add your products or services, and Pomelli will use them to generate person...

智能体Google产品更新
02:58
OpenAI Developers@OpenAIDevs
56
OpenAI四月开发者更新概览

OpenAI在四月份为开发者推出多项重要更新。核心是GPT-5.5的发布和广泛应用,社区已积极采用。Codex获得增强,支持更多插件集成、Chronicle上下文记忆功能以及团队协作。Agents SDK增加了对长时间运行智能体的控制,并新增TypeScript支持。API方面,Responses API引入WebSockets支持,Symphony功能可将问题队列转化为智能体工作流。图像创建与编辑功能已集成至Codex和API,同时支持构建交互式语音应用,推动开发者工具生态发展。

智能体OpenAI产品更新多模态
02:56
Google AI Developers@googleaidevs
精选68
Gemini API 文件搜索工具推出三项新更新,助力多模态 RAG 系统开发

Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。

GoogleMCP/工具检索增强产品更新

推荐理由:如果你在用 Gemini 搭 RAG 系统,这三项更新能直接改善搜索精度和可解释性,多模态搜索终于把图片和文档打通了,值得马上试试。
‹ 上一页
1…484950
下一页 ›