阿里 Qoder 推出全托管 AI Agent 运行平台 Cloud Agents。该平台提供 Agent 底座、模型服务及运行环境,企业可通过 API 直接调用,能将 Agent 上线时间从 1 个月缩短至 1 天。Cloud Agents 支持独立沙箱、实时事件流追踪与审计,并原生支持 Skills 和 MCP 协议,可扩展多种企业能力。
阿里达摩院发布“敏迭”求解器 GPU 版本。该版本利用 GPU 并行加速特性,并引入新算法缓解收敛的“长尾效应”。在约 2000 个通用线性规划算例测试中,其高精度稳定求解率超过 99%,并能支持亿级变量线性规划问题。相比业内主流产品,其在大规模问题上的成功率提升 14% 以上,速度平均提升 2.67 倍。在某数字广告平台案例中,该求解器仅用 1700 秒就对 3.3 亿变量的复杂问题求解到可靠精度。
华为 Mate X7 折叠屏手机已开启鸿蒙 HarmonyOS 6.1.0.125 SP9 版本推送,系统包大小约 4.95GB。更新主要新增图库智能清理与贴纸功能、全面升级游戏助手,并实装了“超空间内存技术”,可在保持前台流畅的同时大幅提升后台保活效率。该技术原计划于 6 月推送,此次实装时间更早。此前发布的 Pura 90 Pro Max 也支持此技术,宣称可实现“12G 的内存 16G 的保活体验”。
YouTube 更新了 AI 视频标注功能。首先,标注标签位置将更显眼:长视频标签将出现在播放器下方、描述栏上方;Shorts 短视频标签将以覆盖层形式显示在视频上。其次,若系统检测到视频使用了写实类 AI 但创作者未手动声明,系统将自动为其添加 AI 使用标签。创作者可在 YouTube Studio 中更新披露状态。此外,使用 YouTube 自有 AI 工具(如 Veo 或 Dream Screen)创作的内容,以及包含表明其为完全生成式 AI 的 C2PA 元数据的内容,其披露标签将永久显示。
腾讯搜狗输入法上线“跨设备复制粘贴”功能,支持登录同一账号的 Windows、macOS、iOS、Android 设备间自动共享剪贴板内容,可互传图片、文本与链接。iOS 设备需先唤起键盘以完成同步,暂不支持超大文本与大体积图片互传。用户可对复制的文字在输入法内直接进行润色、翻译等 AI 处理。该功能未来将支持鸿蒙端。
清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的智能体操作系统 PilotDeck,以 WorkSpace(工作舱)替代传统对话框,每个工作舱拥有独立文件系统、记忆和技能,实现项目隔离。三大核心能力:记忆白盒化,全链路可见可控,支持一键修改和回滚;智能路由,自动识别任务难度动态分配模型,开启后成本节省近 70%,复杂任务仅用 1/6 成本即可反超顶级模型方案;Always-on 常驻任务,AI 主动发现并持续推进工作。支持端云协同,可调用端侧模型作为子 Agent,自动部署 VoxCPM 等模型完成多语言播客等任务。
小米招聘Agent正式上线官网,依托Xiaomi MiMo大模型为求职者提供政策解答、职位智能推荐、招聘进展查询等服务。
小米宣布 MiMo-V2.5 系列 API 永久降价,最高降幅达 99% 且不再区分上下文窗口长度。负责人罗福莉解释,核心原因是推理框架实现了针对 SWA 的分层 KV 缓存优化,将 Token 容量提升 5 倍,相当于降低 80% 的缓存成本。结合模型 1:7 的稀疏架构,其原始推理成本远低于行业平均水平,此次降价是将结构性成本优势直接让利给开发者。她也建议 LLM 公司不要盲目降价,需有相应的架构和优化能力支撑。
AI音频公司ElevenLabs宣布与Stan Lee Universe达成合作,将在其平台整合漫威之父斯坦·李的声音、形象及音乐风格。其克隆声音已上线Iconic Marketplace和Eleven Reader,并内置“斯坦·李每月读书会”。ElevenCreative Music平台还推出了两款受其启发的Finetunes微调滤镜。相关使用默认限于个人非商业用途。
Claude Code 发布 v2.1.153 版本。主要新增 skipLfs 选项以跳过 Git LFS 下载;优化了 claude agents 的自动补全建议和 PR 列显示格式。本次更新修复了大量问题,包括:MCP 服务器的连接与重连、子代理的配置策略与严格模式行为、后台会话的管理与权限提示(如恢复、输入响应、临时文件处理),以及跨 macOS/Windows/VSCode 平台的稳定性。此外,还修复了 Windows 更新回滚、内存占用、会话恢复等多个具体问题。/model 命令现在会将选择设为新会话的默认模型。
对话模式在文本和语音输入方面进行了改进。语音会话开始时,可访问用户的图像提示、风格参考、侧边栏设置和最近任务。图像提示功能现可从托盘和侧边栏直接使用。在语音提交过程中,托盘中的图像将保持不变,直至用户手动移除。
Robinhood现允许客户通过MCP协议将Anthropic的Claude等AI智能体连接到独立的投资账户。这些智能体能够自主交易股票。美国金融业监管局(FINRA)已将此类智能体列为新的风险领域,并警告其可能做出不受约束的决策。Robinhood自身也承认该产品并非适合所有客户。
Google Pay 正向"智能体商务"演进,推出了通用商务协议和新的 MCP 服务器,允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账,并通过 WebView 将支付功能扩展至社交媒体应用。此外,平台还推出了跨设备生物认证和新的交易信号,旨在帮助商家减少流程摩擦。
NVIDIA 研究人员推出了 Polar,一个无需修改智能体框架即可利用强化学习训练语言智能体的 rollout 框架。Polar 通过在智能体框架与推理服务器之间放置模型 API 代理来捕获 token 级交互并重建可用于训练的轨迹。基于 Qwen3.5-4B 基础模型,使用 GRPO 进行训练后,Polar 将 SWE-Bench Verified pass@1 在 Codex 框架下提升了 22.6 点,在 Claude Code 下提升了 4.8 点,在 Pi 下提升了 6.2 点。该框架已注册为 NeMo Gym 环境并在 ProRL Agent Server 仓库中发布。
YouTube将上线一套新的AI内容标签系统,旨在使标签位置更显眼:长视频的标签将显示在播放器下方,Shorts的标签将作为叠加层显示。从2026年5月开始,该平台将启动自动检测系统,即使创作者未主动披露,也会对AI生成内容进行标记。该系统对视频的推荐和变现没有影响。
Robinhood宣布向AI智能体开放其交易平台。交易者可以为AI智能体创建独立账户并注入特定资金,使其能够在市场上买卖股票。该功能旨在自动化投资决策,例如监控特定行业或再平衡投资组合。但Robinhood同时发出重大警告:智能体交易涉及重大风险,包括可能损失全部投资,AI驱动的策略在市场条件下可能表现不佳。
ElevenLabs 发布的新模型支持用户对歌曲的任意片段进行重新生成,且修改过程不会影响该曲目的其他部分。
雷鸟推出两款AR眼镜:主打观影的GT Max采用孔雀光引擎3.0 Max与PWG光学结构,搭载视涯5.5代Micro-OLED双层面板,提供267英寸巨幕体验与1200nits峰值亮度,售价2599元(国补后2209元)。另一款AI拍摄眼镜V4仅重38g,具备IP67防水,首发OG09B方形传感器,支持2.5K画质与11.5小时续航,售价2199元(国补后1869元)。
腾讯在 SPARK 2026 发布会宣布旗下全新 AI 游戏创作平台“代号 Craft”,已开启首测报名。该平台内置 AIGC 工具链,提供超万种预制美术资源。用户可通过自然语言对话快速生成 2D、3D 等多种类型的游戏雏形,支持移动端、PC 及主机端游戏原型开发,并适配 Unity 等主流引擎导出格式。
Runway 正式推出 Runway MCP 服务器,允许任何兼容 MCP 的 AI 智能体(如 Claude、ChatGPT、Cursor)在对话界面中直接生成图像与视频,无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型,包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便,通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用,无需单独申请 API 密钥。
关联讨论 1 条X:Runway (@runwayml)睡眠科技初创公司SOND宣布以700万美元融资走出隐身模式。该公司由前Bose睡眠产品负责人创立,其首款产品为AI驱动的睡眠耳机。
Google正在将展示广告整合到其AI驱动的Demand Gen平台中,这标志着一个长期存在的数字广告模式的终结。Google展示网络(GDN)作为开放互联网的支柱已近二十年。此前,营销人员依赖其可预测的框架来定位广告位、竞标受众并进行静态创意的A/B测试。此次整合意味着广告投放将转向由AI主导的模式。
雷鸟创新发布雷鸟V4 AI拍摄眼镜,标准版售价2199元,国补后1869元起,5月30日交付。该机型聚焦AI响应速度优化,采用高通骁龙AR1与恒玄BES2800BP双芯架构,引入通义千问模型,AI最快响应0.2秒,较上一代提升超138%。电池容量提升57%,连续视频录制可达约47分钟。影像方面,首次搭载1/2.9英寸、1:1方形传感器OG09B,单像素尺寸2.09微米。防护等级提升至IP67,整机重量约38克。
雷鸟发布旗舰AR眼镜GT系列。旗舰GT Max具备59度FOV视场角,搭载“孔雀光学引擎 3.0 Max”与5.5代Micro OLED屏幕,支持杜比视界与AI HDR功能,配备双芯片,整机重量78克,售价2599元。轻量化版本GT视场角为46度,重量68克,售价1899元。两款产品已开启预售。雷鸟还预告将于2026年Q3推出AI眼镜新系列“雷鸟 iO”。
YouTube重新设计了AI标签的位置,使其更易被发现。对于普通视频和Shorts,标注AI生成内容的标签现在直接显示在视频播放器下方、描述文字之上。同时,平台将开始自动识别并为AI生成的内容添加标签。
YouTube 宣布将自动标记使用了大量逼真 AI 技术生成的视频。此举改变了以往完全依赖创作者主动披露 AI 内容的方式,YouTube 平台将介入并强制标注。同时,平台上的 AI 内容标签将变得更加醒目。
金融平台 Robinhood 推出一项新功能,允许用户创建一个带有预存余额的独立账户。该账户专门设计用于 AI 智能体执行股票交易操作,为自动化投资代理提供了专用资金渠道。
火山引擎推出AI Trust安全产品体系,以“模型可信-智能体可控-智能化安全运营”三层架构助力企业可信、可控、合规的AI落地。模型可信层通过AICC机密计算提供端到端全链路加密与芯片级信任,支持豆包、DeepSeek、GLM、Kimi等模型及国产芯片。智能体可控层推出AI助手安全平台,内置防御提示词攻击、防数据泄露、权限管控与全局态势监控,每日支持100亿次检测调用,在IDC智能体威胁检测评估中获总分第一。智能化安全运营层推出安全运营Agent,覆盖代码审计、漏洞分析等7个场景,冷启动准确率超95%,经自主学习后达99%以上,广汽集团落地后告警处理效率提升10倍。
开源智能体编程平台 Kilo Code 现已集成 xAI 的 Grok 模型。用户可使用其 SuperGrok 或 X Premium+ 订阅,在 VS Code、JetBrains IDE 及终端等环境中调用最新的 Grok 模型,包括专为智能体编程设计的 Grok Build。连接过程无需单独的 API 密钥,通过 OAuth 认证即可使用。Kilo Code 本身支持 500+ 种模型,并集成了工具使用、浏览器自动化及 MCP 扩展等能力,适用于软件工程与智能体工作流。
腾讯会议正式推出“声链”功能,旨在解决同一会议室内多台设备同时开麦时产生的啸叫问题。该功能基于腾讯天籁实验室的跨设备AI回声消除技术,通过算法对各设备音频进行回声消除与高质量混音对齐,以纯软件方案实现清晰无干扰的音频体验,并支持自动识别发言人。用户需将腾讯会议升级至最新版本以体验该功能。
在鸿蒙智行问界 M9 系列新品发布会上,华为发布全新一代鸿蒙智行 HarmonyOS 专属座舱。该座舱采用华为手机/平板/电脑同源设计,支持卡片/应用/文件夹自由组合布局,操作效率提升 70%,并支持 3D 空间极简控车。此外,座舱配备专属小艺,具备类人思考架构、跨设备协同及模糊目的地导航等功能。
十铨科技将在Computex 2026展出一系列存储器新品。核心产品是面向AI训练、超大规模推理等高性能计算场景的T-CREATE MASTER Ai I6E固态硬盘。作为首批第三方PCIe Gen6 SSD,它采用EDSFF E1.S规格,顺序读取速度可达28GB/s。面向消费市场,将发布以碳纤维设计为核心的CARBON STYLE系列,涵盖DELTA RGB DDR5、XTREEM DDR5内存及基于群联E37T主控的Z54E固态硬盘。此外,整合微型风扇与水冷系统的T-FORCE LIQUID II SSD散热器、CQDIMM版本的T-CREATE EXPERT AI内存条等新品也将亮相。