ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时,该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预,为面临心理健康危机的用户提供额外安全保障。
ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时,该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预,为面临心理健康危机的用户提供额外安全保障。
AlphaEvolve推出了基于Gemini大模型的编程智能体,其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用,通过自动化代码生成与问题解决提升效率。具体实践表明,它能显著加速开发周期并处理复杂任务,标志着AI编程助手从辅助工具向核心生产力引擎的演进。
OpenRouter 向所有支持工具调用的模型开放自主网络搜索与页面内容抓取能力,并允许用户从多个搜索引擎和抓取引擎中自行选择。
同一事件,精选展示《OpenRouter 通过 API 引入网页搜索功能》OpenRouter 推出新功能,允许任何工具调用模型自主进行网页搜索并抓取页面内容,支持多种搜索引擎和抓取引擎供选择。
同一事件,精选展示《OpenRouter 通过 API 引入网页搜索功能》Opera安卓浏览器对其深度思考功能进行了全面升级,该功能旨在为移动端用户提供AI驱动的智能辅助体验。此次升级的具体技术细节与版本号尚未披露。
xAI正式向企业开发者和团队推出Grok Imagine API的“Quality Mode”图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升,能生成细节精细、纹理准确、场景逼真的图像,并具备清晰的多语言文本生成能力。在独立排行榜中,该API已位列顶级模型之列。定价为输入提示每次0.01美元,输出图像根据分辨率(1K或2K)每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。
Claude Code 发布 v2.1.132 版本,新增多项功能并修复超过20个问题。主要新增内容包括:为 Bash 工具子进程环境添加 CLAUDE_CODE_SESSION_ID 环境变量;引入 CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1 环境变量以退出全屏渲染器;在粘贴图片时显示“Pasting…”提示。关键修复涉及:外部 SIGINT 信号现在能触发优雅关机并打印 --resume 提示;修复了原生构建下终端关闭或 SSH 断开时的未捕获异常;解决了 --resume 因表情符号被截断而失败以及 --permission-mode 标志在恢复会话时被忽略的问题。此外,还修复了全屏模式唤醒后黑屏、特定字符输入损坏、鼠标滚动过快、内存无限增长等具体问题。
xAI 正式在 Grok Web 上线 Connectors 功能,提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务,如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格,无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear,涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。
Anthropic为其Claude托管智能体平台推出三项核心更新。“梦想”功能通过回顾会话历史提取模式,使智能体能够自我改进。“成果”功能允许开发者设定成功标准,智能体据此进行自我评估与修正,内部测试显示其显著提升了任务成功率和输出质量。“多智能体编排”功能支持主智能体将复杂任务分解,并分配给配备专用工具的子智能体并行处理。这些更新旨在以最小人工干预,增强智能体处理复杂任务的能力。
Anthropic与SpaceX达成合作,获得其Colossus 1数据中心超300兆瓦(含逾22万块NVIDIA GPU)的算力。此举使Claude Code的Pro、Max等多档计划的五小时速率限制立即翻倍,并取消了高峰时段限流;Claude Opus的API速率也大幅提升。公司还公布了与亚马逊、谷歌、微软等科技巨头的一系列大规模算力协议,总投资额巨大。为满足企业客户的合规需求,算力扩张计划也将覆盖亚洲和欧洲地区。
OpenAI 发布了名为 MRC 的新型超级计算机网络协议,旨在提升大规模 AI 训练集群的韧性与性能。该协议通过开放计算项目公开,支持在数千个 GPU 间建立高效、可靠的多路径连接,能自动绕过故障链路,将网络有效带宽提升最高达 30%,同时显著降低训练作业因网络问题中断的概率。MRC 的设计目标是应对万卡级集群的复杂网络挑战,为下一代大模型训练提供基础设施支持。
2026北京车展上,面壁智能展出了端侧大模型解决方案,包括全模态+全双工交互、AI Box算力魔方、SuperMate无感智舱和EmbodiedClaw物理Agent。AI Box已与Intel等合作,预计2026年底30万辆汽车搭载面壁端侧模型。SuperMate覆盖上车、行程、事故处理等全场景,实现感知→记忆→推理→执行闭环,不依赖云端。EmbodiedClaw让车辆成为24小时在线物理Agent,可完成拿取物品等简单物理任务。
Hugging Face 的 Open ASR Leaderboard 加入了来自 Appen Inc. 和 DataoceanAI 的高质量私有英语 ASR 数据集,涵盖多种口音及脚本式/会话式语音,总时长约 28.7 小时。数据集保持私有以降低 benchmaxxing(针对基准的过度优化)或测试集污染风险。默认平均 WER 仍基于公开数据集计算,用户可通过切换查看私有数据集影响。标准化采用基于 Whisper 的标准化器,UI 代码和评估脚本已开源。自 2023 年 9 月上线以来,该榜单访问量已超过 71 万次。
该版本修复了两个关键问题。一是解决了 VS Code 扩展在 Windows 系统上因捆绑 SDK 中硬编码的构建路径而无法激活的故障,涉及 createRequire 的 polyfill 错误。二是修正了 Mantle 端点认证因缺少 x-api-key 请求头而失败的问题。两项修复均针对特定错误,未涉及功能新增或性能指标变更。
Claude Code 发布 v2.1.129 版本,带来多项功能新增与问题修复。新增功能包括支持通过 --plugin-url 从 URL 获取插件压缩包、新增 CLAUDE_CODE_FORCE_SYNC_OUTPUT 环境变量以强制启用终端同步输出,以及为 Homebrew 或 WinGet 安装提供后台自动更新提示。功能调整方面,插件清单中的 themes 和 monitors 现在建议在 "experimental" 下声明;网关模型发现功能改为通过环境变量手动启用;Ctrl+R 历史记录选择器恢复为默认搜索所有项目的提示。此外,修复了约 20 项问题,涉及 /clear 命令、会话标题显示、外部编辑器切换、令牌浪费、OAuth 凭证刷新、缓存警告等多个方面。
OpenAI扩展ChatGPT广告服务,推出自助广告管理平台测试版,新增CPC竞价功能和增强的广告效果测量工具。新平台注重隐私保护,确保广告内容与用户对话相互独立,帮助广告主更精准地定位目标受众并优化广告投放效果。
Anthropic发布了十个针对金融服务耗时任务的预置智能体模板,涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件,或作为Claude托管智能体的配置指南,帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作,并扩展了合作伙伴生态,新增数据连接器和MCP应用,使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳,该模型在金融任务上达到先进水平。
Runway公司推出“Characters”实时视频智能体,它能将任意单张参考图像(如真人、卡通或幻想生物照片)实时转化为具有自然对话表现力的视频角色。该技术基于其通用世界模型GWM-1,无需微调即可生成每秒24帧的高清视频,并同步口型、表情和头部运动。其核心突破在于通过自回归逐帧生成、流程优化与并行化,实现了每帧仅37毫秒的模型处理时间,以及从用户停止说话到角色开始响应仅1.75秒的服务器端延迟,从而满足了实时交互对话的严苛要求。
本次更新包含多项功能优化与错误修复。主要功能上,/color 命令支持无参数随机选色,/mcp 命令显示已连接服务器的工具数量,--plugin-dir 参数新增支持 .zip 插件包。用户体验方面,优化了 /model 选择器的显示。关键问题修复包括:解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题,以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外,还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。
Gemini API 引入了事件驱动的 Webhook 功能,这是一种基于推送的通知系统。它旨在消除低效的轮询需求,为长时运行的任务(如文件处理或复杂推理)提供更优的解决方案。当任务完成时,系统会自动将结果推送到用户指定的端点,从而显著降低延迟并减少资源消耗,提升开发效率与响应速度。
OpenRouter 新增两个 API 端点,分别提供语音合成(text-to-speech)和音频转录(transcription)功能,用户可通过单一接口跨多个提供商调用。
OpenRouter 现已上线文本转语音和音频转录功能。两个新端点提供跨多家提供商的语音合成与音频转录能力,统一API接入。
OpenRouter 正式上线文本转语音和音频转录功能。平台通过两个新的 API 端点,集成了多家供应商的语音合成与音频转录服务。用户现在可以统一调用单一 API,便捷访问多提供商的高质量语音生成与语音转文本能力,无需再为不同服务商单独集成。这简化了开发流程,为应用添加语音交互与内容转录功能提供了更高效的一站式解决方案。
Dynamic Workflows 是一个函数库,支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建,使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源,实现了工作流与特定租户代码的即时绑定,大幅降低了多租户场景下的运营开销和资源浪费。
xAI于2026年4月30日推出自定义语音和语音库功能。用户可通过约1分钟录音快速克隆声音,并在Grok文本转语音及语音代理API中即时使用,整个过程仅需2分钟。语音库提供集中管理平台,内置语音已超80种,支持28种语言。为确保安全,系统采用两阶段验证,包括实时转录匹配和说话人嵌入确认,以防止未经授权的克隆。这些功能适用于品牌代理、内容创作、无障碍辅助、多语言团队及游戏娱乐等多种场景,且使用自定义语音无需额外费用。
本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 claude project purge 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 allowManagedDomainsOnly 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。
Midjourney V8.1 版本现已登陆 Discord 平台及其官方网站。本次更新重点提升了图像的清晰度与整体画质,这一改进在风格参考(SREF)和情绪板(Moodboards)功能中效果最为显著,同时所有类型的图像生成质量均有所增强,为用户带来更精细的视觉体验。
2025年数据显示,美国员工工作AI使用率已从2023年的20%升至40%。真正获得持续竞争优势的企业正将智能体AI深度嵌入工作流程,并将机构知识编码成可累积的系统。本指南以欧莱雅、Lyft和乐天为例,提出企业AI转型三大支柱:跨越“智能体思维鸿沟”、基于实际工作流程培训员工、在压缩信息密集型流程时保留人工判断,以及构建能创造收入的新产品能力。Claude Cowork平台为此提供了无需定制开发的团队级解决方案,并包含六个月的落地框架。
Google正式发布Gemini Embedding 2统一嵌入模型,该模型能将文本、图像、视频、音频和文档映射到同一语义空间。开发者可通过单请求处理交织多模态输入,显著提升智能RAG、视觉搜索等内容审核任务的性能。模型支持超100种语言,并提供任务特定前缀和马特廖什卡降维等特性,为构建复杂AI智能体提供高效精准的基础。
OpenRouter 新增 Response Caching 头部,用于缓存完全相同的 API 请求,使后续请求的响应时间大幅缩短,且缓存调用完全免费。
OpenRouter 推出 Response Caching header,允许缓存相同的 API 请求,使响应时间缩短至极小,且完全零成本。
新推出的 Response Caching 头部实现了 API 请求的缓存机制,完全相同的请求可获得缓存响应,响应时间大幅缩短至微乎其微的水平,且不会产生额外成本。该功能通过自动识别并复用已生成的响应,显著提升了重复请求的处理效率。
Claude Security 现已面向所有 Claude Enterprise 客户开放公开测试。该功能基于 Claude Opus 4.7 模型,能够扫描代码库中的漏洞并生成针对性修复方案。公开版本新增了计划扫描与定向扫描功能,更易于与审计系统集成,并改进了问题追踪流程。此外,Opus 4.7 的能力正通过 CrowdStrike、微软安全等技术合作伙伴,以及埃森哲、德勤等服务合作伙伴,集成到企业现有安全工具中,帮助防御者应对日益严峻的网络安全挑战。
平台推出了高级账户安全功能,核心更新包括抗钓鱼登录验证、更强大的账户恢复机制以及增强型保护措施。这些升级旨在更有效地保护用户的敏感数据,并重点防范账户被恶意接管的风险。新安全体系通过多重技术强化了整体防护层级。
Opera 将 AI 技术全面融入产品,从传统浏览器转型为 AI 驱动的超级入口,并由此成为昆仑万维海外市场增长的核心引擎。
Qwen Studio 发布了一个集成了多种功能的综合平台。该平台的核心功能包括智能聊天机器人、图像与视频理解、图像生成以及文档处理。此外,它还整合了网络搜索能力,支持工具调用,并能生成可用的“工件”或成果物。这一系列功能旨在通过一个统一的界面,全面解码并释放人工智能在不同模态任务中的潜力。
面壁智能(MiniCPM)通过技术创新推动汽车智能化变革,重点布局端侧智能座舱(智舱)领域,旨在提升车载AI的本地化处理能力与响应效率。
OpenRouter 四月发布涵盖视频生成、工作区(workspaces)、Agent SDK、重排序模型(reranker models)以及一批前沿模型(frontier model)的推出。
OpenRouter 在四月推出多项更新,涵盖视频生成、工作区功能、Agent SDK、Reranker 模型以及一批前沿模型。