5月18日,豆包 App 在国际博物馆日上线“博物馆讲解”功能,用户点击对话框内按钮即可通过视频通话获得展品自动识别与个性化讲解。该功能支持轻声提问和“边走边听”模式,无需逐次交互。目前,豆包已合作覆盖中国国家博物馆、浦东美术馆等20余家博物馆和美术馆,并与其中5家机构达成深度合作,成为其重磅展览的官方AI讲解员。
亚马逊将其Rufus购物聊天机器人与Alexa+整合,正式推出全新购物助手Alexa for Shopping。该功能已部署至亚马逊应用、网站及Echo Show设备,可回答商品咨询、比价、追踪价格并设置购物提醒。助手还支持计划性购物操作及符合条件的自动购买服务。此次更新标志着Rufus从独立界面转为底层支持,进一步强化亚马逊在智能购物领域的生态整合。
中兴携手中国移动推出“二合一 5G 云电脑”逍遥 W200DS Pro 并正式上市。该产品本质为安卓平板,但可通过云端一键切换至 Windows 系统,在电脑与平板模式间灵活转换。硬件搭载 11.97 英寸 2K 屏幕、紫光展锐 T9100 处理器,配备 8GB 内存与 256GB 存储,内置 8000mAh 电池。产品预装 AI 工具,附赠 1 年云电脑服务,起售价为 2349 元。
LG UltraGear evo 39GX950B 39英寸OLED显示器国行版重新上架并开启预售,定价12999元。该产品为全球首款39英寸5K2K OLED显示器,采用1500R曲率第四代Tandem OLED面板,峰值亮度1500nits。其支持5120×2160 165Hz与2560×1080 330Hz双模切换,色域覆盖99.5% DCI-P3。此外,它搭载免GPU端侧AI超分辨率技术,并支持AI场景优化与AI音频功能,配备了HDMI 2.1等丰富接口及内置双扬声器。
腾讯云正式公测自研AI设计智能体平台Ardot。该平台核心功能包括:用户通过一句话指令即可生成App页面、官网、海报等可编辑设计稿;支持调用团队自有组件库生成规范稿,并能直接导入Figma文件保留原有设计。同时,Ardot具备设计稿一键转换为代码的能力,可对接CodeBuddy等开发工具实现代码还原。平台还提供多人在线实时评论、标注反馈和版本对比等协作功能,其微信小程序即将上线。
上海移动在世界电信日宣布其5G-A超级上行网络能力正式规模商用,通过三项关键技术实现上行峰值1Gbps、泛在覆盖20Mbps,已覆盖核心城区等重点区域。同时,公司推出Token通用服务,支持一号通用、跨平台使用和话费支付,并以1元40万Tokens的价格联合腾讯提供AI原生工作台。此外,上海移动完成了天地一体化海洋通信专网验证,实现国产邮轮5G+卫星通信首呼,智算能力达11.2EFLOPS,并构建了以Token运营为核心的新数智服务生态。
据彭博社报道,苹果将在下月WWDC上发布全新的独立Siri应用测试版,并随iOS 27正式推出。新版Siri核心升级包括:采用谷歌Gemini大模型增强能力,但数据处理在苹果私有云端进行,以保护隐私;支持聊天记录自动删除功能,用户可设置30天、1年或永久保留;提供全新对话界面和短信样式的列表界面;新增全局快捷手势一键唤起。即使秋季正式推送,该版本仍将保留测试版标识,用户可选择退出测试体验。
据马克・古尔曼报道,苹果计划在iOS 27和iPadOS 27中为Genmoji功能引入智能推荐。该功能将基于用户相册照片和键盘输入记录,自动生成个性化的专属表情,旨在提升功能使用率。用户可在键盘设置中自主选择开启或关闭此推荐选项。Genmoji功能最初随iOS 18.2上线,允许用户通过文字指令生成表情。此次升级强调场景贴合度与实用性,但具体是否仍完全依靠端侧AI模型运行尚未明确。
Google 推出 Gemini for Science 项目,发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度,通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域,目标是将大规模生成式模型能力整合进科研工作流,推动跨学科研究的突破性进展。
关联讨论 3 条X:Google AI (@GoogleAI)X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)特斯拉已向美国和加拿大用户推送FSD V14.3.3(监督版)软件更新。本次更新的重点之一是优化智能召唤功能,其最高行驶速度从6英里/小时提升至8英里/小时(约13公里/小时),提升了在停车场等密集场景的实用性。在核心系统层面,引入了强化学习模块优化决策,并升级视觉编码器以增强空间感知和复杂路况识别能力。此外,系统反应速度提升20%,减少了无故偏道、近距离跟车等行为,并加强了对异形障碍物的识别。
平台宣布扩展其内容透明工具,旨在让用户更便捷地追溯网络内容的创建与编辑历史。这项更新将适用于社交媒体平台、网页内容等多个场景,帮助用户识别信息的修改痕迹,提升数字内容的透明度。
微信鸿蒙版 App 于5月17日在华为应用市场发布8.0.17.38尝鲜版本,测试期至6月16日。本次更新虽官方说明为修复问题,但实际新增多项功能,主要包括:视频号支持修改资料、新注册、双击点赞及直播选项扩展;听一听板块新增“歌曲制作”和“音乐空间”,支持AI写歌与翻唱;卡包灰度开放会员卡功能;并灰度支持与“元宝”聊天。此外,新版本还优化了二维码界面,并支持跨平台扫描传输文件。微信鸿蒙版安装量已突破5500万次。
中国电信推出试商用Token套餐,分为面向开发者/企业及个人/家庭两大类。前者提供基础版、专业版、旗舰版三档,月费39.9元至299.9元,对应每月1500万至1.5亿Tokens,适配AI编程、高算力等场景。后者提供轻享版、畅享版、尊享版三档,月费9.9元至49.9元,对应每月1000万至8000万Tokens,用于办公、学习等。用户可通过天翼云官网或中国电信App订购,支持自有硬件或云电脑交付。此外,电信即将面向生态合作伙伴推出天翼Token币和权益。
OpenAI正通过金融科技公司Plaid将ChatGPT与用户银行账户连接。这一集成将允许ChatGPT直接访问个人财务数据,旨在提供个性化的理财分析与建议。目前该功能的具体技术细节、数据安全措施及正式上线时间尚未公布,但其标志着AI助手向更深入的金融服务领域迈出关键一步,引发了关于数据隐私与安全的广泛讨论。
英特尔在Linux内核补丁中曝光了新款Panther Lake R处理器,这是一款面向工业、嵌入式等严苛环境的加固版芯片。其核心配置舍弃了标准E核,仅保留P核与低功耗LP E核的组合,与标准版Panther Lake的三类核心设计不同。该处理器采用独立的ID 223型号,意味着其在散热、电源管理等方面需差异化处理。作为加固版本,它将进一步拓展英特尔在工厂自动化、车载系统等高温高振动场景的部署能力。
YouTube 将其“肖像检测”工具向所有18岁及以上的创作者全面开放。该系统能识别其他用户视频中由AI生成的人脸伪造内容,并允许创作者直接通过YouTube Studio提交移除请求。此前该功能仅限于合作伙伴计划成员使用,此次开放旨在为更多小型频道提供保护。
VITURE Beast XR 智能眼镜现已现货开售,优惠后到手价2854.87元。产品采用新一代索尼Micro-OLED屏幕,具备58°视场角、1200p分辨率、120Hz刷新率及1250nits入眼亮度,可等效4米外174英寸画面。机身重88克,采用镁铝合金材质,支持9档无极电致变色调节与哈曼卡顿立体声效。它能直连游戏掌机、笔记本等设备,并通过配件连接Switch 2,兼容安卓、iOS、Windows、macOS四大平台。
广东联通与华为合作,在广州、深圳、佛山部署无线智能板,建成大湾区首张Mobile AI高品质体验网,并升级上千个站点为智能站点。该网络已覆盖多个核心场馆与商圈,在万人演唱会等高密场景下,用户感知速率与时延保持稳定。针对此类场景,广东联通推出了基于“可信数据空间”架构的场馆网络加速包,在指定终端上提供“一键智能加速”功能,实测微信发送文件速度提升超30%。此外,网络还能智能识别AI大模型等新兴应用,使Token交互时延降低50%以上。
研究者 Filippo Menolascina 使用 AI 工具 Co-Scientist,旨在寻找新的肝脏疾病治疗方法,并解释现有药物为何仅对部分患者有效。该研究聚焦于加速对疾病机制的理解,以推动更精准的治疗方案开发。
谷歌为其即将推出的安卓AI助手Gemini Intelligence设定了明确的硬件与系统门槛。硬件上要求设备搭载旗舰芯片、至少12GB内存,并支持端侧AI模型Gemini Nano v3或更高版本。系统层面则需承诺至少5次安卓大版本升级和6年安全更新。符合这些条件的设备主要集中在2026年发布的新机型,如谷歌Pixel 10系列、三星Galaxy S26系列及Z Fold/Flip 8等。该助手旨在跨应用理解并执行用户任务,计划于今年夏季推出。
摩尔线程宣布将于5月18日19:00举行2026产品发布会。根据预热视频信息,该公司预计将推出采用NAS或迷你主机形态的家庭AI产品。发布会具体内容有待届时揭晓。
新插件 datasette-llm-limits 0.1a0 发布,需与 datasette-llm 及 datasette-llm-accountant 配合使用。该插件允许在 Datasette 内为每位用户或全局配置大语言模型(LLM)使用的支出限额。配置示例显示,可为用户设置滚动24小时窗口内的使用额度,金额上限为1.00美元。这为团队管理LLM调用成本提供了细粒度的控制工具。
OpenAI于5月15日以预览版形式,向美国部分月费100美元的ChatGPT Pro用户开放个人理财功能测试。该功能通过Plaid安全连接用户金融账户,生成个人理财仪表盘,提供消费洞察、旅行支出分析、目标规划、情景模拟及投资组合表现等个性化财务视图。测试暂未覆盖月费20美元的Plus用户,OpenAI将根据小范围使用反馈进行优化。用户可随时删除财务数据,且私密聊天不会调用理财信息。
Claude Code 发布 v2.1.143 版本,重点增强了插件管理功能,包括强制执行插件依赖关系,并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本,增加了 worktree.bgIsolation: "none" 设置。多项体验得到改进:后台会话唤醒后保留模型与努力级别设置;Windows PowerShell 工具默认绕过执行策略;claude agents 命令新增多个参数以配置默认会话。此外,本次更新修复了大量错误,包括修复损坏的 .credentials.json 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用,以及 macOS 上后台作业读取特定目录文件的权限错误等。
xAI宣布,用户现可将Grok订阅账户接入Nous Research的开源自改进智能体Hermes Agent。该集成对所有订阅层级开放,允许用户在Hermes环境中直接使用Grok 4.3进行文本对话与高级推理、调用其文本转语音功能生成语音回复,并利用Grok Imagine创建图像与视频。Hermes Agent可持久运行于电脑、沙盒或VPS,具备跨会话长期记忆能力,并能连接WhatsApp、Discord等通讯平台。用户通过安装Hermes Agent并选择Grok提供商即可完成配置。
OpenAI 正在将 ChatGPT 转变为个人财务助手。美国地区的 Pro 用户现已能通过 Plaid 连接银行账户,基于真实交易数据获得个性化财务分析。该功能运行于 GPT-5.5 Thinking 模型,未来将向所有用户开放。OpenAI 同时提醒,ChatGPT 并非持牌财务顾问,其分析仅供参考。
英国发布了主权大型语言模型推理服务relax.ai。该服务旨在提供基于英国本土基础设施的AI推理能力,确保数据主权和合规性。其核心变化在于将模型推理过程完全保留在英国境内,以满足对数据安全和隐私有严格要求的政府与企业客户。目前该服务已上线,相关技术文档可通过其官方网站获取。
OpenAI 为美国地区的 ChatGPT Pro 用户推出个人理财功能预览版。用户可安全连接个人金融账户,获取基于自身财务状况、目标和优先级生成的 AI 洞察与指导。该体验通过账户关联实现个性化分析,标志着 ChatGPT 正式向个人金融助手领域拓展。
埃隆·马斯克的人工智能公司 x.AI 发布了其首款基于终端的编码助手 Grok Build,正式进入编码代理领域。该工具旨在通过命令行界面直接辅助开发者进行编程任务,标志着 x.AI 在竞争激烈的人工智能编程工具市场中迈出了关键一步。
谷歌 Gemini 被曝正在开发名为 Spark 的智能体功能。与仅回答问题的传统助手不同,Spark 能直接替用户执行任务,例如清理 Gmail 收件箱、整理会议笔记和生成新闻摘要。用户可创建特定技能处理重复性工作,并支持多步骤工作流。目前它主要集成谷歌 Workspace,未来可能扩展至第三方应用。此外,Spark 或将能控制 Chrome 浏览器和调用文件,但暂时无法像 OpenClaw 等工具那样控制整台电脑。
光帆科技发布行业首款搭载摄像头的AI耳机——光帆全感AI耳机。该产品单耳重11克,采用开放式耳挂设计,双侧配备200万像素双目摄像头,可实时识别环境并提供主动智能服务。其耳机盒集成指纹解锁与4G eSIM模块,支持脱离手机独立使用。续航方面,耳机通话可达9小时,音乐播放15小时,配合充电盒总续航至高90小时。产品提供多种套装,耳机本体首发价1799元起。
追觅发布了一款名为 D·NOTE 的 AI 录音名片,主打一键录音、转写和总结功能。产品重30克,支持145种语言的在线秒速转写,并内置超过1800个中文模板以智能匹配总结。它还具备说话人识别功能,最大工作距离5米,最多可识别35人。此外,该设备支持NFC传输电子名片,内置电池提供最长30小时续航。产品提供8GB和64GB两个存储版本,首发价分别为899元和999元。
Kimi WebBridge 是一款面向本地 AI Agent 的浏览器插件,使智能体能够直接操控浏览器,执行网页导航、数据提取等任务。
腾讯地图推出专为外卖、快递骑手设计的“骑手模式”,宣称可提升配送效率20%。该模式基于大数据和AI模型,智能规划少红灯、少转弯的骑行路线,并提前展示150-300米路况。导航可精确定位至具体楼栋单元,在大型商场等复杂场景会提示具体入口、电梯及店铺位置。骑手出发前还能查看终点实景图与门禁信息,便于提前识别目的地并联系用户,减少现场寻找与等待时间。用户更新至最新版腾讯地图即可使用。
OpenAI 将其 AI 编程助手 Codex 集成到 iOS 和 Android 平台的 ChatGPT 应用中。这一更新使移动开发者能够通过 ChatGPT 应用直接访问 Codex 的编程辅助功能,支持代码生成、调试和优化等任务,扩展了 AI 工具在移动端的应用场景。