Claude 发布 v2.1.133 版本,新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础,引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径,并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上,钩子现在可接收活动努力级别信息,Bash 工具命令可读取相应环境变量。此外,改进了焦点模式行为,并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题,包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。`claude --help` 现已列出远程控制选项,VSCode 扩展也修复了相关错误。
据报道,iOS 27系统将对Siri进行彻底重构,其底层将基于谷歌Gemini构建,交互模式将从指令式转变为类似ChatGPT的对话模式。新版Siri将与备忘录应用深度整合,用户可通过“把这个加到新备忘录”等语音指令,直接将AI生成的内容自动、完整地保存至备忘录,解决手动复制粘贴导致的流程繁琐和格式错乱问题。此外,Siri还能利用大语言模型能力,高效梳理信息并创建特定主题的备忘录。
OpenAI为ChatGPT推出“可信联系人”功能,以应对对话中的自残风险。当系统检测到成年用户对话涉及相关内容时,会鼓励用户联系他人,并自动向其预设的联系人发送简短的电子邮件、短信或推送通知提醒,以促进沟通。通知不包含具体对话细节以保护隐私。该功能采用自动审核与人工复核结合,触发提醒的对话会交由人工安全团队处理,官方承诺对此类通知进行人工审核并力求在一小时内完成。此前,OpenAI曾因被指控鼓励用户自杀而面临诉讼。
该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。
2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。
llm-gemini 0.31 版本发布,其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态,转为正式可用。该模型自三月份预览以来,其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。
DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型,实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能,降低了延迟与内存占用。该项目已在 GitHub 开源,并在 Hacker News 上获得了关注。
OpenAI开始在ChatGPT中测试广告功能,旨在支持其免费服务的持续运营。测试强调广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施,并确保用户对广告体验拥有控制权。
Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文,实现跨文件智能协作。例如,在Outlook中分类邮件并起草回复,在Excel中调整数据后,PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署,并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问,Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。
关联讨论 2 条X:Claude (@claudeai)X:宝玉 (@dotey)Chrome浏览器近日从其帮助文档中撤回了关于“设备端AI不会将数据发送至Google服务器”的声明。这一修改表明,谷歌可能调整了其设备端AI功能的隐私数据处理政策,相关AI功能在本地处理数据时,或许仍存在将某些数据发送至服务器的可能性。该变动引发了技术社区的关注,在Hacker News上获得了超过100的讨论热度。
ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时,该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预,为面临心理健康危机的用户提供额外安全保障。
DeepMind发布了由Gemini驱动的编程代理AlphaEvolve。该代理能自动生成、测试和优化代码,显著提升了软件开发效率与质量。其影响已扩展至多个领域,包括科学研究和工业应用,在特定基准测试中展示了卓越的代码生成能力。该技术旨在通过自动化复杂编程任务,降低开发门槛并加速各行业的创新进程。
AlphaEvolve推出了基于Gemini大模型的编程智能体,其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用,通过自动化代码生成与问题解决提升效率。具体实践表明,它能显著加速开发周期并处理复杂任务,标志着AI编程助手从辅助工具向核心生产力引擎的演进。
绿联 X8 耳夹式蓝牙耳机现已发售,首发价399元。耳机采用专利C桥设计,内嵌钛镁合金记忆丝确保稳固佩戴。其搭载11mm双磁钛膜单元,支持Hi-Res/LDAC双金标认证与格莱美大师调音。核心亮点是首发VPU骨声纹降噪技术,结合4麦克风与2个VPU实现6麦通话降噪。此外,内置AI助手支持实时翻译与录音转写,配备蓝牙6.0与IP56防尘防水。电池续航方面,单次使用可达10小时,配合充电仓综合续航为46小时。
大疆宣布将于5月11日发布DJI ROMO 2代扫地机器人。官方预热重点突出了其床底清扫能力,并暗示其具备高精度避障,可做到“不会碰倒放在地上的玻璃水杯”。新品还有望支持地面速干功能。作为参考,初代ROMO系列于2025年8月发布,主打旗舰无人机同款感知与避障技术、25000 Pa吸力、柔性双机械臂贴边清扫、164 ml机载水箱及基站自清洁等功能。
Anthropic为Claude Managed Agents新增“Dreaming”功能,这是一个异步处理过程,能自动回顾历史代理会话、清理重复或过时的记忆条目,并提炼新见解。同时,Outcomes和Multiagent Orchestration两项功能现已进入公开测试阶段。这些更新旨在帮助AI代理在跨会话中从错误学习,实现持续改进,提升代理的自主学习和适应能力。
高德地图基于VLM大模型,将实时路况服务扩展至全国100多所高校校园。校内主干道、校门口、宿舍区、食堂周边、教学楼路口等关键点位拥堵情况可实时查看,校园交通管理实现数据化、可视化。系统在暴雨天或校庆等大型活动时提供出行指导,如提示绕行路线;课间人流高峰、午晚餐时段车流等动态一目了然,帮助用户优化出行选择。
群晖科技发布两款AI监控摄像头BC510和TC510。新品具备IP66/IP67防尘防水等级,支持录制2880×1620分辨率、30帧/秒的视频,提供110°水平广角视野和30米夜视距离。摄像头搭载边缘AI功能,可在本地运行人流与车辆计数、入侵侦测等分析任务。它们设计用于深度整合群晖现有监控架构及即将推出的VSaaS平台,并兼容第三方环境。
谷歌发布Chrome 148版本更新,重点增强了AI功能与自动填充工具。用户现可通过地址栏或新标签页直接询问AI智能体获取聚合信息与自然回答;自动填充新增对驾照、护照等政府标识符的支持,并将内置Gemini聊天机器人扩展至亚太49个国家和地区。平台方面,Android版新增近似位置权限,ChromeOS支持垂直标签栏。开发者API引入了用于本地大模型交互的Prompt API。本次更新共修复127个安全漏洞,其中3个为高危级别。
AMD 预览了 Instinct MI400 系列中的 MI430X 加速器,该产品已获多款超算采用。与侧重AI的MI455X不同,MI430X兼顾人工智能与传统高性能计算工作负载,并原生支持FP64高精度数据格式。其FP64算力预计超过200 TFLOPs,是英伟达Rubin架构的六倍以上,有望成为有史以来性能最高的FP64 GPU。AMD强调,FP64高精度对于气候学、材料科学等领域的科学探索至关重要,能为基于AI的研究提供高保真基础,以捕获底层科学的真实结构。
宇树科技宣布其全球首个人形机器人任务动作应用商店“UniStore”正式全面开放。该平台允许用户像使用手机应用商店一样,轻松上传、分享和下载训练好的机器人动作模型,例如舞蹈、武术和劳动技能。此举旨在推动人形机器人从“功能机”向“智能机”时代跨越,通过共享应用生态解锁机器人的无限潜能。平台包含用户广场和动作库,用户可一键获取复杂操作预设。
谷歌为Gemma 4系列开源模型推出多Token预测起草器,采用推测解码技术以提升推理效率。该技术通过轻量级起草器预测多个未来Token,再由重型目标模型并行验证,从而突破内存带宽限制,将计算资源利用率最大化。实测显示,在特定条件下,Gemma 4 26B模型在Apple Silicon芯片上实现了约2.2倍的本地加速。此举有助于在个人电脑、消费级显卡及边缘设备上高效部署低延迟AI应用,如聊天机器人和编程助手。
阿里千问在PC端上线AI语音输入功能,用户通过快捷键即可在各类桌面应用中直接使用。该功能不仅支持去除语气词、纠错和格式化整理口语内容,更能基于上下文智能回复,并可直接下达创作、问答、翻译等指令。其设计逻辑超越传统语音打字工具,旨在成为跨应用的AI任务调度中枢:用户通过按住快捷键启动语音输入模式,或双击切换至AI指令模式,可直接派发信息检索、文档生成等任务。该功能覆盖文档编辑、网页浏览、即时通讯等主流办公场景,无需切换客户端或打开额外窗口,目前所有用户可免费使用。
中国台湾地区AI IP企业Skymizer近日发布推理解码加速器芯片HTX301,该芯片可与GPU协同工作,加速AI推理结果的输出,提升算力系统利用率和能效。HTX301基于HyperThought软硬件协同平台,采用LISA指令集架构,专注于带宽密集型负载处理。其支持SoC与PCIe AIC两种部署形态,其中单张PCIe加速卡可集成6颗HTX301芯片,提供总计384GB内存,足以满足7000亿参数大模型的本地运行需求,而整卡功耗仅为240瓦。
上汽MG宣布纯电SUV MG 4X将于5月11日开启盲订。新车将搭载地平线博弈大模型和半固态电池,入门版即配备,续航里程510公里起。车身尺寸为长4500mm、宽1849mm、高1621(1627)mm,轴距2735mm。动力方面,后轴搭载永磁同步电机,额定功率80kW,峰值功率150kW。新车还延续发光LOGO设计,并支持OPPO智行生态互联。该车型此前已出现在工信部新产品公示中。
谷歌紧急推送版本号为I610UEU2AZD8的修复补丁,以解决三星Galaxy XR头显在安装4月系统更新后出现的严重内存泄漏问题。该故障导致设备在运行20至30分钟后内存占用持续攀升直至耗尽,引发系统卡死、画面帧率大幅下降,用户体验严重受损。官方确认此次更新修复了前述问题,并包含一系列系统稳定性与性能优化措施。所有受影响用户可通过系统设置中的软件更新菜单手动下载并安装此补丁。
海信大白闺蜜机 X8 Ultra 将于5月30日20:00开售,定价8499元。该产品采用32英寸4K面板,配备天鹅颈灵动系统和20000mAh电池,续航达15小时。存储组合为8GB+256GB,运行Android系统,支持Wi-Fi并集成摄像头。其主要功能覆盖护眼学习、家庭娱乐、智能AI助手、居家办公及健身追剧,同时支持AI健身、AI语音和K歌。
谷歌于5月4日宣布停运其于2024年12月推出的实验性网页自动化项目Project Mariner。该项目旨在代替用户执行跨网站的多步骤任务,如信息检索与操作。谷歌强调其技术并未废弃,核心功能已被整合至Gemini智能体和AI Mode等核心产品中。过去一年,谷歌已逐步将此类智能体能力融入现有生态,例如让Gemini Agent代为处理邮件和预订酒店。此外,谷歌今年在Chrome中展示的“auto-browse”AI功能,可执行查询航班价格等复杂任务,被视为对竞争对手的直接回应。
漫步者 Lolli5 ANC 智能触控大圆屏耳机已上市,售价539元,提供沙滩白、礁石黑、落日橙三种配色。其最大亮点是充电盒配备智能触控屏,可显示时间并控制音乐、拍照。耳机支持50dB深度、5kHz宽度的ANC自适应降噪和3+3麦智能通话降噪,拥有双Hi-Res金标认证。采用13mm双复合LCP液晶振膜单元,支持蓝牙6.0、双设备连接和IP55级防尘防水。此外,还集成了豆包与DeepSeek双脑问答、会议录音及App实时互译等智能功能。
Adobe于5月6日在Acrobat中推出PDF Spaces功能,可将PDF、文档、链接等静态材料转化为交互式AI工作空间。该功能利用AI自动生成摘要、音频概览、品牌演示文稿及定制聊天机器人。接收者能与AI助手对话以快速获取信息并定位关键内容,适用于销售提案、市场营销和人力资源等场景。目前,该功能已在Acrobat Express和Acrobat Studio上线。
名为《幻觉百科》的新网站Halupedia正式发布,这是一个专注于收集和记录人工智能生成内容中各类“幻觉”现象的在线百科。网站旨在系统化归类AI模型产生的事实错误、逻辑矛盾或虚构信息,为开发者和研究者提供参考案例以改善模型可靠性。目前该平台已获得106个Hacker News社区点赞,显示出技术社区对此类工具的关注。
微信鸿蒙版 App 发布 8.0.17.36 正式版,安装量已达 5369 万次。本次更新聚焦视频号、听一听及支付交互功能:视频号支持资料修改、新账号注册、双击点赞及直播选项细化;听一听新增 AI 写歌与翻唱功能,并可将歌曲设为状态或跳转至 QQ 音乐;支付方面新增 Apple 服务扣费管理,收款时可选择存入零钱或零钱通。此外,还优化了头像查看、图片引用浏览、跨端文件传输及聊天框语音转文字快捷按钮等多项用户体验细节。
xAI正式向企业开发者和团队推出Grok Imagine API的“Quality Mode”图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升,能生成细节精细、纹理准确、场景逼真的图像,并具备清晰的多语言文本生成能力。在独立排行榜中,该API已位列顶级模型之列。定价为输入提示每次0.01美元,输出图像根据分辨率(1K或2K)每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。
关联讨论 1 条X:xAI (@xai)Claude Code 发布 v2.1.132 版本,新增多项功能并修复超过20个问题。主要新增内容包括:为 Bash 工具子进程环境添加 `CLAUDE_CODE_SESSION_ID` 环境变量;引入 `CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1` 环境变量以退出全屏渲染器;在粘贴图片时显示“Pasting…”提示。关键修复涉及:外部 SIGINT 信号现在能触发优雅关机并打印 `--resume` 提示;修复了原生构建下终端关闭或 SSH 断开时的未捕获异常;解决了 `--resume` 因表情符号被截断而失败以及 `--permission-mode` 标志在恢复会话时被忽略的问题。此外,还修复了全屏模式唤醒后黑屏、特定字符输入损坏、鼠标滚动过快、内存无限增长等具体问题。
xAI 正式在 Grok Web 上线 Connectors 功能,提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务,如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格,无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear,涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。
Google Cloud 发布了其反欺诈防护产品“Google Cloud fraud defense”,这是对 reCAPTCHA 的重大升级。新方案旨在为网站和应用提供更强大的自动化欺诈和滥用防护,同时致力于改善用户体验,减少对用户的中断和验证干扰。此次升级标志着 reCAPTCHA 从传统的挑战应答测试,向一个更全面、基于云服务的主动防御系统演进。
Tilde.run 发布了一款代理沙箱,其核心特点是具备事务性和版本控制功能的文件系统。该系统支持事务操作,确保文件更改的原子性,同时提供完整的版本历史记录。该工具旨在为开发者提供一个安全、可回溯的代码执行环境,适用于需要高可靠性的自动化代理或脚本测试场景。目前该项目已在 Hacker News 上获得 102 点关注度。
Google 为其 Gemma 4 开源模型家族发布了多令牌预测模块,可将文本生成速度提升高达三倍。该技术通过一个小型辅助模型一次性预测多个令牌,再由主模型单次检查完成验证,从而显著提高了推理效率。
Anthropic为其Claude托管智能体平台推出三项核心更新。“梦想”功能通过回顾会话历史提取模式,使智能体能够自我改进。“成果”功能允许开发者设定成功标准,智能体据此进行自我评估与修正,内部测试显示其显著提升了任务成功率和输出质量。“多智能体编排”功能支持主智能体将复杂任务分解,并分配给配备专用工具的子智能体并行处理。这些更新旨在以最小人工干预,增强智能体处理复杂任务的能力。
关联讨论 3 条X:Claude Devs (@ClaudeDevs)Claude:Blog(网页)X:Claude (@claudeai)Anthropic与SpaceX达成合作,获得其Colossus 1数据中心超300兆瓦(含逾22万块NVIDIA GPU)的算力。此举使Claude Code的Pro、Max等多档计划的五小时速率限制立即翻倍,并取消了高峰时段限流;Claude Opus的API速率也大幅提升。公司还公布了与亚马逊、谷歌、微软等科技巨头的一系列大规模算力协议,总投资额巨大。为满足企业客户的合规需求,算力扩张计划也将覆盖亚洲和欧洲地区。
关联讨论 15 条Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:歸藏 (@op7418)X:Thariq (@trq212)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)X:小互 (@xiaohu)X:xAI (@xai)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:宝玉 (@dotey)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:Berry Xia (@berryxia)