名为《幻觉百科》的新网站Halupedia正式发布,这是一个专注于收集和记录人工智能生成内容中各类“幻觉”现象的在线百科。网站旨在系统化归类AI模型产生的事实错误、逻辑矛盾或虚构信息,为开发者和研究者提供参考案例以改善模型可靠性。目前该平台已获得106个Hacker News社区点赞,显示出技术社区对此类工具的关注。
微信鸿蒙版 App 发布 8.0.17.36 正式版,安装量已达 5369 万次。本次更新聚焦视频号、听一听及支付交互功能:视频号支持资料修改、新账号注册、双击点赞及直播选项细化;听一听新增 AI 写歌与翻唱功能,并可将歌曲设为状态或跳转至 QQ 音乐;支付方面新增 Apple 服务扣费管理,收款时可选择存入零钱或零钱通。此外,还优化了头像查看、图片引用浏览、跨端文件传输及聊天框语音转文字快捷按钮等多项用户体验细节。
xAI正式向企业开发者和团队推出Grok Imagine API的“Quality Mode”图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升,能生成细节精细、纹理准确、场景逼真的图像,并具备清晰的多语言文本生成能力。在独立排行榜中,该API已位列顶级模型之列。定价为输入提示每次0.01美元,输出图像根据分辨率(1K或2K)每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。
关联讨论 1 条X:xAI (@xai)Claude Code 发布 v2.1.132 版本,新增多项功能并修复超过20个问题。主要新增内容包括:为 Bash 工具子进程环境添加 `CLAUDE_CODE_SESSION_ID` 环境变量;引入 `CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1` 环境变量以退出全屏渲染器;在粘贴图片时显示“Pasting…”提示。关键修复涉及:外部 SIGINT 信号现在能触发优雅关机并打印 `--resume` 提示;修复了原生构建下终端关闭或 SSH 断开时的未捕获异常;解决了 `--resume` 因表情符号被截断而失败以及 `--permission-mode` 标志在恢复会话时被忽略的问题。此外,还修复了全屏模式唤醒后黑屏、特定字符输入损坏、鼠标滚动过快、内存无限增长等具体问题。
xAI 正式在 Grok Web 上线 Connectors 功能,提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务,如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格,无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear,涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。
Google Cloud 发布了其反欺诈防护产品“Google Cloud fraud defense”,这是对 reCAPTCHA 的重大升级。新方案旨在为网站和应用提供更强大的自动化欺诈和滥用防护,同时致力于改善用户体验,减少对用户的中断和验证干扰。此次升级标志着 reCAPTCHA 从传统的挑战应答测试,向一个更全面、基于云服务的主动防御系统演进。
Tilde.run 发布了一款代理沙箱,其核心特点是具备事务性和版本控制功能的文件系统。该系统支持事务操作,确保文件更改的原子性,同时提供完整的版本历史记录。该工具旨在为开发者提供一个安全、可回溯的代码执行环境,适用于需要高可靠性的自动化代理或脚本测试场景。目前该项目已在 Hacker News 上获得 102 点关注度。
Google 为其 Gemma 4 开源模型家族发布了多令牌预测模块,可将文本生成速度提升高达三倍。该技术通过一个小型辅助模型一次性预测多个令牌,再由主模型单次检查完成验证,从而显著提高了推理效率。
Anthropic为其Claude托管智能体平台推出三项核心更新。“梦想”功能通过回顾会话历史提取模式,使智能体能够自我改进。“成果”功能允许开发者设定成功标准,智能体据此进行自我评估与修正,内部测试显示其显著提升了任务成功率和输出质量。“多智能体编排”功能支持主智能体将复杂任务分解,并分配给配备专用工具的子智能体并行处理。这些更新旨在以最小人工干预,增强智能体处理复杂任务的能力。
关联讨论 3 条X:Claude Devs (@ClaudeDevs)Claude:Blog(网页)X:Claude (@claudeai)Anthropic与SpaceX达成合作,获得其Colossus 1数据中心超300兆瓦(含逾22万块NVIDIA GPU)的算力。此举使Claude Code的Pro、Max等多档计划的五小时速率限制立即翻倍,并取消了高峰时段限流;Claude Opus的API速率也大幅提升。公司还公布了与亚马逊、谷歌、微软等科技巨头的一系列大规模算力协议,总投资额巨大。为满足企业客户的合规需求,算力扩张计划也将覆盖亚洲和欧洲地区。
关联讨论 15 条Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)X:小互 (@xiaohu)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:歸藏 (@op7418)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:Berry Xia (@berryxia)Xbox CEO 阿莎·夏尔马宣布,将于5月13日为Xbox主机上线新的开机动画和音效。新动画将展示此前已公布的玻璃质感新版Xbox标志,音效也将进行微调。此次更新紧随夏尔马上任后的首次重大组织调整,包括人员变动、引入技术专长新成员及从微软CoreAI部门调入前同事。此外,她还通过推进玩家期待的功能、下调Xbox Game Pass价格及将Microsoft Gaming改回Xbox等举措,积极塑造其领导下的Xbox新方向。
NVIDIA宣布其Spectrum-X以太网扩展架构现已支持多资源容器(MRC)。这一AI原生的开放以太网架构旨在为构建千兆级AI工厂提供网络标准,以满足大规模AI训练与推理对高性能、可扩展网络的需求。MRC的加入增强了资源隔离与管理能力,使Spectrum-X能够更好地支持多租户、多工作负载的复杂AI环境,确保AI计算集群的性能与效率。
OpenAI正式向美国广告主全面开放ChatGPT自助广告投放平台,取消了此前5万美元的最低预算门槛,小型企业现可自主在ChatGPT内投放广告。该公司正加速构建完整的广告生态系统,目标是在今年实现25亿美元的广告营收。这一举措标志着ChatGPT商业化进程的重要扩张,降低了企业参与AI对话广告的门槛。
OpenAI 发布了名为 MRC 的新型超级计算机网络协议,旨在提升大规模 AI 训练集群的韧性与性能。该协议通过开放计算项目公开,支持在数千个 GPU 间建立高效、可靠的多路径连接,能自动绕过故障链路,将网络有效带宽提升最高达 30%,同时显著降低训练作业因网络问题中断的概率。MRC 的设计目标是应对万卡级集群的复杂网络挑战,为下一代大模型训练提供基础设施支持。
关联讨论 1 条X:OpenAI (@OpenAI)微软正式推出 Microsoft 365 E7 企业版订阅,该版本在 E5 基础上整合了 Microsoft 365 Copilot、Microsoft Entra 套件及 Agent 365 服务等多项 AI 功能。新方案采用基于用户席位的收费模式,超出基础额度后按词元使用量和资源消耗额外计费。价格方面,含 Teams 版本为每用户每月 99 美元,不含 Teams 版本为 90.45 美元。此外,Agent 365 服务也可单独订阅,价格为每用户每月 15 美元。
Hugging Face 团队宣布为其开源自动语音识别(ASR)评测平台 Open ASR Leaderboard 引入名为“Benchmaxxer Repellant”的新防护机制。该机制旨在检测并抑制旨在人为操纵排行榜结果的基准测试投机行为,确保评测结果更公平、更具代表性。这一更新是平台持续维护的一部分,以应对社区中出现的非常规优化策略,维护开源 AI 研究与评估的诚信度。
该版本修复了两个关键问题。一是解决了 VS Code 扩展在 Windows 系统上因捆绑 SDK 中硬编码的构建路径而无法激活的故障,涉及 `createRequire` 的 polyfill 错误。二是修正了 Mantle 端点认证因缺少 `x-api-key` 请求头而失败的问题。两项修复均针对特定错误,未涉及功能新增或性能指标变更。
映泰将在COMPUTEX 2026台北电脑展上推出新一代AMD与英特尔800系列主板,展位位于南港展览馆二馆P0914。消费级产品线包括旗舰VALKYRIE电竞系列、主流AI PC平台、AMD Radeon RX显卡及完整存储方案。工业领域将展示基于英特尔W880平台的工业主板,支持英特尔Panther Lake和英伟达Jetson Thor的次世代解决方案,以及EdgeComp系列边缘AI系统。
光子跃迁 LEAPTIC Cube 拇指运动相机已开启预售,起售价2599元。该相机采用磁吸分体设计,重56克,具备IPX8防水能力。其核心搭载1/1.3英寸5000万像素传感器,支持拍摄8K@30fps和4K@120fps视频,并集成AI美颜、场景识别与主角跟随功能。单机续航为110分钟,可通过连接磁吸配件“灵动拓展屏”或外挂电池,将续航分别提升至240分钟和210分钟。
华为鸿蒙HarmonyOS 6系统负一屏的“Today-Task Skill”功能正式上线,AI Claw任务动态已实时接入。用户桌面右滑进入负一屏后,可在顶部服务动态提醒处直接查看任务进度与结果,无需打开电脑即可实现同频追踪与重要进展展示。该功能基于此前内测的智慧助手·今天15.0.22.210版本,进一步整合了Claw智能体关联服务,提供AI任务完成提醒。
前沃尔玛电商业务CEO马克·劳尔在其餐饮平台Wonder中推出AI工具“Wonder Create”,用户可在不到一分钟内生成完整的虚拟餐厅品牌,包括名称、描述、图片及菜谱。Wonder平台采用“可编程烹饪平台”模式,配备机器人厨房与700种食材库,能灵活切换25种菜系。该创新旨在大幅降低餐饮创业门槛,让用户快速测试新菜品与品牌概念。
小米米家扫拖机器人6推出限时优惠。该机器人具备28000Pa吸力和40mm越障高度。原价水箱版2699元、上下水版3099元,现叠加PLUS立减和10%政府补贴后,水箱版到手价1899.21元,上下水版2206.93元。此外,以旧换新可享额外补贴,水箱版补贴100元,上下水版补贴200元。
谷歌正在内部测试一款名为“Remy”的全新AI个人智能体,旨在对标此前走红的OpenClaw。该智能体基于仅供员工使用的Gemini专属版本开发,被定位为工作、学业和生活中的全天候助理。其核心在于能代表用户自主执行实际任务,而不仅仅是回答问题。Remy深度集成Gmail、Chrome、Calendar等谷歌服务,可主动监控事项、处理复杂任务并学习用户偏好。目前项目处于内部测试阶段,尚未公布公开上线时间,其进展有望在即将到来的谷歌I/O大会上披露。
据科技媒体9to5Google报道,谷歌正开发代号“Neon”的Gemini AI新订阅层级,暂定名为“Google AI Ultra Lite”,预计定价约每月100美元。该层级旨在填补现有20美元的AI Pro与250美元的AI Ultra之间的市场空白,面向需要比Pro更多资源、又无需承担Ultra企业级溢价的高级用户,将与Anthropic和OpenAI展开竞争。同时,谷歌计划推出专属仪表板,帮助用户通过“5小时限制”、“每周预算”和“超额积分”三项核心数据,精确追踪和规划AI使用配额与Token消耗。
Astera Labs 发布了拥有320条可配置通道的Scorpio X-Series PCIe交换芯片,号称业界规模最大的开放式内存语义互连交换芯片。该产品可用单颗芯片替代多颗传统低通道数量交换芯片,从而简化AI系统互联拓扑,实现更低延迟、更大规模的集群扩展。其硬件加速的Hypercast和网内计算引擎可将集体运算性能提升高达2倍,提高每瓦特的词元处理能力。同时,公司公布了2026年第一季度创纪录的财务数据,营业收入达3.084亿美元,环比增长14%,同比增长93%。
AMD首席执行官苏姿丰在财报会议上宣布,已开始向核心客户送样Instinct MI450 GPU加速卡,并计划在下半年逐步提高Helios AI机架的出货量。客户需求强劲,已超出公司对2027年的内部预期,OpenAI等已签署大规模部署协议。MI450基于CDNA 5架构,其FP8算力较前代翻倍,并升级搭载了HBM4内存。该系列被AMD用来对标英伟达的竞品平台,其内存容量和横向扩展带宽具备优势。
Cloudflare宣布其代理商合作伙伴现可直接创建Cloudflare账户、购买域名并部署服务。这一功能整合了账户创建、域名注册和项目部署流程,简化了代理商的管理与操作步骤。此举旨在提升合作伙伴的自主性和效率,进一步扩展Cloudflare的生态系统与服务覆盖范围。
雷柏新上架无线AI办公鼠标C10,售价49元,提供岩灰、云白、雾蓝三种配色。其核心卖点是支持按键自定义,可一键唤醒豆包AI助手。鼠标配备轻音按键,采用自研驱动AI HUB,通过AA电池供电,续航可达12个月。连接方面支持2.4GHz,具备七档DPI调节和500Hz回报率。
华为鸿蒙HarmonyOS 6.1系统的AI记忆管家“小艺帮记”正通过热更新上线两项新功能。身份验证功能开启后,查看个人敏感信息时需要验证身份以增强安全性。同步收藏功能可将应用内收藏的内容自动同步至小艺帮记,便于集中访问和管理,并支持智能合集、AI摘要、AI问答及AI播客等智能化处理。该应用本身支持一站式记录身份证、生日、地址、订单等常用信息,并能收藏与管理在线网页和本地文件。
Airbyte 代理发布,为跨多个数据源的智能体提供上下文支持。该工具允许开发者和数据团队将不同来源的数据(如数据库、API、文件)统一接入,并转化为可供AI代理或自动化流程使用的结构化上下文。其在Hacker News上获得102点关注,显示社区关注度较高。这一方案旨在简化多源数据集成流程,提升智能体处理复杂任务的效率。
Claude Code 发布 v2.1.129 版本,带来多项功能新增与问题修复。新增功能包括支持通过 `--plugin-url` 从 URL 获取插件压缩包、新增 `CLAUDE_CODE_FORCE_SYNC_OUTPUT` 环境变量以强制启用终端同步输出,以及为 Homebrew 或 WinGet 安装提供后台自动更新提示。功能调整方面,插件清单中的 `themes` 和 `monitors` 现在建议在 `"experimental"` 下声明;网关模型发现功能改为通过环境变量手动启用;Ctrl+R 历史记录选择器恢复为默认搜索所有项目的提示。此外,修复了约 20 项问题,涉及 `/clear` 命令、会话标题显示、外部编辑器切换、令牌浪费、OAuth 凭证刷新、缓存警告等多个方面。
微软Xbox新任CEO确认将逐步关闭移动端Gaming Copilot并停止主机端开发。该AI游戏助手功能因在单机游戏中可能缩短游戏时长、削弱探索乐趣,且被指直接抓取现有攻略网站内容而引发争议,遭到玩家和内容创作者批评。由于整体市场反响冷淡及内部支持不足,新任管理层决定收缩战线,但PC端Gaming Copilot的命运暂未明确。
Meta 计划在 Facebook 和 Instagram 部署 AI 年龄检测系统,旨在识别并移除未满 13 岁的用户账户。新系统采用文本分析与视觉扫描双重手段:视觉扫描通过分析用户上传的照片和视频,从身高、骨骼结构等物理线索估算年龄范围;文本分析则抓取用户内容中的生日帖、年级提及等信号。Meta 强调该系统不进行面部或身份识别,仅估算大致年龄段,以在保护未成年人安全与尊重用户隐私之间寻求平衡。
据报道,苹果计划在秋季发布的iOS 27等系统中,推出名为“Extensions”的新功能,允许用户自行选择已通过App Store集成的第三方AI模型(如谷歌、Anthropic的模型),来驱动设备上的文本生成、图像编辑等AI功能。此举将打破此前ChatGPT作为唯一第三方选项的独占地位。同时,Siri将支持更换不同音色以区分内外模型,并迎来独立App及更深度的系统整合。苹果将在App Store设立专区展示兼容应用,并对第三方模型生成的内容免责。
Anthropic公司发布了面向金融服务与保险领域的AI智能体。该智能体旨在处理该行业复杂的专业任务,例如文档分析、风险评估和客户咨询。发布信息显示,相关讨论在Hacker News上获得了164个社区积分,表明其在科技圈内受到了关注。这一工具代表了AI在高度规范和专业化的金融保险领域的具体应用进展。
OpenAI扩展ChatGPT广告服务,推出自助广告管理平台测试版,新增CPC竞价功能和增强的广告效果测量工具。新平台注重隐私保护,确保广告内容与用户对话相互独立,帮助广告主更精准地定位目标受众并优化广告投放效果。
Meta 开始利用AI图像分析技术,通过识别骨骼结构和身体尺寸等视觉特征(而非面部识别)来检测Instagram和Facebook上的未成年人。公司强调该方法不依赖人脸识别,旨在更精准地识别未成年用户以加强平台保护措施。
Anthropic发布了十个针对金融服务耗时任务的预置智能体模板,涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件,或作为Claude托管智能体的配置指南,帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作,并扩展了合作伙伴生态,新增数据连接器和MCP应用,使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳,该模型在金融任务上达到先进水平。
关联讨论 5 条X:Testing Catalog (@testingcatalog)X:Claude (@claudeai)X:阿易 AI Notes (@AYi_AInotes)Claude:Blog(网页)X:Rohan Paul (@rohanpaul_ai)Amazon SageMaker AI 新增了一个 AI 智能体,旨在帮助开发者定制语言模型。该功能支持对 Llama、Qwen、Deepseek 和 Nova 等主流模型进行智能体驱动的微调,使开发者能更高效地优化模型以适应特定任务,无需从零开始构建。这标志着 AWS 在降低大模型定制门槛、提升开发效率方面迈出重要一步。
Runway公司推出“Characters”实时视频智能体,它能将任意单张参考图像(如真人、卡通或幻想生物照片)实时转化为具有自然对话表现力的视频角色。该技术基于其通用世界模型GWM-1,无需微调即可生成每秒24帧的高清视频,并同步口型、表情和头部运动。其核心突破在于通过自回归逐帧生成、流程优化与并行化,实现了每帧仅37毫秒的模型处理时间,以及从用户停止说话到角色开始响应仅1.75秒的服务器端延迟,从而满足了实时交互对话的严苛要求。
关联讨论 1 条X:Runway (@runwayml)