5月7日
22:41
TestingCatalog News 🗞@testingcatalog
55
Meta即将推出常驻AI智能体"Hatch",基于社交数据训练

Meta即将推出名为“Hatch”的常驻AI智能体,目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露,内部测试计划于6月底启动,Meta为此构建了模拟Reddit、Etsy和DoorDash的环境,以训练其工具使用行为。技术架构方面,最终将由Meta自家的Muse Spark模型系列作为核心支撑,而在过渡阶段,将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

智能体AnthropicMCP/工具Meta
22:31
Chubby♨️@kimmonismus
48
Superintelligence升级为AI与未来科技对话媒体平台

Superintelligence宣布提升至新水平,从新闻通讯和播客转型为媒体平台,专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持,优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue,探讨AI生成代码如何改变软件安全,以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中,旨在追踪AI的实际发展方向。

产品更新安全/对齐
21:16
IT之家(RSS)
18
绿联 X8 耳夹式耳机发售:VPU 骨声纹降噪、11mm 单元,399 元

绿联 X8 耳夹式蓝牙耳机现已发售,首发价399元。耳机采用专利C桥设计,内嵌钛镁合金记忆丝确保稳固佩戴。其搭载11mm双磁钛膜单元,支持Hi-Res/LDAC双金标认证与格莱美大师调音。核心亮点是首发VPU骨声纹降噪技术,结合4麦克风与2个VPU实现6麦通话降噪。此外,内置AI助手支持实时翻译与录音转写,配备蓝牙6.0与IP56防尘防水。电池续航方面,单次使用可达10小时,配合充电仓综合续航为46小时。

产品更新语音
20:33
20:11
TestingCatalog News 🗞@testingcatalog
57
Anthropic测试Claude Console托管代理的Insights功能

Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话,将每个会话记录与代理系统提示并行发送给模型,以生成包含任务、行动、问题和评估的摘要,并给出0-100的质量评分。同时,直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后,另一个模型调用会读取所有摘要和统计信息,生成跨会话洞察,包括重复错误、使用模式、效率异常点和成功案例,并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载,所有数值均基于原始事件数据计算,仅文本描述和分类来自模型生成。

智能体Anthropic产品更新部署/工程
19:16
IT之家(RSS)
27
大疆 DJI ROMO 2 代扫地机器人官宣 5 月 11 日发布

大疆宣布将于5月11日发布DJI ROMO 2代扫地机器人。官方预热重点突出了其床底清扫能力,并暗示其具备高精度避障,可做到“不会碰倒放在地上的玻璃水杯”。新品还有望支持地面速干功能。作为参考,初代ROMO系列于2025年8月发布,主打旗舰无人机同款感知与避障技术、25000 Pa吸力、柔性双机械臂贴边清扫、164 ml机载水箱及基站自清洁等功能。

产品更新
19:08
The Decoder:AI News(RSS)
59
Claude的新"Dreaming"功能旨在让AI代理从错误中学习

Anthropic为Claude Managed Agents新增“Dreaming”功能,这是一个异步处理过程,能自动回顾历史代理会话、清理重复或过时的记忆条目,并提炼新见解。同时,Outcomes和Multiagent Orchestration两项功能现已进入公开测试阶段。这些更新旨在帮助AI代理在跨会话中从错误学习,实现持续改进,提升代理的自主学习和适应能力。

智能体Anthropic产品更新
18:16
IT之家(RSS)
41
高德路况扩展至全国 100+ 高校校园,课间人流高峰实时可见

高德地图基于VLM大模型,将实时路况服务扩展至全国100多所高校校园。校内主干道、校门口、宿舍区、食堂周边、教学楼路口等关键点位拥堵情况可实时查看,校园交通管理实现数据化、可视化。系统在暴雨天或校庆等大型活动时提供出行指导,如提示绕行路线;课间人流高峰、午晚餐时段车流等动态一目了然,帮助用户优化出行选择。

产品更新行业动态
17:59
Alibaba Cloud@alibaba_cloud
34
阿里云ClawTalks EP3直播:从本地自动化到团队协作的AI工作流

阿里云ClawTalks第三期将于2026年5月8日进行YouTube直播,重点介绍其开源AI智能体工具如何提升工作流。核心产品包括QwenPaw和HiClaw:QwenPaw支持在设备本地运行轻量级、低内存的AI自动化任务;HiClaw则致力于实现透明、人机协同的多智能体团队协作,旨在变革AI智能体的构建与应用方式。

智能体产品更新
17:16
IT之家(RSS)
34
群晖推出 AI 监控摄像头 BC510 / TC510,支持 IP6X 防尘

群晖科技发布两款AI监控摄像头BC510和TC510。新品具备IP66/IP67防尘防水等级,支持录制2880×1620分辨率、30帧/秒的视频,提供110°水平广角视野和30米夜视距离。摄像头搭载边缘AI功能,可在本地运行人流与车辆计数、入侵侦测等分析任务。它们设计用于深度整合群晖现有监控架构及即将推出的VSaaS平台,并兼容第三方环境。

产品更新端侧视频
17:16
IT之家(RSS)
57
谷歌 Chrome 浏览器 148 版本更新发布,自动填充和 AI 模式改进

谷歌发布Chrome 148版本更新,重点增强了AI功能与自动填充工具。用户现可通过地址栏或新标签页直接询问AI智能体获取聚合信息与自然回答;自动填充新增对驾照、护照等政府标识符的支持,并将内置Gemini聊天机器人扩展至亚太49个国家和地区。平台方面,Android版新增近似位置权限,ChromeOS支持垂直标签栏。开发者API引入了用于本地大模型交互的Prompt API。本次更新共修复127个安全漏洞,其中3个为高危级别。

智能体Google产品更新端侧
16:16
IT之家(RSS)
52
AMD:Instinct MI430X 显卡加速器 FP64 性能超英伟达 Rubin 六倍

AMD 预览了 Instinct MI400 系列中的 MI430X 加速器,该产品已获多款超算采用。与侧重AI的MI455X不同,MI430X兼顾人工智能与传统高性能计算工作负载,并原生支持FP64高精度数据格式。其FP64算力预计超过200 TFLOPs,是英伟达Rubin架构的六倍以上,有望成为有史以来性能最高的FP64 GPU。AMD强调,FP64高精度对于气候学、材料科学等领域的科学探索至关重要,能为基于AI的研究提供高保真基础,以捕获底层科学的真实结构。

产品更新数据/训练
15:16
IT之家(RSS)
59
全球首个人形机器人任务动作应用商店:宇树 UniStore 官方共享应用平台正式全面开放

宇树科技宣布其全球首个人形机器人任务动作应用商店“UniStore”正式全面开放。该平台允许用户像使用手机应用商店一样,轻松上传、分享和下载训练好的机器人动作模型,例如舞蹈、武术和劳动技能。此举旨在推动人形机器人从“功能机”向“智能机”时代跨越,通过共享应用生态解锁机器人的无限潜能。平台包含用户广场和动作库,用户可一键获取复杂操作预设。

产品更新具身智能
15:16
IT之家(RSS)
64
谷歌为 Gemma 4 系列 AI 模型推出 MTP 起草器,推理速度最高提升 3 倍

谷歌为Gemma 4系列开源模型推出多Token预测起草器,采用推测解码技术以提升推理效率。该技术通过轻量级起草器预测多个未来Token,再由重型目标模型并行验证,从而突破内存带宽限制,将计算资源利用率最大化。实测显示,在特定条件下,Gemma 4 26B模型在Apple Silicon芯片上实现了约2.2倍的本地加速。此举有助于在个人电脑、消费级显卡及边缘设备上高效部署低延迟AI应用,如聊天机器人和编程助手。

Google产品更新推理
15:16
IT之家(RSS)
精选72
用嘴干活:阿里千问 PC 端上线 AI 语音输入功能

阿里千问在PC端上线AI语音输入功能,用户通过快捷键即可在各类桌面应用中直接使用。该功能不仅支持去除语气词、纠错和格式化整理口语内容,更能基于上下文智能回复,并可直接下达创作、问答、翻译等指令。其设计逻辑超越传统语音打字工具,旨在成为跨应用的AI任务调度中枢:用户通过按住快捷键启动语音输入模式,或双击切换至AI指令模式,可直接派发信息检索、文档生成等任务。该功能覆盖文档编辑、网页浏览、即时通讯等主流办公场景,无需切换客户端或打开额外窗口,目前所有用户可免费使用。

产品更新语音

推荐理由:阿里千问把语音输入做成了跨应用的AI任务调度中枢,按住说话就能直接发指令干活,对办公族来说是个真提效的小功能,值得装上试试。
14:16
IT之家(RSS)
49
Skymizer 公布 AI 推理解码加速器:单 PCIe AIC 可集成 384GB 内存

中国台湾地区AI IP企业Skymizer近日发布推理解码加速器芯片HTX301,该芯片可与GPU协同工作,加速AI推理结果的输出,提升算力系统利用率和能效。HTX301基于HyperThought软硬件协同平台,采用LISA指令集架构,专注于带宽密集型负载处理。其支持SoC与PCIe AIC两种部署形态,其中单张PCIe加速卡可集成6颗HTX301芯片,提供总计384GB内存,足以满足7000亿参数大模型的本地运行需求,而整卡功耗仅为240瓦。

产品更新推理端侧
14:03
13:16
IT之家(RSS)
22
上汽 MG 4X 纯电 SUV 官宣 5 月 11 日开启盲订,搭载地平线博弈大模型和半固态电池

上汽MG宣布纯电SUV MG 4X将于5月11日开启盲订。新车将搭载地平线博弈大模型和半固态电池,入门版即配备,续航里程510公里起。车身尺寸为长4500mm、宽1849mm、高1621(1627)mm,轴距2735mm。动力方面,后轴搭载永磁同步电机,额定功率80kW,峰值功率150kW。新车还延续发光LOGO设计,并支持OPPO智行生态互联。该车型此前已出现在工信部新产品公示中。

产品更新端侧
12:20
Berryxia.AI@berryxia
52
马斯克给其打Call的Neuralink 这次直接把"脑机接口"从"局部修复"升级成了"全脑通用解决方案"

Neuralink研发手术机器人,可精准抵达大脑任意区域,将脑机接口从局部修复升级为全脑通用解决方案,旨在治疗瘫痪、癫痫等大脑疾病。机器人演示了在血管网络中穿行和微米级植入能力,使脑外科手术从高风险艺术变为可重复工程,拆除普惠化门槛,迈向人类大脑操作系统。

Neuralink: We're building a surgical robot capable of reaching any brain region. The goal: a generalized neural interface to help s...

产品更新其他
11:16
阿绎 AYi@AYi_AInotes
63
AI在专业命理大赛接近人类顶尖水平,技术路径可迁移至垂直领域

Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著超越通用大模型40%的基线。其突破在于采用工程化方案:开发200多个专用原子工具处理精确计算,将流派技法封装为可调用函数,并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径,相关评测基准已开源。

DestinyLinker: Tianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%) 比赛 3069 名参赛者 人类 Top-20 选手平均 53.5% 最强通用大模型基线(Claude Opus 4.6)40%...

智能体产品更新开源生态推理
10:36
meng shao@shao__meng
精选77
Amp发布新版CLI工具Neo,引领Coding Agent向长链路转型

Amp发布CLI工具Neo,标志着Coding Agent从“陪伴式”转向“长链路”新方向,核心是减少人工介入、支持随处运行与触发。关键更新包括:实现本地线程的远程控制与编排;引入自动上下文压缩,淘汰手动管理;正式发布Plugin API,支持扩展工具与交互;采用队列与引导机制优化工作流;权限模型彻底反转,默认允许所有操作,将安全控制权移交插件系统;性能大幅提升,CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。

Thorsten Ball: The best coding agent in the world is back. https://ampcode.com/news/neo

智能体MCP/工具产品更新编码

推荐理由:Amp 这次重写把 Coding Agent 从「陪你写代码」变成了「替你干完活」,默认不询问权限这步走得够狠,但也确实是大模型能力上来的必然。
10:16
IT之家(RSS)
28
谷歌发布紧急补丁,修复三星 Galaxy XR 头显严重内存泄漏问题

谷歌紧急推送版本号为I610UEU2AZD8的修复补丁,以解决三星Galaxy XR头显在安装4月系统更新后出现的严重内存泄漏问题。该故障导致设备在运行20至30分钟后内存占用持续攀升直至耗尽,引发系统卡死、画面帧率大幅下降,用户体验严重受损。官方确认此次更新修复了前述问题,并包含一系列系统稳定性与性能优化措施。所有受影响用户可通过系统设置中的软件更新菜单手动下载并安装此补丁。

Google产品更新
10:16
IT之家(RSS)
19
海信大白闺蜜机 X8 Ultra 部分规格确认,静待明日发布

海信大白闺蜜机 X8 Ultra 将于5月30日20:00开售,定价8499元。该产品采用32英寸4K面板,配备天鹅颈灵动系统和20000mAh电池,续航达15小时。存储组合为8GB+256GB,运行Android系统,支持Wi-Fi并集成摄像头。其主要功能覆盖护眼学习、家庭娱乐、智能AI助手、居家办公及健身追剧,同时支持AI健身、AI语音和K歌。

多模态行业动态
10:12
向阳乔木@vista8
67
Refero Styles:给AI Agent用的前端设计参考网站。

Refero Styles是一个为AI Agent设计的前端参考网站,允许输入网站名或URL自动提取设计风格并生成DESIGN.md文件。它收录了ElevenLabs、Apple等优质网站的Design文档,并提供Refero MCP,包含真实产品截图和用户流程,让AI Agent在编码前参考以提升效率。

智能体MCP/工具产品更新编码
09:12
向阳乔木@vista8
59
字节TRAE SOLO移动端打通IDE,支持第三方模型与飞书集成

TRAE SOLO推出移动端应用,可与电脑端IDE打通,实现远程控制与任务下发。该应用支持用户配置第三方模型并使用自己的API密钥,增强了灵活性与自主性。尤其在与飞书绑定后,其实用性显著提升,使得用户能够在手机端处理一些相对复杂的任务,扩展了移动办公与开发的场景。

向阳乔木: http://x.com/i/article/2052185467773202433

产品更新编码
09:09
08:20
Berryxia.AI@berryxia
72
Google翻译推出实时耳机传译,支持70多种语言

Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。

Google: Save this tip before your next big trip abroad ⬇️ With Google Translate's Live translate feature, you can get instant tr...

Google产品更新语音
08:16
IT之家(RSS)
42
谷歌停运 Project Mariner,跨网页自动化技术整合至 AI Mode

谷歌于5月4日宣布停运其于2024年12月推出的实验性网页自动化项目Project Mariner。该项目旨在代替用户执行跨网站的多步骤任务,如信息检索与操作。谷歌强调其技术并未废弃,核心功能已被整合至Gemini智能体和AI Mode等核心产品中。过去一年,谷歌已逐步将此类智能体能力融入现有生态,例如让Gemini Agent代为处理邮件和预订酒店。此外,谷歌今年在Chrome中展示的“auto-browse”AI功能,可执行查询航班价格等复杂任务,被视为对竞争对手的直接回应。

智能体Google产品更新
08:16
IT之家(RSS)
23
漫步者 Lolli5 ANC 智能触控大圆屏耳机开售:50dB 降噪,539 元

漫步者 Lolli5 ANC 智能触控大圆屏耳机已上市,售价539元,提供沙滩白、礁石黑、落日橙三种配色。其最大亮点是充电盒配备智能触控屏,可显示时间并控制音乐、拍照。耳机支持50dB深度、5kHz宽度的ANC自适应降噪和3+3麦智能通话降噪,拥有双Hi-Res金标认证。采用13mm双复合LCP液晶振膜单元,支持蓝牙6.0、双设备连接和IP55级防尘防水。此外,还集成了豆包与DeepSeek双脑问答、会议录音及App实时互译等智能功能。

DeepSeek产品更新语音
08:16
IT之家(RSS)
65
Adobe Acrobat 发布 PDF Spaces:静态文档秒变 AI 交互工作空间

Adobe于5月6日在Acrobat中推出PDF Spaces功能,可将PDF、文档、链接等静态材料转化为交互式AI工作空间。该功能利用AI自动生成摘要、音频概览、品牌演示文稿及定制聊天机器人。接收者能与AI助手对话以快速获取信息并定位关键内容,适用于销售提案、市场营销和人力资源等场景。目前,该功能已在Acrobat Express和Acrobat Studio上线。

智能体产品更新多模态
08:04
Hacker News 热门(buzzing.cc 中文翻译)
52
Show HN: 《幻觉百科》

名为《幻觉百科》的新网站Halupedia正式发布,这是一个专注于收集和记录人工智能生成内容中各类“幻觉”现象的在线百科。网站旨在系统化归类AI模型产生的事实错误、逻辑矛盾或虚构信息,为开发者和研究者提供参考案例以改善模型可靠性。目前该平台已获得106个Hacker News社区点赞,显示出技术社区对此类工具的关注。

产品更新数据/训练
07:16
IT之家(RSS)
53
微信鸿蒙版 App 8.0.17.36 正式版更新发布

微信鸿蒙版 App 发布 8.0.17.36 正式版,安装量已达 5369 万次。本次更新聚焦视频号、听一听及支付交互功能:视频号支持资料修改、新账号注册、双击点赞及直播选项细化;听一听新增 AI 写歌与翻唱功能,并可将歌曲设为状态或跳转至 QQ 音乐;支付方面新增 Apple 服务扣费管理,收款时可选择存入零钱或零钱通。此外,还优化了头像查看、图片引用浏览、跨端文件传输及聊天框语音转文字快捷按钮等多项用户体验细节。

产品更新语音
07:11
xAI:News(网页)
精选79
Grok Imagine API 推出"Quality Mode"图像生成与编辑功能

xAI正式向企业开发者和团队推出Grok Imagine API的“Quality Mode”图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升,能生成细节精细、纹理准确、场景逼真的图像,并具备清晰的多语言文本生成能力。在独立排行榜中,该API已位列顶级模型之列。定价为输入提示每次0.01美元,输出图像根据分辨率(1K或2K)每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。

xAI产品更新多模态

推荐理由:Grok Imagine 的 Quality Mode 在写实度和文字渲染上提升很明显,对需要高频生成产品图和 UGC 内容的品牌团队是个实在的更新,API 直接能用,单张才几分钱。
06:30
Claude Code:GitHub Releases(RSS)
51
Claude Code v2.1.132 版本更新与问题修复

Claude Code 发布 v2.1.132 版本,新增多项功能并修复超过20个问题。主要新增内容包括:为 Bash 工具子进程环境添加 `CLAUDE_CODE_SESSION_ID` 环境变量;引入 `CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1` 环境变量以退出全屏渲染器;在粘贴图片时显示“Pasting…”提示。关键修复涉及:外部 SIGINT 信号现在能触发优雅关机并打印 `--resume` 提示;修复了原生构建下终端关闭或 SSH 断开时的未捕获异常;解决了 `--resume` 因表情符号被截断而失败以及 `--permission-mode` 标志在恢复会话时被忽略的问题。此外,还修复了全屏模式唤醒后黑屏、特定字符输入损坏、鼠标滚动过快、内存无限增长等具体问题。

Anthropic产品更新编码