4月27日
13:48
Berryxia.AI@berryxia
55
基于AI多模态的macOS右键智能批量重命名工具

一款名为“小耳”的开发者制作的macOS右键工具,利用AI多模态模型(如Gemini)智能识别文件内容,并自动将其重命名为“内容+日期”的格式,解决了系统自带批量重命名功能不够智能的问题。该工具以Quick Action形式集成,无需安装新应用或后台进程,支持图片、视频、PDF、Word等多种文件类型的批量处理。其关键优势包括处理在本地完成、可使用Gemini Flash免费额度、支持撤销操作,并建议用户也可考虑使用Gemma或Qwen等本地小模型以降低成本。

小耳👂Jane|Xiaoer我是一个 AI Builder & Learn in Publish 👇 🔥一键让AI帮你改文件名🔥 你是不是有这种情况: 📁 截图全叫 Scre…

Google产品更新多模态
13:21
小互@xiaohu
62
蚂蚁灵光App上线手机端世界模型体验功能

蚂蚁灵光App推出“体验世界模型”新功能,用户上传图片后,可在几秒到几十秒内生成一个可供探索的3D世界。该功能疑似主要依赖云端算力完成生成,尽管手机本地算力有限,但其生成速度仍被评价为“牛P”。目前生成效果虽未达到“惊艳”程度,但已具备可玩性,用户实测可成功进入多个由图片生成的3D场景。

产品更新具身智能多模态
13:18
IT之家(RSS)
46
腾讯 QClaw 宣布升级 v0.2.14 版本:率先支持 Hermes,接入 DeepSeek-V4-Pro 与混元 Hy3 preview 模型

腾讯云QClaw发布v0.2.14版本,迎来最大规模更新。新版本率先支持Hermes框架,允许单一应用同时运行两种Agent内核。核心功能“灵感广场”升级为“专家广场”,内置超100个行业场景AI专家,用户通过自然语言交互即可直接生成文档、代码等结果。底层模型支持自由切换,新增接入腾讯混元Hy3 preview和DeepSeek-V4 Pro等大模型。微信小程序新增语音交互、文件共享及云端Agent远程管理功能。同时,平台新增百度网盘、携程等四个连接器,并上线了基于腾讯文档的Agent团队协作功能。

智能体MCP/工具产品更新
11:30
Elon Musk@elonmusk
51
Grok 想象
xAI产品更新图像生成
11:18
IT之家(RSS)
28
GPD 加入 MCIO 生态,预热 "Panther Lake" 迷你主机与显卡坞

GPD宣布推出两款采用MCIO接口的新产品。其中,GPD BOX迷你主机将搭载英特尔酷睿Ultra 300“Panther Lake”处理器,配备一个提供PCIe Gen5 ×8带宽的MCIO 8i接口和两个80Gbps的USB4 v2接口。另一款GPD G2则被称作全球首款兼具MCIO与USB4 v2双接口的eGPU扩展坞,官方称其在搭配GeForce RTX 4090显卡时性能损失仅为2%。该扩展坞还内置了M.2 SSD插槽,并支持100W PD输出供电。

产品更新
11:18
IT之家(RSS)
48
世界模型首次搬进手机:蚂蚁灵光 App 今日上线「体验世界模型 」功能

蚂蚁集团全模态AI助手灵光App今日正式上线“体验世界模型”功能,首次将世界模型应用于手机端。用户上传一张图片,即可在几秒钟内生成对应的3D世界,并能通过摇杆控制以第一人称视角自由漫步探索,体验类似游戏。该功能基于蚂蚁灵波LingBot-World-Fast世界模型,该模型已对外开源。

产品更新图像生成多模态
11:18
IT之家(RSS)
7
安克影音漫游二代头戴耳机开售:70 小时续航,到手价 687 元

安克影音(原声阔)推出漫游二代头戴耳机,售价687元。耳机升级四重低频降噪系统,针对飞机引擎等低频噪声优化,支持通透模式。采用40mm双层振膜单元,支持LDAC,有线无线均获Hi-Res认证。关闭降噪后续航达70小时,充电5分钟可听音4小时。配备3麦克风AI防风噪,通过App可使用个人AI助手Anka、支持100多种语言实时翻译,并内置白噪音小憩模式。耳机采用人体工学头梁与可折叠设计。

其他
11:00
meng shao@shao__meng
67
Browser Use 团队推出「Browser Use Box (bux)」:个人专属的24/7在线浏览器智能体盒子

Browser Use团队发布Browser Use Box(bux),一个可部署在自有设备(如VPS、树莓派)的24/7在线个人代理盒子。它通过将Claude Code Agent部署于本地,并将浏览器外移至Browser Use Cloud,解决了传统智能体会话不持久、本地浏览器环境脆弱(受2FA/CAPTCHA等限制)以及无法随时随地调用的问题。用户可通过Telegram或Web终端远程触发,Agent通过CDP-over-WSS协议驱动云端真实Chromium执行自动化任务(如预订航班、回复消息)。该项目已开源。

智能体产品更新开源生态
10:29
小互@xiaohu
57
Telegram推出Managed Bots,简化专属AI助手创建流程

Telegram上线Managed Bots功能,极大简化了专属AI助手机器人的创建和管理流程。用户只需点击链接并确认名称,几秒内即可获得一个以自己名字命名的专属Bot,体验从使用公共客服转变为拥有私人助手。该功能支持机器人创建和管理其他机器人,并能互相通信。其核心潜力在于支持大规模个性化部署,应用场景包括:为每个用户创建隔离记忆与配置的个人AI助手;让商家一键开通品牌客服Bot的客服SaaS平台;用户点链接即开通的AI Agent平台;以及为每位订阅者提供定制化内容推送的专属Bot。

智能体MCP/工具产品更新
09:18
IT之家(RSS)
66
机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程

小米正式发布了其开源视觉语言动作大模型Xiaomi-Robotics-0的真机后训练全流程。通过仅20小时的任务数据训练,该模型成功掌握了将耳机精准收纳进耳机盒的高难度动作,并能连续丝滑完成多个耳机的收纳。此任务要求模型具备亚毫米级的空间感知精度,以应对耳机与槽位间极小的公差,同时能快速修正动作偏差,克服耳机盒表面最低Ra0.03μm粗糙度带来的位移挑战。该模型此前已在HuggingFace全球VLA模型下载榜位列第六。

具身智能开源生态教程/实践
07:29
07:18
IT之家(RSS)
32
吉利旗下芯擎科技发布 5 纳米车规级 AI 座舱芯片"龍鹰二号"

在2026北京国际车展上,芯擎科技发布了5纳米车规级AI座舱芯片“龍鹰二号”,并计划于2027年第一季度启动适配。该芯片AI算力高达200 TOPS,原生支持7B+多模态大模型,内置高性能CPU与GPU,带宽达518GB/s。其采用柔性架构,可满足从入门到旗舰级中央计算平台的需求,并通过集成专用车控单元与安全岛设计,实现舱驾业务的物理隔离,保障安全。

产品更新端侧
00:53
DeepSeek@deepseek_ai
精选62
🔥DeepSeek 输入缓存价格下调! 即刻起,整个 DeepSeek API 系列的输入缓存命中价格降至原价的十分之一!以更少成本,更高效地构建。 📌提醒:DeepSeek-V4-Pro 七五折优惠活动持续有效至 2026 年 5 月 5 日 15:59(UTC 时间)。
DeepSeek产品更新部署/工程

推荐理由:输入缓存命中价格直接打一折,对高频调用 API 的开发者来说是实打实的成本减负,配合 V4-Pro 的七五折促销,DeepSeek 在用价格战抢开发者心智。
4月26日
23:52
Hacker News 热门(buzzing.cc 中文翻译)
42
Eden AI--OpenRouter的欧洲替代方案

Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。

产品更新开源生态部署/工程
23:19
Berryxia.AI@berryxia
60
微软开源TRELLIS.2:单图3秒生成高质量3D模型

微软开源了40亿参数的TRELLIS.2模型,可将单张图片在3秒内转换为具备完整PBR材质(粗糙度、金属度、不透明度)的专业级3D资产。该模型生成的并非粗糙网格,而是直接可用于生产流程的高质量模型,能够准确处理开放表面、空心结构以及复杂几何体,显著提升了图像到3D内容的生成效率与实用性。

Microsoft多模态开源/仓库
关联讨论 1Hacker News 热门(buzzing.cc 中文翻译)
19:20
IT之家(RSS)
27
鸿蒙智行全新一代问界 M9 汽车"成精":会卖萌、能说话,还可以开箱送礼

华为余承东通过视频展示了全新一代问界M9的智能交互功能。该车具备车外语音能力,不仅能与人打招呼、自我介绍,还能主动打开前备箱送出礼物,并通过轻晃车身“卖萌”表达情绪。新车搭载超140项创新技术,实现全面重构。目前华为官网已开启预订,标准版预售价49.98万元起,配备双腔双阀、后轮转向、6激光雷达并首发ADS 5系统,全系采用800V高压平台。同时推出的问界M9 Ultimate领世加长版预售价66.98万元起,搭载2.0T增程器与三电机,提供专属设计与座舱体验。

产品更新具身智能
16:21
阿绎 AYi@AYi_AInotes
55
Clicky:常驻光标的AI助手,语音操控自动执行任务

前_buildspace创始人Farza发布了Mac端AI助手Clicky。它常驻光标旁,用户无需打开应用或打字,直接对屏幕说话即可触发。AI能理解指令并自动执行任务,例如整理桌面截图、创建提醒事项、搜索整理网红列表生成CSV文件,甚至能在几分钟内根据描述编译并运行一个功能完整的原生Mac App。其核心突破在于从“用户主动寻找并操作AI”转变为“AI常驻感知屏幕,听令即执行”,直接完成而非仅提供操作路径,类似于数字员工而非聊天机器人。目前该产品已可免费下载。

智能体MCP/工具产品更新
14:20
IT之家(RSS)
29
斑马智能联合东风首发淘宝闪购 Agent 上车,支持一句话点餐

在2026北京国际车展上,斑马智能与东风研发总院宣布,基于元神AI的淘宝闪购Agent将首次搭载于东风天元智舱。该功能允许用户仅通过自然语音完成全流程点餐,能精准识别模糊意图、自动匹配门店并推荐餐品,支持自由对话与订单中途修改。服务覆盖全品类美食,原生集成于座舱系统,可实现优惠自动叠加、配送时间智能联动导航。未来双方还计划在影音娱乐、出行游玩等场景推出更多原生Agent服务。

智能体MCP/工具行业动态
14:20
IT之家(RSS)
53
今天起,DeepSeek V4 成 OpenClaw 默认模型

OpenClaw 2026.4.24版本发布,重磅接入DeepSeek V4模型。其中,DeepSeek V4 Flash被设为默认大模型,V4 Pro也已上线模型库。V4 Pro拥有1.6万亿总参数和49B激活参数,是全球最大的开源模型;V4 Flash总参数284B,激活参数13B。两者均采用MoE架构,支持100万token上下文,并以MIT协议开源。此次更新还深度整合了Google Meet作为内置插件,支持实时语音通话、会议记录处理与导出。同时,系统修复了多轮工具调用中的逻辑错误,增强了浏览器自动化的稳定性和坐标点击等兜底功能,并优化了插件与模型的架构以降低启动负担。

智能体DeepSeek产品更新
13:21
阿绎 AYi@AYi_AInotes
58
NotebookLM更新:AI智能分组解决"第二大脑"资料混乱痛点

NotebookLM最新更新解决了资料过多导致混乱的核心问题。当用户添加超过5个来源后,AI会自动按主题对所有文档进行智能分组并命名,例如将园艺资料分为堆肥、种植日历等类别。文档可跨组归属,用户也能手动调整。此次更新的关键在于AI仅在资料量达到需要整理的阈值(5个以上)时才自动介入,既避免了过度干预,又有效帮助用户从繁琐查找中解放出来,更专注于思考与学习。

检索增强产品更新
12:20
IT之家(RSS)
49
国家超算互联网推出 DeepSeek-V4 限时免费对话服务

4月26日,国家超算互联网上线DeepSeek-V4限时免费对话服务。用户登录官网即可体验其百万Token超长上下文实时对话能力。此举标志着百万上下文从高端选配变为基础标配,进入普惠时代。该能力可一次性处理如《三体》三部曲总字数的文本,支持全文分析与深度推理。通过国家级算力基础设施与顶级大模型的融合,此举大幅降低了大规模AI应用的门槛与成本,推动AI技术更广泛地赋能千行百业。

DeepSeek产品更新开源生态
12:20
IT之家(RSS)
28
微信鸿蒙版 App 获 8.0.17.34 尝鲜升级,视频号补全大量特性

微信鸿蒙版 App 在华为应用市场推出 8.0.17.34 尝鲜升级,测试期至2026年5月24日。此次升级虽官方称修复已知问题,但实际新增大量特性:视频号功能大幅补全,支持修改资料、新注册、播放页面旋转和双击点赞;听一听新增AI写歌和AI翻唱,并支持QQ音乐打开歌曲;微信卡包增加会员卡,引用图片可滑动查看,长按应用图标新增“我的二维码”快捷方式。此外,该版本安装量已突破5000万次。

产品更新端侧
11:22
ginobefun@hongming731
33
BestBlogs v2.1.0发布,新增主题解读与文档中心

AI驱动的BestBlogs平台发布v2.1.0版本,带来多项核心功能更新。主要包括深度改进的主题解读页面、重新设计图文并茂的早报展示、新上线的文档中心以整合帮助资源。同时,内容翻译功能升级至v2版,提升了中英翻译质量与切换便捷性。移动端用户体验获得显著优化,UI更简洁流畅。专为移动端开发的应用也已完工,待上架后将提供更佳体验。

产品更新其他
11:20
IT之家(RSS)
45
Momenta R7 强化学习世界模型北京车展量产首发

在北京车展上,Momenta正式宣布其强化学习世界模型R7实现量产首发。该模型通过“World Model Prediction”预测物理世界未来状态与交互逻辑,旨在让AI理解物体物理属性、运动因果关系及交互可能性。其技术架构分为三层:基于海量驾驶数据的世界模型预训练、用于自动驾驶闭环仿真的世界模型仿真,以及在模型内进行的强化学习虚拟训练。目前,Momenta已交付超70款量产车型,累计定点车型超200款,本次车展有超过20个品牌的60余款车型搭载了其智驾方案。

产品更新具身智能部署/工程