4月30日
17:10
IT之家(RSS)
62
快手推出 AI 桌面智能体 KroWork,支持通过自然语言生成本地应用

快手于4月30日发布AI桌面智能体KroWork。用户可通过自然语言指令驱动AI完成文件处理、浏览器自动化等任务,并能将重复性工作流固化为本地桌面应用,实现零token消耗、输出稳定且保障数据安全。该产品面向市场营销、财务等非技术用户,集成Qwen、Kimi等主流模型,支持沙箱执行和权限管控,旨在降低软件开发门槛,让个人能将日常需求转化为桌面工具。

智能体产品更新端侧部署/工程
17:10
IT之家(RSS)
45
中国移动发布灵犀机器人家族,人形产品 22.9 万元、四足机器狗 3.99 万元

在第九届数字中国建设峰会上,中国移动发布了“灵犀机器人家族”,包括人形机器人和四足机器狗等形态。人形机器人零售价22.9万元/台,日租5199元;四足机器狗零售价3.99万元/台,两只起租日租699元。产品应用于家庭、养老、园区及展厅等场景,并提供销售、租赁、订阅等多种服务模式。技术方面,中国移动自研了“VLA-RAIL”实时异步推理框架,提升自主执行效率1.5倍,并搭载“韬驭”导航系统,以实现复杂环境下的自主移动。

产品更新具身智能
17:10
IT之家(RSS)
44
钉钉 DingTalk A1 Pro"充电宝版录音卡"发售:内置 2980mAh 电池,1299 元

钉钉正式发售DingTalk A1 Pro“充电宝版录音卡”,定价1299元。该产品采用卡片式设计,厚度仅6.4mm,内置行业首发的MEMS指向麦克风,拾音距离可达10米。其配备2980mAh电池,支持连续录音180小时、待机180天,并可作为磁吸移动电源为手机充电。购买用户可获6个月专属权益,每月享有1500分钟语音转文字服务。

产品更新语音
15:09
IT之家(RSS)
55
阿里发布数字员工 QoderWake:可在真实工作中承担软件工程师、运营、分析师等岗位角色

阿里发布业界首个安全可控、持续进化的生产级数字员工产品QoderWake,可在真实工作中承担软件工程师、运营、分析师等岗位。目前已上线“数字程序员”,能自主完成代码变更简报整理、错误诊断与初诊报告、告警分诊等工作,全流程基本无人值守。该产品已在阿里内部应用,将单条问题的根因分析耗时从30分钟大幅缩短至2分钟。近期还将上线数字分析师、数字客户经理等多种数字员工角色。QoderWake已开放邀测,个人和企业可通过官网申请雇佣或定制专属数字员工。

智能体产品更新编码
15:09
IT之家(RSS)
24
华硕 2026 款 ProArt 创 13 笔记本新增"AI Max+ 395 处理器、128GB RAM 1TB SSD 版本",28999 元

华硕为其2026款ProArt创13笔记本推出了高配新版本,售价28999元。该机型搭载16核心32线程的AMD锐龙AI Max+ 395处理器,配备128GB LPDDR5X内存和1TB PCIe 4.0 SSD。笔记本采用13英寸2880x1800分辨率触控屏,支持360度翻转,机身厚度为15.8mm,重量1.39千克,并配备三热管四出风口散热系统。接口方面提供了HDMI 2.1、两个USB4、一个USB-A 3.2 Gen 2以及MicroSD读卡器等。

产品更新端侧
14:52
Alibaba Cloud@alibaba_cloud
精选68
阿里云发布HappyHorse,实现秒级AI视频生成

阿里云推出最新AI视频生成模型HappyHorse。该模型具备多项突破性功能:可生成影院级1080p高清画质;原生实现精准的音画同步,确保口型与声音对齐;在复杂场景和镜头切换中保持多镜头角色一致性;支持从文本提示到视频成片的秒级即时生成。用户现可免费试用。

多模态模型发布视频
关联讨论 1X:阿里云 / Alibaba Cloud (@alibaba_cloud)
推荐理由:阿里云终于放出视频生成模型,1080p+音频同步+秒级生成,功能直指 Sora 的短板。如果 demo 没修图,国产视频工具又多一个靠谱选择。
14:45
宝玉@dotey
35
Hermes Agent推出Curator功能,自动整理优化技能库

Hermes Agent新增Curator功能,旨在解决其“自我进化”机制持续生成技能文件导致的技能库臃肿问题。Curator会每周自动运行,追踪技能使用频率与更新时间,自动合并功能重叠的技能、清理闲置技能,并将过于具体的技能转化为模板或脚本整合到更通用的技能中。该功能仅处理智能体自动生成和用户手写的技能,不会影响外部安装、内置或被用户“钉住”的技能。用户也可在配置文件中关闭自动运行,或通过命令行手动触发。

智能体产品更新
14:35
IT之家(RSS)
64
谷歌:Gemini 应用可直接生成并下载 PDF、Word、Excel 等文件

谷歌宣布其Gemini应用现已支持直接生成并下载多种格式文件。用户仅需输入一条提示词,即可在对话中创建PDF、Microsoft Word、Excel、谷歌Workspace文档等,无需离开应用即可完成从构思到成文的流程。该功能已面向全球所有Gemini用户开放,生成的文件可直接下载至设备或导出至谷歌云端硬盘。支持的格式包括谷歌文档、表格、幻灯片、PDF、Word(docx)、Excel(xlsx)、CSV、LaTeX、Markdown、纯文本(TXT)和富文本格式(RTF)。

Google产品更新
13:35
IT之家(RSS)
23
vivo X300 Ultra / X300s 手机影像创作升级,新增与上海迪士尼度假区的联名样张水印等

vivo 为 X300 Ultra 和 X300s 手机推出影像系统升级。X300 Ultra 在 19.10 及以上版本中获得了多项功能提升,包括支持追光、浓郁等风格的拍后可逆编辑;新增与上海迪士尼度假区的联名样张水印及旅拍风格水印;人像模式加入希区柯克变焦实况;通过云端大模型增强长焦画质;人像录像可手动调节曝光;录像支持地平线防抖;Log视频支持外接硬盘录制。X300s 在 10.5 及以上版本中,主要获得了拍后可逆编辑和全新的迪士尼联名、旅拍水印两项升级。

其他
12:35
IT之家(RSS)
40
2.69 万元起,宇树双臂人形机器人发布

宇树科技发布新款双臂人形机器人,起售价2.69万元。该机器人主打上半身双臂操作,配备视觉双目算力模组,支持15至31个自由度,手臂自由度可选5x2或7x2。机身和头部各搭载8核CPU,头部模组算力达10TOPS。下半身可选固定底座或移动底盘,末端执行器可更换为双指、三指或五指灵巧手。产品提供四个不同配置版本。

产品更新具身智能
11:44
小互@xiaohu
59
Stripe推出Link代理钱包,AI代付不泄露真实卡号

Stripe发布Link agent wallet,使AI agent能代表用户发起支付,同时保护银行卡信息安全。其核心机制是让AI agent生成一次性支付凭证,每笔交易需用户在Link中手动批准或拒绝。真实卡号既不会提供给AI agent,也不会泄露给其调用的外部工具。此外,Stripe已开源Link CLI,开发者可将其集成至Claude Code、MCP客户端或自定义的agent工作流中。

智能体MCP/工具产品更新
11:39
11:34
IT之家(RSS)
48
打破纯文本限制,微软 OneNote 内置 AI 现支持理解表格 / 图像等

微软于4月29日宣布,为拥有Microsoft 365 Copilot许可的用户在Windows、macOS及iOS平台的OneNote应用推出AI功能更新。新版内置Copilot AI突破纯文本限制,新增对表格、图像及标签的理解与分析能力。例如在规划旅行时,AI可综合分析行程表格、检查清单和景点照片,智能排查行程漏洞并提供优化建议。该更新通过服务器端推送自动部署,用户无需手动更新,只需确保设备版本符合要求即可。

Microsoft产品更新多模态
10:34
IT之家(RSS)
31
ASUSTOR 预热 Flashstor Gen3 全闪 NAS,用上 8640U

ASUSTOR宣布将推出新一代全闪存NAS产品Flashstor Gen3系列,包括Flashstor 6 Gen3和Flashstor 12 Pro Gen3两款型号。新品均搭载AMD锐龙5 PRO 8640U处理器,提供16 TOPS的NPU AI算力,支持本地边缘计算和智能影像识别。该系列分别提供6个和12个M.2 NVMe SSD盘位,最高支持PCIe Gen4,并配备USB4、HDMI等接口。其支持双USB网络直连,传输效率可超越10GbE。同期推出的还有12盘位存储扩充设备Xpanstor 12R Gen2,配备550W白金效率冗余电源和热插拔风扇,可为特定NAS系列提供额外存储空间。

产品更新端侧
10:21
Alibaba Cloud@alibaba_cloud
精选60
你知道吗?Wan2.7-Image 也有自己的"调色板"功能?😉 只需输入参考图像、精确色码,甚至插入自己的调色板,该模型就能确保色码匹配以保持品牌一致性,并克服长期困扰 AI 图像的色彩还原不一致问题 🎨 观看视频,立即完美掌控你的色彩! #AlibabaAI #Wan #Innovation
产品更新图像生成

推荐理由:通义万相2.7新增调色板功能,靠参考图或色号就能锁定品牌色,算是解决了AI画图颜色跑偏的老问题,做品牌视觉的可以试试。
10:21
Alibaba Cloud@alibaba_cloud
53
OKX与阿里云推出开放支付协议APP,共建AI代理经济金融层

AI代理经济需要开放的支付通道,正如互联网依赖HTTP协议。OKX推出首个跨链开放标准Agent Payments Protocol(APP),为AI代理之间的支付与商业交互提供基础框架。OKX与AlibabaCloud的合作从云基础设施与AI领域进一步延伸,共同构建代理经济的金融层。作为APP创始合作伙伴,双方认为AI时代刚刚起步,开放支付通道将激发代理生态的创新潜力。

智能体行业动态
09:34
Simon Willison 博客
47
llm 0.32a0 发布

Simon Willison 发布了其命令行工具 LLM 的 0.32a0 版本。此次更新为 alpha 预发布版本,主要变更与详细说明可通过 GitHub 的发布页面及作者博客上的注解式发布说明获取。该版本标志着 LLM 工具在功能或兼容性上的进一步迭代,通常涉及对大型语言模型(如 GPT、Claude、LLaMA 等)进行访问或操作的改进。

产品更新开源生态部署/工程
09:34
Simon Willison 博客
30
llm 0.32a1 发布

llm 发布了 0.32a1 版本,修复了 0.32a0 版本中存在的一个关键缺陷。该缺陷会导致从 SQLite 数据库重新加载时,工具调用对话无法正确恢复。此次更新解决了 GitHub 上的 issue #1426。

GitHub产品更新
08:37
阿绎 AYi@AYi_AInotes
精选70
Google Gemini实现AI"交付时代"跨越,直接生成可下载办公文件

Google Gemini迎来重磅更新,用户现可在聊天中通过一句话指令,直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件,无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表,且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”,迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成,实现了降维打击,对依赖AI生成文档的初创公司构成巨大压力,并推动行业竞争焦点转向直接产出可用成果。

Google产品更新
关联讨论 4X:Gemini (@GeminiApp)X:Testing Catalog (@testingcatalog)X:Josh Woodward (@joshwoodward, Google Labs VP)X:Sundar Pichai (@sundarpichai)
推荐理由:Gemini原生生成文档这功能,不是简单的“能出Word”,而是把二十年Workspace生态变成AI的输出管道,那些靠格式转换吃饭的中间商要慌了。
08:34
IT之家(RSS)
36
消息称苹果 iOS 27 版相机新增 Siri 模式,AI 记录食品标签、名片、活动门票等

苹果计划在 iOS 27 版相机应用中新增 Siri 模式,整合 Visual Intelligence 功能。该模式将与现有拍照模式并列显示,使智能视觉能力更易访问。功能包括扫描食品营养标签记录卡路里数据并同步至健康应用,识别名片信息添加联系人,以及扫描活动门票和会员卡生成数字版本存入钱包。此前需长按按钮激活的隐蔽操作被直接集成,提升用户使用便捷性。

产品更新多模态
08:34
IT之家(RSS)
37
谷歌相册推出衣橱规划功能:AI 提取服装图像整理到数字衣橱,支持虚拟试穿

<谷歌相册推出AI衣橱规划功能,通过人工智能自动提取用户照片中的服装图像,整理到数字衣橱。用户可按类别筛选服装,混搭单品设计穿搭,并支持虚拟试穿预览;还可保存穿搭到数字情绪板,适用于不同场合。该功能预计今年夏季首发于安卓平台,随后登陆iOS设备。>

Google产品更新图像生成
08:00
OpenRouter:Announcements(RSS)
54
April Release Spotlight

本月发布聚焦视频生成、工作空间、智能体SDK与重排序模型。多家公司推出前沿大模型,包括GPT、Claude和LLaMA系列的新版本。核心变化体现在模型多模态能力增强,特别是视频生成功能成为竞争焦点。部分新模型在标准基准测试中性能提升超过15%,同时上下文窗口扩展至百万token级别。开发者工具方面,新的智能体SDK支持更复杂的任务编排,而重排序模型显著提升了检索精度。

智能体产品更新多模态模型发布
07:39
Berryxia.AI@berryxia
52
Moonlake推出3D Agent:AI自动化生成可编辑3D资产

Moonlake发布3D Agent,这是一个AI驱动的工具,能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景(包含数百物体)。它支持从零建模,自动处理独立部件和关节绑定,无需预设规则,并能重建完整可编辑的室内或室外场景。通过原生集成Blender,该工具实现了真实工作流的自动化,简化3D创作过程。

智能体产品更新多模态
07:34
IT之家(RSS)
45
苹果 AI 眼镜曝光:内置 2 颗摄像头、支持 Siri 智能交互、可手势控制

据报道,苹果正加速研发其首款智能眼镜,预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备,核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头:高分辨率主摄用于拍照录像,低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄,眼镜不内置显示屏及LiDAR等模块,并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri,支持拍照、通话及环境交互。产品可能于2026年晚些时候预览,2027年正式上市。

多模态端侧行业动态
06:09
05:09
OpenAI Developers@OpenAIDevs
精选62
⚙️ 我们通过 Responses API 中的 WebSockets 让代理循环运行得更快 随着 Codex 速度提升,瓶颈从推理转移到了低效的 API 调用 WebSockets 在工具调用之间保持响应状态活跃,帮助工作流程端到端运行速度提升高达 40% https://openai.com/index/speeding-up-agentic-workflows-with-websockets
智能体OpenAI产品更新

推荐理由:这不是颠覆性更新,但对依赖 Responses API 搭 agent 的开发者是个实打实的好消息,loop 加速 40% 意味着延迟和成本双降,官方推荐的最佳实践值得直接套用。