AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「多模态」清除
4月29日周三
07:38Berryxia.AI60NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni
07:38Berryxia.AI52SATO实现从点云直接生成高质量3D网格
07:38ginobefun50老代码、AI工具与组织治理的融合趋势
07:33IT之家(RSS)54加速你的创意落地:Claude AI 接入 Adobe、Blender 等创意软件生态
07:11小互53Adobe 把8款创意工具的打包接进 Claude
07:07Rohan Paul40眼科医生佩戴Vision Pro完成白内障手术
05:39AK59英伟达发布Nemotron 3 Nano Omni模型
02:18Suno70精选60秒制作伴奏指南
01:38AK66Meta发布Tuna-2模型 像素嵌入超越视觉编码器
01:08AK57Meta发布TUNA框架统一视觉表征
01:00OpenRouter66精选NVIDIA发布开源多模态模型Nemotron 3 Nano Omni
00:37Hugging Face:Blog(RSS)70精选介绍 NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频智能体的长上下文多模态模型
00:07Sundar Pichai46谷歌翻译二十周年:从简单短语到实时对话的演进
00:06Google Blog:AI(RSS)51庆祝 Google Translate 20 周年:趣闻、技巧与可尝试的新功能
4月28日周二
20:46公众号:可灵AI(快手·视频)41可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元斩获大奖
20:36Chubby♨️59微软开源4B参数图像转3D模型
20:25SenseTime59SenseNova U1 Lite系列开源,统一多模态理解与生成
20:08The Decoder:AI News(RSS)50Google的"Ask YouTube"将视频搜索转变为对话
19:06公众号:昆仑万维(天工)30昆仑万维"4+3战略"落地首季:一季度营收25.7亿元,视频与音乐模型登顶全球第一
18:36Berryxia.AI56商汤开源多模态大模型SenseNova-U1,推动本地化部署
18:01Alibaba Cloud33阿里云媒体AI平台助力内容管理智能化
17:33IT之家(RSS)61网信部门依法查处剪映、猫箱、即梦 AI 生成合成内容标识违法问题网站平台
16:36HuggingFace Daily Papers(社区热门论文)53利用感知中心的过程奖励模型改进视觉语言模型
12:34HuggingFace Daily Papers(社区热门论文)69Tuna-2:基于像素嵌入的统一跨模态模型在理解与生成任务上超越视觉编码器
12:34HuggingFace Daily Papers(社区热门论文)54ReVSI:重建视觉空间智能评估以准确评估VLM的3D推理能力
12:34HuggingFace Daily Papers(社区热门论文)39OmniShotCut:基于镜头查询Transformer的整体关系式镜头边界检测
11:16IT之家(RSS)68阿里达摩院 AI 全球首次实现肠癌"无感"检测,登上国际肿瘤学顶刊
08:00Apple Machine Learning Research(RSS)45StereoFoley: 从视频生成具有对象感知能力的立体声音频
08:00HuggingFace Daily Papers(社区热门论文)56RADIO-ViPE:面向动态环境的开放词汇语义SLAM在线紧耦合多模态融合系统
07:34Berryxia.AI54Minmax Music-2.6限时免费开放体验
07:13TestingCatalog News 🗞49Gemini新增文档与表格生成功能
05:45Google Gemini31Gemini Canvas创意演示会即将举行
05:22Suno49截图即可生成歌曲 Suno推新功能
04:26AK51小米MiMo-V2.5模型上线Hugging Face
01:52MiniMax (official)57Cloudflare AI上线Music 2.6,文本生成完整歌曲
01:37Simon Willison 博客53Google Meet 语音翻译功能现正向移动设备推出
00:49AK49构建人类与AI协同监督的精准视频语言模型
00:44凡人小北35整合多款AI与地图API自动生成路线引导视频
00:34AK48语义进展函数实现视频分析与生成
4月27日周一
23:22IT之家(RSS)30三星 Galaxy Glasses 智能眼镜外观曝光:骁龙 AR1 处理器,无屏设计
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月29日
07:38
Berryxia.AI@berryxia
60
NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni

NVIDIA 重磅发布!🚀 Nemotron 3 Nano Omni 多模态开源模型来了! 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型(语言+视觉+语音+视频+音频一体化) 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源(权重 + 数据 + 配方),领跑多项榜单 可通过 NVIDIA NIM API 免费试用!完美驱动多代理工作流。

NVIDIA AI: Meet Nemotron 3 Nano Omni 👋 Our latest addition to the Nemotron family is the highest efficiency, open multimodal model...

智能体多模态开源生态模型发布
07:38
Berryxia.AI@berryxia
52
SATO实现从点云直接生成高质量3D网格

3D网格生成领域出现重大突破,新方法SATO能够直接从点云生成完整的网格模型。其核心技术在于采用了基于条带的标记化方法,从而实现了极其干净、结构清晰的边缘流。该模型在生成过程中原生集成了UV分割,简化了后续纹理贴图流程。此外,SATO的一个显著优势是单个模型能同时支持生成三角网格和四边形网格,提供了更高的灵活性和应用潜力。

多模态论文/研究
07:38
ginobefun@hongming731
50
老代码、AI工具与组织治理的融合趋势

当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

AnthropicMCP/工具多模态现象/趋势
07:33
IT之家(RSS)
54
加速你的创意落地:Claude AI 接入 Adobe、Blender 等创意软件生态

Anthropic于4月29日宣布升级Claude AI,新增专属连接器,全面接入Adobe、Blender等八大主流创意软件生态。此次更新将AI能力深度整合至专业工作流,用户可直接在Adobe系列软件中调用50多项工具,在Autodesk Fusion中通过对话创建修改3D工业模型,在Blender中生成脚本与调试场景。此外,音频软件Ableton和Splice用户也能快速查询文档与检索采样库。Claude旨在充当智能助手,自动化处理重复任务,让创作者更专注于核心创意。

AnthropicMCP/工具产品更新多模态
07:11
小互@xiaohu
53
Adobe 把8款创意工具的打包接进 Claude

Adobe 将 Photoshop、Lightroom、Illustrator 等八款核心创意工具集成至 Claude。用户现可通过 AI 助手直接调用这些工具,执行调色、抠图、扩图等图像处理,套用模板设计、剪辑视频、获取 Stock 授权素材,以及搜索、总结和整理创意文件。此举旨在简化创意工作流程。

AnthropicMCP/工具产品更新多模态
07:07
Rohan Paul@rohanpaul_ai
40
圣地亚哥一位眼科医生佩戴Apple Vision Pro完成了白内障手术。 该头显将数字显微镜的实时3D影像和患者数据直接叠加在他的视野中。 无需再转头查看单独的显示器。
多模态端侧行业动态
05:39
AK@_akhaliq
59
Nvidia发布了Nemotron 3 Nano Omni 在Hugging Face上为其制作了一个gradio应用
多模态开源/仓库端侧
02:18
Suno@suno
精选70
如何在60秒内制作伴奏音轨。
多模态教程/实践

推荐理由:虽然只是 Suno 的官方教程,但这 60 秒的视频把生成伴奏这件事儿讲得明明白白,对于想快速出 demo 的音乐创作者来说,是个能立刻用上的实用技巧。
01:38
AK@_akhaliq
66
Meta 推出 Tuna-2 像素嵌入优于视觉编码器,用于多模态理解与生成 paper: https://huggingface.co/papers/2604.24763
Meta多模态论文/研究
01:08
AK@_akhaliq
57
Meta 推出 TUNA 驯服统一视觉表示以构建原生统一多模态模型 论文:https://huggingface.co/papers/2512.02014
Meta多模态论文/研究
01:00
OpenRouter@OpenRouter
精选66
NVIDIA NemotronTM 3 Nano Omni 已在 OpenRouter 上线。 这是一个用于智能体工作流的开源 30B-A3B 多模态模型:文本、图像、视频和音频输入 → 文本输出,拥有 256k 上下文窗口和高效的 MoE 架构,适用于计算机使用、文档和音视频推理。
智能体产品更新多模态

推荐理由:Nemotron 3 Nano Omni 是 NVIDIA 在开源多模态模型上的新动作,30B 参数 MoE 架构、256k 上下文、四模态输入,做 Agent 工作流的开发者值得试一下,尤其文档和音视频推理场景。
00:37
Hugging Face:Blog(RSS)
精选70
介绍 NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频智能体的长上下文多模态模型

NVIDIA 发布了 Nemotron 3 Nano Omni 模型,这是一个专为处理长上下文多模态任务设计的轻量级模型。该模型能够同时理解并处理文档、音频和视频数据,旨在赋能新一代多模态智能体。其核心变化在于将长上下文能力与多模态理解结合到一个小型化模型中,提升了在复杂跨模态场景下的处理效率与应用灵活性。

多模态模型发布端侧

推荐理由:NVIDIA 把多模态长上下文塞进 Nano 级别模型,文档、音频、视频 Agent 通吃,做端侧多模态应用的团队值得认真看看这个架构思路。
00:07
Sundar Pichai@sundarpichai
46
谷歌翻译二十周年:从简单短语到实时对话的演进

谷歌翻译迎来二十周年,已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段:2006年依靠统计机器学习分析词簇,2016年转向神经网络实现超越字面的翻译,如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话,最新模型甚至能通过耳机充当口译器,并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言,人们却逐渐将其视为常态。谷歌对此表达感谢,并展望未来二十年的技术突破。

Google多模态大佬观点
00:06
Google Blog:AI(RSS)
51
庆祝 Google Translate 20 周年:趣闻、技巧与可尝试的新功能

Google Translate 迎来 20 周年,从 2006 年的一项 AI 实验起步,现已支持近 250 种语言。官方分享了 20 条相关趣闻,并介绍了用户可尝试使用的实用技巧与新功能,以展示其多年来的技术演进与服务扩展。

Google产品更新多模态
4月28日
20:46
公众号:可灵AI(快手·视频)
41
可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元斩获大奖

可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元并斩获大奖。

多模态行业动态视频
20:36
Chubby♨️@kimmonismus
59
Microsoft 推出 "TRELLIS.2":一个开源的、40亿参数的图像转3D模型,可生成高达15363的PBR纹理资产。 基于原生3D VAES,具有16倍空间压缩能力,提供高效、可扩展、高保真的资产生成。 说实话,相当酷!
Microsoft多模态开源生态模型发布
20:25
SenseTime@SenseTime_AI
59
SenseNova U1 Lite系列开源,统一多模态理解与生成

SenseNova宣布开源其U1 Lite系列模型。该系列基于NEO-unify架构,原生统一了多模态理解与生成能力。其核心优势包括:在开源模型中具备领先的效率,紧凑的8B和A3B模型在保持商业级性能的同时实现了优异的成本效益;支持原生的图像-文本交织生成,单一模型即可在单次流程中生成连贯交织的图文内容,适用于制作指南等实用场景;并拥有高密度信息渲染能力,擅长为知识图解、海报、PPT、漫画等信息密集型格式生成结构丰富的版式。模型已在Hugging Face、GitHub等平台发布。

图像生成多模态开源/仓库模型发布
20:08
The Decoder:AI News(RSS)
50
Google的"Ask YouTube"将视频搜索转变为对话

谷歌正在测试名为“Ask YouTube”的对话式搜索功能。该功能将传统的视频列表结果页面,替换为融合文本摘要、完整长度视频及Shorts短视频的综合结果页。用户可通过自然语言对话进行搜索,获得更直接、整合的信息呈现,标志着视频搜索体验从关键词匹配向交互式对话转变。

产品更新多模态搜索
19:06
公众号:昆仑万维(天工)
30
昆仑万维"4+3战略"落地首季:一季度营收25.7亿元,视频与音乐模型登顶全球第一

昆仑万维发布2026年一季度财报,营收25.7亿元,同比增长46%,为“4+3战略”落地首季。公司自研视频模型与音乐模型均登顶全球第一,但正文未披露具体模型名称及版本号。具体营收增长主要来自AI业务驱动,战略聚焦多模态大模型与AI应用生态。

多模态行业动态
18:36
Berryxia.AI@berryxia
56
商汤开源多模态大模型SenseNova-U1,推动本地化部署

商汤发布开源可商用的多模态大模型SenseNova-U1,采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版,适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度,并即将推出办公场景应用功能。

图像生成多模态开源生态模型发布
18:01
Alibaba Cloud@alibaba_cloud
33
您的媒体库应成为宝贵资产,而非负担。阿里云媒体AI解决方案提供统一的AI平台,通过自动标记和总结视频内容、帧级内容审核以及支持跨模态内容的AI搜索,来理解、组织并加速您的整个媒体工作流程。让您的内容最终为您所用。 🔗 https://int.alibabacloud.com/m/1000412499/
产品更新多模态部署/工程
17:33
IT之家(RSS)
61
网信部门依法查处剪映、猫箱、即梦 AI 生成合成内容标识违法问题网站平台

网信部门近期依法查处“剪映”“猫箱”App及“即梦 AI”网站,这些平台未有效落实人工智能生成合成内容标识规定,违反《网络安全法》《生成式人工智能服务管理暂行办法》等法律。国家互联网信息办公室指导属地部门对涉事平台采取约谈、责令改正、警告、从严处理责任人等处罚措施。网信部门强调网站平台需严守法律底线,严格落实标识要求,并将加大监督管理力度,维护社会公共利益,推动人工智能健康有序发展。

多模态政策/监管行业动态
16:36
HuggingFace Daily Papers(社区热门论文)
53
利用感知中心的过程奖励模型改进视觉语言模型

针对视觉语言模型在强化学习训练中面临的监督信号粗粒度问题,本研究提出了Perceval过程奖励模型。该模型能够从模型回应中提取图像相关声明,并与视觉证据进行逐项比对,从而精确定位感知错误的片段。在训练阶段,Perceval被整合进强化学习框架,通过对幻觉片段施加标记级惩罚,提供细粒度的监督信号。在推理阶段,该模型可截断错误回应并引导模型重新生成或反思,实现测试时扩展。实验表明,该方法在多领域基准测试中显著提升了经过RL训练的VLM性能,且其测试时扩展策略也优于多数投票等方法。代码与数据已公开。

多模态数据/训练论文/研究
12:34
HuggingFace Daily Papers(社区热门论文)
69
Tuna-2:基于像素嵌入的统一跨模态模型在理解与生成任务上超越视觉编码器

Tuna-2是一种原生统一的跨模态模型,它摒弃了传统的VAE等模块化视觉编码器,直接通过简单的图像块嵌入层处理像素,统一执行视觉理解与生成任务。实验表明,该模型在多项跨模态基准测试中取得了最先进的性能,证明其像素空间建模在高质量图像生成上可与潜在空间方法竞争。尽管基于编码器的变体在预训练早期收敛更快,但Tuna-2的无编码器设计在大规模训练后实现了更强的跨模态理解能力,尤其在细粒度视觉感知任务上表现突出。这表明预训练视觉编码器对跨模态建模并非必需,端到端的像素学习为视觉任务提供了可扩展的新路径。

图像生成多模态论文/研究
12:34
HuggingFace Daily Papers(社区热门论文)
54
ReVSI:重建视觉空间智能评估以准确评估VLM的3D推理能力

现有视觉语言模型(VLM)的空间智能评估存在系统性缺陷:基于点云标注的问答对在视频评估中因重建误差和标注伪影导致答案错误或模糊,且评估常假设全场景访问,而实际模型仅处理稀疏采样帧。为提升评估有效性,我们提出ReVSI基准,通过重新标注5个数据集的381个场景并严格生成可信问答对,确保问题在模型实际输入下可答且答案正确。该基准提供多种帧预算变体及细粒度物体可见性元数据,支持可控诊断分析。在ReVSI上的评估揭示了以往基准掩盖的系统性故障模式,实现了更可靠、更具诊断性的空间智能评估。

多模态论文/研究评测/基准
12:34
HuggingFace Daily Papers(社区热门论文)
39
OmniShotCut:基于镜头查询Transformer的整体关系式镜头边界检测

针对现有镜头边界检测方法存在边界不可解释、遗漏细微间断、依赖噪声标注与过时基准等问题,本研究提出OmniShotCut方法。该方法将镜头边界检测构建为结构化关系预测任务,通过基于镜头查询的密集视频Transformer,联合估计镜头范围及其内外关系。为规避人工标注不精确,采用全合成过渡合成流程自动生成带精确边界及参数化变体的主要过渡类型。同时,发布了支持整体与诊断评估的现代宽领域基准OmniShotCutBench。

多模态视频论文/研究
11:16
IT之家(RSS)
68
阿里达摩院 AI 全球首次实现肠癌"无感"检测,登上国际肿瘤学顶刊

阿里巴巴达摩院联合广东省人民医院等机构,研发出肠癌筛查AI模型DAMO COCA。该模型基于平扫CT影像,采用两阶段深度学习架构,在国际上首次实现了无需肠道准备、患者“无感”的肠癌机会性筛查。在回顾2.7万人影像的试验中,模型精准识别出5例漏诊肠癌,敏感性达86.6%,特异性高达99.8%。与10名影像科医生相比,其敏感性显著高出20.4%,并能辅助医生将敏感性提升14.5%。相关成果已发表于顶级期刊《肿瘤学年鉴》。

多模态论文/研究部署/工程
08:00
Apple Machine Learning Research(RSS)
45
StereoFoley: 从视频生成具有对象感知能力的立体声音频

StereoFoley是一个视频到音频的生成框架,能生成48kHz、语义对齐、时间同步且空间准确的立体声。现有视频生成音频模型大多局限于单声道或无法实现对象感知的立体声成像,主要受限于缺乏专业混音、空间准确的视频-音频数据集。该研究首先开发了一个从视频生成立体声的基础模型,在语义准确性上达到了与当前最先进V2A模型相当的性能。

多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
RADIO-ViPE:面向动态环境的开放词汇语义SLAM在线紧耦合多模态融合系统

RADIO-ViPE 是一个在线语义SLAM系统,能够在动态环境中实现几何感知的开放词汇关联,将任意自然语言查询与定位的3D区域和物体进行匹配。该系统直接处理原始单目RGB视频流,无需预先获取相机内参、深度传感器或位姿初始化。它通过将来自聚合基础模型的多模态嵌入与几何场景信息在初始化、优化和因子图连接中进行紧耦合,提升了多模态地图的一致性。优化过程采用了自适应鲁棒核函数,以同时处理主动移动的物体和因智能体移动而改变位置的场景元素。实验表明,RADIO-ViPE 在动态TUM-RGBD基准测试中取得了最先进的结果,其性能可与依赖标定数据和静态场景假设的离线开放词汇方法相竞争。该系统为自主机器人和无约束野外视频流提供了鲁棒的开放词汇语义基础。

具身智能多模态论文/研究
07:34
Berryxia.AI@berryxia
54
Minmax 的 Music-2.6 本周在 Cloudflare 上免费使用! 从文本提示生成完整长度的歌曲或器乐作品,并可选自动生成歌词。 直接开整吧!!!

Cloudflare Developers: Music-2.6 from @MiniMax_AI is free on Cloudflare this week! Generate full-length songs or instrumentals from a text prom...

产品更新多模态部署/工程
07:13
TestingCatalog News 🗞@testingcatalog
49
你可能错过了:Gemini 现在可以在网页和移动端生成 Docs 和 Sheets。不过不确定这个功能是何时添加的。 目前 Slides 还不能用,但考虑到 Gemini for Business,我们很可能也会获得该功能,或许还会有一个内联编辑器。

XIVIX: Gemini app has gained the ability to generate and send files It's similar to Claude now It has it's own sandbox that it ...

Google产品更新多模态
05:45
Google Gemini@GeminiApp
31
准备好通过Gemini Canvas释放你的创造力了吗?🪄 别错过我们下一次Discord活动,届时Gemini创意技术专家@DavidMaliglowka将现场演示他最新的Canvas和Nano Banana工作流程,帮助你提升创意提示技巧。 🗓️ 4月29日星期三 ⏰ 太平洋时间上午11:30 📍 http://discord.gg/gemini
Google产品更新多模态
05:22
Suno@suno
49
截图它。歌曲它。#SunoTextSong
产品更新多模态
04:26
AK@_akhaliq
51
小米 MiMo-V2.5 已在 Hugging Face 发布 https://huggingface.co/collections/XiaomiMiMo/mimo-v25
多模态开源/仓库模型发布
01:52
MiniMax (official)@MiniMax_AI
57
Music 2.6模型现已在Cloudflare AI平台推出,用户可通过文本提示生成带人声、伴奏或翻唱的完整歌曲。该模型由MiniMax AI提供,本周免费使用,支持从文本生成完整歌曲或伴奏,并可选自动歌词。基于Cloudflare的全球网络,它能实现快速推理,适合开发者在Cloudflare Workers上构建音乐应用。作者呼吁用户试用并提供真实反馈。

Cloudflare: Music-2.6 from @MiniMax_AI is free on Cloudflare this week! Generate full-length songs or instrumentals from a text prom...

产品更新多模态
01:37
Simon Willison 博客
53
Google Meet 语音翻译功能现正向移动设备推出

Google Meet 的实时语音翻译功能已开始向移动设备端推送。该功能支持英语、西班牙语、法语、德语、葡萄牙语和意大利语共六种语言,能在对话中近乎实时地将一种语言翻译成另一种,并用近似原说话者音色的合成语音播放译文。目前该功能仍处于早期测试阶段,在网页浏览器端运行较为成功,但在 iPhone 与 iPad 等移动设备间的通话中尚不稳定。

Google产品更新多模态
00:49
AK@_akhaliq
49
构建一个由人类与AI监督的精确视频语言 paper: https://huggingface.co/papers/2604.21718
多模态视频论文/研究
00:44
凡人小北@frxiaobei
35
开发者通过整合Google Maps的街景与3D视图功能,利用OPENAI进行路线优化与关键地点提取,并结合预设的角色卡,调用Seedance的API,实现了从起点到终点的引导视频自动生成。该系统能自动选取路线中的标志性地标,并将虚拟角色融入场景进行引导。生成的视频片段经手动合成编辑后,最终形成完整的导航视频,展现了AI技术对生活方式的革新。

梁: 重新优化了一天, 调用googlemap的街景功能和3D视图功能, 用OPENAI进行优化与关键地点提取, 结合设计好的角色卡, 调用Seedance的API, 自动生成一个从起点到终点的案内视频。 自动挑选路线中的几个标志性地点, 然后让...

多模态教程/实践视频
00:34
AK@_akhaliq
48
通过语义进展函数进行视频分析与生成 paper: https://huggingface.co/papers/2604.22554
多模态视频论文/研究
4月27日
23:22
IT之家(RSS)
30
三星 Galaxy Glasses 智能眼镜外观曝光:骁龙 AR1 处理器,无屏设计

三星 Galaxy Glasses 智能眼镜渲染图近日曝光。产品采用无显示屏设计,外观类似 Meta 和谷歌的同类产品,运行 Android XR 系统。其搭载高通骁龙 AR1 处理器,配备 1200 万像素摄像头,支持骨传导音频,重量约 50 克。该眼镜可能在今年 7 月的三星发布会上亮相,但不会立即上市。此外,三星另一款带屏幕的智能眼镜正在开发中,预计 2027 年发布。

多模态行业动态
‹ 上一页
1…4344454647…50
下一页 ›