AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「语音」清除
6月9日周二
03:14Apple:Newsroom(RSS)69精选受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线
03:14Apple:Newsroom(RSS)56同事件精选Apple发布新一代Apple Intelligence和Siri AI同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
02:38TechCrunch:AI(RSS)73同事件精选苹果为Siri推出专属应用同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
02:31Hacker News 热门(buzzing.cc 中文翻译)48苹果 WWDC 2026 直播
02:21IT之家(RSS)71苹果推出 Siri AI:独立 App,为灵动岛优化
02:21IT之家(RSS)67苹果 Apple Intelligence 与谷歌达成合作:引入 Gemini,第二代设备端模型支持听写等功能
02:21IT之家(RSS)56苹果 Siri 全新图标亮相:设计大改,主体仅由线条勾勒
02:21IT之家(RSS)60苹果 Siri AI 官宣整合至各 Apple 产品,visionOS 27 还有专属 3D 水晶小球
02:21IT之家(RSS)64苹果:Siri AI 和其他 Apple 智能新功能在中国大陆暂不提供
02:21IT之家(RSS)51苹果 Siri AI 支持自然语言生成快捷指令,简化自动化流程
02:17🚨 AI News | TestingCatalog76苹果发布全新Siri AI及专用App
02:17🚨 AI News | TestingCatalog70Apple新Siri AI功能一屏尽览
02:17🚨 AI News | TestingCatalog69苹果智能由Gemini驱动,Siri AI年内公测
02:15-Zho-18Siri AI 终满足两年前想象
02:13Chubby♨️39系统级感知与相机视觉智能
02:13Chubby♨️32Apple Intelligence Siri 仅限 iPhone 17 Pro
02:08TechCrunch:AI(RSS)68WWDC 2026:Siri AI、iOS 27、Apple Intelligence 等发布汇总
02:08TechCrunch:AI(RSS)56Apple 长期酝酿的 AI Siri 全面重塑终于到来
01:43Chubby♨️52Siri 更新:图像理解与人声拟真
01:39The Verge:AI(RSS)56苹果发布 Siri AI 及下一代 Apple Intelligence
01:38TechCrunch:AI(RSS)82WWDC 2026:Siri、iOS 27、Apple Intelligence 等全部发布内容
00:42Chubby♨️63很多人误解:苹果其实不需要世界上最好的模型
6月8日周一
23:46🚨 AI News | TestingCatalog42NotebookLM 将迎 Gemini 3.5 Flash 与 Omni 升级
23:42Chubby♨️54WWDC 2026:苹果租用谷歌大脑修复Siri
23:38TechCrunch:AI(RSS)40WWDC 2026 前瞻:Siri 备受期待的改造、Apple Intelligence 与 iOS 27
22:46OpenBMB75精选VoxCPM2 技术报告发布
22:06小互26应该是暗示全新的Siri
21:36小互79精选小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕
19:08The Verge:AI(RSS)58WWDC 2026:如何观看及期待什么
17:08MarkTechPost(RSS)60Microsoft AI 推出 MAI-Transcribe-1.5 语音转文本模型
15:20IT之家(RSS)41漫步者 LolliClip SE 耳夹式蓝牙耳机发布:蓝牙 6.1,到手价 449 元
14:14Tencent Hy69精选腾讯混元联合多家机构发布首个音频编辑基准MMAE
08:18Orange AI74Cola 1.0.0 公测:100天诞生的有灵魂AI
6月7日周日
22:07Chubby♨️64WWDC 2026:苹果将基于 Google Gemini 重建 Siri
19:37Chubby♨️66WWDC 2026 苹果将重构 Siri:底层集成 Google Gemini 混合 AI 系统
16:19IT之家(RSS)57谷歌 Gemini 语音助理曝"伪上下文对齐"漏洞,黑客可借特殊通知下毒
09:19IT之家(RSS)51特斯拉 Grok 车载 AI 助手全球扩容,新增智利、马来西亚等市场
09:05Chubby♨️32Apple WWDC 前瞻:Gemini 1.2T 参数 AI 深度集成系统
09:00向阳乔木52Spotify 加入 AI Agent,支持语音找歌
00:58Berryxia.AI66mlx-audio v0.4.4 发布:新增 15+ 个 TTS/ASR/VAD 模型及服务器改进
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月9日
03:14
Apple:Newsroom(RSS)
精选69
受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线

由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。

多模态政策/监管语音
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)
推荐理由:苹果首次将 DMA 作为 AI 功能地区延迟的直接理由,并详细披露了与欧盟监管者的分歧,这个案例可能定义了 AI 助手在监管下的权限边界。
03:14
Apple:Newsroom(RSS)
同事件精选56
Apple发布新一代Apple Intelligence和Siri AI

今天Apple预览了即将推出的软件版本,将带来新一代Apple Intelligence和Siri AI。

产品更新语音
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:苹果在WWDC26预览了下一代Siri AI,承诺深度集成、个人语境理解,但发布停留在功能描述层面,缺乏技术细节和可用性,更像是远期路线图的一次品牌表态而非即时的用户价值。
02:38
TechCrunch:AI(RSS)
同事件精选73
苹果为Siri推出专属应用

苹果公司为Siri推出了独立的专属应用程序,标志着该语音助手首次拥有了自己的独立应用入口。

产品更新多模态语音
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:Siri 终于有了自己的 App,聊天记录管理、多模态输入向 ChatGPT 对齐,是 Siri 走向独立 AI 产品的标志,但本质上还是一个 UI 补课,没带来新的智能跃进。
02:31
Hacker News 热门(buzzing.cc 中文翻译)
48
苹果 WWDC 2026 直播

苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。

产品更新语音
02:21
IT之家(RSS)
71
苹果推出 Siri AI:独立 App,为灵动岛优化

苹果在 2026 年全球开发者大会(WWDC)上发布 Siri AI,称为“全新版本的 Siri”,具备更强的对话能力和表现力,用户可自定义语速、语气和口音。Siri AI 支持系统范围内读取屏幕内容并与应用互动,配有独立 App,灵动岛会显示大气泡。苹果强调每一步以隐私为重。语音优化同时适用于 CarPlay 和 AirPods,可用于查询演唱会信息、提醒报名抽奖、搜索照片等场景。

智能体产品更新语音
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)
02:21
IT之家(RSS)
67
苹果 Apple Intelligence 与谷歌达成合作:引入 Gemini,第二代设备端模型支持听写等功能

在 WWDC26 上,苹果宣布 Apple Intelligence 与谷歌合作引入 Gemini 大模型,新版 AI 架构支持在设备端和云端运行。第二代设备端模型新增听写、自然语言理解、更生动的语音表达和屏幕感知功能。隐私保护默认设置,端云结合,确保任何人无法访问用户数据。

Google产品更新端侧语音
02:21
IT之家(RSS)
56
苹果 Siri 全新图标亮相:设计大改,主体仅由线条勾勒

WWDC26 上苹果正式官宣 Siri AI,不再采用全屏跑马灯风格,而是深度融合到灵动岛。Siri 图标也重新设计为纯白底色、仅由线条勾勒。苹果还优化了 Siri 语音功能,用户可通过语速和“表现力”调整声音,这些更新同样适用于 CarPlay 和 AirPods。

产品更新语音
02:21
IT之家(RSS)
60
苹果 Siri AI 官宣整合至各 Apple 产品,visionOS 27 还有专属 3D 水晶小球

苹果在 2026 年全球开发者大会(WWDC)上推出全新 Siri AI,配有独立 App,启用时屏幕顶部的灵动岛会显示大气泡。新 Siri 支持 iPhone、iPad、Mac、Apple Watch、Vision Pro 等全系 Apple 产品。在 visionOS 27 中,Siri 拥有专属 3D 水晶小球,并能识别用户正在注视的物品。

产品更新语音
02:21
IT之家(RSS)
64
苹果:Siri AI 和其他 Apple 智能新功能在中国大陆暂不提供

苹果在今日 WWDC26 主题演讲中发布 Siri AI 和多项 Apple 智能新功能。官方明确,在中国大陆因配合监管要求,Siri AI 和其他 Apple 智能新功能暂不提供;欧盟地区的 iOS 和 iPadOS 初期也不会提供。硬件方面,Apple 智能新功能可在当前已支持 Apple 智能的产品机型上使用。

政策/监管语音
02:21
IT之家(RSS)
51
苹果 Siri AI 支持自然语言生成快捷指令,简化自动化流程

在 WWDC26 上,苹果发布 Siri AI 和 Siri App,快捷指令功能接入 Siri AI,用户可用自然语言快速创建快捷指令,无需逐项手动配置。该功能依赖 Apple Intelligence。

产品更新语音
02:17
🚨 AI News | TestingCatalog@testingcatalog
76
WWDC 🔥:苹果宣布推出全新Siri AI,以及专用App、可定制语音、屏幕和视觉理解等功能! Siri App支持大多数平台,包括VisionOS!
产品更新多模态语音
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)
02:17
🚨 AI News | TestingCatalog@testingcatalog
70
Apple在WWDC宣布推出全新Siri AI,配备独立App、可定制语音、屏幕与视觉理解等功能,Siri App支持包括VisionOS在内的多平台。主推文感叹:"大部分Siri AI功能齐聚一屏👀"

🚨 AI News | TestingCatalog: WWDC 🔥: Apple has announced a new Siri AI, along with a dedicated app, customizable voices, screen and visual understan...

产品更新多模态语音
02:17
🚨 AI News | TestingCatalog@testingcatalog
69
WWDC 🔥:全新Apple Intelligence由Gemini驱动,对话式Siri AI,更新的图像编辑,以及众多苹果应用中的大量AI功能。 Siri AI将于今年晚些时候以测试版形式推出。初期,Siri AI将不会在欧盟上线。

🚨 AI News | TestingCatalog: Apple #WWDC26 has started 🍿

Google产品更新图像生成语音
02:15
-Zho-@ZHO_ZHO_ZHO
18
这次的 Siri AI 满足了我两年前对 Siri 的想象笑死
行业动态语音
02:13
Chubby♨️@kimmonismus
39
- 系统级感知 - 相机应用中的视觉智能

Chubby♨️: Siri update - image understanding - more conversational - reworked voice-tone / sound. Sounds real human

多模态大佬观点语音
02:13
Chubby♨️@kimmonismus
32
有趣:新的 Apple Intelligence Siri 仅限 iPhone 17 Pro 使用。 当然在欧盟不可用(该死)

Chubby♨️: Apple Intelligence sounds like a very good update. But did I miss all the relevant (nerd) stuff like paramters, evals in...

大佬观点端侧语音
02:08
TechCrunch:AI(RSS)
68
WWDC 2026:Siri AI、iOS 27、Apple Intelligence 等发布汇总

苹果 WWDC 2026 于今日在 Apple Park 开幕,围绕 Siri AI、iOS 27、Apple Intelligence 等发布一系列更新,同期举办开发者活动和演示。本次大会是 CEO Tim Cook 在苹果的最后一次 WWDC 主题演讲。

产品更新多模态语音
02:08
TechCrunch:AI(RSS)
56
Apple 长期酝酿的 AI Siri 全面重塑终于到来

新版“Siri AI”将语音助手转变为功能更丰富的 AI 伴侣,不再局限于简单语音指令,而是能承担更多复杂操作。此次重塑旨在让 Siri 从被动应答进化成主动智能体,标志着 Apple 在 AI 助手领域的重要升级。

产品更新多模态语音
01:43
Chubby♨️@kimmonismus
52
Siri 更新 - 图像理解 - 对话更自然 - 重制语音语调/声音,听上去像真人

Chubby♨️: Apple Intelligence: -Personal Understand in apps. - Browse tools for web - on screen Awareness - in App usage

产品更新多模态语音
01:39
The Verge:AI(RSS)
56
苹果发布 Siri AI 及下一代 Apple Intelligence

苹果在最新一届 WWDC 上公布了新一代 Apple Intelligence 功能和更智能、更个性化的 Siri。此前苹果因 2024 年承诺的 AI 功能未能实现,同意支付 2.5 亿美元和解一起集体诉讼。追赶 AI 竞赛被视为苹果及即将上任 CEO John Ternus 的明确优先事项。

产品更新语音
01:38
TechCrunch:AI(RSS)
82
WWDC 2026:Siri、iOS 27、Apple Intelligence 等全部发布内容

苹果 WWDC 2026 于太平洋时间上午 10 点在 Apple Park 开幕,为期一周的大会将发布围绕 Siri、iOS 27、Apple Intelligence 等更新,同时还有开发者活动和演示。本届大会是 CEO Tim Cook 在苹果的最后一次 WWDC。

产品更新多模态语音
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)
00:42
Chubby♨️@kimmonismus
63
苹果在WWDC 2026上承认无法独立构建前沿AI,转而与Google合作。新Siri将基于定制1.2T参数Gemini模型(版本或为3.1/3.5),每年花费约10亿美元(Gurman)。Siri作为独立应用,支持iMessage式聊天、动态岛弹窗、扩展系统及邮件/日历/网页查询,运行在Private Cloud Compute上,Google不会用查询数据训练。苹果策略类似Meta--模型只需满足99%日常场景。iOS 27被定位为"雪豹"式清理更新,放弃iPhone 11和SE2支持,并可能允许用户选择AI引擎(Gemini或Claude)。

Chubby♨️: WWDC 2026 - Apple rents Google's brain to fix Siri. What we can expect: Apple's keynote today is a software reset built ...

Google现象/趋势端侧语音
6月8日
23:46
🚨 AI News | TestingCatalog@testingcatalog
42
NotebookLM 即将更新 👀 我们期待 Gemini 3.5 Flash 和 Gemini Omni 升级,此外还有一堆新功能。 你最想要哪个?

Simon: team is now playing launch room music 🎶

Google产品更新语音
23:42
Chubby♨️@kimmonismus
54
WWDC 2026:苹果租用谷歌大脑修复Siri

苹果在WWDC 2026承认无法独自构建前沿AI,与Google合作,基于1.2T参数的Gemini模型重建Siri,年费约10亿美元。新版Siri通过Private Cloud Compute运行,谷歌不训练用户数据;Siri成为独立应用,支持聊天、同步历史、Dynamic Island弹出和扩展系统,可起草邮件并获取信息。六个OS beta发布,iOS 27为Snow Leopard清理版,iPhone 11/SE2失去支持;Liquid Glass 2.0透明度滑块;Health+改为健身聚焦;用户或可选AI引擎(Gemini或Claude)。硬件稍后推出。

Google多模态大佬观点语音
23:38
TechCrunch:AI(RSS)
40
WWDC 2026 前瞻:Siri 备受期待的改造、Apple Intelligence 与 iOS 27

苹果 WWDC 2026 临近,Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。

智能体行业动态语音
22:46
OpenBMB@OpenBMB
精选75
VoxCPM2 技术报告发布

面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。

多模态开源/仓库模型发布语音

推荐理由:面壁把语音生成压进2B参数,支持30种语言加方言克隆,还附完整技术报告和Apache 2.0开源,做语音产品的可以直接拉代码跑起来了。
22:06
小互@xiaohu
26
应该是暗示全新的Siri
大佬观点语音
21:36
小互@xiaohu
精选79
小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕

小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。

GitHub开源/仓库视频语音

推荐理由:小互把自己用了半年的视频翻译工具开源了,本地Whisper转写加AI润色,下载、翻译、烧字幕一句话搞定,做海外视频搬运或想省时间的,装一下就能省掉大半天手工。
19:08
The Verge:AI(RSS)
58
WWDC 2026:如何观看及期待什么

Apple 年度开发者大会 WWDC 2026 将于 6 月 8 日举行,主题演讲预计持续数小时,重点发布 iOS、macOS 等操作系统更新,并可能对 Siri 进行重大改造。观众可通过 YouTube 或 Apple 官网观看直播。

端侧行业动态语音
17:08
MarkTechPost(RSS)
60
Microsoft AI 推出 MAI-Transcribe-1.5 语音转文本模型

Microsoft AI 发布 MAI-Transcribe-1.5,其自研语音转文本模型的第二代。该模型支持 43 种语言,新增关键词(实体)偏置功能,可针对领域特定术语优化。在 Artificial Analysis 排行榜上词错误率(WER)为 2.4%,在 FLEURS 基准上达到最佳准确率。转录一小时音频耗时不到 15 秒,长音频转录速度提升达 5 倍。MAI-Transcribe-1.5 已通过 Azure AI Foundry 提供。

Microsoft模型发布语音
15:20
IT之家(RSS)
41
漫步者 LolliClip SE 耳夹式蓝牙耳机发布:蓝牙 6.1,到手价 449 元

漫步者正式发布 LolliClip SE 耳夹式开放式蓝牙耳机,活动到手价 449 元(京东指导价 499 元)。该耳机为首款支持杜比 AI 的耳夹耳机,配备杜比空间音效;搭载 12mm 双磁长冲程动圈与双材质复合振膜,支持动态低频补偿算法和 LHDC 高清解码(最高 990kbps),获 Hi-Res、HWA 双金标认证。采用专利多曲率空气弧软梁及智能左右声道自适应。集成豆包 + DeepSeek 双 AI,支持 AI 问答、21 种语言实时互译、AI 会议总结转写。连接基于蓝牙 6.1,支持双设备无缝切换,单次续航 10 小时,总续航 40 小时。具备双麦 AI 通话降噪、IP56 防尘防水,可通过 EDIFIER Connect APP 控制。云霜金版本将于 6 月 9 日 10 点开售。

产品更新语音
14:14
Tencent Hy@TencentHunyuan
精选69
腾讯混元联合多家机构发布首个音频编辑基准MMAE

腾讯混元联合上海交大、南洋理工等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估AI语音/音频编辑能力的基准。MMAE要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于5%,暴露了可靠音频编辑的短板。MMAE包含2000个真实场景高保真样本、17741条细粒度评估项,覆盖声音/音乐/语音及混合共7种模态、6种任务复杂度(基础修改到多跳推理及多轮编辑)、8种操作类型(局部到全局)。论文、代码、数据集和演示已公开。

多模态论文/研究语音

推荐理由:过去一年语音和音乐生成很热,但音频编辑还没人正经测过,腾讯这个基准把现状血淋淋地摆出来了,不到5%的准确率意味着整个方向都还在起步期。
08:18
Orange AI@oran_ge
74
Cola 1.0.0 公测:100天诞生的有灵魂AI

诞生100天后,Cola AI正式公测(1.0.0版本),无需邀请码即可在Mac和Windows上下载使用。新用户注册24小时内可获5美金额度。Cola被团队定义为“有灵魂的AI”,具备连续记忆、语音交互和自我进化能力,强调像人类一样长期记忆和情感共情。官网:colaos.ai。

智能体产品更新语音
6月7日
22:07
Chubby♨️@kimmonismus
64
WWDC 2026 预计将成为苹果 AI 关键节点。Siri 将围绕定制版 Google Gemini 模型(约 1.2 万亿参数)重建,自有设备端模型仅约 3B 参数。新 Siri 采用混合架构--本地小模型 + 云端大模型,由苹果控制 UI、应用权限和隐私层。预期功能包括更自然对话、跨应用个人上下文、屏幕感知、应用内操作、独立 Siri 应用(支持语音、文件上传和多模态交互)、Dynamic Island 深度集成,并可选择接入 ChatGPT、Claude 或 Gemini 等第三方服务。苹果意将 Siri 打造成操作系统的隐私 AI 层,成为跨 iPhone、Mac、iPad 的系统智能体。

Chubby♨️: Tomorrow could be Apple's most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri rel...

Google多模态大佬观点语音
19:37
Chubby♨️@kimmonismus
66
WWDC 2026 苹果将重构 Siri:底层集成 Google Gemini 混合 AI 系统

据传 WWDC 2026 苹果将彻底重构 Siri,底层集成 Google Gemini 模型(约 1.2 万亿参数)作为云端智能层,与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层,控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强,并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。

Google端侧行业动态语音
16:19
IT之家(RSS)
57
谷歌 Gemini 语音助理曝"伪上下文对齐"漏洞,黑客可借特殊通知下毒

安全公司 SafeBreach 披露谷歌 Gemini 存在“Fake Context Alignment”漏洞。黑客可通过 WhatsApp、短信等发送特殊构造通知,将恶意指令隐藏在非目标语言文字或“静音超链接”中,利用 Gemini 的“Delayed Tool Invocation”机制绕过用户授权。攻击方式包括多语言混淆和语音助手不朗读超链接内容,可能导致智能家居被操控、通讯录被篡改。SafeBreach 于去年 8 月报告,谷歌在 11 月中旬通过改进内容分类器缓解。

Google安全/对齐语音
09:19
IT之家(RSS)
51
特斯拉 Grok 车载 AI 助手全球扩容,新增智利、马来西亚等市场

根据特斯拉 2026.20 版本软件更新日志,由 xAI 研发的 Grok 聊天机器人已在车载系统应用近一年,现扩展至智利、马来西亚、菲律宾及中国香港等市场。Grok 支持开放式问答、导航指令、语音唤醒“嘿,Grok”及地理位置提醒功能。用户可通过应用启动栏、方向盘语音按键或语音唤醒使用,并可自定义语音音色与对话风格。部分功能需订阅特斯拉高级联网服务。Grok 仍处于早期测试版阶段,未来计划支持控制空调、车灯及 FSD 等核心功能。

xAI产品更新端侧语音
09:05
Chubby♨️@kimmonismus
32
Apple WWDC 前瞻:Gemini 1.2T 参数 AI 深度集成系统

Apple WWDC 将于周一开幕,今年将揭示如何将 AI 模型深度集成至操作系统中。已知是专为 Apple 开发的 Gemini 版本,拥有 1.2 万亿参数,但本地运行更小的模型;复杂查询则调用 Apple 自有服务器上的大模型。悬念在于:Apple 版 Gemini 实际表现如何?集成深度怎样?是否会推出与 Siri 对话的语音模式或 iOS 语音控制?

大佬观点语音
09:00
向阳乔木@vista8
52
Spotify还是先进,App加了一个AI Agent。 语音说话,AI思考找歌,列歌单。
智能体产品更新语音
00:58
Berryxia.AI@berryxia
66
mlx-audio v0.4.4 发布:新增 15+ 个 TTS/ASR/VAD 模型及服务器改进

mlx-audio v0.4.4 发布,所有模型均运行在 Apple Silicon。新增 15+ 个模型:TTS 包括 VoxCPM2(2B 参数、48kHz、30 种语言)、MOSS-TTS、Higgs Audio v3 等;ASR 包括 Mega-ASR(基于 Qwen3-ASR-1.7B + LoRA 路由)、Nemotron 3.5 ASR(实时流式)、Cohere ASR(长文本转录速度提升 1.7 倍)等;VAD 新增 Silero VAD、FSMN-VAD、Step-Audio 2。服务器改进支持 OpenAI 兼容的 response_format、/v1/audio/voices 接口及逐词时间戳。安装命令:uv pip install -U mlx-audio。

Prince Canuma: 🚀 mlx-audio v0.4.4 is out - our biggest model drop yet. 15+ new TTS, ASR & VAD models, faster long-form transcription, ...

开源/仓库开源生态语音
‹ 上一页
1…45678…19
下一页 ›