6月13日

07:36

IT之家（RSS）

iOS 27 Beta 1 新增“高级听写预览”功能，支持离线运行。该功能提升语音转写准确率，能实时处理大写字母与标点符号。默认禁用，需在“设置→通用→键盘→听写”中手动开启。适配机型包括 iPhone 17 Pro、iPhone Air、第二代 Vision Pro（M5芯片）、搭载M4及以上芯片且内存≥12GB的iPad、搭载M3及以上芯片且内存≥12GB的Mac。

产品更新端侧语音

05:48

Google AI Developers@googleaidevs

通过 Gemini Live API 中的 Gemini 3.5 Live Translate，为你的应用添加近实时语音翻译。🎙️ 观看模型如何处理实时直播流和翻译，包括连续语音到语音流（S2ST）和同步转录文本，让用户能以母语收听全球广播节目。

Google 产品更新语音

01:55

The Verge：AI（RSS）

Siri现在变好了吗？

苹果发布了新版Siri AI，The Verge编辑David和Nilay在The Vergecast中分享了初期体验。过去十几年Siri在"部分功能勉强可用"和"彻底翻车"之间摇摆，而新版Siri AI在多数任务上表现足够出色，尽管没有带来突破性创新，但相比过往已发生质变。

评测/基准语音

01:15

Google AI@GoogleAI

Google AI 本周发布多项更新

Google AI 本周推出多项更新：Gemini 3.5 Live Translate 是用于实时语音到语音翻译的最新音频模型；NotebookLM 获重大升级，加入智能体对话能力、更高级推理及新输出格式；来自 GoogleLabs 的 Project Genie 向 Google AI Ultra 5x 订阅者全球开放；GeminiApp 中的 Notebooks 在 EEA、英国、瑞士上线；同时发布实验性开源模型 DiffusionGemma，探索文本扩散技术，实现极快文本生成。

智能体 Google 产品更新开源生态

6月12日

15:24

The Verge：AI（RSS）

Siri 不会成为你的 AI 女友

苹果软件负责人 Craig Federighi 在接受 Mostly Human 采访时表示，新版 Siri 不会像 OpenAI、Google 等公司的聊天机器人那样谄媚和过度互动。Federighi 指出，现有许多聊天机器人为了拉拢用户会鼓励对方表露个人信息，而苹果有意采取了不同设计策略，让 Siri 懂得适时保持沉默。

大佬观点安全/对齐语音

11:34

IT之家（RSS）

可检测 AI 音乐，Deezer 为 Spotify、Apple Music 等第三方平台推出免费工具

法国音乐流媒体平台 Deezer 昨日推出一款免费工具，可扫描 Apple Music、Spotify 等第三方平台的播放列表，检测是否包含 AI 生成音乐。Deezer 是首批标注 AI 音乐的平台之一，此前曾向其他平台推销该识别技术但未获回应。CEO Alexis Lanternier 表示，既然没有平台跟进，就让所有用户自行检测。使用方法：访问 Deezer 检测网站，选择流媒体服务并授权账户即可完成分析。

产品更新语音

07:34

IT之家（RSS）

苹果高管克雷格明确表态：全新 Siri 不会成为你的 AI 女友 / 男友

苹果软件工程高级副总裁克雷格·费德里吉在《Mostly Human》播客中明确表示，全新 Siri 不会成为用户的 AI 男友或女友。他指出，Siri 的设计理念是提供“实用工具”而非“情感陪伴”，不会迎合用户或扮演恋爱角色。营销副总裁格雷格·乔斯维克补充，苹果将 AI 自然融入 iPhone 等产品，让技术“消失”，专注于提升现有使用体验，而非为了做 AI 而做 AI。

大佬观点安全/对齐语音

00:10

Berryxia.AI@berryxia

苹果新Siri AI等候名单形同虚设：Mac用户通过修改plist文件即可解锁

WWDC上苹果展示新Siri AI，用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关，通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中，仅被人为名单阻挡，官方推送反而滞后。

ldt: How to bypass the new Siri waitlist (Mac only): 🧵 #WWDC26

安全/对齐现象/趋势语音

6月11日

19:10

公众号：京东JoyAI

为卫浴装上"AI大脑"，JoyInside×惠达AI卫浴套系6月17日重磅开售

京东JoyInside与惠达推出行业首款搭载JoyInside统一智能中枢的卫浴套系“惠达小京灵系列AI卫浴套装”，含AI智能马桶、AI智能花洒、AI智能浴室柜。依托JoyAI大模型，设备支持语音控制、模糊语义理解、连续多轮对话及方言识别，可实现自动预排冷水、语音控温、镜面除雾等场景联动。套系已开启预售，6月17日晚8点正式售卖。JoyInside已与近200家机器人、AI玩具、家电家居品牌合作，预计年内接入超千万终端设备。

产品更新端侧语音

16:22

The Verge：AI（RSS）

精选73

Deezer 推出面向其他流媒体服务的 AI 音乐检测器

Deezer 将扫描用户在其它流媒体平台的播放列表，检测其中的 AI 生成音乐。Deezer 是最早标记 AI 生成音乐的大型流媒体服务之一，曾向其他平台提供该技术但少有采纳。Deezer CEO Alexis Lanternier 表示，由于没有其他公司跟进，他们决定让用户无论使用哪个平台，都能检查自己的播放列表中是否包含合成音乐。

产品更新语音

推荐理由：Deezer这手挺狠，自家技术没人买账就做成免费跨平台工具，现在用Spotify和Apple Music的人也能扫歌单了，对在意音乐‘血统’的人来说是个刚需小功能。

10:50

公众号：小米 MiMo

精选74

小米发布并开源终端AI编程助手MiMo Code V0.1.0，采用MIT协议

小米发布并开源终端AI编程助手MiMo Code V0.1.0，采用MIT协议。内置限时免费MiMo-V2.5多模态模型，性能比肩Claude Sonnet 4.6；支持接入DeepSeek、Kimi、GLM等模型。核心能力包括持久记忆系统（项目记忆、会话检查点、任务进度）和无限上下文——通过独立subagent自动保存状态解决长会话遗忘。独创Compose模式实现模型与Agent协同优化，SWE-Bench Pro达62%（Claude Code 57%），Terminal Bench 2达73%（68%）。内置语音输入和/dream命令，每7天自动合并记忆。终端输入mimo即可使用，所有设置中文汉化。

智能体产品更新开源生态编码

关联讨论 3 条

推荐理由：小米悄悄发了MiMo Code，开源且免费，用记忆系统和Compose模式解决了AI编程两大顽疾：健忘和跑偏，实测比同模型Claude Code更强，开发者现在就能装上试。

09:30

IT之家（RSS）

外媒体验苹果 iOS 27 全新 Siri AI：回复简洁，不套近乎

外媒 The Verge 体验苹果 iOS 27 全新 Siri AI，发现其回复极为简洁，不套近乎。相比谷歌 Gemini 热情外放、ChatGPT 力求沉稳但仍拉近距离，Siri AI 只回答问题，不作闲聊引导。例如问“最近怎么样”，Siri AI 直接建议开启设置搜索新闻；问天气时提示美国国家气象局已发布极端高温预警；问“你能做我的朋友吗”回答“无论顺逆境，我都会做你的朋友”；问“你喜欢我吗”回答“我觉得你很不错”。苹果将 Siri AI 定位为实用工具，新版需等到今年秋季 iOS 27 正式推送后全面开放。

评测/基准语音

06:41

Orange AI@oran_ge

Google 推出 Gemini 3.5 Live Translate，支持 70 多种语言边听边译，保留说话人语调、节奏和音高，延迟仅几秒，自动降噪。Google Translate App 新增听筒模式，开发者可通过 API 调用，支持自动语言检测。

小互: 今天被很多人忽略的大新闻 Google 发布实时翻译模型 :Gemini 3.5 Live Translate - 能在70多种语言之间做到边听边译 - 同时保留说话人的语调、节奏和音高 - 不用等说完才翻,全程只比说话人慢几秒 - 自动滤...

Google 产品更新多模态语音

05:47

Chubby♨️@kimmonismus

Inworld 宣布将 API 价格下调约 50%，覆盖 TTS、STT 和 LLM 服务。主推文补充称语音成本降幅超 50%，并推出双倍六月积分及年付免两个月优惠。此举旨在解决消费级 AI 开发者面临的模型成本困境--现有定价基于企业级 $300/月座位，而非消费者 $10/月订阅。已有 Wishroll、Biblechat、Talkpal、Luvu 等团队实现 AI 成本降低 40-95%。

Inworld AI: We want to make AI accessible for everyone, so we're reducing our API prices by ~50%. Consumer AI growth is still blocke...

行业动态语音

04:24

Xiaomi MiMo@XiaomiMiMo

小米 MiMo 推出开源 AI 编程助手 MiMo Code V0.1

小米 MiMo 正式开源 AI 编程助手 MiMo Code V0.1，搭载多模态模型 MiMo V2.5（限时免费），拥有百万 token 上下文窗口。核心功能包括：无限上下文与无损压缩、Agent 框架（测试/审查/验证闭环）、Compose 模式（设计先行）、自进化系统、语音输入（基于 MiMo-V2.5-ASR）。兼容 Claude Code，自动加载现有技能、MCP 服务器和命令，零成本迁移。采用 MIT 许可，支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。可通过一行命令安装。

智能体产品更新开源生态编码

02:48

xAI@xai

同事件精选74

Grok Voice 提供最先进的性能，具有类人的时机、语调和温暖感。而且价格仅为竞争对手的一小部分。查看详情：http://x.ai/api/voice

ServiceNow AI Research: 🚀 Grok Voice Think Fast 1.0 (@xAI) lands on the Pareto frontier on EVA-Bench - no system in the eval beats it on accura...

xAI 模型发布语音

同一事件，精选展示《Grok 成为 Vapi 的默认语音引擎》

推荐理由：语音AI的SOTA这次不是OpenAI了，Grok Voice在EVA-Bench上无死角领先，价格还打到对手十分之一，做语音产品的可以认真看看这个帕累托前沿选手。

01:02

🚨 AI News | TestingCatalog@testingcatalog

Inworld 大幅降低实时推理、带语音特征分析的语音转文本（STT）以及 TTS 服务的 API 价格，将 Gemma 4、DeepSeek、MiniMax 等开源模型

Inworld AI: We want to make AI accessible for everyone, so we're reducing our API prices by ~50%. Consumer AI growth is still blocke...

产品更新推理语音

6月10日