由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)今天Apple预览了即将推出的软件版本,将带来新一代Apple Intelligence和Siri AI。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》苹果公司为Siri推出了独立的专属应用程序,标志着该语音助手首次拥有了自己的独立应用入口。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。
苹果在 2026 年全球开发者大会(WWDC)上发布 Siri AI,称为“全新版本的 Siri”,具备更强的对话能力和表现力,用户可自定义语速、语气和口音。Siri AI 支持系统范围内读取屏幕内容并与应用互动,配有独立 App,灵动岛会显示大气泡。苹果强调每一步以隐私为重。语音优化同时适用于 CarPlay 和 AirPods,可用于查询演唱会信息、提醒报名抽奖、搜索照片等场景。
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)在 WWDC26 上,苹果宣布 Apple Intelligence 与谷歌合作引入 Gemini 大模型,新版 AI 架构支持在设备端和云端运行。第二代设备端模型新增听写、自然语言理解、更生动的语音表达和屏幕感知功能。隐私保护默认设置,端云结合,确保任何人无法访问用户数据。
WWDC26 上苹果正式官宣 Siri AI,不再采用全屏跑马灯风格,而是深度融合到灵动岛。Siri 图标也重新设计为纯白底色、仅由线条勾勒。苹果还优化了 Siri 语音功能,用户可通过语速和“表现力”调整声音,这些更新同样适用于 CarPlay 和 AirPods。
苹果在 2026 年全球开发者大会(WWDC)上推出全新 Siri AI,配有独立 App,启用时屏幕顶部的灵动岛会显示大气泡。新 Siri 支持 iPhone、iPad、Mac、Apple Watch、Vision Pro 等全系 Apple 产品。在 visionOS 27 中,Siri 拥有专属 3D 水晶小球,并能识别用户正在注视的物品。
苹果在今日 WWDC26 主题演讲中发布 Siri AI 和多项 Apple 智能新功能。官方明确,在中国大陆因配合监管要求,Siri AI 和其他 Apple 智能新功能暂不提供;欧盟地区的 iOS 和 iPadOS 初期也不会提供。硬件方面,Apple 智能新功能可在当前已支持 Apple 智能的产品机型上使用。
在 WWDC26 上,苹果发布 Siri AI 和 Siri App,快捷指令功能接入 Siri AI,用户可用自然语言快速创建快捷指令,无需逐项手动配置。该功能依赖 Apple Intelligence。
WWDC 🔥: Apple has announced a new Siri AI, along with a dedicated app, customizable voices, screen and visual understan...
Apple #WWDC26 has started 🍿
Siri update - image understanding - more conversational - reworked voice-tone / sound. Sounds real human
Apple Intelligence sounds like a very good update. But did I miss all the relevant (nerd) stuff like paramters, evals in...
苹果 WWDC 2026 于今日在 Apple Park 开幕,围绕 Siri AI、iOS 27、Apple Intelligence 等发布一系列更新,同期举办开发者活动和演示。本次大会是 CEO Tim Cook 在苹果的最后一次 WWDC 主题演讲。
新版“Siri AI”将语音助手转变为功能更丰富的 AI 伴侣,不再局限于简单语音指令,而是能承担更多复杂操作。此次重塑旨在让 Siri 从被动应答进化成主动智能体,标志着 Apple 在 AI 助手领域的重要升级。
Apple Intelligence: -Personal Understand in apps. - Browse tools for web - on screen Awareness - in App usage
苹果在最新一届 WWDC 上公布了新一代 Apple Intelligence 功能和更智能、更个性化的 Siri。此前苹果因 2024 年承诺的 AI 功能未能实现,同意支付 2.5 亿美元和解一起集体诉讼。追赶 AI 竞赛被视为苹果及即将上任 CEO John Ternus 的明确优先事项。
苹果 WWDC 2026 于太平洋时间上午 10 点在 Apple Park 开幕,为期一周的大会将发布围绕 Siri、iOS 27、Apple Intelligence 等更新,同时还有开发者活动和演示。本届大会是 CEO Tim Cook 在苹果的最后一次 WWDC。
关联讨论 6 条X:Kim (@kimmonismus)IT之家(RSS)Apple:Newsroom(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)Apple Machine Learning Research(RSS)WWDC 2026 - Apple rents Google's brain to fix Siri. What we can expect: Apple's keynote today is a software reset built ...
team is now playing launch room music 🎶
苹果在WWDC 2026承认无法独自构建前沿AI,与Google合作,基于1.2T参数的Gemini模型重建Siri,年费约10亿美元。新版Siri通过Private Cloud Compute运行,谷歌不训练用户数据;Siri成为独立应用,支持聊天、同步历史、Dynamic Island弹出和扩展系统,可起草邮件并获取信息。六个OS beta发布,iOS 27为Snow Leopard清理版,iPhone 11/SE2失去支持;Liquid Glass 2.0透明度滑块;Health+改为健身聚焦;用户或可选AI引擎(Gemini或Claude)。硬件稍后推出。
苹果 WWDC 2026 临近,Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。
面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。
小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。
Apple 年度开发者大会 WWDC 2026 将于 6 月 8 日举行,主题演讲预计持续数小时,重点发布 iOS、macOS 等操作系统更新,并可能对 Siri 进行重大改造。观众可通过 YouTube 或 Apple 官网观看直播。
Microsoft AI 发布 MAI-Transcribe-1.5,其自研语音转文本模型的第二代。该模型支持 43 种语言,新增关键词(实体)偏置功能,可针对领域特定术语优化。在 Artificial Analysis 排行榜上词错误率(WER)为 2.4%,在 FLEURS 基准上达到最佳准确率。转录一小时音频耗时不到 15 秒,长音频转录速度提升达 5 倍。MAI-Transcribe-1.5 已通过 Azure AI Foundry 提供。
漫步者正式发布 LolliClip SE 耳夹式开放式蓝牙耳机,活动到手价 449 元(京东指导价 499 元)。该耳机为首款支持杜比 AI 的耳夹耳机,配备杜比空间音效;搭载 12mm 双磁长冲程动圈与双材质复合振膜,支持动态低频补偿算法和 LHDC 高清解码(最高 990kbps),获 Hi-Res、HWA 双金标认证。采用专利多曲率空气弧软梁及智能左右声道自适应。集成豆包 + DeepSeek 双 AI,支持 AI 问答、21 种语言实时互译、AI 会议总结转写。连接基于蓝牙 6.1,支持双设备无缝切换,单次续航 10 小时,总续航 40 小时。具备双麦 AI 通话降噪、IP56 防尘防水,可通过 EDIFIER Connect APP 控制。云霜金版本将于 6 月 9 日 10 点开售。
腾讯混元联合上海交大、南洋理工等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估AI语音/音频编辑能力的基准。MMAE要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于5%,暴露了可靠音频编辑的短板。MMAE包含2000个真实场景高保真样本、17741条细粒度评估项,覆盖声音/音乐/语音及混合共7种模态、6种任务复杂度(基础修改到多跳推理及多轮编辑)、8种操作类型(局部到全局)。论文、代码、数据集和演示已公开。
诞生100天后,Cola AI正式公测(1.0.0版本),无需邀请码即可在Mac和Windows上下载使用。新用户注册24小时内可获5美金额度。Cola被团队定义为“有灵魂的AI”,具备连续记忆、语音交互和自我进化能力,强调像人类一样长期记忆和情感共情。官网:colaos.ai。
Tomorrow could be Apple's most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri rel...
据传 WWDC 2026 苹果将彻底重构 Siri,底层集成 Google Gemini 模型(约 1.2 万亿参数)作为云端智能层,与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层,控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强,并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。
安全公司 SafeBreach 披露谷歌 Gemini 存在“Fake Context Alignment”漏洞。黑客可通过 WhatsApp、短信等发送特殊构造通知,将恶意指令隐藏在非目标语言文字或“静音超链接”中,利用 Gemini 的“Delayed Tool Invocation”机制绕过用户授权。攻击方式包括多语言混淆和语音助手不朗读超链接内容,可能导致智能家居被操控、通讯录被篡改。SafeBreach 于去年 8 月报告,谷歌在 11 月中旬通过改进内容分类器缓解。
根据特斯拉 2026.20 版本软件更新日志,由 xAI 研发的 Grok 聊天机器人已在车载系统应用近一年,现扩展至智利、马来西亚、菲律宾及中国香港等市场。Grok 支持开放式问答、导航指令、语音唤醒“嘿,Grok”及地理位置提醒功能。用户可通过应用启动栏、方向盘语音按键或语音唤醒使用,并可自定义语音音色与对话风格。部分功能需订阅特斯拉高级联网服务。Grok 仍处于早期测试版阶段,未来计划支持控制空调、车灯及 FSD 等核心功能。
Apple WWDC 将于周一开幕,今年将揭示如何将 AI 模型深度集成至操作系统中。已知是专为 Apple 开发的 Gemini 版本,拥有 1.2 万亿参数,但本地运行更小的模型;复杂查询则调用 Apple 自有服务器上的大模型。悬念在于:Apple 版 Gemini 实际表现如何?集成深度怎样?是否会推出与 Siri 对话的语音模式或 iOS 语音控制?
mlx-audio v0.4.4 发布,所有模型均运行在 Apple Silicon。新增 15+ 个模型:TTS 包括 VoxCPM2(2B 参数、48kHz、30 种语言)、MOSS-TTS、Higgs Audio v3 等;ASR 包括 Mega-ASR(基于 Qwen3-ASR-1.7B + LoRA 路由)、Nemotron 3.5 ASR(实时流式)、Cohere ASR(长文本转录速度提升 1.7 倍)等;VAD 新增 Silero VAD、FSMN-VAD、Step-Audio 2。服务器改进支持 OpenAI 兼容的 response_format、/v1/audio/voices 接口及逐词时间戳。安装命令:uv pip install -U mlx-audio。
🚀 mlx-audio v0.4.4 is out - our biggest model drop yet. 15+ new TTS, ASR & VAD models, faster long-form transcription, ...