# Canonical 推出本地语音转文字项目 Myna，为 Ubuntu 26.10 引入 AI 听写功能

- 来源：IT之家（RSS）
- 发布时间：2026-06-18 18:41
- AIHOT 分数：32
- AIHOT 链接：https://aihot.virxact.com/items/cmqjekr3l02lqslmhkpfqh0pz
- 原文链接：https://www.ithome.com/0/966/221.htm

## AI 摘要

Canonical 公布 Project Myna，为 Ubuntu 桌面打造的本地语音转文字工具，首个版本随 Ubuntu 26.10 发布。Myna 仅提供听写功能：用户按下键盘快捷键后说话，转录文字直接插入当前应用，屏幕显示视觉反馈。所有识别在本地运行，下载模型后无需联网；麦克风仅在激活时被访问，音频数据在内存中处理后丢弃。首版以 Wayland 上的 GNOME 为主要验证环境，架构采用模块化设计，源码和文档已以 GPLv3 协议托管于 GitHub。后续计划加强桌面集成并优化听写体验。

## 正文

IT之家 6 月 18 日消息，当地时间 6 月 17 日，Canonical 公布了一项名为 Project Myna 的新项目，旨在为 Ubuntu 桌面操作系统引入本地化的语音转文字功能。

该项目得名于擅长模仿人类说话的鹩哥 / 八哥鸟，首个版本计划随 Ubuntu 26.10（Stonking Stingray）一同发布，并成为 Ubuntu 桌面体验的核心组成部分。

Myna 被定位为一款原生桌面听写工具，而非语音助手或语音控制系统。IT之家注意到，用户按下键盘快捷键后即可开始说话，转录后的文字会直接插入当前正在使用的应用程序中，听写过程中屏幕会显示明确的视觉反馈。

Canonical 表示，首版功能范围将刻意收窄，不会涉及语音助手、语音命令、桌面控制、翻译工具或自动语言检测等功能，目标是把基础听写体验做扎实。

在技术架构上，Myna 使用 AI 语音识别模型，所有识别任务均在用户本地机器上运行，下载安装必要的模型后无需任何互联网连接。首版以 Wayland 上的 Ubuntu 桌面为目标，GNOME 是主要验证环境，架构保持开放以便未来支持更多桌面环境。

另外，麦克风仅在用户主动激活听写时才会被访问，音频数据在内存中处理后即被丢弃，不会上传至任何外部服务。整体架构采用模块化设计，语音识别、用户交互、听写管理和文本注入分别由独立组件处理，以便后续对各部分单独改进而不影响整体使用体验。

Canonical 桌面团队成员 Jean Baptiste Lallement 表示，该团队希望“在过多的设计决策被固定下来之前”获得社区反馈，尤其欢迎依赖听写或辅助技术的用户、已在 Linux 上使用语音识别的用户、开发者、测试人员及文档编写者参与进来。项目源码和架构文档已在 GPLv3 协议下托管于 GitHub。

在 Ubuntu 26.10 之后，Canonical 计划持续改善 Myna 与桌面的集成度，并探索让听写更自然、更准确的方法。后续功能的优先级将取决于早期用户的反馈和更多社区意见。
