# Jina同步发布MLX格式嵌入模型，端侧AI部署迎来新趋势

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-05-13 08:22
- AIHOT 分数：65
- AIHOT 链接：https://aihot.virxact.com/items/cmp3cdlef04u4sl1qm53wjhnb
- 原文链接：https://x.com/berryxia/status/2054356472042270834

## AI 摘要

Jina在其新版嵌入模型发布首日，即同步提供了全套MLX格式变体，改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标，背后应有自动化流程支持。这一动向反映了MLX生态的崛起：Qwen、DeepSeek等主流模型官方开始集成MLX，Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性，尤其适合在Mac的M系列统一内存上运行，为本地RAG等场景提供了理想的端侧AI解决方案。

## 正文

Mac用户大喜啊！苹果端侧模型的优势又来了！
今天还看到Jina直接原生框架支持了MLX了！

以前开源 embedding 模型发布节奏一般是这样：

Day 0：放 PyTorch 原版

Day 7-30：社区有人转 GGUF

Day 30-90：有人想起来转 MLX

大部分时候：MLX 版本永远不会有，得自己
mlx_lm.convert
Jina 这次是和原版同一天发布 MLX 变体，而且是全套--nano/small × 4 个任务变体 = 8 个 MLX 模型。

这意味着：

MLX 已经被 Jina 当成很重要的部署目标，不是社区可选项
他们内部应该有 MLX pipeline，不是手工转的。

这背后的趋势，最近半年同类产品都有这些动作。

Qwen3、DeepSeek、Llama 系列官方 release 都开始带 MLX 变体。
Hugging Face 自己加了 MLX 作为一级 framework tag（和 PyTorch、JAX 并列）
mlx-community 的下载量已经不输 GGUF 在某些细分领域
Apple 自己的 Foundation Models 也是 MLX 路线
embedding 这个赛道尤其适合 MLX：

模型小（1-2B 很完美啊！，正好塞进 M 系列统一内存）
推理频繁但每次量小（不像 LLM 是长 generation）

本地 RAG / 个人知识库场景天然在 Mac 上。

### 引用推文

> Berryxia.AI：https://huggingface.co/collections/jinaai/jina-embeddings-v5-omni