Berryxia.AI@berryxia

2026-05-13 08:22·51天前

AI 摘要

Jina在其新版嵌入模型发布首日，即同步提供了全套MLX格式变体，改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标，背后应有自动化流程支持。这一动向反映了MLX生态的崛起：Qwen、DeepSeek等主流模型官方开始集成MLX，Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性，尤其适合在Mac的M系列统一内存上运行，为本地RAG等场景提供了理想的端侧AI解决方案。

Mac用户大喜啊！苹果端侧模型的优势又来了！今天还看到Jina直接原生框架支持了MLX了！

以前开源 embedding 模型发布节奏一般是这样：

Day 0：放 PyTorch 原版

Day 7-30：社区有人转 GGUF

Day 30-90：有人想起来转 MLX

大部分时候：MLX 版本永远不会有，得自己 mlx_lm.convert Jina 这次是和原版同一天发布 MLX 变体，而且是全套--nano/small × 4 个任务变体 = 8 个 MLX 模型。

这意味着：

MLX 已经被 Jina 当成很重要的部署目标，不是社区可选项他们内部应该有 MLX pipeline，不是手工转的。

这背后的趋势，最近半年同类产品都有这些动作。

Qwen3、DeepSeek、Llama 系列官方 release 都开始带 MLX 变体。 Hugging Face 自己加了 MLX 作为一级 framework tag（和 PyTorch、JAX 并列） mlx-community 的下载量已经不输 GGUF 在某些细分领域 Apple 自己的 Foundation Models 也是 MLX 路线 embedding 这个赛道尤其适合 MLX：

模型小（1-2B 很完美啊！，正好塞进 M 系列统一内存）推理频繁但每次量小（不像 LLM 是长 generation）

本地 RAG / 个人知识库场景天然在 Mac 上。