Jina在其新版嵌入模型发布首日,即同步提供了全套MLX格式变体,改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标,背后应有自动化流程支持。这一动向反映了MLX生态的崛起:Qwen、DeepSeek等主流模型官方开始集成MLX,Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性,尤其适合在Mac的M系列统一内存上运行,为本地RAG等场景提供了理想的端侧AI解决方案。
Mac用户大喜啊!苹果端侧模型的优势又来了! 今天还看到Jina直接原生框架支持了MLX了!
以前开源 embedding 模型发布节奏一般是这样:
Day 0:放 PyTorch 原版
Day 7-30:社区有人转 GGUF
Day 30-90:有人想起来转 MLX
大部分时候:MLX 版本永远不会有,得自己 mlx_lm.convert Jina 这次是和原版同一天发布 MLX 变体,而且是全套--nano/small × 4 个任务变体 = 8 个 MLX 模型。
这意味着:
MLX 已经被 Jina 当成很重要的部署目标,不是社区可选项 他们内部应该有 MLX pipeline,不是手工转的。
这背后的趋势,最近半年同类产品都有这些动作。
Qwen3、DeepSeek、Llama 系列官方 release 都开始带 MLX 变体。 Hugging Face 自己加了 MLX 作为一级 framework tag(和 PyTorch、JAX 并列) mlx-community 的下载量已经不输 GGUF 在某些细分领域 Apple 自己的 Foundation Models 也是 MLX 路线 embedding 这个赛道尤其适合 MLX: