AI 摘要
MiniMax 官方展示开源模型 M3 Q4(4-bit 量化版)本地运行能力:使用 MLX-VLM 部署在 Mac Studio M3 Ultra 上,模型读取驾照照片和扫描文档后,自动完成一份美国海关申报表。处理耗时约 31 秒,输入 1,847 tokens,输出 736 tokens。过程中模型流式输出推理链,并调用 write_field、mark、sign 三个工具,无需人工干预。
Nice demo from @atomic_chat_hq:
M3 Q4 ran locally with MLX-VLM, and completed a US customs form entirely on a Mac Studio M3 Ultra.
Open-weight MiniMax M3 filled out a US customs form from a driver's license photo For this test we deployed MiniMax M3 Q4 using MLX-VLM on a Mac Studio M3 Ultra...