5月22日

15:09

IT之家（RSS）

美团开源 LongCat-Video-Avatar 1.5：数字人视频从"彩排"走向"真舞台"，生成 10 秒视频仅需 1 分钟

美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级，支持复杂语音输入与多种主体。通过 DMD 蒸馏技术，推理效率提升约 15 倍，生成 10 秒视频仅需约 1 分钟。在性能评测中，模型在四个关键维度表现领先，用户偏好对比中胜率均超 54%，旨在推动数字人视频从技术演示走向商业应用。

开源生态推理模型发布视频

关联讨论 1 条

14:09

IT之家（RSS）

"拼好模"：字节跳动开源轻量原生统一多模态 AI 模型 Lance

字节跳动开源了轻量级多模态模型Lance，其激活参数量为3B。该模型采用原生统一架构，在训练阶段即整合图像与视频的理解、生成及跨模态编辑功能。Lance通过双流专家设计和模态感知旋转位置编码等技术，平衡了理解任务所需的高层语义与生成任务所需的低层连续表示。模型训练共分四阶段，数据规模约1.9T标记，计算预算控制在128张GPU内。基准测试表明，Lance在图像生成、视频生成、图像编辑及视频理解等多项任务中表现突出。该模型权重已依据Apache 2.0协议开源。

多模态开源生态模型发布

13:09

IT之家（RSS）

精选78

DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标

DeepSeek正推进700亿元人民币的巨额融资，估值约450亿美元。创始人梁文锋承诺将继续开源开发AI模型，不追求短期商业化，目标是技术升级与通用人工智能。腾讯、IDG资本等接近参投，梁文锋个人可能注资200亿元。若成功将创下中国科技初创公司首轮融资纪录。

DeepSeek 开源生态行业动态

关联讨论 4 条

推荐理由：700 亿元首轮融资创下纪录，梁文锋明确表态不追求短期商业化、继续死磕开源，国家队和腾讯都在这轮里，对国内开源生态是个强心针。

08:00

HuggingFace Daily Papers（社区热门论文）

FastKernels：面向生产环境的GPU内核生成基准测试

现有用于GPU内核生成的AI智能体测试基准与生产推理框架严重脱节。它们仅在单一GPU上使用合成输入评估内核，忽略了实际的编译技术栈，并奖励复现已知优化而非发现新方法。为此，我们提出FastKernels。它既是一个涵盖8个类别、46个代表性架构的内核基准（其内核覆盖了96.2%的HuggingFace Transformers架构），也是一个极简的生产级推理框架，性能与vLLM和SGLang等成熟系统相当。实验表明，最强的内核生成智能体在FastKernels上仅能实现0.94倍的整体加速，证实了基准与生产环境的错位是关键瓶颈。

开源生态推理论文/研究部署/工程

5月21日

23:26

The Decoder：AI News（RSS）

Cohere开源迄今最强模型

加拿大AI公司Cohere以Apache 2.0许可证开源了其迄今最强语言模型Command A+。该公司宣称这是其最高性能的模型，此次开源标志着Cohere在开放AI生态中的重要布局。Command A+面向开发者与研究社区免费开放，旨在推动大模型技术的透明化与协同创新，为行业提供更高性能的基础模型选择。

开源生态模型发布

18:06

IT之家（RSS）

腾讯混元发布新一代翻译模型Hy-MT2，支持手机端本地部署

腾讯混元正式开源新一代多语言翻译模型Hy-MT2，提供1.8B、7B、30B-A3B三种尺寸，支持33种语言及5种民族语言/方言互译。相比上一代，模型在指令遵循与专业领域翻译能力上显著提升。其中1.8B轻量模型仅需440MB存储，可部署于手机芯片进行本地推理，速度提升1.5倍。同步推出的腾讯Hy翻译小程序支持自定义风格、离线翻译，并开源了翻译指令遵循测试集IFMTBench，模型已上架GitHub、HuggingFace等平台。

开源生态模型发布端侧部署/工程

关联讨论 1 条