5月19日

07:25

karminski-牙医@karminski3

字节跳动开源了全模态模型Lance，其激活参数量仅为3B，却能同时处理文本、图片和视频的输入与输出，完成理解、生成与编辑等多种任务。该模型通过模块化拼接构建了Lance_3B与Lance_3B_Video两个版本，其创新在于采用共享交错序列统一语义空间，并引入专用专家模块协调理解与生成的互斥关系，使得小参数模型性能接近更大规模模型。训练仅需128张A100，对端侧部署和多模态Agent应用具有重要价值。

多模态开源生态模型发布

05:42

OpenAI Developers@OpenAIDevs

Altaratech公司正利用OpenAI模型解决科学数据多模态且复杂的核心挑战，旨在帮助科学家和工程师在复杂的研发流程中更高效、透明地工作。其应用关键点在于：协助科研人员跨复杂多模态数据进行推理、实现长流程研发任务的并行化处理，并通过提升过程透明度来建立信任。该公司在OpenAI开发者日上分享了这些实践，并表示正积极招募相关人才。

Catherine Yeo: At the recent @OpenAIDevs Founder Day, I had fun chatting about how we use OpenAI's capabilities to scale scientific int...

OpenAI 多模态行业动态

03:55

karminski-牙医@karminski3

Qwen3.7内测跑分出炉，空间理解与指令遵循大幅提升

Qwen3.7-Max-Preview在ArenaAI内测中排名第13，为当前版本国产模型最佳。其数学能力（第7）与编程能力（第10）提升显著。实测显示，在前端代码生成任务中，Qwen3.7在空间理解和指令遵循上较前代（Qwen3.6）有巨大进步，能更准确地维持元素轴向与标记。文章同时指出，ArenaAI评分仅供参考，其为Meta新模型Muse Spark给出的高排名（第5）与社区现状不符。

多模态推理评测/基准

03:50

Claude@claudeai

精选75

现在你可以用 Claude Design 创作更多内容了。我们已将所有套餐的 token 限制翻倍。

Anthropic 产品更新图像生成多模态

推荐理由：Claude Design 令牌加倍，做图做设计的人现在可以更放肆地挥霍上下文了，Anthropic 这波更新把设计工具的可用性拉高了一个档次。

03:12

OpenRouter@OpenRouter

精选65

@xai 的 Grok 创意套件中 3 款新模型现已在 OpenRouter 上线： • Grok Imagine Image Quality：照片级真实图像生成与编辑 • Grok Imagine Video：从文本、图像或参考生成短片 • Grok Voice TTS 1.0：支持 20 多种语言的 5 种语音更多详情见下方 🧵

xAI 产品更新多模态语音

推荐理由：如果你觉得官方 Grok API 麻烦，OpenRouter 现在一口气上线了 Imagine 图像、视频和 Voice TTS，做创意产品的开发者可以直接从这里调用了，省去多签一轮 API key 的功夫。

02:55

karminski-牙医@karminski3

Qwen3.7！就在今天！

阿里千问今日推出Qwen3.7-Max-Preview，在ArenAI（原LMArena）内测中排名第13，为国内模型最高水平。模型数学能力显著提升，位列总榜第7；编程能力排名第10；视觉能力测试升至第16。作者实测显示，在前端代码生成场景中，Qwen3.7的空间理解与指令遵循能力进步明显，元素轴向一致性优于DeepSeek-V4-Pro等模型。此外，ArenaAI给Meta新模型Muse Spark的异常高评分引发关注，但该评分仅供参考。

多模态推理编码评测/基准

00:56

Berryxia.AI@berryxia

阿里Qwen3.7预览版在Arena排行榜取得显著成绩

阿里巴巴最新发布的Qwen3.7预览版在Arena社区排行榜上表现突出。在基于百万真实用户投票的Text Arena中，Qwen3.7 Max Preview总榜排名第13，使阿里巴巴位列实验室第6名，并在数学、专家咨询、软件与IT、编程等细分领域进入前十。同时，在Vision Arena中，Qwen3.7 Plus Preview总榜排名第16，助力阿里巴巴升至实验室第5名。此次排名并非实验室内部测试，而是社区实际交互的体现，标志着阿里在模型的文本与视觉综合能力上实现了重要进步。

Arena.ai: Qwen3.7 Preview By @Alibaba_Qwen lands on Arena for Text and Vision. In Text Arena, Qwen3.7 Max Preview ranks #13 overal...

多模态评测/基准