5月29日

17:13

Alibaba Cloud@alibaba_cloud

加入阿里云和Appnovation的战略简报，了解通义千问（Qwen）如何帮助企业重新思考AI性能与成本的平衡。了解全球领先企业为何选择Qwen，以及您的团队需要了解哪些信息以保持竞争力。 📅 6月9日星期二 | 太平洋时间上午11：00 / 东部时间下午2：00 | 55分钟 | 线上立即注册：https://lnkd.in/gHEyw6EQ

开源生态行业动态

09:39

StepFun@StepFun_ai

现已在 @Designarena 上线--快去试试看 👀

Design Arena: Step 3.7 Flash is now on Design Arena! A 400TPS open-weight model with a 256K content window, built for agentic, coding,...

多模态开源生态模型发布

08:09

StepFun@StepFun_ai

阶跃星辰 Step 3.7 Flash 发布，聚焦智能体效率

阶跃星辰（Step）发布了开源大模型 Step 3.7 Flash，主打智能体（Agent）工作流的效率。该模型在 ClawEval-1.1（67.1分）和 SimpleVQA Search（79.2分）评测中排名第一。其架构为 198B 参数的 MoE，约 11B 为活跃参数，支持 256K 上下文。模型具备多模态理解能力，能处理图像、文档并生成代码或调用工具执行任务。在工具使用方面，它致力于高可靠性，τ²-bench 得分超过 98%。Step 3.7 Flash 兼容 Claude Code、MCP 协议等工具链，并支持在 Mac Studio M4 Max 等设备上本地运行。模型权重以 Apache 2.0 许可开源。

智能体多模态开源生态推理

关联讨论 4 条

02:07

Nathan Lambert@natolambert

许可证可能是最不性感但最能帮助开放生态实现长期稳定和经济可行性的东西。对此感到兴奋！

NVIDIA AI: We're adopting the Linux Foundation's OpenMDW framework across our open model families. This helps make open model licen...

大佬观点开源生态

01:44

Chubby♨️@kimmonismus

字节跳动开源多模态模型BAGEL，单一7B参数模型即可执行图像生成、编辑、风格转换与视觉理解，采用Apache 2.0许可。引用推文显示，该公司此前已发布首个去中心化训练的视频生成模型Paris 2.0，其在FVD基准上性能约为同等数据与算力单体模型的2倍。

bidhan: We're releasing Paris 2.0, which, to our knowledge, is the world's first decentralized trained video generation model. W...

多模态开源生态模型发布

5月28日

23:38

Xiaomi MiMo@XiaomiMiMo

今天我们很高兴地宣布，首批13家生态伙伴加入小米MiMo Orbit计划。衷心感谢每一位伙伴的信任与合作。@gitlawb 及其他12家生态伙伴。这仅仅是开始。MiMo Orbit计划仍在开放中，我们期待与您合作！ → business-mimo@xiaomi.com

开源生态行业动态

23:31

Berryxia.AI@berryxia

通义千问（Qwen）发布新T2I评测基准Qwen-Image-Bench，推动评价标准升级

阿里通义千问（Qwen）推出了新的文本到图像（T2I）评测基准Qwen-Image-Bench。该基准包含56个细粒度评估维度，并配备与人类对齐度达ρ=0.92的评判模型Q-Judger。其核心理念是将T2I模型评价从基础的“提示词对齐”，提升至关注“真实世界保真度”和“创意生成能力”两大支柱，通过1000条测试提示词能更清晰地区分现有SOTA模型表现。该基准为开发者、提示词工程师及企业提供了一个更贴近实际创作需求的新评估框架。

Adina Yakup: Qwen @Alibaba_Qwen just dropped a new Text to Image benchmark + a judge model https://huggingface.co/collections/Qwen/qw...

图像生成开源生态评测/基准