AIHOT

2月20日

00:00

Runway：Changelog（网页）

新增第三方模型

平台宣布接入新的第三方模型，开发者可通过统一接口调用外部AI能力。此次更新扩展模型选择范围，支持按场景灵活切换，提升开发效率。

产品更新视频

2月19日

04:14

Midjourney：Updates（RSS）

V8 图像评分活动 Round 3

V8 图像评分活动进入第三轮。本轮重点从识别"差的"样本转向学习"好的"标准，与上一轮形成对比，邀请用户前往投票链接参与。

产品更新图像生成

00:15

Hugging Face：Blog（RSS）

精选70

IBM与伯克利利用IT-Bench和MAST诊断企业级AI智能体失败原因

IBM Research与加州大学伯克利分校合作，通过新构建的IT-Bench基准测试和MAST评估框架，系统分析了企业级AI智能体在复杂IT运维任务中的失败原因。研究发现，当前智能体在多步骤规划、长序列操作及工具精确使用方面存在明显不足，导致任务失败率较高。该研究旨在为开发更可靠、适用于实际业务环境的企业级智能体提供关键诊断依据和改进方向。

智能体论文/研究评测/基准

关联讨论 1 条

推荐理由：企业Agent落地失败的系统性诊断，部署前可参考避坑

00:01

Google DeepMind：Blog（RSS）

表达自我的新方式：Gemini 现已支持音乐创作

Gemini 应用集成 Lyria 3 音乐生成模型，支持通过文本或图片提示创作 30 秒音乐片段，让任何用户都能轻松制作音轨。

Google产品更新多模态

00:00

LMSYS：Blog（Chatbot Arena 团队）

GB300 NVL72部署DeepSeek R1优化方案：长上下文推理性能突破

NVIDIA与SGLang团队发布DeepSeek R1-NVFP4在GB300 NVL72上的优化部署方案，针对128K/8K长上下文推理实现显著性能提升。通过PD分离、分块流水线并行、宽专家并行及多Token预测（MTP）等技术，系统在GB300上达226 TPS/GPU峰值吞吐量，较GB200提升1.53倍；相同延迟下性能领先1.4–1.6倍。MTP可再提升每用户TPS达1.87倍，128K预填充首Token延迟降至8.6秒。

DeepSeek开源/仓库推理部署/工程

2月18日

09:45

Ethan Mollick：One Useful Thing（RSS）

精选

Agentic 时代 AI 选择指南

Agentic 时代 AI 不再只是聊天机器人，而是能自主执行任务的智能体。面对 Claude、GPT、LLaMA 等模型，需根据代理能力、任务类型和生态集成重新评估选择策略。

智能体教程/实践

推荐理由：AI 大咖 Ethan Mollick 撰写 Agent 时代实用选型指南

08:00

Hugging Face：Blog（RSS）

精选78

使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用

Gradio 的 gr.HTML 组件允许开发者通过单一 Python 文件快速构建和部署交互式 Web 应用，无需构建步骤。它通过 html、css 和 js_on_load 三个模板，将 Python 状态注入前端并实现与 JavaScript 的双向同步。应用示例涵盖生产力工具（如像素艺术番茄钟）、商业应用（如可拖拽看板）、创意组件（如抽奖转盘）以及专业的 ML 应用（如目标检测查看器）。组件可子类化复用，并能直接集成到模型流水线中，借助快速重载模式，从构思到部署仅需数秒。

Hugging Face产品更新部署/工程

推荐理由：ML 开发者可快速构建自定义 Web 应用，单文件部署，无需前端经验。

06:22

Midjourney：Updates（RSS）

V8 Rating Party！（第二轮）

Midjourney 开启 V8 第二轮评级活动，重点针对生成文本的提示词测试模型能力。用户可访问 midjourney.com/rank-v8 参与图片评级，活动持续1天。

产品更新图像生成

01:27

Nathan Lambert：Interconnects（RSS）

精选

开源模型的永无止境的追赶

开源模型与闭源巨头（如 GPT、Claude）之间的能力差距持续存在，形成永无止境的追赶态势。文章探讨了知识蒸馏技术对缩小差距的作用，分析了开源与闭源模型在创新时间尺度上的差异，以及开源模型如何通过专业化模型在特定领域寻找获胜路径。同时指出当前开源生态在基础研究和资源投入上的缺失环节，并评估了这种追赶模式的可持续性。

大佬观点开源生态现象/趋势

关联讨论 1 条

推荐理由：开源与闭源鸿沟难越，但蒸馏与专业化或是破局关键

2月17日