3月27日

08:00

Hugging Face：Blog（RSS）

Anthropic公司发布新一代大模型Claude 3.5 Sonnet，在多项基准测试中超越前代Opus及GPT-4o等竞争对手，尤其在高级推理、知识掌握和编程能力上表现卓越。新模型处理速度提升至两倍且定价更低。同时推出的“Artifacts”功能可将生成的代码或文本在独立面板实时展示，标志着其向交互式工作空间演进。

Hugging Face 其他开源生态

3月25日

21:18

美团 LongCat：HuggingFace 新模型

美团 LongCat-Next

美团开源项目 LongCat-Next 正式发布，宣称将通过开源与开放科学推进人工智能技术的普及与民主化。该项目目前仅公开使命宣言，强调降低AI技术门槛的愿景，尚未披露具体模型架构、训练数据或性能基准等技术指标，也未说明应用场景或发布时间表。

Hugging Face 开源生态模型发布

3月24日

10:01

Hugging Face：Blog（RSS）

精选78

全新语音智能体评估框架EVA发布

ServiceNow AI团队在Hugging Face上发布了语音智能体评估框架EVA。该框架通过标准化测试集与多模态指标，系统评估语音助手在对话理解、任务完成及交互自然度等方面的性能，旨在量化衡量智能体在复杂真实场景下的表现，助力研究人员客观比较不同模型，推动技术优化。

智能体 Hugging Face 开源/仓库语音

推荐理由：提供语音代理评估标准，帮助开发者优化模型性能和测试效率。

3月21日

03:38

Hugging Face：Blog（RSS）

精选70

一日之内构建领域特定嵌入模型

英伟达在Hugging Face平台发布技术博客，分享了一种在24小时内快速构建高质量领域特定嵌入模型的方法。该方法通过结合高效微调技术与领域数据，显著提升了模型在专业任务中的语义理解与检索性能，为企业和开发者提供了低成本、高效率的定制化嵌入解决方案。

Hugging Face 教程/实践数据/训练

推荐理由：一天内搞定领域专属 Embedding 微调，RAG 检索效果可显著提升

3月20日

12:04

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 LongCat-Flash-Prover

美团 LongCat 团队发布开源项目 LongCat-Flash-Prover，致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛，促进先进技术的广泛可及性，但尚未公布具体的技术架构、功能特性及性能评估指标。

Hugging Face 推理模型发布

3月18日

00:37

Hugging Face：Blog（RSS）

精选78

Hugging Face开源现状：2026年春季

Hugging Face发布了一篇关于其平台开源生态的博客文章。该文由Hugging Face官方撰写并发布在其自有平台上，内容聚焦于2026年春季的开源发展状态。文章具体分析了平台上的模型、数据集及开源社区活动趋势，但未提供详细的量化指标或具体产品发布信息。

Hugging Face 开源生态现象/趋势

推荐理由：Hugging Face 季度开源生态报告，可快速掌握 AI 开源社区最新动向与趋势

3月17日

20:33

Hugging Face：Blog（RSS）

精选83

Holotron-12B - 高吞吐计算机使用智能体

H公司发布了多模态计算机使用模型Holotron-12B。该模型基于NVIDIA开源的Nemotron-Nano-12B-VL模型，使用专有数据混合进行训练，专注于在交互环境中高效感知、决策和行动。其采用混合状态空间模型与注意力机制架构，在单张H100 GPU上实现了比前代Holo2-8B高2倍以上的吞吐量，在100并发基准测试中达到每秒8900个token。在WebVoyager基准测试中，性能从基线的35.1%提升至80.5%，在定位和导航基准上也显著提升。模型已通过NVIDIA开放模型许可在Hugging Face发布。

智能体 Hugging Face 多模态模型发布

推荐理由：高效推理的计算机使用代理模型，适合生产部署，开发者可直接试用。

3月10日

08:00

Hugging Face：Blog（RSS）

精选83

Hugging Face Hub 正式推出 Storage Buckets 存储服务

Hugging Face Hub 发布 Storage Buckets，这是一种为机器学习工作流设计的可变、类 S3 的对象存储服务。它基于 Xet 存储后端，能对跨文件共享内容的 ML 工件进行高效去重，从而节省带宽、加速传输并降低存储成本。该服务还提供“预暖”功能，可将数据预先迁移至靠近计算资源的云区域，以提升分布式训练等场景的效率。目前支持 AWS 和 GCP，用户可通过 CLI 或 Python 库在 2 分钟内快速创建和同步存储桶。

Hugging Face 产品更新数据/训练部署/工程

推荐理由：ML 开发者可高效管理训练数据和检查点，节省存储成本并加速工作流。

3月9日

08:00

Hugging Face：Blog（RSS）

精选71

LeRobot v0.5.0：扩展每一个维度

Hugging Face 发布了 LeRobot v0.5.0 版本。该版本在数据集、模型、任务和社区四个维度上进行了全面扩展。具体包括：引入了新的现实世界和模拟数据集，推出了支持多任务学习的模型，并扩展了任务范围至移动操作和双臂协调。社区方面，提供了更易用的库、演示应用和教学资源。此次更新的核心目标是降低机器人技术的应用门槛，推动其民主化发展。

Hugging Face 具身智能开源/仓库

推荐理由：开源机器人AI框架大版本更新，降低具身智能研发门槛，值得关注落地进展

3月5日

22:16

Hugging Face：Blog（RSS）

精选73

将机器人AI引入嵌入式平台：数据集记录、VLA微调与设备端优化

NXP在Hugging Face发布技术博客，详细介绍了将视觉语言动作模型应用于嵌入式机器人系统的完整流程。核心工作包括构建真实世界的机器人交互数据集，对VLA模型进行针对性微调，以及实施一系列设备端优化以实现高效部署。该方案旨在解决大型模型在资源受限的嵌入式硬件上运行的挑战，推动机器人AI在边缘端的实际应用。

Hugging Face 具身智能教程/实践端侧

推荐理由：嵌入式AI开发者可掌握从数据集记录到设备端优化的全流程实践。

08:00

Hugging Face：Blog（RSS）

介绍Modular Diffusers--扩散流程的可组合构建模块

Hugging Face发布Modular Diffusers库，将扩散模型流程解构为独立模块（如调度器、VAE、UNet）。用户可像组合积木一样自由替换和组合组件，显著提升了模型实验的灵活性与可复现性，简化了自定义流程的创建。该库已开源，旨在支持快速创新。

Hugging Face 产品更新图像生成

2月24日

08:00

HuggingFace Daily Papers（社区热门论文）

精选

屏幕上的图灵测试：移动GUI代理人性化基准

研究团队提出"屏幕图灵测试"框架，将人机交互形式化为MinMax优化问题，并发布Agent Humanization Benchmark (AHB)。基于新收集的高保真移动触摸动态数据集，发现普通LMM代理因运动学特征不自然而极易被检测。该基准量化了可模仿性与任务效用的权衡，提出的启发式噪声至数据驱动行为匹配方法，使代理在不牺牲性能的前提下实现高可模仿性，推动GUI代理从"能否完成任务"向"如何像人类一样完成"的范式转变。

智能体 arXiv Hugging Face 多模态

推荐理由：让AI操作手机更像真人，避免被平台识别封禁的实用新研究

2月20日

08:00

Hugging Face：Blog（RSS）

使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型

Hugging Face 宣布通过其平台提供免费 AI 模型训练服务，用户可结合 Unsloth 高效训练工具与 Hugging Face Jobs 功能，无需支付费用。该举措旨在降低 AI 开发门槛，推动开源开放科学，促进人工智能技术的民主化进程。核心变化在于将原先需付费或自建基础设施的训练流程，整合为平台内可直接调用的免费资源，显著减少开发者的时间和经济成本。

Hugging Face 教程/实践数据/训练

2月18日

08:00

Hugging Face：Blog（RSS）

精选78

使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用

Gradio 的 gr.HTML 组件允许开发者通过单一 Python 文件快速构建和部署交互式 Web 应用，无需构建步骤。它通过 html、css 和 js_on_load 三个模板，将 Python 状态注入前端并实现与 JavaScript 的双向同步。应用示例涵盖生产力工具（如像素艺术番茄钟）、商业应用（如可拖拽看板）、创意组件（如抽奖转盘）以及专业的 ML 应用（如目标检测查看器）。组件可子类化复用，并能直接集成到模型流水线中，借助快速重载模式，从构思到部署仅需数秒。

Hugging Face 产品更新部署/工程

推荐理由：ML 开发者可快速构建自定义 Web 应用，单文件部署，无需前端经验。

2月12日

08:00

Hugging Face：Blog（RSS）

精选83

实践中的OpenEnv：在真实环境中评估工具使用智能体

Meta与Hugging Face联合推出开源评估框架OpenEnv，旨在标准化智能体与真实系统的交互。Turing公司贡献了生产级“Calendar Gym”环境，用于在权限控制、时间推理等现实约束下研究工具使用智能体。该框架采用类似Gymnasium的API，通过标准接口连接真实工具，将评估重点从受控演示转向真实世界可靠性。日历系统因涉及多用户、多步骤工作流等复杂性，成为评估智能体实际能力的强大测试平台。

智能体 Hugging Face MCP/工具 Meta

推荐理由：提供生产级基准测试，帮助开发者评估和改进 AI 代理在复杂环境中的表现。

2月9日

08:00

Hugging Face：Blog（RSS）

精选76

Transformers.js v4：现已在 NPM 上发布！

Transformers.js 发布第四个主要版本 v4，该版本现已通过 NPM 包管理器提供。这一更新延续了项目通过开源与开放科学推动人工智能技术进步与普及的使命，使开发者能够更便捷地获取并在项目中集成这一机器学习库。

Hugging Face 开源/仓库端侧部署/工程

推荐理由：浏览器和 Node.js 直接跑 HF 模型的大版本升级，前端开发者可零门槛接入 AI

2月6日

15:32

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型

美团 LongCat 团队发布 LongCat-Flash-Lite-FP8 模型。该版本采用 FP8（8位浮点）精度格式，属于 Flash-Lite 轻量化系列，旨在提升推理效率并降低显存占用。目前公开信息仅包含平台默认标语，具体参数规模、基准测试成绩及技术细节有待进一步披露。

Hugging Face 模型发布端侧部署/工程

00:52

Hugging Face：Blog（RSS）

ServiceNow AI 发布 SyGra Studio：低代码知识图谱构建平台

ServiceNow AI 在 Hugging Face 上推出了 SyGra Studio，这是一个低代码平台，旨在简化知识图谱的构建、可视化与分析。该平台允许用户通过直观界面整合多源数据，并支持与 GPT、Claude 等大语言模型集成，以增强语义理解和推理能力，显著降低了领域专家构建知识图谱的技术门槛。

Hugging Face 开源/仓库部署/工程

2月4日

08:00

Hugging Face：Blog（RSS）

精选76

Community Evals：因为我们不再信任黑箱排行榜胜过社区

LMSys 推出了社区驱动的评估框架 Community Evals，旨在通过开源和开放科学推进人工智能民主化。该框架允许社区贡献和审查评估案例，以透明、可复现的方式测试模型。此举旨在改变依赖少数机构“黑箱”排行榜的现状，让更广泛的社区参与定义和衡量AI模型的能力与价值。

Hugging Face 开源生态评测/基准

推荐理由：Hugging Face 推社区评测挑战黑盒排行榜，开源生态评测标准可能改变

01:40

Hugging Face：Blog（RSS）

精选73

H公司新模型Holo2在UI本地化领域取得领先

H公司在Hugging Face发布博客，正式推出新一代模型Holo2。该模型在用户界面本地化任务上表现突出，实现了技术领先。其核心改进在于显著提升了多语言UI元素的识别与适配能力，能够更精准地处理图标、布局、文本标签等组件的文化适配与翻译。这一进展有望帮助全球应用和软件更高效地实现界面本地化，降低跨区域运营成本。

Hugging Face 多模态模型发布

推荐理由：UI本地化领域新标杆，开发者可关注其多模态能力。

2月3日

23:03

Hugging Face：Blog（RSS）

精选80

全球开源AI生态系统的未来：从 DeepSeek 到 AI+

Hugging Face 在其官方博客发布文章，展望了全球开源人工智能生态系统的发展路径与未来趋势。文章以 DeepSeek 等代表性开源模型为例，探讨了开源社区如何推动技术民主化与创新加速。核心观点指向一个更加开放、协作的“AI+”未来生态，其中开源框架、模型和工具将深度融入各行各业，降低开发门槛并促进多样化应用场景的涌现。

DeepSeek Hugging Face 开源生态现象/趋势

推荐理由：开源AI核心平台对生态走向的判断，直接影响开发者技术选型和投资方向

19:25

Hugging Face：Blog（RSS）

精选73

文本到图像模型训练设计：来自消融研究的经验

Photoroom团队通过消融研究，总结了文本到图像模型训练的关键发现：混合高质量与多样化数据、在训练中后期引入强数据增强，以及调整无分类器引导的丢弃率，能有效优化模型性能。这些结论为Stable Diffusion等模型的训练提供了实用指导。

Hugging Face 图像生成论文/研究

推荐理由：为文本到图像模型训练提供实用优化建议，帮助开发者提升模型效果。