AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Hugging Face」清除
3月31日周二
16:23Hugging Face:Blog(RSS)83精选以165美元成本训练25个物种的mRNA语言模型:构建从结构预测到密码子优化的AI流程
08:00Hugging Face:Blog(RSS)58TRL v1.0:与领域同步发展的后训练库
3月27日周五
08:00Hugging Face:Blog(RSS)43解放你的OpenClaw:致力于通过开源与开放科学推动AI民主化
3月25日周三
21:18美团 LongCat:HuggingFace 新模型美团 LongCat-Next
3月24日周二
10:01Hugging Face:Blog(RSS)78精选全新语音智能体评估框架EVA发布
3月21日周六
03:38Hugging Face:Blog(RSS)70精选一日之内构建领域特定嵌入模型
3月20日周五
12:04美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Prover
3月18日周三
00:37Hugging Face:Blog(RSS)78精选Hugging Face开源现状:2026年春季
3月17日周二
20:33Hugging Face:Blog(RSS)83精选Holotron-12B - 高吞吐计算机使用智能体
3月10日周二
08:00Hugging Face:Blog(RSS)83精选Hugging Face Hub 正式推出 Storage Buckets 存储服务
3月9日周一
08:00Hugging Face:Blog(RSS)71精选LeRobot v0.5.0: 扩展每一个维度
3月5日周四
22:16Hugging Face:Blog(RSS)73精选将机器人AI引入嵌入式平台:数据集记录、VLA微调与设备端优化
08:00Hugging Face:Blog(RSS)53介绍Modular Diffusers--扩散流程的可组合构建模块
2月24日周二
08:00HuggingFace Daily Papers(社区热门论文)精选屏幕上的图灵测试:移动GUI代理人性化基准
2月20日周五
08:00Hugging Face:Blog(RSS)58使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型
2月18日周三
08:00Hugging Face:Blog(RSS)78精选使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用
2月12日周四
08:00Hugging Face:Blog(RSS)83精选实践中的OpenEnv:在真实环境中评估工具使用智能体
2月9日周一
08:00Hugging Face:Blog(RSS)76精选Transformers.js v4:现已在 NPM 上发布!
2月6日周五
15:32美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型
00:52Hugging Face:Blog(RSS)60ServiceNow AI 发布 SyGra Studio:低代码知识图谱构建平台
2月4日周三
08:00Hugging Face:Blog(RSS)76精选Community Evals:因为我们不再信任黑箱排行榜胜过社区
01:40Hugging Face:Blog(RSS)73精选H公司新模型Holo2在UI本地化领域取得领先
2月3日周二
23:03Hugging Face:Blog(RSS)80精选全球开源AI生态系统的未来:从 DeepSeek 到 AI+
19:25Hugging Face:Blog(RSS)73精选文本到图像模型训练设计:来自消融研究的经验
17:46美团 LongCat:HuggingFace 新模型美团-longcat/LongCat-Image-Edit-Turbo
1月29日周四
08:00Hugging Face:Blog(RSS)63发布 Daggr:以编程方式链接应用,以可视化方式进行检查
1月27日周二
18:26Hugging Face:Blog(RSS)60Alyah ⭐️: 迈向对阿拉伯语大语言模型(LLaMA、GPT、Claude等)阿联酋方言能力的稳健评估
16:03美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite
09:53Hugging Face:Blog(RSS)83精选解锁GPT-OSS的智能体强化学习训练:一项实践回顾
1月23日周五
10:50美团 LongCat:HuggingFace 新模型美团 LongCat 发布 Flash-Thinking-ZigZag 模型
1月22日周四
01:05Nathan Lambert:Interconnects(RSS)精选精通 Agents
1月20日周二
23:02Hugging Face:Blog(RSS)58"DeepSeek时刻"一周年
08:00Hugging Face:Blog(RSS)73精选Overworld发布实时交互式视频扩散模型Waypoint-1
1月14日周三
18:44美团 LongCat:HuggingFace 新模型精选美团LongCat发布重思考模式总结模型
12月23日周二
22:07Hugging Face:Blog(RSS)66AprielGuard:现代大语言模型系统的安全与对抗鲁棒性护栏
12月18日周四
08:00Hugging Face:Blog(RSS)73精选Transformers v5 中的分词:更简单、清晰与模块化
12月17日周三
21:22Hugging Face:Blog(RSS)66开放评估标准:使用NeMo Evaluator对NVIDIA Nemotron 3 Nano进行基准测试
12月16日周二
00:01Hugging Face:Blog(RSS)83精选CUGA 登陆 Hugging Face:普及可配置的通用 AI 智能体
12月13日周六
17:03美团 LongCat:HuggingFace 新模型meituan-longcat/LongCat-Video-Avatar 视频化身项目
12月5日周五
15:34美团 LongCat:HuggingFace 新模型美团 LongCat-Image-Edit 图像编辑项目
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
3月31日
16:23
Hugging Face:Blog(RSS)
精选83
以165美元成本训练25个物种的mRNA语言模型:构建从结构预测到密码子优化的AI流程

OpenMed团队构建了一个覆盖蛋白质结构预测、序列设计和密码子优化的端到端AI流程。在密码子优化环节,CodonRoBERTa-large-v2模型以4.10的困惑度和0.40的斯皮尔曼CAI相关性显著优于其他架构。研究将训练扩展至25个物种,仅用55个GPU小时训练了4个生产级模型,并建立了独特的物种条件化系统,实现了从蛋白质概念到合成就绪DNA序列的快速转化。完整代码与实验结果已开源。

Hugging Face开源生态数据/训练论文/研究

推荐理由:低成本开源生物AI管道,可加速蛋白质工程和药物开发。
08:00
Hugging Face:Blog(RSS)
58
TRL v1.0:与领域同步发展的后训练库

Hugging Face 正式发布 TRL v1.0,这是一个专为大语言模型后训练设计的开源库。该版本整合了 SFT、RLHF 等多种高效微调技术,提供从监督微调到人类反馈强化学习的完整工具链。新库支持与 Transformers、PEFT 等主流框架无缝集成,显著简化了模型对齐流程。此次更新旨在降低大语言模型微调门槛,推动AI技术民主化,使开发者能够更便捷地提升模型在对话、安全等方面的性能表现。

Hugging Face开源/仓库数据/训练
3月27日
08:00
Hugging Face:Blog(RSS)
43
解放你的OpenClaw:致力于通过开源与开放科学推动AI民主化

Anthropic公司发布新一代大模型Claude 3.5 Sonnet,在多项基准测试中超越前代Opus及GPT-4o等竞争对手,尤其在高级推理、知识掌握和编程能力上表现卓越。新模型处理速度提升至两倍且定价更低。同时推出的“Artifacts”功能可将生成的代码或文本在独立面板实时展示,标志着其向交互式工作空间演进。

Hugging Face其他开源生态
3月25日
21:18
美团 LongCat:HuggingFace 新模型
美团 LongCat-Next

美团开源项目 LongCat-Next 正式发布,宣称将通过开源与开放科学推进人工智能技术的普及与民主化。该项目目前仅公开使命宣言,强调降低AI技术门槛的愿景,尚未披露具体模型架构、训练数据或性能基准等技术指标,也未说明应用场景或发布时间表。

Hugging Face开源生态模型发布
3月24日
10:01
Hugging Face:Blog(RSS)
精选78
全新语音智能体评估框架EVA发布

ServiceNow AI团队在Hugging Face上发布了语音智能体评估框架EVA。该框架通过标准化测试集与多模态指标,系统评估语音助手在对话理解、任务完成及交互自然度等方面的性能,旨在量化衡量智能体在复杂真实场景下的表现,助力研究人员客观比较不同模型,推动技术优化。

智能体Hugging Face开源/仓库语音

推荐理由:提供语音代理评估标准,帮助开发者优化模型性能和测试效率。
3月21日
03:38
Hugging Face:Blog(RSS)
精选70
一日之内构建领域特定嵌入模型

英伟达在Hugging Face平台发布技术博客,分享了一种在24小时内快速构建高质量领域特定嵌入模型的方法。该方法通过结合高效微调技术与领域数据,显著提升了模型在专业任务中的语义理解与检索性能,为企业和开发者提供了低成本、高效率的定制化嵌入解决方案。

Hugging Face教程/实践数据/训练

推荐理由:一天内搞定领域专属 Embedding 微调,RAG 检索效果可显著提升
3月20日
12:04
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Prover

美团 LongCat 团队发布开源项目 LongCat-Flash-Prover,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛,促进先进技术的广泛可及性,但尚未公布具体的技术架构、功能特性及性能评估指标。

Hugging Face推理模型发布
3月18日
00:37
Hugging Face:Blog(RSS)
精选78
Hugging Face开源现状:2026年春季

Hugging Face发布了一篇关于其平台开源生态的博客文章。该文由Hugging Face官方撰写并发布在其自有平台上,内容聚焦于2026年春季的开源发展状态。文章具体分析了平台上的模型、数据集及开源社区活动趋势,但未提供详细的量化指标或具体产品发布信息。

Hugging Face开源生态现象/趋势

推荐理由:Hugging Face 季度开源生态报告,可快速掌握 AI 开源社区最新动向与趋势
3月17日
20:33
Hugging Face:Blog(RSS)
精选83
Holotron-12B - 高吞吐计算机使用智能体

H公司发布了多模态计算机使用模型Holotron-12B。该模型基于NVIDIA开源的Nemotron-Nano-12B-VL模型,使用专有数据混合进行训练,专注于在交互环境中高效感知、决策和行动。其采用混合状态空间模型与注意力机制架构,在单张H100 GPU上实现了比前代Holo2-8B高2倍以上的吞吐量,在100并发基准测试中达到每秒8900个token。在WebVoyager基准测试中,性能从基线的35.1%提升至80.5%,在定位和导航基准上也显著提升。模型已通过NVIDIA开放模型许可在Hugging Face发布。

智能体Hugging Face多模态模型发布

推荐理由:高效推理的计算机使用代理模型,适合生产部署,开发者可直接试用。
3月10日
08:00
Hugging Face:Blog(RSS)
精选83
Hugging Face Hub 正式推出 Storage Buckets 存储服务

Hugging Face Hub 发布 Storage Buckets,这是一种为机器学习工作流设计的可变、类 S3 的对象存储服务。它基于 Xet 存储后端,能对跨文件共享内容的 ML 工件进行高效去重,从而节省带宽、加速传输并降低存储成本。该服务还提供“预暖”功能,可将数据预先迁移至靠近计算资源的云区域,以提升分布式训练等场景的效率。目前支持 AWS 和 GCP,用户可通过 CLI 或 Python 库在 2 分钟内快速创建和同步存储桶。

Hugging Face产品更新数据/训练部署/工程

推荐理由:ML 开发者可高效管理训练数据和检查点,节省存储成本并加速工作流。
3月9日
08:00
Hugging Face:Blog(RSS)
精选71
LeRobot v0.5.0: 扩展每一个维度

Hugging Face 发布了 LeRobot v0.5.0 版本。该版本在数据集、模型、任务和社区四个维度上进行了全面扩展。具体包括:引入了新的现实世界和模拟数据集,推出了支持多任务学习的模型,并扩展了任务范围至移动操作和双臂协调。社区方面,提供了更易用的库、演示应用和教学资源。此次更新的核心目标是降低机器人技术的应用门槛,推动其民主化发展。

Hugging Face具身智能开源/仓库

推荐理由:开源机器人AI框架大版本更新,降低具身智能研发门槛,值得关注落地进展
3月5日
22:16
Hugging Face:Blog(RSS)
精选73
将机器人AI引入嵌入式平台:数据集记录、VLA微调与设备端优化

NXP在Hugging Face发布技术博客,详细介绍了将视觉语言动作模型应用于嵌入式机器人系统的完整流程。核心工作包括构建真实世界的机器人交互数据集,对VLA模型进行针对性微调,以及实施一系列设备端优化以实现高效部署。该方案旨在解决大型模型在资源受限的嵌入式硬件上运行的挑战,推动机器人AI在边缘端的实际应用。

Hugging Face具身智能教程/实践端侧

推荐理由:嵌入式AI开发者可掌握从数据集记录到设备端优化的全流程实践。
08:00
Hugging Face:Blog(RSS)
53
介绍Modular Diffusers--扩散流程的可组合构建模块

Hugging Face发布Modular Diffusers库,将扩散模型流程解构为独立模块(如调度器、VAE、UNet)。用户可像组合积木一样自由替换和组合组件,显著提升了模型实验的灵活性与可复现性,简化了自定义流程的创建。该库已开源,旨在支持快速创新。

Hugging Face产品更新图像生成
2月24日
08:00
HuggingFace Daily Papers(社区热门论文)
精选
屏幕上的图灵测试:移动GUI代理人性化基准

研究团队提出"屏幕图灵测试"框架,将人机交互形式化为MinMax优化问题,并发布Agent Humanization Benchmark (AHB)。基于新收集的高保真移动触摸动态数据集,发现普通LMM代理因运动学特征不自然而极易被检测。该基准量化了可模仿性与任务效用的权衡,提出的启发式噪声至数据驱动行为匹配方法,使代理在不牺牲性能的前提下实现高可模仿性,推动GUI代理从"能否完成任务"向"如何像人类一样完成"的范式转变。

智能体arXivHugging Face多模态

推荐理由:让AI操作手机更像真人,避免被平台识别封禁的实用新研究
2月20日
08:00
Hugging Face:Blog(RSS)
58
使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型

Hugging Face 宣布通过其平台提供免费 AI 模型训练服务,用户可结合 Unsloth 高效训练工具与 Hugging Face Jobs 功能,无需支付费用。该举措旨在降低 AI 开发门槛,推动开源开放科学,促进人工智能技术的民主化进程。核心变化在于将原先需付费或自建基础设施的训练流程,整合为平台内可直接调用的免费资源,显著减少开发者的时间和经济成本。

Hugging Face教程/实践数据/训练
2月18日
08:00
Hugging Face:Blog(RSS)
精选78
使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用

Gradio 的 gr.HTML 组件允许开发者通过单一 Python 文件快速构建和部署交互式 Web 应用,无需构建步骤。它通过 html、css 和 js_on_load 三个模板,将 Python 状态注入前端并实现与 JavaScript 的双向同步。应用示例涵盖生产力工具(如像素艺术番茄钟)、商业应用(如可拖拽看板)、创意组件(如抽奖转盘)以及专业的 ML 应用(如目标检测查看器)。组件可子类化复用,并能直接集成到模型流水线中,借助快速重载模式,从构思到部署仅需数秒。

Hugging Face产品更新部署/工程

推荐理由:ML 开发者可快速构建自定义 Web 应用,单文件部署,无需前端经验。
2月12日
08:00
Hugging Face:Blog(RSS)
精选83
实践中的OpenEnv:在真实环境中评估工具使用智能体

Meta与Hugging Face联合推出开源评估框架OpenEnv,旨在标准化智能体与真实系统的交互。Turing公司贡献了生产级“Calendar Gym”环境,用于在权限控制、时间推理等现实约束下研究工具使用智能体。该框架采用类似Gymnasium的API,通过标准接口连接真实工具,将评估重点从受控演示转向真实世界可靠性。日历系统因涉及多用户、多步骤工作流等复杂性,成为评估智能体实际能力的强大测试平台。

智能体Hugging FaceMCP/工具Meta

推荐理由:提供生产级基准测试,帮助开发者评估和改进 AI 代理在复杂环境中的表现。
2月9日
08:00
Hugging Face:Blog(RSS)
精选76
Transformers.js v4:现已在 NPM 上发布!

Transformers.js 发布第四个主要版本 v4,该版本现已通过 NPM 包管理器提供。这一更新延续了项目通过开源与开放科学推动人工智能技术进步与普及的使命,使开发者能够更便捷地获取并在项目中集成这一机器学习库。

Hugging Face开源/仓库端侧部署/工程

推荐理由:浏览器和 Node.js 直接跑 HF 模型的大版本升级,前端开发者可零门槛接入 AI
2月6日
15:32
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型

美团 LongCat 团队发布 LongCat-Flash-Lite-FP8 模型。该版本采用 FP8(8位浮点)精度格式,属于 Flash-Lite 轻量化系列,旨在提升推理效率并降低显存占用。目前公开信息仅包含平台默认标语,具体参数规模、基准测试成绩及技术细节有待进一步披露。

Hugging Face模型发布端侧部署/工程
00:52
Hugging Face:Blog(RSS)
60
ServiceNow AI 发布 SyGra Studio:低代码知识图谱构建平台

ServiceNow AI 在 Hugging Face 上推出了 SyGra Studio,这是一个低代码平台,旨在简化知识图谱的构建、可视化与分析。该平台允许用户通过直观界面整合多源数据,并支持与 GPT、Claude 等大语言模型集成,以增强语义理解和推理能力,显著降低了领域专家构建知识图谱的技术门槛。

Hugging Face开源/仓库部署/工程
2月4日
08:00
Hugging Face:Blog(RSS)
精选76
Community Evals:因为我们不再信任黑箱排行榜胜过社区

LMSys 推出了社区驱动的评估框架 Community Evals,旨在通过开源和开放科学推进人工智能民主化。该框架允许社区贡献和审查评估案例,以透明、可复现的方式测试模型。此举旨在改变依赖少数机构“黑箱”排行榜的现状,让更广泛的社区参与定义和衡量AI模型的能力与价值。

Hugging Face开源生态评测/基准

推荐理由:Hugging Face 推社区评测挑战黑盒排行榜,开源生态评测标准可能改变
01:40
Hugging Face:Blog(RSS)
精选73
H公司新模型Holo2在UI本地化领域取得领先

H公司在Hugging Face发布博客,正式推出新一代模型Holo2。该模型在用户界面本地化任务上表现突出,实现了技术领先。其核心改进在于显著提升了多语言UI元素的识别与适配能力,能够更精准地处理图标、布局、文本标签等组件的文化适配与翻译。这一进展有望帮助全球应用和软件更高效地实现界面本地化,降低跨区域运营成本。

Hugging Face多模态模型发布

推荐理由:UI本地化领域新标杆,开发者可关注其多模态能力。
2月3日
23:03
Hugging Face:Blog(RSS)
精选80
全球开源AI生态系统的未来:从 DeepSeek 到 AI+

Hugging Face 在其官方博客发布文章,展望了全球开源人工智能生态系统的发展路径与未来趋势。文章以 DeepSeek 等代表性开源模型为例,探讨了开源社区如何推动技术民主化与创新加速。核心观点指向一个更加开放、协作的“AI+”未来生态,其中开源框架、模型和工具将深度融入各行各业,降低开发门槛并促进多样化应用场景的涌现。

DeepSeekHugging Face开源生态现象/趋势

推荐理由:开源AI核心平台对生态走向的判断,直接影响开发者技术选型和投资方向
19:25
Hugging Face:Blog(RSS)
精选73
文本到图像模型训练设计:来自消融研究的经验

Photoroom团队通过消融研究,总结了文本到图像模型训练的关键发现:混合高质量与多样化数据、在训练中后期引入强数据增强,以及调整无分类器引导的丢弃率,能有效优化模型性能。这些结论为Stable Diffusion等模型的训练提供了实用指导。

Hugging Face图像生成论文/研究

推荐理由:为文本到图像模型训练提供实用优化建议,帮助开发者提升模型效果。
17:46
美团 LongCat:HuggingFace 新模型
美团-longcat/LongCat-Image-Edit-Turbo

美团-longcat发布LongCat-Image-Edit-Turbo图像编辑模型,秉持开源与开放科学理念推进人工智能技术的普及。该项目专注于图像编辑领域,旨在提供高效的图像处理能力。目前公开信息主要阐述项目愿景与使命,具体技术参数、性能指标及版本更新细节有待进一步披露。

Hugging Face图像生成模型发布
1月29日
08:00
Hugging Face:Blog(RSS)
63
发布 Daggr:以编程方式链接应用,以可视化方式进行检查

Meta AI 团队发布了开源工具 Daggr,旨在通过编程方式链接不同的 AI 应用,并支持对工作流进行可视化检查与调试。该工具允许开发者将多个模型(如 GPT、Claude、LLaMA)和数据处理步骤串联成自动化流程,同时提供直观的图形界面来监控数据流转和状态变化。此举是其通过开源与开放科学推进人工智能民主化进程的一部分。

智能体Hugging Face产品更新部署/工程
1月27日
18:26
Hugging Face:Blog(RSS)
60
Alyah ⭐️: 迈向对阿拉伯语大语言模型(LLaMA、GPT、Claude等)阿联酋方言能力的稳健评估

阿联酋技术创新研究院在Hugging Face发布博客,正式推出Alyah评估框架,专门用于系统评估各类阿拉伯语大语言模型在理解与生成阿联酋方言方面的能力。该框架旨在解决当前阿拉伯语评估中标准方言主导、忽视地区方言多样性的问题。Alyah包含一个精心构建的基准数据集,涵盖多种方言语言现象和实际应用场景,为衡量模型在阿联酋方言上的真实性能提供了首个系统化、可复现的评估标准。

Hugging Face评测/基准
16:03
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Lite

美团 LongCat 团队发布开源模型 LongCat-Flash-Lite,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 应用门槛,为开发者社区提供轻量级技术基础设施,助力先进人工智能能力的广泛获取与开放协作。

Hugging Face开源生态模型发布端侧
09:53
Hugging Face:Blog(RSS)
精选83
解锁GPT-OSS的智能体强化学习训练:一项实践回顾

LinkedIn团队探索了将GPT-OSS模型作为智能体应用核心进行强化学习的可行性。实验发现,由于GPT-OSS采用的混合专家架构在两次前向传播中可能产生路由差异,导致在同策略PPO训练中出现重要性采样比率偏离、KL散度爆炸及奖励不增长的问题。团队通过一个关键修复——在同策略条件下强制将旧对数概率设置为新计算值(并分离梯度),确保了重要性采样比率为1,从而恢复了PPO同策略训练的完整性。该修复方案适用于GPT-OSS-20B及GPT-OSS-120B模型。

智能体Hugging Face教程/实践数据/训练

推荐理由:为MoE模型RL训练提供实用调试方案,提升代理AI开发效率。
1月23日
10:50
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 Flash-Thinking-ZigZag 模型

美团 LongCat 团队发布 Flash-Thinking-ZigZag 模型,延续通过开源与开放科学推进人工智能民主化的技术路线。该项目致力于降低 AI 应用门槛,以开源方式使先进技术更广泛地惠及开发者社区,推动 AI 技术的普及与可持续发展。

Hugging Face开源生态推理模型发布
1月22日
01:05
Nathan Lambert:Interconnects(RSS)
精选
精通 Agents

AI Agents 的能力正逼近关键临界点,其性能飞跃已超出传统工作模式的承载范围。这要求从业者必须重新界定工作范畴、重构项目管理流程并革新任务执行策略。从需求规划到交付标准,现有方法论面临全面调整,组织与个人亟需掌握与智能体协作的新范式,以适应这一技术变革带来的深层影响。

智能体Hugging Face大佬观点

推荐理由:Agent工具迫使开发者重构工作流,资深研究者分享进阶路径
1月20日
23:02
Hugging Face:Blog(RSS)
58
"DeepSeek时刻"一周年

Hugging Face在其官方博客发布文章,回顾“DeepSeek时刻”过去一年的影响。文章指出,自DeepSeek系列模型发布以来,开源大模型生态发生了显著变化。模型能力快速逼近甚至在某些任务上超越了闭源模型,社区参与度和模型下载量均创下新高。这一趋势降低了AI技术的使用门槛,并推动了更多商业化应用的探索。开源与闭源模型的竞争格局正在被重塑。

DeepSeekHugging Face现象/趋势
08:00
Hugging Face:Blog(RSS)
精选73
Overworld发布实时交互式视频扩散模型Waypoint-1

Overworld推出实时交互式视频扩散模型Waypoint-1,用户可通过文本、鼠标和键盘实时控制生成可步入的虚拟世界。该模型基于帧因果校正流变换器架构,在1万小时游戏视频及对应控制数据上训练,从一开始就专注于交互体验,支持零延迟的自由操控。其配套的高性能推理库WorldEngine在消费级硬件上可实现流畅运行,例如Waypoint-1-Small在RTX 5090上能以30 FPS(4步去噪)或60 FPS(2步去噪)生成画面。模型采用扩散强制预训练和自我强制后训练来确保生成长序列的稳定性。

智能体Hugging Face模型发布视频

推荐理由:零延迟交互式视频生成,游戏和创意应用开发者的福音。
1月14日
18:44
美团 LongCat:HuggingFace 新模型
精选
美团LongCat发布重思考模式总结模型

美团LongCat推出基于5600亿参数MoE架构大模型LongCat-Flash-Thinking-2601的重思考模式(Heavy Thinking Mode),并发布LongCat-HeavyModel-Summary模型。该模式通过并行思考与总结两阶段协同扩展推理能力:前者以高温度并行生成多路径扩展宽度,后者将精炼轨迹递归反馈形成迭代循环延伸深度。模型经额外强化学习优化总结能力,已在Longcat AI平台上线。

Hugging Face推理模型发布
关联讨论 1 条美团 LongCat:HuggingFace 新模型
推荐理由:美团开源 560B 参数 MoE 推理模型,Heavy Thinking 模式支持并行多路径探索,已上线可体验
12月23日
22:07
Hugging Face:Blog(RSS)
66
AprielGuard:现代大语言模型系统的安全与对抗鲁棒性护栏

ServiceNow AI团队在Hugging Face发布了AprielGuard框架。该框架专为提升LLM在生产环境中的安全性而设计,通过集成多层检测与过滤机制,防御对抗性攻击和恶意输入,以增强系统的整体稳健性。

Hugging Face安全/对齐部署/工程
12月18日
08:00
Hugging Face:Blog(RSS)
精选73
Transformers v5 中的分词:更简单、清晰与模块化

Transformers v5 发布了全新的分词处理架构,核心变化是引入了更简单、统一的 API 设计,将分词器、后处理器和解码器模块化。新版移除了大量遗留代码,使代码库体积减少了约 40%,并显著提升了处理长文本和特殊 token 的灵活性。这一改进旨在降低开发者使用门槛,同时为各类大语言模型(如 GPT、Claude、LLaMA)提供更高效、一致的分词支持。

Hugging Face开源/仓库数据/训练

推荐理由:Transformers库tokenization模块重构,开发者可更高效处理文本数据。
12月17日
21:22
Hugging Face:Blog(RSS)
66
开放评估标准:使用NeMo Evaluator对NVIDIA Nemotron 3 Nano进行基准测试

NVIDIA在Hugging Face发布博客,介绍Nemotron 3 Nano模型,并通过NeMo Evaluator工具进行开放标准基准测试。评估覆盖代码生成、数学推理和常识问答等任务,以透明、可复现的方式量化模型性能,体现NVIDIA推动开源评估生态的努力。

Hugging Face评测/基准部署/工程
12月16日
00:01
Hugging Face:Blog(RSS)
精选83
CUGA 登陆 Hugging Face:普及可配置的通用 AI 智能体

开源可配置通用智能体 CUGA 现已集成至 Hugging Face Spaces,便于开发者便捷实验。该智能体在复杂任务基准测试中表现卓越,在包含 457 个 API、750 个真实任务的 AppWorld 基准排名第一,在 WebArena 基准也位居前列。其核心提供可配置的推理模式以平衡性能与成本,支持计算机使用与多工具无缝集成,并能与 Langflow 结合进行低代码工作流设计。采用 Apache 2.0 许可的 CUGA 支持多种开源模型,在高性能推理平台(如 Groq)上运行能显著提升效率。

智能体Hugging FaceMCP/工具开源/仓库

推荐理由:开源AI代理框架性能领先,集成Hugging Face和Langflow,开发者可快速构建复杂任务。
12月13日
17:03
美团 LongCat:HuggingFace 新模型
meituan-longcat/LongCat-Video-Avatar 视频化身项目

meituan-longcat 发布 LongCat-Video-Avatar 视频数字人项目,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在打破视频化身技术壁垒,将先进的 AI 能力开放给更广泛的开发者社区,推动前沿技术的平民化应用与生态发展。

Hugging Face模型发布视频
12月5日
15:34
美团 LongCat:HuggingFace 新模型
美团 LongCat-Image-Edit 图像编辑项目

美团发布 LongCat-Image-Edit 图像编辑项目,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛,通过开放协作促进全球开发者共同参与技术创新,推动先进图像编辑能力的广泛可及。

Hugging Face图像生成模型发布
‹ 上一页
1…6789
下一页 ›