AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 130 条
全部一手资讯X论文
标签「Hugging Face」清除
2月20日周五
08:00Hugging Face:Blog(RSS)58使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型
2月18日周三
08:00Hugging Face:Blog(RSS)78精选使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用
2月12日周四
08:00Hugging Face:Blog(RSS)83精选实践中的OpenEnv:在真实环境中评估工具使用智能体
2月9日周一
08:00Hugging Face:Blog(RSS)76精选Transformers.js v4:现已在 NPM 上发布!
2月6日周五
15:32美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型
00:52Hugging Face:Blog(RSS)60ServiceNow AI 发布 SyGra Studio:低代码知识图谱构建平台
2月4日周三
08:00Hugging Face:Blog(RSS)76精选Community Evals:因为我们不再信任黑箱排行榜胜过社区
01:40Hugging Face:Blog(RSS)73精选H公司新模型Holo2在UI本地化领域取得领先
2月3日周二
23:03Hugging Face:Blog(RSS)80精选全球开源AI生态系统的未来:从 DeepSeek 到 AI+
19:25Hugging Face:Blog(RSS)73精选文本到图像模型训练设计:来自消融研究的经验
17:46美团 LongCat:HuggingFace 新模型美团-longcat/LongCat-Image-Edit-Turbo
1月29日周四
08:00Hugging Face:Blog(RSS)63发布 Daggr:以编程方式链接应用,以可视化方式进行检查
1月27日周二
18:26Hugging Face:Blog(RSS)60Alyah ⭐️: 迈向对阿拉伯语大语言模型(LLaMA、GPT、Claude等)阿联酋方言能力的稳健评估
16:03美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite
09:53Hugging Face:Blog(RSS)83精选解锁GPT-OSS的智能体强化学习训练:一项实践回顾
1月23日周五
10:50美团 LongCat:HuggingFace 新模型美团 LongCat 发布 Flash-Thinking-ZigZag 模型
1月22日周四
01:05Nathan Lambert:Interconnects(RSS)精选精通 Agents
1月20日周二
23:02Hugging Face:Blog(RSS)58"DeepSeek时刻"一周年
08:00Hugging Face:Blog(RSS)73精选Overworld发布实时交互式视频扩散模型Waypoint-1
1月14日周三
18:44美团 LongCat:HuggingFace 新模型精选美团LongCat发布重思考模式总结模型
12月23日周二
22:07Hugging Face:Blog(RSS)66AprielGuard:现代大语言模型系统的安全与对抗鲁棒性护栏
12月18日周四
08:00Hugging Face:Blog(RSS)73精选Transformers v5 中的分词:更简单、清晰与模块化
12月17日周三
21:22Hugging Face:Blog(RSS)66开放评估标准:使用NeMo Evaluator对NVIDIA Nemotron 3 Nano进行基准测试
12月16日周二
00:01Hugging Face:Blog(RSS)83精选CUGA 登陆 Hugging Face:普及可配置的通用 AI 智能体
12月13日周六
17:03美团 LongCat:HuggingFace 新模型meituan-longcat/LongCat-Video-Avatar 视频化身项目
12月5日周五
15:34美团 LongCat:HuggingFace 新模型美团 LongCat-Image-Edit 图像编辑项目
08:00Hugging Face:Blog(RSS)76精选介绍 swift-huggingface:完整的 Hugging Face Swift 客户端
12月4日周四
21:02美团 LongCat:HuggingFace 新模型美团 LongCat-Image-Dev 开源图像项目
20:38美团 LongCat:HuggingFace 新模型美团-longcat/LongCat-Image
08:00Hugging Face:Blog(RSS)76精选利用Claude微调开源大语言模型的新途径
08:00Hugging Face:Blog(RSS)66DeepMath: 一个基于 smolagents 的轻量级数学推理智能体
12月1日周一
08:00Hugging Face:Blog(RSS)93精选Transformers v5:以简化模型定义驱动AI生态
11月25日周二
08:00Hugging Face:Blog(RSS)76精选从第一性原理看连续批处理
08:00Hugging Face:Blog(RSS)80精选Diffusers 集成 FLUX-2 模型
01:40Hugging Face:Blog(RSS)83精选构建深度研究智能体:实现顶尖水平的经验
00:08Hugging Face:Blog(RSS)73精选OVHcloud 成为 Hugging Face 官方推理服务提供商
11月21日周五
08:00Hugging Face:Blog(RSS)83精选Open ASR 排行榜新增多语言与长格式赛道,揭示模型性能新挑战
08:00Hugging Face:Blog(RSS)80精选RapidFire AI 实现20倍更快的 TRL 微调
11月19日周三
13:19Hugging Face:Blog(RSS)78精选Apriel-H1:蒸馏高效推理模型的关键要素
11月17日周一
08:00Hugging Face:Blog(RSS)73精选使用Hugging Face轻松构建和共享ROCm内核
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
2月20日
08:00
Hugging Face:Blog(RSS)
58
使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型

Hugging Face 宣布通过其平台提供免费 AI 模型训练服务,用户可结合 Unsloth 高效训练工具与 Hugging Face Jobs 功能,无需支付费用。该举措旨在降低 AI 开发门槛,推动开源开放科学,促进人工智能技术的民主化进程。核心变化在于将原先需付费或自建基础设施的训练流程,整合为平台内可直接调用的免费资源,显著减少开发者的时间和经济成本。

Hugging Face教程/实践数据/训练
2月18日
08:00
Hugging Face:Blog(RSS)
精选78
使用 Gradio 的 gr.HTML 组件一键构建任意 Web 应用

Gradio 的 gr.HTML 组件允许开发者通过单一 Python 文件快速构建和部署交互式 Web 应用,无需构建步骤。它通过 html、css 和 js_on_load 三个模板,将 Python 状态注入前端并实现与 JavaScript 的双向同步。应用示例涵盖生产力工具(如像素艺术番茄钟)、商业应用(如可拖拽看板)、创意组件(如抽奖转盘)以及专业的 ML 应用(如目标检测查看器)。组件可子类化复用,并能直接集成到模型流水线中,借助快速重载模式,从构思到部署仅需数秒。

Hugging Face产品更新部署/工程

推荐理由:ML 开发者可快速构建自定义 Web 应用,单文件部署,无需前端经验。
2月12日
08:00
Hugging Face:Blog(RSS)
精选83
实践中的OpenEnv:在真实环境中评估工具使用智能体

Meta与Hugging Face联合推出开源评估框架OpenEnv,旨在标准化智能体与真实系统的交互。Turing公司贡献了生产级“Calendar Gym”环境,用于在权限控制、时间推理等现实约束下研究工具使用智能体。该框架采用类似Gymnasium的API,通过标准接口连接真实工具,将评估重点从受控演示转向真实世界可靠性。日历系统因涉及多用户、多步骤工作流等复杂性,成为评估智能体实际能力的强大测试平台。

智能体Hugging FaceMCP/工具Meta

推荐理由:提供生产级基准测试,帮助开发者评估和改进 AI 代理在复杂环境中的表现。
2月9日
08:00
Hugging Face:Blog(RSS)
精选76
Transformers.js v4:现已在 NPM 上发布!

Transformers.js 发布第四个主要版本 v4,该版本现已通过 NPM 包管理器提供。这一更新延续了项目通过开源与开放科学推动人工智能技术进步与普及的使命,使开发者能够更便捷地获取并在项目中集成这一机器学习库。

Hugging Face开源/仓库端侧部署/工程

推荐理由:浏览器和 Node.js 直接跑 HF 模型的大版本升级,前端开发者可零门槛接入 AI
2月6日
15:32
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型

美团 LongCat 团队发布 LongCat-Flash-Lite-FP8 模型。该版本采用 FP8(8位浮点)精度格式,属于 Flash-Lite 轻量化系列,旨在提升推理效率并降低显存占用。目前公开信息仅包含平台默认标语,具体参数规模、基准测试成绩及技术细节有待进一步披露。

Hugging Face模型发布端侧部署/工程
00:52
Hugging Face:Blog(RSS)
60
ServiceNow AI 发布 SyGra Studio:低代码知识图谱构建平台

ServiceNow AI 在 Hugging Face 上推出了 SyGra Studio,这是一个低代码平台,旨在简化知识图谱的构建、可视化与分析。该平台允许用户通过直观界面整合多源数据,并支持与 GPT、Claude 等大语言模型集成,以增强语义理解和推理能力,显著降低了领域专家构建知识图谱的技术门槛。

Hugging Face开源/仓库部署/工程
2月4日
08:00
Hugging Face:Blog(RSS)
精选76
Community Evals:因为我们不再信任黑箱排行榜胜过社区

LMSys 推出了社区驱动的评估框架 Community Evals,旨在通过开源和开放科学推进人工智能民主化。该框架允许社区贡献和审查评估案例,以透明、可复现的方式测试模型。此举旨在改变依赖少数机构“黑箱”排行榜的现状,让更广泛的社区参与定义和衡量AI模型的能力与价值。

Hugging Face开源生态评测/基准

推荐理由:Hugging Face 推社区评测挑战黑盒排行榜,开源生态评测标准可能改变
01:40
Hugging Face:Blog(RSS)
精选73
H公司新模型Holo2在UI本地化领域取得领先

H公司在Hugging Face发布博客,正式推出新一代模型Holo2。该模型在用户界面本地化任务上表现突出,实现了技术领先。其核心改进在于显著提升了多语言UI元素的识别与适配能力,能够更精准地处理图标、布局、文本标签等组件的文化适配与翻译。这一进展有望帮助全球应用和软件更高效地实现界面本地化,降低跨区域运营成本。

Hugging Face多模态模型发布

推荐理由:UI本地化领域新标杆,开发者可关注其多模态能力。
2月3日
23:03
Hugging Face:Blog(RSS)
精选80
全球开源AI生态系统的未来:从 DeepSeek 到 AI+

Hugging Face 在其官方博客发布文章,展望了全球开源人工智能生态系统的发展路径与未来趋势。文章以 DeepSeek 等代表性开源模型为例,探讨了开源社区如何推动技术民主化与创新加速。核心观点指向一个更加开放、协作的“AI+”未来生态,其中开源框架、模型和工具将深度融入各行各业,降低开发门槛并促进多样化应用场景的涌现。

DeepSeekHugging Face开源生态现象/趋势

推荐理由:开源AI核心平台对生态走向的判断,直接影响开发者技术选型和投资方向
19:25
Hugging Face:Blog(RSS)
精选73
文本到图像模型训练设计:来自消融研究的经验

Photoroom团队通过消融研究,总结了文本到图像模型训练的关键发现:混合高质量与多样化数据、在训练中后期引入强数据增强,以及调整无分类器引导的丢弃率,能有效优化模型性能。这些结论为Stable Diffusion等模型的训练提供了实用指导。

Hugging Face图像生成论文/研究

推荐理由:为文本到图像模型训练提供实用优化建议,帮助开发者提升模型效果。
17:46
美团 LongCat:HuggingFace 新模型
美团-longcat/LongCat-Image-Edit-Turbo

美团-longcat发布LongCat-Image-Edit-Turbo图像编辑模型,秉持开源与开放科学理念推进人工智能技术的普及。该项目专注于图像编辑领域,旨在提供高效的图像处理能力。目前公开信息主要阐述项目愿景与使命,具体技术参数、性能指标及版本更新细节有待进一步披露。

Hugging Face图像生成模型发布
1月29日
08:00
Hugging Face:Blog(RSS)
63
发布 Daggr:以编程方式链接应用,以可视化方式进行检查

Meta AI 团队发布了开源工具 Daggr,旨在通过编程方式链接不同的 AI 应用,并支持对工作流进行可视化检查与调试。该工具允许开发者将多个模型(如 GPT、Claude、LLaMA)和数据处理步骤串联成自动化流程,同时提供直观的图形界面来监控数据流转和状态变化。此举是其通过开源与开放科学推进人工智能民主化进程的一部分。

智能体Hugging Face产品更新部署/工程
1月27日
18:26
Hugging Face:Blog(RSS)
60
Alyah ⭐️: 迈向对阿拉伯语大语言模型(LLaMA、GPT、Claude等)阿联酋方言能力的稳健评估

阿联酋技术创新研究院在Hugging Face发布博客,正式推出Alyah评估框架,专门用于系统评估各类阿拉伯语大语言模型在理解与生成阿联酋方言方面的能力。该框架旨在解决当前阿拉伯语评估中标准方言主导、忽视地区方言多样性的问题。Alyah包含一个精心构建的基准数据集,涵盖多种方言语言现象和实际应用场景,为衡量模型在阿联酋方言上的真实性能提供了首个系统化、可复现的评估标准。

Hugging Face评测/基准
16:03
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Lite

美团 LongCat 团队发布开源模型 LongCat-Flash-Lite,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 应用门槛,为开发者社区提供轻量级技术基础设施,助力先进人工智能能力的广泛获取与开放协作。

Hugging Face开源生态模型发布端侧
09:53
Hugging Face:Blog(RSS)
精选83
解锁GPT-OSS的智能体强化学习训练:一项实践回顾

LinkedIn团队探索了将GPT-OSS模型作为智能体应用核心进行强化学习的可行性。实验发现,由于GPT-OSS采用的混合专家架构在两次前向传播中可能产生路由差异,导致在同策略PPO训练中出现重要性采样比率偏离、KL散度爆炸及奖励不增长的问题。团队通过一个关键修复——在同策略条件下强制将旧对数概率设置为新计算值(并分离梯度),确保了重要性采样比率为1,从而恢复了PPO同策略训练的完整性。该修复方案适用于GPT-OSS-20B及GPT-OSS-120B模型。

智能体Hugging Face教程/实践数据/训练

推荐理由:为MoE模型RL训练提供实用调试方案,提升代理AI开发效率。
1月23日
10:50
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 Flash-Thinking-ZigZag 模型

美团 LongCat 团队发布 Flash-Thinking-ZigZag 模型,延续通过开源与开放科学推进人工智能民主化的技术路线。该项目致力于降低 AI 应用门槛,以开源方式使先进技术更广泛地惠及开发者社区,推动 AI 技术的普及与可持续发展。

Hugging Face开源生态推理模型发布
1月22日
01:05
Nathan Lambert:Interconnects(RSS)
精选
精通 Agents

AI Agents 的能力正逼近关键临界点,其性能飞跃已超出传统工作模式的承载范围。这要求从业者必须重新界定工作范畴、重构项目管理流程并革新任务执行策略。从需求规划到交付标准,现有方法论面临全面调整,组织与个人亟需掌握与智能体协作的新范式,以适应这一技术变革带来的深层影响。

智能体Hugging Face大佬观点

推荐理由:Agent工具迫使开发者重构工作流,资深研究者分享进阶路径
1月20日
23:02
Hugging Face:Blog(RSS)
58
"DeepSeek时刻"一周年

Hugging Face在其官方博客发布文章,回顾“DeepSeek时刻”过去一年的影响。文章指出,自DeepSeek系列模型发布以来,开源大模型生态发生了显著变化。模型能力快速逼近甚至在某些任务上超越了闭源模型,社区参与度和模型下载量均创下新高。这一趋势降低了AI技术的使用门槛,并推动了更多商业化应用的探索。开源与闭源模型的竞争格局正在被重塑。

DeepSeekHugging Face现象/趋势
08:00
Hugging Face:Blog(RSS)
精选73
Overworld发布实时交互式视频扩散模型Waypoint-1

Overworld推出实时交互式视频扩散模型Waypoint-1,用户可通过文本、鼠标和键盘实时控制生成可步入的虚拟世界。该模型基于帧因果校正流变换器架构,在1万小时游戏视频及对应控制数据上训练,从一开始就专注于交互体验,支持零延迟的自由操控。其配套的高性能推理库WorldEngine在消费级硬件上可实现流畅运行,例如Waypoint-1-Small在RTX 5090上能以30 FPS(4步去噪)或60 FPS(2步去噪)生成画面。模型采用扩散强制预训练和自我强制后训练来确保生成长序列的稳定性。

智能体Hugging Face模型发布视频

推荐理由:零延迟交互式视频生成,游戏和创意应用开发者的福音。
1月14日
18:44
美团 LongCat:HuggingFace 新模型
精选
美团LongCat发布重思考模式总结模型

美团LongCat推出基于5600亿参数MoE架构大模型LongCat-Flash-Thinking-2601的重思考模式(Heavy Thinking Mode),并发布LongCat-HeavyModel-Summary模型。该模式通过并行思考与总结两阶段协同扩展推理能力:前者以高温度并行生成多路径扩展宽度,后者将精炼轨迹递归反馈形成迭代循环延伸深度。模型经额外强化学习优化总结能力,已在Longcat AI平台上线。

Hugging Face推理模型发布
关联讨论 1 条美团 LongCat:HuggingFace 新模型
推荐理由:美团开源 560B 参数 MoE 推理模型,Heavy Thinking 模式支持并行多路径探索,已上线可体验
12月23日
22:07
Hugging Face:Blog(RSS)
66
AprielGuard:现代大语言模型系统的安全与对抗鲁棒性护栏

ServiceNow AI团队在Hugging Face发布了AprielGuard框架。该框架专为提升LLM在生产环境中的安全性而设计,通过集成多层检测与过滤机制,防御对抗性攻击和恶意输入,以增强系统的整体稳健性。

Hugging Face安全/对齐部署/工程
12月18日
08:00
Hugging Face:Blog(RSS)
精选73
Transformers v5 中的分词:更简单、清晰与模块化

Transformers v5 发布了全新的分词处理架构,核心变化是引入了更简单、统一的 API 设计,将分词器、后处理器和解码器模块化。新版移除了大量遗留代码,使代码库体积减少了约 40%,并显著提升了处理长文本和特殊 token 的灵活性。这一改进旨在降低开发者使用门槛,同时为各类大语言模型(如 GPT、Claude、LLaMA)提供更高效、一致的分词支持。

Hugging Face开源/仓库数据/训练

推荐理由:Transformers库tokenization模块重构,开发者可更高效处理文本数据。
12月17日
21:22
Hugging Face:Blog(RSS)
66
开放评估标准:使用NeMo Evaluator对NVIDIA Nemotron 3 Nano进行基准测试

NVIDIA在Hugging Face发布博客,介绍Nemotron 3 Nano模型,并通过NeMo Evaluator工具进行开放标准基准测试。评估覆盖代码生成、数学推理和常识问答等任务,以透明、可复现的方式量化模型性能,体现NVIDIA推动开源评估生态的努力。

Hugging Face评测/基准部署/工程
12月16日
00:01
Hugging Face:Blog(RSS)
精选83
CUGA 登陆 Hugging Face:普及可配置的通用 AI 智能体

开源可配置通用智能体 CUGA 现已集成至 Hugging Face Spaces,便于开发者便捷实验。该智能体在复杂任务基准测试中表现卓越,在包含 457 个 API、750 个真实任务的 AppWorld 基准排名第一,在 WebArena 基准也位居前列。其核心提供可配置的推理模式以平衡性能与成本,支持计算机使用与多工具无缝集成,并能与 Langflow 结合进行低代码工作流设计。采用 Apache 2.0 许可的 CUGA 支持多种开源模型,在高性能推理平台(如 Groq)上运行能显著提升效率。

智能体Hugging FaceMCP/工具开源/仓库

推荐理由:开源AI代理框架性能领先,集成Hugging Face和Langflow,开发者可快速构建复杂任务。
12月13日
17:03
美团 LongCat:HuggingFace 新模型
meituan-longcat/LongCat-Video-Avatar 视频化身项目

meituan-longcat 发布 LongCat-Video-Avatar 视频数字人项目,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在打破视频化身技术壁垒,将先进的 AI 能力开放给更广泛的开发者社区,推动前沿技术的平民化应用与生态发展。

Hugging Face模型发布视频
12月5日
15:34
美团 LongCat:HuggingFace 新模型
美团 LongCat-Image-Edit 图像编辑项目

美团发布 LongCat-Image-Edit 图像编辑项目,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛,通过开放协作促进全球开发者共同参与技术创新,推动先进图像编辑能力的广泛可及。

Hugging Face图像生成模型发布
08:00
Hugging Face:Blog(RSS)
精选76
介绍 swift-huggingface:完整的 Hugging Face Swift 客户端

swift-huggingface 是一个全新的 Swift 客户端,旨在彻底解决旧库下载模型缓慢、不可靠且不支持断点续传的问题。它提供完整的 Hub API 覆盖,核心改进包括具备进度跟踪和断点续传的可靠下载、与 Python 生态共享缓存以避免重复下载,以及通过灵活的 TokenProvider 模式简化身份验证。该库现已独立发布,并将很快集成到 swift-transformers 中取代原有实现,未来还将支持 Xet 存储后端以实现更快的下载。

Hugging Face开源/仓库部署/工程

推荐理由:Swift 开发者可无缝集成 Hugging Face 模型,下载更可靠且与 Python 共享缓存。
12月4日
21:02
美团 LongCat:HuggingFace 新模型
美团 LongCat-Image-Dev 开源图像项目

美团发布 LongCat-Image-Dev 开源项目,致力于通过开源和开放科学推进人工智能技术的普及与民主化。该项目作为 LongCat 系列的图像开发版本,旨在降低 AI 技术门槛,促进全球开发者协作创新,体现了美团在人工智能领域拥抱开源生态的战略布局。

Hugging Face图像生成模型发布
20:38
美团 LongCat:HuggingFace 新模型
美团-longcat/LongCat-Image

美团-longcat 推出 LongCat-Image 开源项目,致力于通过开源协作与开放科学研究推进人工智能技术的进步与民主化。该项目旨在降低 AI 技术门槛,打破技术壁垒,让先进的 AI 能力更加普惠可及,体现了通过开放生态促进 AI 技术普及的战略愿景。

Hugging Face图像生成模型发布
08:00
Hugging Face:Blog(RSS)
精选76
利用Claude微调开源大语言模型的新途径

Anthropic的研究人员探索了一种新方法:使用其强大的闭源AI助手Claude来生成高质量的指令遵循数据,并用这些数据对较小的开源模型(如LLaMA系列)进行监督微调。这项实验旨在展示如何利用尖端闭源模型的能力来指导和改进可公开访问的开源模型性能,从而推动AI技术的进步与民主化。

AnthropicHugging Face教程/实践数据/训练

推荐理由:用闭源模型蒸馏能力给开源模型,一条低成本微调的新路径值得关注
08:00
Hugging Face:Blog(RSS)
66
DeepMath: 一个基于 smolagents 的轻量级数学推理智能体

研究团队发布了 DeepMath,一个轻量级的数学推理智能体。该智能体基于 smolagents 框架构建,旨在提升模型解决复杂数学问题的能力。DeepMath 的设计强调轻量化,力求在保持高效推理性能的同时降低计算资源消耗。其发布是团队通过开源与开放科学推动人工智能技术发展与普及的举措之一。

智能体Hugging Face开源/仓库推理
12月1日
08:00
Hugging Face:Blog(RSS)
精选93
Transformers v5:以简化模型定义驱动AI生态

Transformers v5正式发布,其每日pip安装量从v4的2万次大幅提升至300万次以上,总安装量突破12亿次。模型架构数量从40个扩展至超400个,Hub上兼容的模型检查点从约1,000个增至75万个。新版本聚焦于简化模型定义、训练、推理与生产部署,通过引入AttentionInterface等模块化设计,显著降低了代码贡献与维护成本。此外,库将明确以PyTorch为唯一后端,逐步淘汰Flax/TensorFlow支持,并简化分词处理,以推动标准化与生态兼容性。

Hugging Face开源/仓库部署/工程

推荐理由:Transformers v5 大幅简化模型集成,提升训练推理效率,开发者可快速上手最新 AI 模型。
11月25日
08:00
Hugging Face:Blog(RSS)
精选76
从第一性原理看连续批处理

连续批处理是优化大型语言模型推理吞吐量的核心技术,通过并行处理多个对话并在生成完成后动态交换任务,以最大化硬件利用率。从注意力机制和KV缓存的基础原理出发,文章推导了如何通过优化批处理提升性能。注意力层具有二次复杂度,但连续批处理允许查询、键和值张量容纳不同长度的令牌序列,从而同时处理预填充和解码阶段。该技术能显著降低生成每个令牌的计算成本,适用于高负载服务场景,提升响应速度。

Hugging Face推理教程/实践部署/工程

推荐理由:深入理解LLM推理优化原理,助力高效模型部署。
08:00
Hugging Face:Blog(RSS)
精选80
Diffusers 集成 FLUX-2 模型

Hugging Face 的 Diffusers 库正式集成 Black Forest Labs 开发的 FLUX-2 文生图模型。该模型拥有 120 亿参数,采用多模态扩散 Transformer 架构,在图像质量、提示遵循和分辨率方面表现优异,支持生成 1024x1024 像素图像。此次集成让开发者能通过 Diffusers API 便捷使用这一先进模型。

Hugging Face图像生成模型发布

推荐理由:FLUX-2 图像生成模型正式进入 Diffusers 生态,本地部署和微调更便捷
01:40
Hugging Face:Blog(RSS)
精选83
构建深度研究智能体:实现顶尖水平的经验

Tavily团队因模型迭代重建了深度研究系统,核心是从工作流转向智能体架构,并聚焦上下文工程。通过Tavily Advanced Search进行上下文管理的网络检索,高效获取高相关度内容,避免信息过载。智能体设计模仿人类研究模式:收集信息、提炼要点、决策下一步,仅在生成最终交付物时引用原始资料,大幅减少令牌消耗,实现线性增长而非传统二次方增长。团队遵循简化编排逻辑、关注模型与工具优化方向、强化上下文工程等原则,以构建能随模型进化而持续改进的智能体系统。

智能体Hugging Face教程/实践部署/工程

推荐理由:分享构建高效 AI 代理的实战技巧,优化上下文工程以提升性能。
00:08
Hugging Face:Blog(RSS)
精选73
OVHcloud 成为 Hugging Face 官方推理服务提供商

OVHcloud 现已正式加入 Hugging Face Hub 的推理服务提供商生态。用户可直接在模型页面使用其全托管、无服务器化的 AI 端点服务,便捷调用 gpt-oss、Qwen3 等热门开源模型。该服务基于欧洲数据中心,保障数据主权与低延迟,首 token 响应时间低于 200 毫秒,并支持结构化输出等高级功能。定价为每百万 token 0.04 欧元起,用户可选择使用自定义 API 密钥或通过 Hugging Face 账户路由请求并计费。

Hugging Face产品更新部署/工程

推荐理由:欧洲开发者可低成本合规访问前沿AI模型,推理选项更丰富。
11月21日
08:00
Hugging Face:Blog(RSS)
精选83
Open ASR 排行榜新增多语言与长格式赛道,揭示模型性能新挑战

Hugging Face 的 Open ASR 排行榜新增多语言和长格式语音识别评估赛道。多语言赛道涵盖8种语言,长格式赛道则测试模型处理连续数分钟语音的能力。新榜单显示,领先模型在多语言任务上的词错误率平均比专用单语模型高约15%,在长格式任务上错误率可能上升超20%,凸显了模型在实际应用中的泛化能力仍面临严峻挑战。

Hugging Face评测/基准语音

推荐理由:ASR排行榜新增多语言和长形式评估,助力开发者优化语音应用。
08:00
Hugging Face:Blog(RSS)
精选80
RapidFire AI 实现20倍更快的 TRL 微调

RapidFire AI 发布了一套加速 TRL 微调的工具,通过自适应分块调度方案,允许在单个或多个 GPU 上并发启动多个训练配置并实时比较。内部基准测试显示,实验吞吐量比顺序执行高出约 16 至 24 倍。该工具提供即插即用的 TRL 配置包装器、分块并发训练、支持实时停止/恢复/克隆修改的交互式控制操作、自动多 GPU 编排以及 MLflow 仪表板,使用户能快速筛选最优配置,极大提升微调效率。

Hugging Face开源/仓库数据/训练部署/工程

推荐理由:开发者可并发测试多个微调配置,大幅提升实验效率。
11月19日
13:19
Hugging Face:Blog(RSS)
精选78
Apriel-H1:蒸馏高效推理模型的关键要素

ServiceNow-AI在Hugging Face发布博客,介绍了其提出的Apriel-H1方法,该方法通过知识蒸馏技术有效提升小型模型的推理能力。该方法的核心在于从大型模型中提取并转移复杂的推理路径,使蒸馏后的小模型在多项推理任务上表现显著提升,同时保持高效的部署性能。这一技术为在资源受限环境中部署高性能推理模型提供了新思路。

Hugging Face推理数据/训练模型发布

推荐理由:新蒸馏方法可能大幅降低推理模型部署成本,开发者可借鉴实践。
11月17日
08:00
Hugging Face:Blog(RSS)
精选73
使用Hugging Face轻松构建和共享ROCm内核

Hugging Face的kernels库简化了高性能深度学习内核的构建与共享,支持CUDA、ROCm等多种后端。本文以ROCm兼容内核为例,展示如何利用kernel-builder工具构建、测试并共享内核。以RadeonFlow的GEMM内核为具体案例,该内核是针对AMD Instinct MI300X GPU优化的FP8块状矩阵乘法实现,采用e4m3fnuz浮点格式和每块缩放因子以保持低精度计算准确性,并在2025年AMD开发者挑战赛中获最高奖。指南涵盖项目设置、构建配置及通过kernels社区分享的完整步骤。

Hugging Face开源生态教程/实践部署/工程

推荐理由:AMD GPU开发者可快速上手构建高性能AI内核,提升部署效率。
‹ 上一页
1234
下一页 ›