AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Hugging Face」清除
12月5日周五
08:00Hugging Face:Blog(RSS)76精选介绍 swift-huggingface:完整的 Hugging Face Swift 客户端
12月4日周四
21:02美团 LongCat:HuggingFace 新模型美团 LongCat-Image-Dev 开源图像项目
20:38美团 LongCat:HuggingFace 新模型美团-longcat/LongCat-Image
08:00Hugging Face:Blog(RSS)76精选利用Claude微调开源大语言模型的新途径
08:00Hugging Face:Blog(RSS)66DeepMath: 一个基于 smolagents 的轻量级数学推理智能体
12月1日周一
08:00Hugging Face:Blog(RSS)93精选Transformers v5:以简化模型定义驱动AI生态
11月25日周二
08:00Hugging Face:Blog(RSS)76精选从第一性原理看连续批处理
08:00Hugging Face:Blog(RSS)80精选Diffusers 集成 FLUX-2 模型
01:40Hugging Face:Blog(RSS)83精选构建深度研究智能体:实现顶尖水平的经验
00:08Hugging Face:Blog(RSS)73精选OVHcloud 成为 Hugging Face 官方推理服务提供商
11月21日周五
08:00Hugging Face:Blog(RSS)83精选Open ASR 排行榜新增多语言与长格式赛道,揭示模型性能新挑战
08:00Hugging Face:Blog(RSS)80精选RapidFire AI 实现20倍更快的 TRL 微调
11月19日周三
13:19Hugging Face:Blog(RSS)78精选Apriel-H1:蒸馏高效推理模型的关键要素
11月17日周一
08:00Hugging Face:Blog(RSS)73精选使用Hugging Face轻松构建和共享ROCm内核
11月14日周五
05:37Hugging Face:Blog(RSS)58参与 AMD Open Robotics 黑客松
11月13日周四
08:00Hugging Face:Blog(RSS)88精选共建开放未来:Hugging Face与Google Cloud达成新合作
10月30日周四
18:03Hugging Face:Blog(RSS)83精选Aligning to What? Rethinking Agent Generalization in MiniMax M2
10月25日周六
00:04美团 LongCat:HuggingFace 新模型美团 LongCat-Video 项目
10月24日周五
08:48美团 LongCat:HuggingFace 新模型精选美团开源全模态模型LongCat-Flash-Omni
10月23日周四
17:42美团 LongCat:HuggingFace 新模型美团 LongCat 发布 Flash-Omni 模型
10月17日周五
11:09美团 LongCat:HuggingFace 新模型meituan-longcat 发布 LongCat-Audio-Codec
9月21日周日
16:54美团 LongCat:HuggingFace 新模型meituan-longcat 发布 LongCat-Flash-Thinking-FP8
8月29日周五
15:39美团 LongCat:HuggingFace 新模型meituan-longcat 发布 LongCat-Flash-Chat
5月23日周二
09:00EleutherAI:BlogSafetensors 通过安全审计并将成为默认格式
没有更多了
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
12月5日
08:00
Hugging Face:Blog(RSS)
精选76
介绍 swift-huggingface:完整的 Hugging Face Swift 客户端

swift-huggingface 是一个全新的 Swift 客户端,旨在彻底解决旧库下载模型缓慢、不可靠且不支持断点续传的问题。它提供完整的 Hub API 覆盖,核心改进包括具备进度跟踪和断点续传的可靠下载、与 Python 生态共享缓存以避免重复下载,以及通过灵活的 TokenProvider 模式简化身份验证。该库现已独立发布,并将很快集成到 swift-transformers 中取代原有实现,未来还将支持 Xet 存储后端以实现更快的下载。

Hugging Face开源/仓库部署/工程

推荐理由:Swift 开发者可无缝集成 Hugging Face 模型,下载更可靠且与 Python 共享缓存。
12月4日
21:02
美团 LongCat:HuggingFace 新模型
美团 LongCat-Image-Dev 开源图像项目

美团发布 LongCat-Image-Dev 开源项目,致力于通过开源和开放科学推进人工智能技术的普及与民主化。该项目作为 LongCat 系列的图像开发版本,旨在降低 AI 技术门槛,促进全球开发者协作创新,体现了美团在人工智能领域拥抱开源生态的战略布局。

Hugging Face图像生成模型发布
20:38
美团 LongCat:HuggingFace 新模型
美团-longcat/LongCat-Image

美团-longcat 推出 LongCat-Image 开源项目,致力于通过开源协作与开放科学研究推进人工智能技术的进步与民主化。该项目旨在降低 AI 技术门槛,打破技术壁垒,让先进的 AI 能力更加普惠可及,体现了通过开放生态促进 AI 技术普及的战略愿景。

Hugging Face图像生成模型发布
08:00
Hugging Face:Blog(RSS)
精选76
利用Claude微调开源大语言模型的新途径

Anthropic的研究人员探索了一种新方法:使用其强大的闭源AI助手Claude来生成高质量的指令遵循数据,并用这些数据对较小的开源模型(如LLaMA系列)进行监督微调。这项实验旨在展示如何利用尖端闭源模型的能力来指导和改进可公开访问的开源模型性能,从而推动AI技术的进步与民主化。

AnthropicHugging Face教程/实践数据/训练

推荐理由:用闭源模型蒸馏能力给开源模型,一条低成本微调的新路径值得关注
08:00
Hugging Face:Blog(RSS)
66
DeepMath: 一个基于 smolagents 的轻量级数学推理智能体

研究团队发布了 DeepMath,一个轻量级的数学推理智能体。该智能体基于 smolagents 框架构建,旨在提升模型解决复杂数学问题的能力。DeepMath 的设计强调轻量化,力求在保持高效推理性能的同时降低计算资源消耗。其发布是团队通过开源与开放科学推动人工智能技术发展与普及的举措之一。

智能体Hugging Face开源/仓库推理
12月1日
08:00
Hugging Face:Blog(RSS)
精选93
Transformers v5:以简化模型定义驱动AI生态

Transformers v5正式发布,其每日pip安装量从v4的2万次大幅提升至300万次以上,总安装量突破12亿次。模型架构数量从40个扩展至超400个,Hub上兼容的模型检查点从约1,000个增至75万个。新版本聚焦于简化模型定义、训练、推理与生产部署,通过引入AttentionInterface等模块化设计,显著降低了代码贡献与维护成本。此外,库将明确以PyTorch为唯一后端,逐步淘汰Flax/TensorFlow支持,并简化分词处理,以推动标准化与生态兼容性。

Hugging Face开源/仓库部署/工程

推荐理由:Transformers v5 大幅简化模型集成,提升训练推理效率,开发者可快速上手最新 AI 模型。
11月25日
08:00
Hugging Face:Blog(RSS)
精选76
从第一性原理看连续批处理

连续批处理是优化大型语言模型推理吞吐量的核心技术,通过并行处理多个对话并在生成完成后动态交换任务,以最大化硬件利用率。从注意力机制和KV缓存的基础原理出发,文章推导了如何通过优化批处理提升性能。注意力层具有二次复杂度,但连续批处理允许查询、键和值张量容纳不同长度的令牌序列,从而同时处理预填充和解码阶段。该技术能显著降低生成每个令牌的计算成本,适用于高负载服务场景,提升响应速度。

Hugging Face推理教程/实践部署/工程

推荐理由:深入理解LLM推理优化原理,助力高效模型部署。
08:00
Hugging Face:Blog(RSS)
精选80
Diffusers 集成 FLUX-2 模型

Hugging Face 的 Diffusers 库正式集成 Black Forest Labs 开发的 FLUX-2 文生图模型。该模型拥有 120 亿参数,采用多模态扩散 Transformer 架构,在图像质量、提示遵循和分辨率方面表现优异,支持生成 1024x1024 像素图像。此次集成让开发者能通过 Diffusers API 便捷使用这一先进模型。

Hugging Face图像生成模型发布

推荐理由:FLUX-2 图像生成模型正式进入 Diffusers 生态,本地部署和微调更便捷
01:40
Hugging Face:Blog(RSS)
精选83
构建深度研究智能体:实现顶尖水平的经验

Tavily团队因模型迭代重建了深度研究系统,核心是从工作流转向智能体架构,并聚焦上下文工程。通过Tavily Advanced Search进行上下文管理的网络检索,高效获取高相关度内容,避免信息过载。智能体设计模仿人类研究模式:收集信息、提炼要点、决策下一步,仅在生成最终交付物时引用原始资料,大幅减少令牌消耗,实现线性增长而非传统二次方增长。团队遵循简化编排逻辑、关注模型与工具优化方向、强化上下文工程等原则,以构建能随模型进化而持续改进的智能体系统。

智能体Hugging Face教程/实践部署/工程

推荐理由:分享构建高效 AI 代理的实战技巧,优化上下文工程以提升性能。
00:08
Hugging Face:Blog(RSS)
精选73
OVHcloud 成为 Hugging Face 官方推理服务提供商

OVHcloud 现已正式加入 Hugging Face Hub 的推理服务提供商生态。用户可直接在模型页面使用其全托管、无服务器化的 AI 端点服务,便捷调用 gpt-oss、Qwen3 等热门开源模型。该服务基于欧洲数据中心,保障数据主权与低延迟,首 token 响应时间低于 200 毫秒,并支持结构化输出等高级功能。定价为每百万 token 0.04 欧元起,用户可选择使用自定义 API 密钥或通过 Hugging Face 账户路由请求并计费。

Hugging Face产品更新部署/工程

推荐理由:欧洲开发者可低成本合规访问前沿AI模型,推理选项更丰富。
11月21日
08:00
Hugging Face:Blog(RSS)
精选83
Open ASR 排行榜新增多语言与长格式赛道,揭示模型性能新挑战

Hugging Face 的 Open ASR 排行榜新增多语言和长格式语音识别评估赛道。多语言赛道涵盖8种语言,长格式赛道则测试模型处理连续数分钟语音的能力。新榜单显示,领先模型在多语言任务上的词错误率平均比专用单语模型高约15%,在长格式任务上错误率可能上升超20%,凸显了模型在实际应用中的泛化能力仍面临严峻挑战。

Hugging Face评测/基准语音

推荐理由:ASR排行榜新增多语言和长形式评估,助力开发者优化语音应用。
08:00
Hugging Face:Blog(RSS)
精选80
RapidFire AI 实现20倍更快的 TRL 微调

RapidFire AI 发布了一套加速 TRL 微调的工具,通过自适应分块调度方案,允许在单个或多个 GPU 上并发启动多个训练配置并实时比较。内部基准测试显示,实验吞吐量比顺序执行高出约 16 至 24 倍。该工具提供即插即用的 TRL 配置包装器、分块并发训练、支持实时停止/恢复/克隆修改的交互式控制操作、自动多 GPU 编排以及 MLflow 仪表板,使用户能快速筛选最优配置,极大提升微调效率。

Hugging Face开源/仓库数据/训练部署/工程

推荐理由:开发者可并发测试多个微调配置,大幅提升实验效率。
11月19日
13:19
Hugging Face:Blog(RSS)
精选78
Apriel-H1:蒸馏高效推理模型的关键要素

ServiceNow-AI在Hugging Face发布博客,介绍了其提出的Apriel-H1方法,该方法通过知识蒸馏技术有效提升小型模型的推理能力。该方法的核心在于从大型模型中提取并转移复杂的推理路径,使蒸馏后的小模型在多项推理任务上表现显著提升,同时保持高效的部署性能。这一技术为在资源受限环境中部署高性能推理模型提供了新思路。

Hugging Face推理数据/训练模型发布

推荐理由:新蒸馏方法可能大幅降低推理模型部署成本,开发者可借鉴实践。
11月17日
08:00
Hugging Face:Blog(RSS)
精选73
使用Hugging Face轻松构建和共享ROCm内核

Hugging Face的kernels库简化了高性能深度学习内核的构建与共享,支持CUDA、ROCm等多种后端。本文以ROCm兼容内核为例,展示如何利用kernel-builder工具构建、测试并共享内核。以RadeonFlow的GEMM内核为具体案例,该内核是针对AMD Instinct MI300X GPU优化的FP8块状矩阵乘法实现,采用e4m3fnuz浮点格式和每块缩放因子以保持低精度计算准确性,并在2025年AMD开发者挑战赛中获最高奖。指南涵盖项目设置、构建配置及通过kernels社区分享的完整步骤。

Hugging Face开源生态教程/实践部署/工程

推荐理由:AMD GPU开发者可快速上手构建高性能AI内核,提升部署效率。
11月14日
05:37
Hugging Face:Blog(RSS)
58
参与 AMD Open Robotics 黑客松

AMD联合Hugging Face和Data Monsters举办AMD Open Robotics黑客松,首站将于2025年12月5日至7日在日本东京举行,第二站于12月12日至14日在法国巴黎举行。活动面向18岁以上开发者,需组成最多四人的团队,在三天内完成LeRobot开发环境学习与自主创新项目开发两个任务。比赛将提供SO-101机器人套件、搭载AMD Ryzen™ AI处理器的笔记本电脑以及AMD Developer Cloud上的AMD Instinct™ MI300X GPU。每座城市的前七名团队将获得奖励,冠军奖金为一万美元。评委将依据创意、难度、易用性和实用性对项目进行百分制评分。

Hugging Face具身智能端侧行业动态
11月13日
08:00
Hugging Face:Blog(RSS)
精选88
共建开放未来:Hugging Face与Google Cloud达成新合作

Hugging Face与Google Cloud宣布建立深度战略合作,旨在将Google Cloud打造为使用开放模型的最佳平台。双方将合作构建CDN网关,把Hugging Face上的模型和数据集直接缓存在Google Cloud上,显著提升下载速度并增强供应链稳定性。Google Cloud客户在Vertex AI、GKE等服务中部署模型时将获得更快的首次响应。同时,Hugging Face的1000万开发者将受益于更多新型计算实例、价格下降以及通过Google安全技术强化的模型安全性。此次合作还将推动TPU在开放模型开发中的普及应用。

GoogleHugging Face开源生态行业动态

推荐理由:开发者将享受更快的模型下载、TPU 原生支持和增强安全,简化 AI 部署流程。
10月30日
18:03
Hugging Face:Blog(RSS)
精选83
Aligning to What? Rethinking Agent Generalization in MiniMax M2

MiniMax 在 Hugging Face 发布博客,探讨其 M2 智能体模型的泛化能力。文章核心在于重新思考智能体应“对齐”到什么标准或目标,以提升其在未见任务和环境中的通用性能。这涉及对模型训练范式和评估指标的反思,旨在突破当前智能体在特定任务上过拟合、难以泛化的局限。

智能体Hugging Face论文/研究

推荐理由:Agent 泛化是 AI 实用化关键,这篇重新思考可能带来新突破。
10月25日
00:04
美团 LongCat:HuggingFace 新模型
美团 LongCat-Video 项目

美团 LongCat-Video 项目秉持开源与开放科学理念,致力于推进并普及人工智能技术。该项目通过开放源代码的方式,旨在降低 AI 技术应用门槛,打破技术壁垒,促进视频领域人工智能技术的广泛传播与创新发展,体现了推动 AI 技术民主化与开源生态建设的长期愿景。

Hugging Face模型发布视频
10月24日
08:48
美团 LongCat:HuggingFace 新模型
精选
美团开源全模态模型LongCat-Flash-Omni

美团开源全模态模型LongCat-Flash-Omni,采用5600亿参数MoE架构(激活270亿),支持128K上下文与实时音视频交互。模型基于快捷连接MoE与零计算专家,配备轻量级编解码器及分块特征交错机制,通过课程式渐进训练提升效率。在OmniBench、WorldSense等基准测试中超越Qwen3-Omni与Gemini-2.5-Pro,在文档理解、语音识别及GUI控制等任务中达到领先水平。

Hugging Face多模态模型发布语音
关联讨论 1 条美团 LongCat:HuggingFace 新模型
推荐理由:美团开源 560B 参数多模态模型,27B 激活即可实现实时音视频交互
10月23日
17:42
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 Flash-Omni 模型

美团 LongCat 团队发布 LongCat-Flash-Omni 开源项目,致力于通过开源和开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛,打破技术壁垒,但目前尚未披露具体模型架构、性能基准、参数规模及应用场景等详细技术规格。

Hugging Face多模态开源生态模型发布
10月17日
11:09
美团 LongCat:HuggingFace 新模型
meituan-longcat 发布 LongCat-Audio-Codec

meituan-longcat 发布开源项目 LongCat-Audio-Codec,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在促进音频编解码技术的开放获取,推动行业技术进步与开放生态建设。

Hugging Face开源生态模型发布语音
9月21日
16:54
美团 LongCat:HuggingFace 新模型
meituan-longcat 发布 LongCat-Flash-Thinking-FP8

meituan-longcat 开源发布 LongCat-Flash-Thinking-FP8 模型,采用 FP8 8位浮点精度格式优化计算效率与推理速度。该模型支持 Flash-Thinking 快速推理能力,致力于通过开源和开放科学推进人工智能的民主化。正文未披露具体参数规模、训练数据详情或基准测试指标。

Hugging Face推理模型发布
8月29日
15:39
美团 LongCat:HuggingFace 新模型
meituan-longcat 发布 LongCat-Flash-Chat

meituan-longcat 发布 LongCat-Flash-Chat 项目,宣称将通过开源与开放科学推进人工智能技术的进步与民主化。该项目致力于打破技术壁垒,降低 AI 使用门槛,但目前尚未披露具体的技术架构、参数规模、性能基准测试数据及应用场景等详细信息。

Hugging Face模型发布
5月23日
09:00
EleutherAI:Blog
Safetensors 通过安全审计并将成为默认格式

Hugging Face 联合 EleutherAI 与 Stability AI 委托 Trail of Bits 对 Safetensors 库完成独立安全审计,结果证实该库安全可靠,具备成为默认格式的条件。三方组织宣布将推动 Safetensors 作为模型保存的默认格式。完整审计报告已公开发布,相关博客文章将进一步阐述该库的技术背景与后续实施计划。

Hugging Face开源/仓库开源生态部署/工程
‹ 上一页
1…789
下一页 ›