AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Hugging Face」清除
5月8日周五
16:23Hugging Face:Blog(RSS)58精选MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型
08:00HuggingFace Daily Papers(社区热门论文)56ModelLens:从海量模型中为你的任务寻找最佳模型
5月7日周四
23:04AK62RLDX-1技术报告正式发布
23:04AK58流式视频生成新突破:奖励蒸馏技术
17:20Berryxia.AI73开源20B参数MoE模型本地流畅运行
03:22Hugging Face:Blog(RSS)65精选vLLM V0 到 V1:在线强化学习中优先确保后端行为正确性
5月6日周三
17:22Hugging Face:Blog(RSS)47Open ASR 排行榜引入私有数据集以对抗基准过度优化
01:27AK61视觉记忆持久化提升LVLM深度生成感知
5月5日周二
05:49AK68UniVidX:基于扩散先验的统一多模态视频生成框架
5月2日周六
01:16AK56异构科学基础模型协同研究新进展
5月1日周五
08:00HuggingFace Daily Papers(社区热门论文)51面向定制化多模态角色扮演
08:00HuggingFace Daily Papers(社区热门论文)56LASE:用于印度语系跨文字身份保护的语言对抗性说话人编码
08:00HuggingFace Daily Papers(社区热门论文)55Themis:训练稳健的多语言代码奖励模型以实现灵活的多标准评分
02:13Ant Ling76精选AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
4月30日周四
23:10Berryxia.AI59🚀 Qwen 重磅开源 Qwen-Scope!
22:43Qwen73精选Qwen-Scope开源套件发布:稀疏自编码器助力模型内部特征操控
18:10IT之家(RSS)61看穿大模型的"小心思":阿里千问开源可解释性模块 Qwen-Scope
01:39Hugging Face:Blog(RSS)62精选AI评估正成为新的算力瓶颈
00:39Hugging Face:Blog(RSS)50DeepInfra 登陆 Hugging Face 推理服务提供商 🔥
4月29日周三
23:10Artificial Analysis63IBM发布三款高效非推理模型Granite 4.1,采用Apache 2.0开源许可
22:17Tencent Hy67精选腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型,440MB体积支持手机离线运行
17:33IT之家(RSS)65腾讯混元开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,仅 440MB
17:16SenseTime56SenseNova U1原生多模态模型开源
16:46SenseTime65精选SenseNova U1上线Hugging Face与GitHub
11:19蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-1T
08:00HuggingFace Daily Papers(社区热门论文)53大原子模型与语言模型的智能体融合加速超导体发现
01:08AK44SenseNova U1模型于Hugging Face发布
00:38AK57异构智能体构建现实公司架构
4月25日周六
00:20AK39Omni模型实现上下文展开技术
4月24日周五
10:18AK40Hugging Face平台AI应用超120万
4月23日周四
08:00HuggingFace Daily Papers(社区热门论文)55Memanto:面向长周期智能体的类型化语义记忆与信息论检索系统
00:16AKOpenAI 刚刚在 Hugging Face 上发布了 privacy-filter 一个用于文本中个人身份信息(PII)检测与掩码的双向 token 分类模型 模型:https://huggingface.co/openai/privacy-filter
4月22日周三
23:13HuggingFace Daily Papers(社区热门论文)RDP LoRA:大语言模型参数高效适应的几何驱动识别方法
11:10HuggingFace Daily Papers(社区热门论文)TEMPO:扩展大型推理模型的测试时训练规模
08:00HuggingFace Daily Papers(社区热门论文)面向长程任务的协同进化LLM决策与技能库智能体
00:14AK通过判别性文本表征将一步图像生成从类别标签扩展到文本 paper: https://huggingface.co/papers/2604.18168
4月21日周二
12:07AK42Kimi K2.6版本于HuggingChat上线
08:00HuggingFace Daily Papers(社区热门论文)CreativeGame:面向机制感知的创意游戏生成
02:04AK无需数据或优化的最大脑损伤 通过符号位翻转破坏神经网络 paper: https://huggingface.co/papers/2502.07408
00:04AK56Kimi K2.6模型于Hugging Face发布
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月8日
16:23
Hugging Face:Blog(RSS)
精选58
MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型

该项目使用AMD Instinct MI300X(192 GB HBM3显存)和ROCm,通过LoRA微调Qwen3-1.7B模型实现医学问答。训练仅用2000条MedMCQA样本,约5分钟完成,仅更新约220万参数(占模型总参数的0.1443%),全程采用fp16精度,无需量化。HuggingFace生态(Transformers、PEFT、TRL、Accelerate)在ROCm上无缝运行,无需修改代码即可直接替代CUDA。模型已上传至HuggingFace Hub并提供在线Demo。

Hugging Face开源生态教程/实践数据/训练

推荐理由:一个月前的教程了,但如果你是 AMD 党想跑医疗微调,这篇把坑都踩完了,代码直接能复现,LoRA 适配器也挂在 Hub 上,拿来就能用。
08:00
HuggingFace Daily Papers(社区热门论文)
56
ModelLens:从海量模型中为你的任务寻找最佳模型

开源生态拥有数十万个预训练模型,但为新数据集选择最佳模型极为困难。现有方法或局限于小型预选池,或需昂贵的逐模型计算。ModelLens框架创新性地利用公开排行榜上分散的交互记录,通过学习模型-数据集-指标三元组的性能感知潜在空间,可直接为未见过的数据集推荐未见过的模型,无需在目标数据集上运行候选模型。在一个包含162万条记录、覆盖4.7万个模型和9600个数据集的新基准测试中,其性能超越了依赖元数据或需运行每个候选模型的基线方法,并能将多种路由方法的性能提升高达81%,在文本和视觉-语言任务上展现了泛化能力。

arXivHugging Face多模态开源生态
5月7日
23:04
AK@_akhaliq
62
RLDX-1 技术报告 论文:https://huggingface.co/papers/2605.03269
Hugging Face论文/研究
23:04
AK@_akhaliq
58
Stream-R1 面向流式视频生成的可靠性-困惑度感知奖励蒸馏 论文: https://huggingface.co/papers/2605.03849
Hugging Face多模态视频论文/研究
17:20
Berryxia.AI@berryxia
73
开源20B参数MoE模型本地流畅运行

刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊! OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。 完全不用联网、不用交月费,还支持131K超长上下文。 日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。 非常适合公司的一些部门使用啊! 以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。 模型直达👉 https://huggingface.co/manjunathshiva/gpt-oss-20b-tq3

Hugging Models: A new GPT model just dropped for Apple Silicon. The gpt-oss-20b-tq3 is a 20B parameter MoE text generator, optimized wit...

Hugging FaceOpenAI开源/仓库部署/工程
03:22
Hugging Face:Blog(RSS)
精选65
vLLM V0 到 V1:在线强化学习中优先确保后端行为正确性

为确保 vLLM 从 0.8.5 到 0.18.1 的重大重写后,在线强化学习训练结果与 V0 参考运行一致,团队优先修复后端行为而非调整 RL 目标。关键修复包括:将日志概率模式设为 processed_logprobs 以匹配采样器分布;禁用 V1 特有的前缀缓存和异步调度等运行时默认值;调整权重更新路径以匹配 V0 的缓存保留行为;并确保 rollout 后端使用 fp32 精度的 lm_head 进行最终投影。这些措施消除了策略比率均值偏差,使 V1 在 KL 散度、熵等指标上与 V0 达成一致。

Hugging Face推理教程/实践部署/工程

推荐理由:vLLM V1迁移时踩的四个坑全在这里,从logprob语义到fp32投影头,修完才调RL目标,做在线RL的团队可以直接抄这份配置清单。
5月6日
17:22
Hugging Face:Blog(RSS)
47
Open ASR 排行榜引入私有数据集以对抗基准过度优化

Hugging Face 的 Open ASR Leaderboard 加入了来自 Appen Inc. 和 DataoceanAI 的高质量私有英语 ASR 数据集,涵盖多种口音及脚本式/会话式语音,总时长约 28.7 小时。数据集保持私有以降低 benchmaxxing(针对基准的过度优化)或测试集污染风险。默认平均 WER 仍基于公开数据集计算,用户可通过切换查看私有数据集影响。标准化采用基于 Whisper 的标准化器,UI 代码和评估脚本已开源。自 2023 年 9 月上线以来,该榜单访问量已超过 71 万次。

Hugging Face产品更新开源/仓库评测/基准
01:27
AK@_akhaliq
61
持久视觉记忆 为LVLMs中的深度生成维持感知 论文: https://huggingface.co/papers/2605.00814
Hugging Face多模态论文/研究
5月5日
05:49
AK@_akhaliq
68
UniVidX 一个通过扩散先验实现多功能视频生成的统一多模态框架 paper: https://huggingface.co/papers/2605.00658
Hugging Face多模态视频论文/研究
5月2日
01:16
AK@_akhaliq
56
异构科学基础模型协作 paper: https://huggingface.co/papers/2604.27351
Hugging Face多模态论文/研究
5月1日
08:00
HuggingFace Daily Papers(社区热门论文)
51
面向定制化多模态角色扮演

本文提出定制化多模态角色扮演任务,旨在统一模型中协同实现角色人格、对话风格与视觉身份的定制,并保持跨模态输出的一致性。研究构建了包含20个角色的RoleScape-20数据集,并开发了名为UniCharacter的两阶段训练框架,包含统一有监督微调与角色特定组相对策略优化。仅需10张图像及对应交互样例,模型即可习得目标角色特征,并在文本与图像生成中展现一致的角色表现,训练约需100 GPU小时。实验表明,该方法显著优于现有方案,消融研究验证了其跨模态一致性设计与小样本定制策略的有效性。

arXivHugging Face多模态数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
56
LASE:用于印度语系跨文字身份保护的语言对抗性说话人编码

研究提出LASE(语言对抗性说话人编码器),以解决多语言语音克隆中因发音文字不同导致的说话人身份漂移问题。现有编码器如WavLM和ECAPA-TDNN在跨文字切换时性能下降。LASE在冻结的WavLM-base-plus模型上增加小型投影头,结合监督对比损失和梯度反转的跨语言分类对抗损失进行训练,使编码消除语言信息的同时保留说话人特征。实验表明,在1118个跨文字语音对上,LASE将身份漂移降至接近零,并扩大与基线的差距2.4-2.7倍。在合成多说话人日记任务中,LASE仅用约百分之一训练数据即达到与ECAPA-TDNN相当的说话人召回率。研究同时发布了模型检查点、语料库和评估代码。

Hugging Face开源生态论文/研究语音
08:00
HuggingFace Daily Papers(社区热门论文)
55
Themis:训练稳健的多语言代码奖励模型以实现灵活的多标准评分

针对代码奖励模型研究不足且现有模型多局限于功能正确性评分的问题,研究团队构建了Themis-CodeRewardBench基准,用于在5个偏好维度和8种编程语言上评估模型,并分析了50多个现有模型。为改进模型,团队创建了迄今最大的开源代码偏好数据集Themis-CodePreference(含超35万个偏好对),并据此训练了参数规模从6亿到320亿不等的Themis-RM系列多语言代码奖励模型,支持灵活的多标准评分。实验表明,模型具有正向缩放趋势,在多样化偏好训练下展现出强大的跨语言迁移能力,验证了多标准训练对可靠代码奖励建模的重要性。

Hugging Face数据/训练论文/研究
02:13
Ant Ling@AntLingAGI
精选76
AntLingAGI团队宣布Ling-2.6-1T模型正式开源,已登陆Hugging Face平台,并通过Novita Labs提供官方推理体验。该模型采用混合专家架构,总参数1万亿、激活参数630亿,核心优化方向为"令牌效率"以满足真实生产需求。具体表现为:低令牌开销,能在无需冗长推理链的情况下保持强大智能;可靠的多步执行能力,提升指令、工具、上下文和工作流的控制水平;生产就绪的部署特性,覆盖从代码生成到错误修复的任务,并广泛兼容各类智能体框架。团队旨在通过降低测试、部署、定制和构建的难度,为开发者创造价值。

Ant Ling: Last week, we introduced Ling-2.6-1T. Today, Ling-2.6-1T is officially an open model~ 🤗 1T total parameters · 63B activ...

智能体Hugging Face模型发布部署/工程

推荐理由:1T参数开源模型不是天天有,蚂蚁这个Ling-2.6-1T强调token效率和Agent能力,做Agent的可以直接去Hugging Face上跑一下,看看是不是真的在生产环境省token。
4月30日
23:10
Berryxia.AI@berryxia
59
🚀 Qwen 重磅开源 Qwen-Scope!

Qwen开源了Qwen-Scope,这是一个为Qwen模型家族设计的稀疏自编码器完整套件,旨在将SAE特征转化为实用工具。该套件提供四大核心功能:在推理方面,可直接操纵模型内部特征以控制输出,无需依赖提示工程;在数据方面,能用极少样本对目标数据进行分类和合成,增强模型的长尾能力;在训练方面,能精准追溯代码切换和重复生成等问题的根源并进行修复;在评估方面,可通过分析特征激活模式来智能筛选基准测试,减少冗余。Qwen希望社区能利用此工具深入探索模型内部机制并开发更多应用。

Qwen: Today we're releasing Qwen-Scope 🔭, an open suite of sparse autoencoders for the Qwen model family. It turns SAE featur...

Hugging Face开源/仓库开源生态
22:43
Qwen@Alibaba_Qwen
精选73
Qwen-Scope开源套件发布:稀疏自编码器助力模型内部特征操控

Qwen团队推出开源稀疏自编码器套件Qwen-Scope,将SAE特征转化为实用工具。该套件支持四大应用方向:无需提示工程即可通过直接操控内部特征引导模型输出;用极少样本对目标数据进行分类与合成,提升长尾能力;追踪代码切换和重复生成问题的根源并进行修复;通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制,并开发出超越现有研究范围的应用。相关资源已开放。

Hugging Face开源/仓库开源生态数据/训练

推荐理由:可解释性工具从学术走向工程,Qwen-Scope 把内部特征操控、数据合成、问题溯源打包成套装,做模型调试和长尾优化的团队值得立刻上手试试。
18:10
IT之家(RSS)
61
看穿大模型的"小心思":阿里千问开源可解释性模块 Qwen-Scope

阿里千问开源可解释性模块 Qwen-Scope,该模块基于 Qwen3 和 Qwen3.5 系列模型训练,通过稀疏自编码器提取可解释特征以分析大模型内在机制。开源权重覆盖 7 个大模型,包含 14 组稀疏自编码器,训练数据规模达 0.5B 词元。Qwen-Scope 能实现推理结果的定向控制、数据分类与合成、模型训练优化及评估冗余分析,在数据合成中使训练能效比提升约 15 倍。

Hugging Face安全/对齐开源/仓库
01:39
Hugging Face:Blog(RSS)
精选62
AI评估正成为新的算力瓶颈

AI评估成本已突破关键阈值,正重塑其可及性。Holistic Agent Leaderboard花费约4万美元运行了2万多次智能体推演,单次前沿模型测试成本可达2829美元。研究显示,相同任务成本差异可达33倍,脚手架选择是核心成本驱动因素。虽然静态基准可通过压缩技术实现百倍成本缩减,但智能体评估因轨迹长、噪声大而压缩有限。高支出未必带来更好结果:例如在GAIA测试中,2828美元方案准确率28.5%,而1686美元方案反达57.6%。当评估包含模型训练时,成本将完全超越常规API框架。

Hugging Face现象/趋势评测/基准

推荐理由:这篇把分散的评估成本数据拉通了算总账,曾经便宜的评测现在动辄上万美元,独立评估正被价格挤出牌桌,做Agent的人必须意识到排行榜的代价。
00:39
Hugging Face:Blog(RSS)
50
DeepInfra 登陆 Hugging Face 推理服务提供商 🔥

DeepInfra 作为高性能、低成本的推理服务提供商,现已在 Hugging Face 平台正式上线。该服务支持众多开源模型,包括 LLaMA、Mistral 等系列,并提供按需付费的灵活计费模式。其 GPU 实例涵盖 H100、A100 等多种型号,显著降低了 AI 模型部署与调用的门槛,进一步推动了开源人工智能技术的普及与应用。

Hugging Face行业动态部署/工程
4月29日
23:10
Artificial Analysis@ArtificialAnlys
63
IBM发布三款高效非推理模型Granite 4.1,采用Apache 2.0开源许可

IBM发布了三款采用Apache 2.0许可的Granite 4.1开源模型(30B、8B、3B)。其核心特点是极高的令牌效率,例如8B模型运行智能指数仅需4M输出令牌,远低于同类模型。在开放性指数上,三款模型均获得61分,领先多数同行。但高效率也带来了智能指数的相对折衷,其得分低于Qwen3.5、Gemma 4等竞品。不过,与上一代Granite 4.0系列相比,新模型的智能表现仍有提升。该系列模型拥有128K令牌的上下文窗口,主要面向企业和边缘部署,可通过WandB、Replicate和Hugging Face获取。

Hugging Face开源生态模型发布
22:17
Tencent Hy@TencentHunyuan
精选67
腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型,440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型,其参数量为18亿,经量化后仅440MB,可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向,包括藏语、蒙古语等少数语言。在标准测试中,其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特,模型内存占用从FP16格式的3.3GB大幅降低,比之前的1.67比特方法体积缩小25%、速度提升约10%,且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一,并部署于腾讯多个产品中。

Hugging Face开源生态模型发布端侧

推荐理由:440MB的模型能在手机上跑33种语言翻译,还宣称比谷歌翻译强,这个量化技术让离线翻译不再是‘能看不能用’,出差党可以试试看。
17:33
IT之家(RSS)
65
腾讯混元开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,仅 440MB

腾讯混元开源了手机端离线翻译模型Hy-MT1.5-1.8B-1.25bit,其体积仅440MB,可在手机本地离线运行。该模型支持33种语言及1056个翻译方向,基于1.8B参数原型通过极致量化压缩实现。其1.25-bit版本采用稀疏高效三值量化技术,将原始3.3GB模型大幅缩减。官方称其翻译质量优于谷歌翻译等主流系统,并提供了2-bit和1.25-bit两种量化方案以适配不同机型。模型完全离线工作,不收集用户数据,相关资源已全面开源。

arXivHugging Face模型发布端侧
17:16
SenseTime@SenseTime_AI
56
感谢 @liuziwei7 与我们共同创造 #多模态智能 的未来!

Ziwei Liu: 🔥Native Unified Multimodal Model Open Sourced🔥 🚀SenseNova U1🚀 is the first native multimodal model that unifies mult...

Hugging Face多模态开源生态模型发布
16:46
SenseTime@SenseTime_AI
精选65
是的,SenseNova U1 现已在 Hugging Face 和 GitHub 上发布! 探索它如何以语义精确性和像素级保真度实现复杂的 #信息图 创作。 Hugging Face: https://huggingface.co/collections/sensenova/sensenova-u1 GitHub: https://github.com/OpenSenseNova/SenseNova-U1 Discord: https://discord.gg/cxkwXWjp

AK: SenseNova U1 is out on Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1

Hugging Face图像生成多模态模型发布

推荐理由:SenseNova U1 开源了,能生成像素级精准的信息图,对于做电商和可视化的人是个直接可用的工具,值得跑一下看看实际表现。
11:19
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-1T

inclusionAI 发布了 Ling-2.6-1T 模型,这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力,同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展,为研究者和开发者提供了可访问的高性能工具。

Hugging Face开源生态模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
53
大原子模型与语言模型的智能体融合加速超导体发现

研究团队提出名为ElementsClaw的智能体框架,通过协同大型原子模型与大型语言模型来加速材料发现。该框架利用微调自10亿参数原子模型Elements的工具进行原子尺度计算,并借助LLM进行高层语义推理,将材料发现转向集成化、人机交互模式。在超导体搜索中,该框架仅用28个GPU小时便筛选了240万种晶体,识别出6.8万个高置信度候选材料,将已知超导体空间扩大了数个数量级。它不仅成功识别出文献中隐藏的超导体,更发现了四种经实验验证的新型超导体,其中Zr3ScRe8和HfZrRe4的转变温度分别为6.8K和6.7K。

智能体arXivHugging Face论文/研究
01:08
AK@_akhaliq
44
SenseNova U1 已在 Hugging Face 发布 https://huggingface.co/collections/sensenova/sensenova-u1
Hugging Face开源生态模型发布
00:38
AK@_akhaliq
57
从技能到人才 将异构智能体组织为现实世界的公司 论文: https://huggingface.co/papers/2604.22446
智能体Hugging Face论文/研究
4月25日
00:20
AK@_akhaliq
39
Omni模型中的上下文展开 paper: https://huggingface.co/papers/2604.21921
Hugging Face多模态论文/研究
4月24日
10:18
AK@_akhaliq
40
Hugging Face 上有超过 120 万个 AI 应用 这可能是最大的 AI 应用商店
Hugging Face开源生态现象/趋势
4月23日
08:00
HuggingFace Daily Papers(社区热门论文)
55
Memanto:面向长周期智能体的类型化语义记忆与信息论检索系统

本文提出Memanto,一种用于智能体AI的通用记忆层,挑战了实现高保真记忆必须依赖复杂知识图的传统假设。该系统集成了包含13个预定义类别的类型化语义记忆架构、自动冲突解决与时间版本管理,其核心由无需索引的Moorcheh信息论搜索引擎驱动,可在低于90毫秒延迟内实现确定性检索,且完全无数据摄入延迟。在LongMemEval和LoCoMo基准测试中,Memanto分别以89.8%和87.1%的准确率取得最优结果,超越所有基于混合图与向量检索的系统,仅需单次查询、无摄入成本并显著降低运行复杂度。

智能体Hugging Face论文/研究部署/工程
00:16
AK@_akhaliq
OpenAI 刚刚在 Hugging Face 上发布了 privacy-filter 一个用于文本中个人身份信息(PII)检测与掩码的双向 token 分类模型 模型:https://huggingface.co/openai/privacy-filter
Hugging FaceOpenAI开源/仓库数据/训练
4月22日
23:13
HuggingFace Daily Papers(社区热门论文)
RDP LoRA:大语言模型参数高效适应的几何驱动识别方法

研究团队提出RDP LoRA方法,将大语言模型隐藏状态演化建模为高维几何轨迹,利用Ramer-Douglas-Peucker算法无训练地识别表征路径关键断点,并直接作为层选择信号。在Qwen3-8B-Base的LoRA微调实验中,仅需适配13个RDP选择的层,便在MMLU-Math上达到81.67%准确率,显著优于全层适配的79.32%和随机选择的75.56%,证明几何轨迹分析可优化参数高效微调中的层选择决策。

Hugging Face数据/训练论文/研究
11:10
HuggingFace Daily Papers(社区热门论文)
TEMPO:扩展大型推理模型的测试时训练规模

TEMPO框架通过期望最大化算法形式化测试时训练过程,交替进行策略优化与周期性critic重新校准,解决了现有方法中自我奖励信号漂移导致的性能瓶颈和多样性崩溃问题。该方法在OLMO3和Qwen3模型家族上验证,使OLMO3-7B在AIME 2024上的准确率从33.0%提升至51.1%,Qwen3-14B从42.3%提升至65.8%,同时保持高生成多样性,实现了测试时计算的有效扩展。

Hugging Face推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
面向长程任务的协同进化LLM决策与技能库智能体

针对大语言模型在长程交互环境中难以持续决策的问题,本文提出COSPLAY协同进化框架。该框架包含两个互相促进的模块:LLM决策智能体从可学习技能库检索技能指导行动生成;技能库智能体则从智能体无标签轨迹中持续发现、提取和更新可重用技能。在六个游戏环境测试中,基于8B基础模型的COSPLAY在单人游戏基准上较四个前沿LLM基线实现25.1%的平均奖励提升,在多人社交推理场景中也保持竞争力。

智能体arXivHugging Face推理
00:14
AK@_akhaliq
通过判别性文本表征将一步图像生成从类别标签扩展到文本 paper: https://huggingface.co/papers/2604.18168
Hugging Face图像生成论文/研究
4月21日
12:07
AK@_akhaliq
42
Kimi K2.6 现已在 huggingchat 上可用
Hugging Face产品更新开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
CreativeGame:面向机制感知的创意游戏生成

研究团队推出CreativeGame多智能体系统,实现HTML5游戏的迭代式生成与进化。该系统通过程序化信号奖励、谱系范围记忆、运行时验证及机制引导规划四者耦合,将游戏机制作为可规划、追踪的显式对象而非事后描述。系统已积累71个存储谱系、88个保存节点及774条全局机制档案,代码量达6181行。真实4代演化案例表明,机制级创新可在后期版本中涌现,支持通过显式机制变化观察渐进演化过程。

智能体arXivHugging Face编码
02:04
AK@_akhaliq
无需数据或优化的最大脑损伤 通过符号位翻转破坏神经网络 paper: https://huggingface.co/papers/2502.07408
Hugging Face安全/对齐论文/研究
00:04
AK@_akhaliq
56
Kimi K2.6 已在 Hugging Face 发布 https://huggingface.co/moonshotai/Kimi-K2.6
Hugging Face开源生态模型发布
‹ 上一页
1…456789
下一页 ›