AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 122 条
全部一手资讯X论文
标签「Hugging Face」清除
AK@_akhaliq · 4月7日

Test-Time Scaling Makes Overtraining Compute-Optimal paper: https://huggingface.co/papers/2604.01411

译新论文提出,Test-Time Scaling(测试时扩展)可让 Overtraining(过度训练)实现 Compute-Optimal。传统 Chinchilla 最优假设训练与推理计算固定,而该研究表明,若允许推理阶段增加计算,过度训练模型在总成本下反而性能更优。

AK@_akhaliq · 4月7日

Token Warping Helps MLLMs Look from Nearby Viewpoints paper: https://huggingface.co/papers/2604.02870

译新论文提出 Token Warping 技术,使 MLLMs 能够从附近视角观察,增强多模态模型的视角理解能力。

没有更多了
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月7日
01:55
AK@_akhaliq
新论文提出,Test-Time Scaling(测试时扩展)可让 Overtraining(过度训练)实现 Compute-Optimal。传统 Chinchilla 最优假设训练与推理计算固定,而该研究表明,若允许推理阶段增加计算,过度训练模型在总成本下反而性能更优。
Hugging Face推理数据/训练论文/研究
00:09
AK@_akhaliq
新论文提出 Token Warping 技术,使 MLLMs 能够从附近视角观察,增强多模态模型的视角理解能力。
Hugging Face多模态论文/研究
‹ 上一页
1234
下一页 ›