AI 摘要
百度开源 Unlimited OCR 模型,仅3B参数、500M激活参数,在小参数量下实现极佳效果。推文提到其参考了滑动注意力窗口技术,并附带了技术解读和开源地址。
大聪明(赛博禅心)一直跟我说,做自媒体要研究新智元。
喷归喷,但人家起标题真的是一绝。
百度在一直OCR方面的技术很强,昨天开源 Unlimited OCR更强,3B参数500M激活,这么小的模型竟然有这么好的效果,出乎意料。
先不管作者是不是从DeepSeek出走的,文章提到的参考滑动注意力窗口技术值得关注。
技术解读见第二条,后面有项目开源地址。