AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源/仓库」清除
5月23日周六
15:19宝玉75精选飞书-Claude Code桥接开源项目
12:14美团 LongCat:HuggingFace 新模型49美团-LongCat/WBench权重模型
10:51向阳乔木68开源GEO系统GEOFlow 2.0发布,从工具升级为基础设施
09:57Hacker News 热门(buzzing.cc 中文翻译)70精选Models.dev:一个关于人工智能模型规格、定价和功能的开源数据库
05:57Hacker News 热门(buzzing.cc 中文翻译)63一款开源的看板桌面应用,可在每张卡片上运行并行代理
01:15Perplexity82精选Perplexity开源供应链安全扫描工具Bumblebee
5月22日周五
22:56Rohan Paul75精选首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
19:30歸藏(guizang.ai)73开源一个 Skill,让 AI 接管你屏幕边那张便签纸
17:19向阳乔木71飞书开源工具接入Claude Code,移动端AI助理体验升级
15:49向阳乔木79精选X平台发布体验差,ChatGPT插件助发布
10:42karminski-牙医61腾讯推出翻译专用大模型,30B-A3B性能突出
10:14HuggingFace Daily Papers(社区热门论文)64TerminalWorld:在真实终端任务上评测智能体
08:13Berryxia.AI60Stable Audio 3登陆Mac本地运行,音乐生成效率惊人
08:00HuggingFace Daily Papers(社区热门论文)40语音识别中面向低资源与口音鲁棒性的凸语言检测
06:38OpenClaw🦞59OpenClaw 2026.5.20 版本更新发布
04:30Simon Willison 博客60datasette-agent-charts 0.1a1
04:30Simon Willison 博客46datasette-agent-sprites 0.1a0版本发布
04:30Simon Willison 博客71精选Datasette Agent
00:07美团 LongCat:HuggingFace 新模型73精选LongCat-Video-Avatar-1.5:升级版音频驱动数字人视频生成框架
5月21日周四
13:15ginobefun69一次性开源17套GEO Skill体系
12:04向阳乔木71爆火论文写作插件,两天获1.6万星
10:34向阳乔木72Suno AI音乐工具新增6000种风格检索并支持免登录创作
10:11SemiAnalysis60Google为llm-d添加TPU夜间CI支持
05:42MarkTechPost(RSS)65介绍Turbovec:一个基于Google TurboQuant算法的Rust向量索引,支持Python绑定
02:15Simon Willison 博客52每秒10个token到底有多快?
01:36Rohan Paul67Velobase开源AI SaaS商业基础设施框架
00:36Rohan Paul63商汤开源统一多模态模型SenseNova U1
00:06Artificial Analysis69Cohere推出开源权重模型Command A+,智能指数得分达37
00:02向阳乔木75精选开源插件为Codex App增添高级功能
5月20日周三
23:56IT之家(RSS)71精选Stability AI 推出音频模型 Stability Audio 3.0,可生成最长 6 分钟专业级歌曲
23:33elvis73自我改进的AI是件大事!
22:08Berryxia.AI68PaddleOCR 3.5支持Hugging Face生态
20:56IT之家(RSS)27BOSS直聘 2026财年首季净利大幅增长,用户与客户指标持续提升
15:07Berryxia.AI72乔帮主开源实用油猴脚本套件
14:31向阳乔木73开源油猴脚本提升YouTube观看效率与AI协作
14:31向阳乔木76精选开源油猴脚本实现多平台截图上传与内容处理
14:01向阳乔木69开源实用油猴脚本,不上班却更忙更充实
13:31向阳乔木72Multica:将Trello看板中的"人"替换为"Agent"的AI工作流引擎
11:05HuggingFace Daily Papers(社区热门论文)68AutoResearchClaw: 具备自我强化与人机协作的自主研究系统
10:05HuggingFace Daily Papers(社区热门论文)65CEPO:基于对比证据的策略优化方法
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月23日
15:19
宝玉@dotey
精选75
飞书-Claude Code桥接开源项目

feishu-claude-code-bridge是一个开源项目,可实现飞书与本机Claude Code CLI的双向连接。用户能从飞书消息中直接指挥Claude Code执行任务,Claude也能读取飞书中的工作上下文并创建、编辑飞书文档。其工作原理是将飞书消息转为Prompt通过命令行调用Claude CLI,并将流式输出实时同步回飞书。该模式可扩展连接Codex等其他本地工具。需注意,2026年6月15日起,Claude订阅计划对claude -p模式将独立计费。

Zara Zhang: Introducing the Claude Code Lark/Feishu Bridge 🌉 (open-source) Talk to Claude Code in Lark/Feishu like a colleague - Us...

智能体开源/仓库教程/实践编码

推荐理由:如果你同时用飞书和 Claude Code,这个开源桥接值得立刻试试,宝玉的教程把从安装到原理讲透了,而且能照葫芦画瓢改接到 Codex、Cursor,实用性拉满。
12:14
美团 LongCat:HuggingFace 新模型
49
美团-LongCat/WBench权重模型

美团开源了用于WBench评估框架的预训练模型权重仓库,将这些权重整合至单一仓库,旨在方便社区快速部署WBench评估环境。该权重仅重新分发用于学术研究和评估用途,所有权利归属原作者。用户可参考WBench GitHub获取安装与评估指南,具体模型许可证详见LICENSE_NOTICE.md文件。

Hugging Face开源/仓库数据/训练
10:51
向阳乔木@vista8
68
开源GEO系统GEOFlow 2.0发布,从工具升级为基础设施

开源GEO系统GEOFlow 2.0发布,一个月内GitHub星标超1.6k。此次关键版本升级,使其从内容生产工具演进为“GEO内容工程基础设施”。核心变化包括基于Laravel重构,实现多站点与多Agent管理;强化AI知识库与向量化检索;新增统一的数据分析页面,构建运营闭环。系统旨在帮助用户持续建设“可信内容资产”,并秉承“利他就是利己”的开源理念。

姚金刚: 经过一个月的持续迭代,第一套GEO系统"GEOFlow 2.0"正式上线,GitHub地址见文末 一个月前,GEOFlow 1.0 上线,到现在,刚好过去一个月,Star数已经超过1.6k,这一个月来,收到了不少朋友的反馈和落地实践案例 这...

智能体GitHub开源/仓库搜索
09:57
Hacker News 热门(buzzing.cc 中文翻译)
精选70
Models.dev:一个关于人工智能模型规格、定价和功能的开源数据库

近期发布了开源数据库Models.dev,专门收录人工智能模型的各项规格、定价及功能信息。该项目在GitHub公开,便于开发者查询和比较不同AI模型。其在Hacker News社区获得101点关注度,显示出技术社区对这类集中化、透明化的模型信息资源的较大兴趣。

GitHub开源/仓库搜索

推荐理由:做AI产品选型最烦的就是到处翻定价和规格页,这个开源数据库把常用模型的底细都摊开摆明了,实用,建议存为浏览器首页。
05:57
Hacker News 热门(buzzing.cc 中文翻译)
63
一款开源的看板桌面应用,可在每张卡片上运行并行代理

开源看板桌面应用KanBots正式发布,其核心功能是允许用户在每张看板卡片上运行并行代理。该应用旨在通过AI代理自动化任务流程,提升项目管理效率。项目在Hacker News社区获得102个点赞,展现了开发者社区对AI辅助工作流工具的浓厚兴趣。

智能体产品更新开源/仓库
01:15
Perplexity@perplexity_ai
精选82
今天我们开源了Bumblebee,一个适用于macOS和Linux的只读扫描器。 它检查开发者机器上的高风险软件包、扩展和AI工具配置。 连接到Computer后,每当出现新的供应链风险时,它可以触发更深入的扫描。 https://github.com/perplexityai/bumblebee
安全/对齐开源/仓库
关联讨论 1 条MarkTechPost(RSS)
推荐理由:这不是另一个华而不实的 AI 玩具,而是实打实的开发环境安全检查工具,开源且只读,接入 Computer 后还能动态响应新威胁,做 AI 工具链的团队应该现在就 fork。
5月22日
22:56
Rohan Paul@rohanpaul_ai
精选75
首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧
关联讨论 1 条IT之家(RSS)
推荐理由:首个开源的1.58-bit三元LLM,直接在昇腾芯片上原生训练,内存压缩到BF16的六分之一,8B模型就能跑在手机上,做端侧部署的可以立刻上手试试了。
19:30
歸藏(guizang.ai)@op7418
73
开源一个 Skill,让 AI 接管你屏幕边那张便签纸

AI Desk Card 是一款 4.7 寸磁吸墨水屏,结合 AI Agent(如 Claude Code),通过预置模板与数据填充,动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制,实现内容自适应和场景切换(如夜间变为电子名片)。核心理念是将硬件从固定功能中解放,使显示能力由 AI 可获取的信息动态定义,从而提升效率并减少手动配置。

智能体开源/仓库教程/实践端侧
17:19
向阳乔木@vista8
71
飞书开源工具接入Claude Code,移动端AI助理体验升级

前字节员工推荐飞书作为连接AI工具的平台。通过Zara开源的lark-channel-bridge工具,可将本地Claude Code变为飞书机器人,实现手机端随时进行复杂任务对话。该工具能将飞书消息转给Claude Code处理,支持可交互卡片和文件图片的直接显示,并结合飞书的全量搜索功能,提供流畅、可控的“AI工作助理”体验,被作者强烈推荐。

智能体MCP/工具开源/仓库
15:49
向阳乔木@vista8
精选79
推文批评X平台产品经理能力不足,发布文章体验糟糕。引用推文显示,开发者利用ChatGPT(通过codex/goal)开发了Markdown转换插件,允许用户拖拽文件快速生成X文章格式,以改善发布流程。该插件开源并提供谷歌插件版本,旨在解决原生体验的痛点。

小小东: X 发布神器: Markdown 转 x 文章, 谷歌插件来了 这几天,我开启了codex /goal 费了10个亿的token 让chatGPT肝出了这个插件 这两天我小小东的文章,都是这个插件发布而来 具体操作是拖拽Markdown 文...

开源/仓库

推荐理由:X官方死活不做Markdown导入,这个插件用拖拽填上了这个坑。如果你经常在X发长文,直接装一个,体验能提升一截。
10:42
karminski-牙医@karminski3
61
腾讯近期发布了三款翻译专用大模型(Hy-MT2系列)。其中,Hy-MT2-30B-A3B在金融、法律等专业领域的翻译基准测试中,性能超越了DeepSeek-V4-Pro。该系列模型具备强大的多语言翻译能力,可应用于包括特定内容在内的多种翻译场景。

karminski-牙医: 这一波估计XX词典凉的透透的了... 刚看到这个图坐不住了, 30B-A3B 的小模型跑分碾压 DeepSeek-V4-Pro? 谁给你的勇气? 然后定睛一看, 原来是翻译专用大模型. 腾讯刚刚放出了3个翻译专用大模型, 分别是 Hy-MT...

开源/仓库模型发布
10:14
HuggingFace Daily Papers(社区热门论文)
64
TerminalWorld:在真实终端任务上评测智能体

研究团队发布了TerminalWorld,一个可扩展的数据引擎,能自动从大量真实终端录制中逆向工程生成高保真的评估任务。该引擎处理了80,870份录制,产出了涵盖18个类别、1,280个唯一命令的1,530个任务基准。其中包含一个经过人工复核的200个任务子集。测试显示,当前先进的模型与智能体在真实终端工作流上表现欠佳,最高通过率仅为62.5%。该基准衡量的能力与现有专家设计基准的相关性很弱(r=0.20),凸显其独特价值。引擎的自动化设计使其具备真实性与可扩展性,数据与代码已开源。

智能体开源/仓库论文/研究评测/基准
08:13
Berryxia.AI@berryxia
60
Stable Audio 3登陆Mac本地运行,音乐生成效率惊人

Stable Audio 3官方正式发布,并提供了针对苹果MLX框架的优化版本,使得强大的音乐生成模型能够直接在本地Mac电脑上高效运行。其核心亮点在于在M5 Pro芯片上可实现59倍实时生成速度,性能表现突出。此外,该工具支持在不到1小时内完成LoRA微调,并提供快速(Sm)与高质量(Medium)两种生成模式。开发者鼓励社区积极探索其潜力,标志着本地化音乐创作工具达到了新高度。

dadabots: 🥳 Announcing Stable Audio 3 🍕 🏆 fastest music models ever 💻 runs on MacBookPro M-series 🧪 break it plz 🧠 LoRA fine...

开源/仓库模型发布端侧语音
08:00
HuggingFace Daily Papers(社区热门论文)
40
语音识别中面向低资源与口音鲁棒性的凸语言检测

全球语音多样性导致现有语音对话系统在处理方言和口音时易误识别语言,引发下游任务失败。为此,研究提出Convex Language Detection框架,将凸优化技术集成到系统中。该方法基于多GPU ADMM在JAX中高效实现,具有全局最优性保证和快速训练能力,并从理论上证明了其稳定性与鲁棒性。实验表明,在低资源场景下,该框架实现了97-98%的语言检测准确率,展现出高样本效率。相关开源工具包已发布。

开源/仓库论文/研究
06:38
OpenClaw🦞@openclaw
59
OpenClaw 2026.5.20 🦞 🎙️ Discord 语音跟随你 🔐 Doctor 捕获明文密钥 🧭 模型状态解释意外情况 🪟 Windows 安装问题解决 依然专注于那些枯燥的修复。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.20
智能体产品更新开源/仓库语音
04:30
Simon Willison 博客
60
datasette-agent-charts 0.1a1

开源数据可视化插件 datasette-agent-charts 发布了 0.1a1 预览版。该版本主要增强了图表呈现:无颜色列的柱状图与华夫图改用连续色阶按数值大小着色,含文本值的颜色列则采用 observable10 分类配色方案。此外,新增了查询前的 execute-sql 权限检查、交互式图表提示信息,并修复了 waffleY 图表类型未被正确描述的问题。

智能体MCP/工具开源/仓库
04:30
Simon Willison 博客
46
datasette-agent-sprites 0.1a0版本发布

Datasette Agent生态推出了一款新插件datasette-agent-sprites的首个预览版本(0.1a0)。该插件的核心功能是允许Agent在Fly Sprites提供的安全沙盒环境中执行命令,旨在增强数据处理与交互过程中的隔离性与安全性。此次发布标志着沙盒技术在AI Agent工具链中的进一步集成与应用。

智能体开源/仓库部署/工程
04:30
Simon Willison 博客
精选71
Datasette Agent

Datasette Agent是Datasette推出的首个可扩展AI助手,为用户提供对话式界面以查询数据,并支持通过插件生成图表。该工具基于其LLM Python库构建,是LLM与Datasette整合的重要成果。目前提供图表生成、AI图像创建和沙箱代码执行等官方插件。它既可运行于Gemini 3.1 Flash-Lite等云端模型,也支持通过LM Studio连接本地开源模型,具备可靠的工具调用与查询能力。

智能体产品更新开源/仓库数据/训练

推荐理由:Simon 终于把 Datasette 和 LLM 接上了,自然语言查 SQL 数据库有了现成方案,插件生态和本地模型支持让这工具的可玩性极高,做数据分析的值得试试。
00:07
美团 LongCat:HuggingFace 新模型
精选73
LongCat-Video-Avatar-1.5:升级版音频驱动数字人视频生成框架

美团LongCat团队发布了LongCat-Video-Avatar-1.5,一个专注于音频驱动数字人视频生成的开源框架。其核心升级在于采用Whisper-Large音频编码器,显著优化了唇部动态的流畅度与自然度。该版本实现了精准的唇形同步、全身时序稳定性以及长视频中的身份一致性,并能泛化应用于动漫、动物及多人交互等复杂场景。通过基于DMD2的步蒸馏技术,模型仅需8步即可高效推理。团队还构建了一个涵盖多场景、多语言的人工评估基准,通过大规模主观评分与专家分析,验证了其在多项关键维度上的优异性能。

Hugging Face图像生成多模态开源/仓库
关联讨论 1 条IT之家(RSS)
推荐理由:美团把数字人模型升级到1.5版,换了Whisper做音频编码,唇形同步比之前自然不少,而且开源了训练代码,做电商直播和虚拟博主的朋友可以直接拿过来跟商业方案掰手腕。
5月21日
13:15
ginobefun@hongming731
69
用户一次性开源了17套面向GEO的实践Skill,其中14套覆盖了从战略、页面、内容到监测、运营等大部分场景,另有3套与GEOFlow系统配套。每个Skill专注解决一个关键问题,例如"品牌知识图谱"、"页面GEO诊断"与各类内容创作改造等。所有Skill均配有示例报告和使用说明,相关成果已发布于GitHub并持续更新。

姚金刚: 一次性开源17套GEO Skill 把这一年来对GEO的研究、学习、实践与思考,大都融合了进去 欢迎下载使用 这套Skill的一些说明: 1、其中14套Skill,覆盖了目前大部分的GEO相关场景,另外3套Skill,与GEOFlow这个系...

GitHub开源/仓库搜索
12:04
向阳乔木@vista8
71
最近两天爆火的写论文Skill 看来太刚需了,没几天都1.6w Star了。 安装命令: /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills 开源地址:https://github.com/Imbad0202/academic-research-skills
智能体GitHub开源/仓库
10:34
向阳乔木@vista8
72
Suno AI音乐工具新增6000种风格检索并支持免登录创作

这条推文介绍了一个对Suno AI音乐生成工具进行优化的Skill。该Skill新增了近6000个音乐风格检索,显著提升了生成音乐的准确性。此外,它通过谷歌CDP技术刷新获取登录Token,使用户无需访问网站即可直接创作歌曲。推文提供了该Skill的开源GitHub地址和安装指令。

开源/仓库教程/实践语音
10:11
SemiAnalysis@SemiAnalysis_
60
TPU警报:针对开源生产级Kubernetes分布式推理,Google刚为llm-d添加了夜间CI。这是Google推动更广泛ML社区使用TPU的重要一步。TPU在llm-d CI和代码质量方面正追赶NVIDIA。相比之下,尽管AMD官方推荐的生产级Kubernetes推理方案是llm-d,但@AnushElangovan尚未将任何AMD GPU或AMD网卡加入CI。
Google开源/仓库推理部署/工程
05:42
MarkTechPost(RSS)
65
介绍Turbovec:一个基于Google TurboQuant算法的Rust向量索引,支持Python绑定

Google Research的TurboQuant算法已通过Turbovec项目应用于向量搜索领域。该工具以Rust语言构建,提供Python绑定接口,可直接集成到RAG流水线中。Turbovec实现了16倍的向量压缩率,同时无需进行任何码本训练,显著降低了部署和使用门槛。

Google检索增强开源/仓库部署/工程
02:15
Simon Willison 博客
52
每秒10个token到底有多快?

开发者Mike Veerman创建了一个名为tokenspeed的HTML应用程序,可模拟从每秒5个到800个token的LLM文本输出速度。用户能够直观感知模型广告中常见速度指标(如30 tokens/秒)的实际生成效果。该工具源代码公开,信息来源于Hacker News,适用于需要理解生成式AI响应速度的开发者与普通用户。

开源/仓库推理
01:36
Rohan Paul@rohanpaul_ai
67
Velobase开源AI SaaS商业基础设施框架

Velobase宣布开源其AI SaaS框架Velobase Harness。该项目强调,在AI应用时代,产品本身并非真正的护城河,将用户转化为收入的基础设施才是关键。Velobase自身从应用无人问津发展到实现八位数ARR的经历,印证了这一观点。该框架旨在补全从可用应用到盈利业务之间的缺失环节,提供包括支付计费、用户归因、分析与A/B测试在内的全套后端服务。

Velobase: Everyone can build an app now. Almost no one makes a dollar from it. We went from the same problem to 8-figure ARR. The ...

开源/仓库开源生态部署/工程
00:36
Rohan Paul@rohanpaul_ai
63
商汤开源统一多模态模型SenseNova U1

商汤科技近日开源了SenseNova U1,其核心创新在于架构设计。该模型摒弃了传统的视觉编码器与变分自编码器分离结构,采用单一共享表示空间原生处理图像与文本,极大减少了模块间转换导致的信息损耗。这一设计使模型能够连贯地同时生成图文内容,在信息图、海报、漫画等需要高一致性的密集视觉内容创作上优势显著。性能方面,其信息图生成速度在同等质量下约为Qwen-Image-2.0/Seedream-4.5的两倍。

图像生成多模态开源/仓库模型发布
00:06
Artificial Analysis@ArtificialAnlys
69
Cohere推出开源权重模型Command A+,智能指数得分达37

Cohere发布了开源权重模型Command A+,其在AI分析智能指数上的得分与Claude 4.5 Haiku持平。该模型核心优势为极低的幻觉率,在相关榜单上以86%领先,体现出模型“知其不知”的可靠性。在速度方面,其API输出速度超过GPT-5.4 nano等多款模型,但仍略逊于Gemini 3.1 Flash-Lite。模型在科学推理与代码生成等高难度任务上表现稍弱,但具备视觉推理能力,性能位于Claude 4.5 Haiku与GPT-5.4 nano之间。

开源/仓库模型发布评测/基准
00:02
向阳乔木@vista8
精选75
开源插件为Codex App增添高级功能

一个开源项目允许用户增强Codex App的功能。即使通过API登录,也能通过安装插件的方式启用Computer Use特性并添加Goal指令。项目还支持界面自定义,例如调整为类似Chrome浏览器的顶部Tab样式,并可设置任务开始和完成的提醒音效。相关开源项目地址已在评论区提供。

智能体MCP/工具OpenAI开源/仓库

推荐理由:这不只是个插件,它把 Codex 从只能聊天变成了能动手的 Agent,用 API 登录也能开 Computer Use,是给开发者装上了超能力的实用补丁。
5月20日
23:56
IT之家(RSS)
精选71
Stability AI 推出音频模型 Stability Audio 3.0,可生成最长 6 分钟专业级歌曲

Stability AI 推出 Stability Audio 3.0 音频生成模型家族,包含四款不同规格模型,参数从45900万到27亿。小型模型专注设备端运行,可本地生成两分钟以内的音频;中型和大型模型支持创作超过6分20秒的完整音乐,

多模态开源/仓库模型发布

推荐理由:Stability Audio 3.0 把AI音乐从几十秒的demo拉到了六分钟的完整歌曲,而且中小模型直接开源,任何一个能跑模型的设备都能玩,音乐创作的门槛继续被踩低。
23:33
elvis@omarsar0
73
自我改进的AI是件大事!

作者探索利用Fireworks AI Agent,通过自然语言交互自动化完成大语言模型的微调流程。他以Qwen小模型为例,调整其输出风格以优化PaperWiki项目的扩展效率。这一方法灵感源于@karpathy关于LLM知识库的推文,强调微调是让模型更“懂”数据的关键步骤。核心观点是自动化微调可推动构建可递归自我改进的AI系统,最终目标是打造一个能自我优化、用于知识发现和端到端自动化研究的强大工具。

elvis: http://x.com/i/article/2056851733582880768

智能体开源/仓库教程/实践数据/训练
22:08
Berryxia.AI@berryxia
68
PaddleOCR 3.5支持Hugging Face生态

PaddleOCR 3.5版本正式支持Transformers作为推理后端。更新后,PP-OCRv5和PaddleOCR-VL 1.5模型可在Hugging Face生态内直接运行,实现了与主流Transformer技术栈的无缝集成。此举解决了此前将OCR工具整合进RAG或Document AI项目时需要额外搭建服务栈的繁琐问题,大幅降低了开发门槛,让OCR能力更自然地融入现有AI应用开发流程。

PaddlePaddle: 🚀 PaddleOCR 3.5: Transformers Backend Support Now Live! We're excited to share that PaddleOCR 3.5 now supports Hugging ...

Hugging Face开源/仓库部署/工程
20:56
IT之家(RSS)
27
BOSS直聘 2026财年首季净利大幅增长,用户与客户指标持续提升

BOSS直聘发布2026财年第一季度业绩,营收20.69亿元,同比增长7.6%;归母净利润达11.57亿元,同比大幅增长123.24%。经营现金流为11.90亿元,同比增长18.6%。用户与客户规模稳健增长:过去12个月总付费企业客户数达710万,同比增长10.9%;本季度平均月活用户为609万,同比增长5.7%,并在3月突破7200万。公司持续推进AI技术应用,并积极进行股份回购与股东回报。展望第二季度,公司预计总收入将达23.8亿元至24.2亿元。

开源/仓库行业动态
15:07
Berryxia.AI@berryxia
72
乔帮主开源实用油猴脚本套件

开发者“乔帮主”开源了一套日常使用的油猴脚本项目,旨在解决多个主流平台(如微信、小红书、抖音)在内容发布时缺少便捷图片粘贴上传功能等操作痛点。该脚本集主要功能包括:支持在多个内容平台通过截图粘贴自动上传图片;提供YouTube网页版的字幕复制、播放倍速调节,并方便将字幕内容传递给NotebookLM、ChatGPT等工具进行处理;同时支持调整小宇宙网页版的播放速度。项目代码已在GitHub公开。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库
14:31
向阳乔木@vista8
73
开源油猴脚本提升YouTube观看效率与AI协作

该开源油猴脚本(qiaomu-userscripts)增强了YouTube的观看体验,核心功能包括一键复制或下载视频字幕、调节播放倍速。用户可便捷地将字幕发送至Raycast AI、ChatGPT或NotebookLM,利用自定义提示词快速生成总结或进行深度加工。此外,脚本还扩展了对小红书、抖音、微信的截图自动上传,以及小宇宙网页版的倍速调整功能,旨在优化多平台内容处理的效率。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库编码
14:31
向阳乔木@vista8
精选76
开源油猴脚本实现小红书、抖音、微信公众号的截图粘贴自动上传,并支持YouTube字幕复制、倍速调节及内容导出至NotebookLM、ChatGPT等工具。主推文作者表示,该工具增强了将X平台内容同步至国内平台的意愿,尽管部分平台体验欠佳。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库开源生态

推荐理由:向阳乔木开源了一套油猴脚本,让截图直接粘贴上传到小红书、抖音等平台,对多平台内容分发的人来说是一个小而实在的时间节省利器。
14:01
向阳乔木@vista8
69
开源实用油猴脚本,不上班却更忙更充实

作者开源了自己常用的油猴脚本,主要功能包括小红书、抖音等平台的截图自动上传,以及YouTube字幕复制与倍速调节,方便与NotebookLM、ChatGPT等工具配合使用,同时支持小宇宙网页版调速。这是其个人工作清单的一项,作者感叹不上班后的日程(如测试AI产品、体验谷歌新模型等)反而更满,但核心在于所有事务都是自主选择并乐在其中。

向阳乔木: 今天的 Todolist 清单: 1. 上架一个快捷提示词 Chrome 插件 2. 开源几个油猴脚本 3. 测朋友的 AI 产品,写个简单评测 4. 准备周六直播问题 5. 去海河钓鱼 6. 体验谷歌昨天的发布模型和工具 ... 不上班比...

开源/仓库开源生态
13:31
向阳乔木@vista8
72
Multica:将Trello看板中的"人"替换为"Agent"的AI工作流引擎

Multica 是一款开源的 AI 工作流引擎,其创新在于将传统 Trello 看板的任务执行者从“人”替换为“Agent智能体”。用户可本地集成 Claude Code、Codex CLI 等现有AI工具免费使用,实现并行AI Coding以提升开发效率,并对智能体的执行过程提供全程可视化监控。

智能体开源/仓库编码
11:05
HuggingFace Daily Papers(社区热门论文)
68
AutoResearchClaw: 具备自我强化与人机协作的自主研究系统

AutoResearchClaw是一种旨在突破现有系统线性流程局限的多智能体自主研究系统。其核心在于五大机制:结构化多智能体辩论用于假设生成与分析;具备自修复能力的执行器可将失败转化为信息;可验证的结果报告防止数据伪造与引用幻觉;提供从全自动到逐步监督的七种人机协作模式;以及能将过往经验转化为未来保障的跨运行进化能力。实验表明,该系统性能显著优于基线模型,且精准、定向的人机协作模式始终优于完全自主或穷举式监督。它被定位为一种增强而非取代人类科研判断力的研究放大器。

智能体arXiv开源/仓库论文/研究
10:05
HuggingFace Daily Papers(社区热门论文)
65
CEPO:基于对比证据的策略优化方法

针对强化学习(RLVR)中对所有生成token给予相同奖励导致的信用分配问题,本文提出对比证据策略优化(CEPO)。该方法通过对比正确与错误答案对每个token的偏好,精准区分关键推理步骤与普通填充token,从而获得更细粒度的奖励信号。CEPO利用训练批次中已有的拒绝样本构建错误答案教师模型,不产生额外采样成本。实验表明,在2B和4B参数规模下,CEPO在多个数学推理基准上分别取得43.43%和60.56%的平均准确率,优于GRPO等基线方法。

开源/仓库推理论文/研究
‹ 上一页
1…1011121314…25
下一页 ›