牛津大学博士后Kevin Lin开源视频翻译工具Violin，旨在打破高质量视频内容的语言壁垒。该工具将语音识别、大语言模型翻译与语音合成整合为自动化流水线，支持多语言互译与个性化翻译风格调整，例如将学术报告转化为儿童易懂版本。用户还能直接与视频内容进行对话并获取相关答案。Violin提供Web应用、命令行界面和Agent Skill三种使用方式，所有功能基于MIT协议开源，由Together Compute提供技术支持，适用于内容创作、教育及多模态智能体开发等领域。

Kevin Lin: 🌟Introducing🎻Violin - an Open-source Video Translation Skill. 📹Video is the dominant medium on the internet, yet most...

GitHub 多模态开源/仓库语音

推荐理由：视频翻译过去得拼几个 API，Violin 一个开源 Skill 把 ASR、翻译、TTS 全通了，还加上视频对话和风格定制，做多语言内容传播的必须收藏。

08:51

Berryxia.AI@berryxia

开发者Yetone将一篇关于桌面应用开发"最佳实践"的文章转化为一个名为"native-feel-skill"的Agent Skill。该Skill旨在帮助开发者利用Coding Agent，轻松地重构或开发跨平台桌面应用，并使其获得极其接近Native原生应用的性能体验。项目代码已开源在GitHub上。

yetone: 由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...

智能体 GitHub 开源/仓库编码

07:51

Berryxia.AI@berryxia

LM Studio 又更新了 Beta 版，在MLX框架下优化增强了之前的缓存问题。目前需要打开dev模式然后加油更新到最新版体验。

产品更新开源/仓库推理

05:06

Peter Steinberger 🦞@steipete

OpenClaw 团队近期专注于提升性能、可靠性、安全性和稳定性，通过引入 crabbox 等全新自动化流程以及投入大量 CPU 资源于 CI 环节，实现了显著改进。新版本默认将 OpenAI 配置设为 Codex 登录，增强了运行时回退与停滞流恢复机制，确保 Telegram 轮询在停滞情况下仍可维持。此外，安装包更精简、启动路径更快速，整体运行更高效、稳定且不易卡顿。

OpenClaw🦞: OpenClaw 2026.5.12 🦞 🧠 OpenAI setup defaults to Codex login 🛟 Runtime fallbacks + stalled-stream recovery 📬 Telegram...

GitHub 开源/仓库编码

00:51

Berryxia.AI@berryxia

精选82

Tom 兄弟开源 html-anything，赋能 AI Agent 输出高质量 HTML

Tom 兄弟开源了“html-anything”项目，旨在让 AI Agent 能将多种数据格式直接转换为专业设计的 HTML。该工具支持 Markdown、CSV、JSON 等 11 种输入格式，并内置 75 套模板，可生成杂志、海报、推文卡片等多种形态。它能自动兼容 Claude Code、Cursor 等主流本地 code agent，实现一键切换、完全本地运行，无需 API 密钥，边际成本极低。这一能力显著提升了 Agent 的内容呈现效果，对日常使用 Agent 进行内容创作、报告和演示的用户具有实用价值。

Tom Huang: 正式开源 html-anything 🚀 1:1 让你感受全网爆火 Claude code 作者提的 HTML 效果! 你的 Agent 现在可以将任何数据转为世界级设计水准的 HTML 🔥 历时 3 天,1万五千行代码!支持 75 套...

智能体开源/仓库

推荐理由：这个工具填补了Agent输出只有干巴文本的尴尬，75套模板直接搞定报告、卡片、海报，做内容的人终于不用再手动排版了。

5月14日

23:51

Berryxia.AI@berryxia

MLX CUDA后端测试全通过，跨平台本地AI时代来临

MLX框架的CUDA后端已实现所有测试通过，标志着其从苹果芯片专属工具正式进军NVIDIA GPU领域。这意味着开发者能用同一套代码，在Mac和NVIDIA显卡上获得高性能运行体验，有望打破PyTorch等框架的兼容性壁垒。此举可能强力推动本地AI应用的跨平台发展进程。

Cheng: We have achieved a milestone in MLX that all tests are passing in CUDA backend now.

产品更新开源/仓库开源生态

22:51

Berryxia.AI@berryxia

腾讯AI团队开源Agent记忆系统，攻克长会话上下文丢失难题

腾讯AI团队耗时6个月，针对AI agent在长会话中频繁丢失上下文的问题，开发并开源了一套记忆系统。该系统通过三大核心操作提升性能：实时压缩过期上下文，将token消耗降低61%；利用mermaid语法生成结构化任务地图，使agent在30多步复杂工作流中不易迷失；建立专用Persona记忆，将人格一致性从48%提升至76%。方案基于实际踩坑经验，强调agent记忆的难点在于在正确时间以正确方式回忆正确信息，而非单纯堆叠token。项目已在GitHub开源，为AI agent发展提供实用解决方案。

Tencent AI: We spent 6 months on one problem: agents losing context in long sessions. Ended up building and open-sourcing an agent m...

智能体 MCP/工具开源/仓库

19:15

SenseTime@SenseTime_AI

精选77

由联合创始人兼首席科学家李沐博士领导的团队发布了SenseNova U1技术报告，详细阐述了其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型（MoE）的新权重，旨在推动AI领域的透明度、可复现性与进一步创新。团队希望通过开放共享促进整个社区的技术发展。

Dahua Lin: Proud to announce the release of the SenseNova U1 Tech Report - together with the a new set of model weights based on Mo...

开源/仓库开源生态数据/训练模型发布

推荐理由：商汤这次把SenseNova U1的MoE权重和完整技术报告一起开源，比常规PR多了些诚意，做模型选型和微调的值得翻翻。

17:38

🚨 AI News | TestingCatalog@testingcatalog

OpenSquilla近日推出了一款开源Python AI代理，专为执行成本效益高的长时任务而设计。其核心创新是内容感知模型路由技术，能自动将简单任务分配给廉价模型，复杂任务分配给高性能模型，基准测试显示相比单一模型方案可节省60%-80%的token成本。该代理还集成四层持久化记忆系统，支持本地嵌入以提升效率，并提供不依赖Docker的系统调用级沙箱隔离，确保运行安全。项目采用Apache-2.0许可证开源，强调本地优先和Python基础。为验证成本节省效果，OpenSquilla启动了"1000万Token账单挑战"，邀请用户对比账单，设立奖项包括忠实复现、最佳节省案例和质量错误报告三类，共30名获奖者各获得1000万OpenRouter积分，旨在推动高效AI代理的实践应用。

OpenSquilla: Long-running agents shouldn't pay frontier-model prices for every turn. We've been quietly building our agent with conte...

智能体 MCP/工具开源/仓库

12:07

宝玉@dotey

精选80

baoyu-skills 新加了一个 Skill：微信群聊总结 Skill：https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 wx-cli：https://github.com/jackwener/wx-cli 如何配置使用 wx-cli 请看项目文档，无法提供帮助。另外目前只是借助其读取数据，其他没任何关系。 Claude Code + Claude Opus 4.6 效果最佳

Anthropic 开源/仓库教程/实践

推荐理由：微信群聊的AI总结一直缺现成方案，宝玉这个skill直接调wx-cli读取聊天记录再丢给Claude总结，社群运营同学可以马上试试。

10:56

向阳乔木@vista8

开源项目OpenSquilla：智能路由与本地检索，大幅降低LLM使用成本

开源项目OpenSquilla针对大语言模型应用Token消耗过高的问题，提出了智能模型路由与本地向量检索相结合的解决方案。系统能自动判断任务复杂度，将简单问题路由至廉价模型，复杂任务则分配给更强模型，且路由决策在本地完成，不消耗Token。通过增量发送与缓存命中机制，实际传输Token减少了90%以上。其记忆系统能在上下文将满时自动筛选并压缩关键信息，支持混合检索。项目还具备成本统计、安全沙箱、支持OpenClaw一键迁移及定时任务等功能，显著提升了使用效率与经济性。

智能体开源/仓库

07:35

Orange AI@oran_ge

作者与登科共同开发了一款名为"Agent坦克大战"的游戏，旨在呼吁人们不要仅将AI用于提升效率的"内卷"，而应将其应用于娱乐放松领域。该游戏的核心是让玩家体验AI驱动的坦克对战，通过具体的游戏项目展示了AI技术在休闲娱乐场景下的创新应用潜力。

Orange AI: http://x.com/i/article/2054702609756508160

智能体开源/仓库

5月13日

23:39

Emad@EMostaque

在构建多智能体生产级系统时，PostgreSQL虽可靠但检索速度不足。团队为此开发并开源了psql_bm25s，这是一个原生PostgreSQL访问方法，实现了精确的BM25检索。其在标准基准测试中比pg_search快约23倍，使得检索不再成为性能瓶颈和成本负担，智能体得以高效查询数据，为大规模自主智能体应用铺平道路。

Intelligent Internet: so we built psql_bm25s. exact BM25 retrieval. native Postgres access method. ~23x faster than pg_search on the standard ...

智能体开源/仓库

14:43

SenseTime@SenseTime_AI

精选72

SenseNova-U1 技术报告深度发布：前沿原生多模态模型构建全指南

SenseNova-U1 技术报告详尽披露了构建前沿原生多模态模型的方法，核心包括原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练、以及原生混合专家骨干网络。报告提供了六阶段训练方案、强化学习后训练与蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构，仅激活30亿参数，实现了高效快速的性能。相关资源已全面开放，涵盖技术报告、模型权重、代码和演示平台。

多模态开源/仓库模型发布

推荐理由：商汤把原生多模态模型的训练细节全公开了，无视觉编码器、原生MoE架构，还开源了38B-A3B权重，做多模态模型的可以直接照着技术报告复现。

14:04

Peter Steinberger 🦞@steipete

感谢微软，他们正助力OpenClaw做好企业级准备。

Omar Shahine: New in @openclaw beta: one path scheme to rule them all. `openclaw path read|write|append` works the same across md, jso...

GitHub MCP/工具 Microsoft 开源/仓库

12:55

向阳乔木@vista8

博主长期计划搭建个人博客，因工程量大而拖延。受@vista8乔木老师开源博客系统启发，他fork代码并部署到Cloudflare，大半天内实现上线。系统提供Notion式写作体验，AI自动生成摘要、标签和封面，内置微信公众号bridge支持一键发布，且零服务器成本。开源社区避免了从零造轮子，大幅提升效率。但系统初版可能存在bug，需等待后续版本更新。

AI 赋能坊: 自己的博客,想了大半年,终于上线了。说来惭愧,"搭一个自己的写作阵地" 这件事在我 TODO 里躺了很久。选框架、挑主题、搞部署、接公众号...... 每次一想就觉得工程量太大,然后就搁置了。直到看到 @vista8 乔木老师开源了他...

开源/仓库开源生态部署/工程

12:50

Berryxia.AI@berryxia

精选76

oMLX更新强化苹果端侧AI，本地能力直逼云端

oMLX项目更新至0.3.9.dev2版本，集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术，显著提升了图文处理速度。新增一键启动copilot功能，可便捷接入Claude等工具，并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现，正推动AI能力从云端向个人电脑回归。

GitHub MCP/工具多模态开源/仓库

推荐理由：oMLX 这个更新把 Gemma 4 的视觉能力塞进本地，加一键接入 Claude 的工具链，端侧 AI 从差点意思到真可用，值得每个 Mac 开发者立刻试一下。

08:49

Berryxia.AI@berryxia

Jina同步发布MLX格式嵌入模型，端侧AI部署迎来新趋势

Jina在其新版嵌入模型发布首日，即同步提供了全套MLX格式变体，改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标，背后应有自动化流程支持。这一动向反映了MLX生态的崛起：Qwen、DeepSeek等主流模型官方开始集成MLX，Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性，尤其适合在Mac的M系列统一内存上运行，为本地RAG等场景提供了理想的端侧AI解决方案。

Berryxia.AI: https://huggingface.co/collections/jinaai/jina-embeddings-v5-omni

Hugging Face 开源/仓库模型发布现象/趋势

08:12

Nathan Lambert@natolambert

Jinja聊天模板一直感觉像是一个临时平衡，所以我们需要有人来接手，并尝试在社区内构建它。对此感到兴奋！

Prime Intellect: Introducing Renderers RL trainers work in tokens. Environments work in messages. Going back and forth corrupts sampled t...

智能体开源/仓库数据/训练

00:52

向阳乔木@vista8

HeavySkill论文提出让多个AI agent并行独立思考同一问题，再通过综合推理得出更优答案，能显著提升回答质量。基于这一思路，开发者开源了一个免费Skill，部署3-5个完全独立的Sub agent进行并行推理，然后由Codex主持讨论，以识别每个agent的视角盲点，最终生成比单一推理更好的结论。该Skill的开源代码和Demo已公开提供。

向阳乔木: 读了一篇叫HeavySkill的论文,非常有意思。让多个 AI先并行"独立思考",生成多条独立推理。再用另一轮推理来综合所有思路,得出最终答案。按论文测试结果,回答质量会提升非常多。正在按这个思路写一个Skill,Claude Co...

智能体开源/仓库推理

00:34

🚨 AI News | TestingCatalog@testingcatalog

holaOS Beta 0.1 正式发布，这是一个专为长期持续性工作设计的操作系统。它基于开源的Agent Computer构建，核心目标是解决当前AI智能体仅适用于单次会话、缺乏记忆与延续性的问题，旨在成为随时间展开的"活"工作空间。系统主要特性包括：具备独立上下文、规则与记忆的多工作空间；可并行处理复杂任务的子智能体；以及用于追踪执行状态、审查任务和规划下一步的可定制化仪表盘。该版本标志着AI从一次性会话工具向可长期协作的"队友"转变的尝试。目前仍处早期测试阶段，开发者建议用户将其应用于每周重复进行的持续性工作流中进行体验。

Jeffrey Li: We just launched holaOS Beta 0.1 - the first product version of what started as our open-source agent computer. I record...

智能体产品更新开源/仓库

5月12日

20:49

Berryxia.AI@berryxia

AI Agent需要用户消费上下文才能充当个人管家，作者调研了主流消费平台的订单导出方法。淘宝提供导出功能；京东无官方支持，但通过Codex定制Chrome插件实现一键导出，并开源在Github；闪购（饿了么）可申请导出Excel；美团外卖暂无方法；大众点评通过定制插件导出收藏列表。作者开源了京东和大众点评的导出工具，鼓励用户利用这些数据让AI Agent进行个性化分析，以提升服务实用性。

paulwei: AI Agent 连你平时买啥、吃啥的上下文都没有, 怎么了解你的消费品味?怎么做你的个人管家? 想拥有吃货Agent、买手Agent、导购Agent? 我又搓了个通宵,替你们调研实操了: 淘宝/京东/闪购(饿了么)/美团外卖/大众点评.....

智能体开源/仓库教程/实践

17:22

向阳乔木@vista8

SkillsVote：解决AI Agent技能发现与安全运行痛点的基建工具

AI Agent面临技能发现难、匹配不准及运行安全等挑战。SkillsVote利用GPT-5.4分析了Github上超160万个技能，筛选出79万多个，并提取功能、环境及权限等关键信息。它不仅提供精准推荐，还能记录执行步骤、反馈结果以优化技能，并生成工作流组合建议，提升技能价值。相比Vercel仅支持发现安装，SkillsVote覆盖了从发现、适配、归因到迭代的全流程，支持多种Agent客户端，是AI Agent的重要基础设施工具。

智能体 MCP/工具开源/仓库

09:49

Berryxia.AI@berryxia

Apple押注端侧AI，开源小模型MiniCPM-V 4.6实现高效边缘部署

推文指出Apple的统一内存架构是端侧AI的理想平台。同时，OpenBMB发布了专为消费级硬件优化的1.3B多模态模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术，将视觉编码成本降低55%，实现了高效的边缘原生部署。其在多项关键基准测试中超越了更大的模型，且token消耗仅为对比模型的2.5%。在RTX 4090上处理高分辨率图像时，首token延迟仅75.7ms，速度快2.2倍。模型技术亮点包括Intra-ViT早期压缩和混合视觉压缩，有效平衡了分辨率与延迟。其部署友好，支持iOS、Android、HarmonyOS及多种主流推理框架与量化格式，相关资源已在各大平台开源。

OpenBMB: 1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...

多模态开源/仓库模型发布端侧

5月11日

21:31

凡人小北@frxiaobei

精选75

知识产权全面沦陷。发明专利生成 skill https://github.com/handsomestWei/patent-disclosure-skill 软著生成 skill https://github.com/Fokkyp/SoftwareCopyright-Skill 设计专利/实用新型更容易，claude desgin/ image2

scavin: 中国软件著作权申请材料生成器 Skills https://meta.appinn.net/t/topic/85159

开源/仓库开源生态

推荐理由：发明和软著生成 skill 直接把知识产权的门槛打到地板，虽然质量可能粗糙，但这套自动化流水线会让审批系统面临海量申请，值得关注。

18:48

Berryxia.AI@berryxia

开发者开源了个人手动积累的工具库网页，内容涵盖审美、AI艺术与网页设计相关资源。为解决资源过多、难以查找的问题，该系统集成了一键收藏功能，并支持Notion数据库备份、Obsidian备份以及AI精准搜索。网页界面经过精心设计，现公开分享供用户探索使用。

小耳👂Jane|Xiaoer: 🌞我的私人工具库web开源了👹 ⚔️不是爬虫爬的合集 ⚔️不是随意收的合集而是 🐝一个一个手动拷贝 🐝记录在我notion的 🦋很多跟审美相关 🦠也跟AI艺术相关做个酷网页相关自己一路的累积实在太多了存的时候没时间记录...

开源/仓库

13:34

阿绎 AYi@AYi_AInotes

大神用Claude Code复刻完整游戏开发工作室，48个AI智能体覆盖全岗位

开源项目Claude Code Game Studios利用Claude Code构建了完整的虚拟游戏开发工作室。该项目包含48个AI智能体，1:1还原从创意总监到关卡设计师等全部岗位，覆盖游戏开发全流程。系统提供36条斜杠指令一键启动工作流，适配Godot、Unity、Unreal三大游戏引擎，并集成自动化校验钩子及28套行业标准文档模板。所有AI仅负责梳理方案，最终决策权由用户掌握。项目采用MIT开源协议，可免费商用，克隆仓库即可快速部署。

智能体 Anthropic 开源/仓库开源生态

09:33

meng shao@shao__meng

这个为 iOS App 创建用户 Onboarding Video 的 Skill 很有启发

一款开源Skill“Create Onboarding Video”利用AI（通过Remotion）为iOS App生成高质量的用户引导视频。它强制遵循一套“反AI油腻感”的硬性规则，以制作出具有“App Store预览”级质感的片段。核心规则包括：视频需聚焦于证明功能在工作的特定UI组件，而非展示完整屏幕；字幕需有固定的位置、大小和入场动画；光标交互必须真实自然，禁止瞬移。该Skill定义了从素材采集、分镜规划到编码实现的四步工作流，强调“展示而非叙述”，旨在快速引导用户达成“aha moment”。

ROFI: http://x.com/i/article/2053059568121282560

智能体 GitHub 开源/仓库教程/实践

08:44

向阳乔木@vista8

OpenCLI项目实现了对微信、Telegram和Discord三大平台内容的命令行读取，通过wx-cli、tg-cli和discord-cli工具，用户可直接获取群消息、聊天记录、朋友圈及收藏夹等私域数据。这标志着个人信息流聚合的关键突破，使得AI Agent不仅能监控外部资讯网站，还能整合个人私密的社交聊天信息，构建真正统一的个人数据流。此举可能引发平台方如微信的关注或反应。

kabikabi: OpenCLI 现在可以读取微信、Telegram、Discord 的内容了!!! wx-cli / tg-cli / discord-cli 全部接入。群消息、聊天记录、朋友圈、收藏夹--全部可以用 CLI 直接拿到。以前 Agent...

智能体开源/仓库开源生态

07:30

Peter Steinberger 🦞@steipete

🎚️ CodexBar 0.25 已上线 🧩 新增提供商：Manus、MiMo、Qwen、Doubao、Venice 等 🔔 配额预警通知 👥 堆叠式 Codex 账户切换器 📊 通过 http://models.dev 获取更快的成本记录重大更新。菜单栏依旧小巧。 https://github.com/steipete/CodexBar/releases/tag/v0.25

产品更新开源/仓库编码

06:45

Berryxia.AI@berryxia

这个太方便了啊！！！搞科研读论文的不要错过啦！如何安装Hugging face的CLI？ curl -LsSf http://hf.co/cli/install.sh | bash 直接开干就完了！支持arxiv和hugging face…

向阳乔木: 如果你喜欢到Huggingface读最新的AI论文。可以安装官方的cli: curl -LsSf https://hf.co/cli/install.sh | bash 安装好以后,提示词: hf papers read [论文编号或论文...

Hugging Face 开源/仓库教程/实践

5月10日

19:29

Peter Steinberger 🦞@steipete

精选76

为@useblacksmith开发了BlackBar菜单栏 https://github.com/openclaw/BlackBar/releases/tag/v0.1.0

开源/仓库编码

推荐理由：为 Blacksmith 做了个菜单栏小工具，虽不是重大更新，但胜在即装即用，对 Blacksmith 用户来说是个实在的便利插件。