Forge – Guardrails 是一个开源工具，通过集成防护栏机制，将8B参数AI模型在代理任务中的准确率从53%大幅提升至99%。这一改进显著增强了模型在复杂任务中的可靠性和效率，降低了错误率。该工具于2026年5月19日在Hacker News社区发布，获得100个点赞，代码已托管在GitHub上供开发者使用。

智能体开源/仓库

05:41

Hacker News：AI 热帖

精选89

Forge：通过防护机制大幅提升8B模型性能的可靠性层

Forge 是一个为自托管大语言模型设计的可靠性层，专注于提升工具调用能力。它通过错误解析、重试提示、步骤强制等防护机制以及高效的上下文管理，成功将8B参数模型在复杂多步骤智能体任务中的表现从53%大幅提升至99%。其核心配置（Ministral-3 8B模型）在自建的26项评估中综合得分达86.5%。Forge 提供三种集成方式：作为全托管工作流运行器、多智能体架构的共享调度器，或嵌入自有编排循环的防护中间件，并附带一个可透明接入的OpenAI兼容代理服务器。

智能体开源/仓库

推荐理由：这个小工具用 guardrails 把本地 8B 模型从 53% 拉升到 99% 的稳定度，对玩自托管 Agent 的人来说像是换了条命，值得一试。

03:03

Hugging Face：Blog（RSS）

OlmoEarth v1.1：更高效的地球观测模型家族

OlmoEarth v1.1 是新一代地球观测模型家族，将计算成本降低最多 3 倍，同时保持与 v1 相近的性能。通过将 Sentinel‑2 不同分辨率（10m、20m、60m）的 token 合并为单个 token，大幅缩短输入序列长度，从而减少预训练、微调和推理所需算力。提供 Base、Tiny、Nano 三种尺寸，权重与训练代码已开源。该模型已在红树林变化追踪、森林退化成因分类、国家级作物图绘制等任务中得到验证。

Hugging Face 开源/仓库数据/训练模型发布

00:39

Hacker News：AI 热帖

精选70

InsForge：面向编程智能体的一体化开源后端平台

InsForge是一个专为AI编码智能体设计的一站式开源后端平台。它通过MCP Server和CLI+Skills两种接口，让智能体能像后端工程师一样直接操作数据库、认证、存储、边缘函数、模型网关等全套后端服务，从而端到端地构建全栈应用。平台支持云托管与基于Docker的自托管，可一键部署至Railway、Zeabur等主流平台。

智能体 MCP/工具开源/仓库部署/工程

推荐理由：这个项目把后端全家桶变成 MCP 工具，AI 代理可以直接管理数据库和部署，对于正在折腾 agent 的团队，比东拼西凑要快得多。

00:02

Berryxia.AI@berryxia

精选78

NVIDIA开源首个4-bit超长视频生成基础设施

NVIDIA研究员开源LongLive 2.0，这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。其核心技术包括FP4量化与并行加速，在5B模型上实现45.7 FPS的生成速度。该框架支持真实视频训练、蒸馏、多镜头生成、序列并行、KV缓存优化及异步解码部署，旨在解决以往长视频生成速度慢或仅限短片的瓶颈。

Yukang Chen: 🚀 Excited to release LongLive 2.0! 🎬 An end-to-end infrastructure for long video generation, with FP4 and parallelism ...

开源/仓库部署/工程

推荐理由：NVIDIA研究员把4-bit长视频生成的全套设施端出来了，45.7FPS跑5B模型，做视频工程的可以直接拿来魔改，这是把长视频的成本打下来的关键一步。

5月19日

23:01

Hugging Face：Blog（RSS）

精选60

引入 Ettin Reranker 系列

Hugging Face 发布六个 Ettin Reranker 重排序模型（17m、32m、68m、150m、400m、1b），基于 Ettin ModernBERT 编码器，蒸馏 self-mxbai-rerank-large-v2 分数训练，在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供，三行代码可调用。同时发布 train-sentence-transformers Agent Skill（v5.5.0），允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。

Hugging Face 检索增强开源/仓库搜索

推荐理由：从17M到1B的全尺寸reranker家族，每个量级都是SOTA，而且训练数据和代码全开放，做搜索和RAG的开发者可以无痛替换旧模型。

21:29

Rohan Paul@rohanpaul_ai

精选78

AI代理在实际应用中需为每个外部服务重复构建集成逻辑，成为其发展的主要瓶颈。针对此问题，Membrane推出了一种通用"技能"解决方案。通过该单一技能，Claude Code、ChatGPT、Cursor等主流AI代理能够用一条指令调用超过10万个不同的API，涵盖从Stripe支付服务到NASA火星车数据等各类服务。这极大简化了开发流程，将定制化集成转变为通用的连接能力，降低了使用门槛。同时，Membrane正发起社区挑战，鼓励用户提交小众API以获得演示和免费额度激励，旨在持续扩展其连接生态。

Membrane: We built one skill that connects any agent to any API. Stripe. NASA Mars Rover. The ISS tracker. The Evil Insult Generat...

智能体 MCP/工具开源/仓库

推荐理由：Membrane 把十万个 API 集成压缩成一行命令，做 agent 的人不用再写胶水代码，直接拿来用就行，省心。

14:51

AYi@AYi_AInotes

AI时代内容交付的真正终点是HTML

开源项目html-anything上线7天即获3.3k星，其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板（如网格、字体、对比度规范），为本地AI Agent设定明确的“设计纪律”，使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断：HTML凭借Web原生与响应式特性在AI时代更先进；本地零API调用通过极致自由与零边际成本提升效率；交付介质的轻量化（数百KB的HTML）直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi: http://x.com/i/article/2053129966217277440

智能体开源/仓库现象/趋势

13:50

AYi@AYi_AInotes

为什么这个GitHub项目全网爆火并拿下10万star？

summary_zh

AYi: Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。一条命令,全部装进你的Claude Code, ...

智能体 Anthropic GitHub MCP/工具

13:44

向阳乔木@vista8

AI助力SEO审计：一键检测网站基础问题

介绍一款名为 seo-audit 的AI技能工具，可通过命令行安装，用于快速分析网站SEO状况。该工具能检测 Sitemap 状态、301重定向、noindex和canonical标签设置等常见基础问题，适用于初步排查网站收录不佳的原因。实际案例显示其生成的报告质量可靠，能有效发现潜在的技术SEO缺陷。

GitHub MCP/工具开源/仓库

10:34

向阳乔木@vista8

AI批量生成艺术风格，一键浏览380+大师作品

作者利用GPT-Image-2模型，批量生成了超过380位艺术家的画风作品。为便于直观学习和借鉴（用于AI生图提示），他创建了一个可体验的网站，将蒙德里安、葛饰北斋等不同风格的创作并置展示，帮助用户快速建立对艺术风格的认知。该项目代码已在GitHub开源。

GitHub 图像生成开源/仓库

09:45

AYi@AYi_AInotes

GitHub爆火项目一键构建AI公司，集成Claude Code

一个GitHub项目引发关注，据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司，包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令，将这些“员工”全部集成到Claude Code中，从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。

智能体 GitHub 开源/仓库编码

06:55

OpenClaw🦞@openclaw

OpenClaw 2026.5.18 已上线 🤖 xAI/Grok OAuth + sidecar 认证修复 🎙️ 实时 Android 对话模式 💬 Telegram 媒体 + 论坛主题推送修复 🪟 浏览器对话框可见且可应答一周的打磨、优化，减少小问题。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.18

智能体开源/仓库部署/工程

00:50

Elon Musk@elonmusk

同事件精选71

马斯克在推文中请求帮助提升 Grok Build。用户 @morganlinton 分享了使用 Grok Build 完成 PasteLocal 项目中 relay 功能开发的体验，称赞其全面性令人惊叹。该功能实现周期短，且包含了端到端加密、数据持久化、自动同步、双向命令行交互等关键技术特性，并经过了多轮严格的代码审查与修复。马斯克此举意在收集更广泛的反馈，以持续改进该开发工具。

Morgan: Phew, Grok Build is really thorough, pretty incredible. Relay feature for PasteLocal is done, pushing to Github now. And...

xAI 产品更新开源/仓库

同一事件，精选展示《Grok Build 0.1 on API》

推荐理由：below_threshold:T2 推文门槛 75,当前 finalScore=71

5月18日

22:52

Hugging Face：Blog（RSS）

精选64

Hugging Face 推出开放 AI 智能体排行榜（Open Agent Leaderboard）

Hugging Face 发布开放 AI 智能体排行榜，用于比较完整智能体系统而非仅底层模型，并同时报告成功率和每次任务成本。排行榜统一了六项已有基准测试（SWE-Bench Verified、BrowseComp+、AppWorld、tau2-Bench Airline & Retail、tau2-Bench Telecom），覆盖代码修复、网络研究、个人任务、客服和技术支持。通过统一协议，各智能体系统以相同接口连接所有基准。结果显示相同模型搭配不同智能体系统会产生显著不同的分数和成本。配套 Exgentic 框架用于运行和复现评估，相关论文开源。

智能体开源/仓库评测/基准

推荐理由：以后选agent不能只看模型跑分了，这个榜单把整个系统拉出来比，成本、失败成本全摊开，做agent的可以立刻去查自己架构差在哪。

16:37

Alibaba Cloud@alibaba_cloud

AgentScope Java 1.1发布，支持工作区驱动持久化、可插拔文件系统、自动上下文管理以及安全沙箱编排，用于构建可扩展的企业级Agent 🚀 了解更多：https://int.alibabacloud.com/m/1000413005/ #Java #AI #AgentScope

智能体开源/仓库

15:32

向阳乔木@vista8

开源Agent IDE ORCA发布：支持移动端与多账号切换

ORCA是一款新开源的Agent IDE，提供iOS及移动端客户端，支持多账号切换（例如多个ChatGPT订阅），并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具，如Claude Code CLI、Codex CLI、Gemini CLI等，支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点，但安装包体积较大。开源地址及官网已公布。

智能体 MCP/工具开源/仓库开源生态

12:02

向阳乔木@vista8

kentzhu: @vista8 我做了个skill,支持飞书机器人之间稳定相互at,支持自定义停止方式,比如x轮、手动停止。并且内置了自由讨论、头脑风暴、评审、辩论4种模式。支持跨openclaw、Hermes的机器人相互at,可以试试。就算用不上,我把飞...

智能体 GitHub 开源/仓库

09:54

Berryxia.AI@berryxia

xAI算法开源深度解析，专家创建完整源码wiki

xAI算法开源后，专家岚叔@LufzzLiz深入研究了xai-org/x-algorithm仓库源码，使用Opus-4.7创建了带有明确源码出处的完整wiki。这与引用推文所指出的现状形成对比：市面上95%的分析是AI批量生产的同质化废话，缺乏对源码的真正理解。岚叔的工作提供了有价值的算法拆解，GitHub仓库和在线阅读地址已公开。

Berryxia.AI: xAI 算法开源后,解读内容铺天盖地。我敢说一句颠覆多数人认知的实话: 市面上 95% 的分析,是 AI 批量生产的同质化废话, 连源码文件名都没翻过一次。「多互动」「多发帖」「账号要垂直」这种谁都会说的话,说了等于没说。真正藏在 ...

GitHub xAI 开源/仓库教程/实践

08:54

Berryxia.AI@berryxia

微信读书数据可视化开源工具yao-weread-skill发布

姚老师开源了名为 yao-weread-skill 的工具，可将用户导出的微信读书数据在本地自动生成包含26个图表的专业可视化阅读报告。报告涵盖近两年阅读时长与节律、书架书籍深度分析、阅读分类/作者/出版社偏好，以及对笔记、划线、想法进行的语义分析，并生成词云、热力图、雷达图等多种图表。该项目旨在帮助用户将碎片化的阅读数据转化为清晰的自我认知报告，方便复盘阅读习惯与进行知识管理，相关代码已在GitHub开源。

姚金刚: 写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...

GitHub 开源/仓库

08:54

Berryxia.AI@berryxia

开源工具揭露AI API中转站安全风险与检测差异

针对AI API中转站可能存在的“掺水”、“造假”等安全风险，开源项目api-relay-audit通过双论文锚定路线，对AC-1工具调用改写、AC-2错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定，并提供透明日志。对比hvoy.ai和cctest.ai等工具，其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开，并开源了该检测工具。

李韭二: http://x.com/i/article/2052006162804125696

开源/仓库部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

SENSE：基于卫星的能量合成促进可持续环境

针对现有城市建筑能耗建模多为预测性、缺乏生成能力且数据稀缺的问题，本文提出了一个名为SENSE的统一生成式框架。该框架能够基于可控扩散模型，联合合成逼真的城市卫星图像以及与之对齐的高质量建筑能耗与高度图。其通过道路网络和城市密度指标进行条件控制，并利用大型视觉模型在潜在空间生成标注信息。在纽约等四个城市的实验表明，SENSE生成的图像视觉保真度高，且符合物理标准。该模型能利用少量标注数据生成合成数据集，显著提升了下游预测任务的性能并降低了误差，为城市可持续规划提供了新方案。

GitHub Hugging Face 图像生成开源/仓库

07:33

Hacker News 热门（buzzing.cc 中文翻译）

Show HN： Semble--一款面向代理的代码搜索工具，其使用的令牌数量比 grep 少 98%

Semble是一款面向AI代理的代码搜索工具，其核心优势在于比传统工具grep节省98%的令牌使用量。该工具已在GitHub开源，并在Hacker News上获得106点热度。这一效率提升旨在降低AI代理处理代码搜索时的计算资源消耗与成本。

智能体 GitHub 开源/仓库搜索

01:00

向阳乔木@vista8

精选80

开发者姚老师开源了微信读书Skill--yao-weread-skill。该工具能将用户的微信读书数据生成本地可视化报告，核心功能包括分析近两年的阅读时长与节律、书架书籍构成、阅读分类与作者偏好，并对笔记和想法进行语义分析。报告最终通过词云、热力图、雷达图等26种图表形式呈现，所有代码已在GitHub公开。

GitHub MCP/工具开源/仓库开源生态

推荐理由：姚老师这个开源的微信读书skill，能直接拉取你的阅读数据，生成热力图、词云等26张可视化图表，读完就能装，做个人报告的可以直接抄作业。

5月17日

18:44

AYi@AYi_AInotes

Garry Tan发布的GBrain直接捅破个人AI天花板

Garry Tan开源的GBrain是一个知识系统，而非简单的RAG工具。它通过8层结构解决AI Agent的记忆缺陷：前4层升级基础检索，后4层实现终身记忆和自我进化，使如OpenClaw、Hermes等Agent能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据，用户可通过安装链接或命令行快速集成，并以Markdown为最高优先级数据源，推动个人AI成为可能。

Garry Tan: What is GBrain? My open source project is a knowledge system, not RAG in a box. It gives agents 8 layers that work toget...

智能体开源/仓库

15:59

The Decoder：AI News（RSS）

Oppo 开源 Android AI 代理 X-OmniClaw，无需离开手机即可调用摄像头、屏幕与语音

Oppo 的 Multi-X 团队发布了开源 AI 代理 X-OmniClaw，该代理可直接在 Android 设备上运行。它整合摄像头、屏幕和语音输入，在真实应用程序中实时处理任务。系统主要依赖本地传感器执行操作，仅将推理任务交由云端计算。用户的操作路径可被克隆为可复用技能，代理下次能通过深度链接直接跳转到应用深层页面，无需重复操作。

智能体多模态开源/仓库端侧

15:32

Hacker News 热门（buzzing.cc 中文翻译）

在8位微控制器上托管网站

一个技术项目成功在8位微控制器上托管了网站，突破了此类设备资源有限、难以运行网络服务的传统限制。该项目在Hacker News上获得102点高分，引发技术社区广泛关注。实现基于代码优化和资源压缩，以适应微控制器的低内存和处理能力，为物联网和嵌入式开发提供了新思路。详细内容可通过maurycyz.com链接访问，展示了实际部署和性能指标。

其他开源/仓库

10:53

meng shao@shao__meng

Vercel发布专为Agent设计的编程语言Zero

Vercel 发布了为 Agent 设计的编程语言 Zero 为什么说它是为 Agent 设计的编程语言呢？因为 ... 我们人类不用看 👀 各位 Agent 请看这里: https://github.com/vercel-labs/zero

Chris Tate: Introducing Zero The programming language for agents. I wanted a systems language that was faster, smaller, and easier f...

智能体开源/仓库

09:02

Hacker News 热门（buzzing.cc 中文翻译）

精选74

Zerostack--一款采用纯Rust语言编写、受Unix启发的编程代理

Zerostack是一款采用纯Rust语言编写、受Unix哲学启发的编程代理工具，已正式发布1.0.0版本并在Rust包管理平台crates.io上提供。该发布在技术社区Hacker News上获得115点关注，反映出开发者对其的高度兴趣。Rust语言以内存安全和性能见称，Unix设计强调简洁与模块化，Zerostack结合两者优势，旨在提升编程效率，为代码辅助领域带来新选择。

智能体开源/仓库编码

推荐理由：不走 IDE 插件的老路，Zerostack 把编程代理做成命令行管道，Rust 纯血、Unix 哲学，适合喜欢拼接工具的开发者尝鲜。

06:54

Berryxia.AI@berryxia

专门属于AI Agent的编程语言Zero发布

Vercel Labs近日推出了专为AI agents设计的编程语言Zero。该语言由Chris Tate主导开发，旨在创建一个更快、更小、且更易于agents编写、修复和维护的系统语言。其核心设计理念是从第一天起就为agents原生构建，而非让agents学习人类语言。关键特性包括显式能力声明、JSON格式的结构化诊断信息以及类型安全的自动修复功能。此举旨在解决当前agents使用Rust或Python等语言时容易产生幻觉和难以调试的问题，试图从语言层面消除这些痛点。项目已在GitHub上开源，鼓励开发者参与和贡献。

Chris Tate: Introducing Zero The programming language for agents. I wanted a systems language that was faster, smaller, and easier f...

智能体 GitHub 产品更新开源/仓库

04:59

Simon Willison 博客

从Warelay到OpenClaw：一个项目的六次更名史

作者为准备PyCon US闪电演讲，使用first_line_history.py工具追溯了OpenClaw项目自2025年11月首次提交以来的名称演变。根据Git历史记录，该项目在短短两个多月内经历了六次更名：从最初的Warelay，依次变为CLAWDIS、CLAWDBOT、Clawdbot、Moltbot，最终定名为OpenClaw。其定位也从基于Twilio的WhatsApp中继命令行工具，逐步演变为支持WhatsApp和Telegram的AI代理网关，最终定型为“个人AI助手”。

GitHub 开源/仓库开源生态

00:51