GitHub 上出现了开源项目 Remove–AI–Watermarks,提供命令行工具与库两种形式,可自动识别并移除图像中由 AI 生成的隐藏水印。该项目旨在提供便捷的技术方案,以应对 AI 内容标识带来的编辑与再利用限制,目前在开发者社区已获得较高关注。
GitHub 上出现了开源项目 Remove–AI–Watermarks,提供命令行工具与库两种形式,可自动识别并移除图像中由 AI 生成的隐藏水印。该项目旨在提供便捷的技术方案,以应对 AI 内容标识带来的编辑与再利用限制,目前在开发者社区已获得较高关注。
datasette-llm 发布 0.1a8 版本。本次更新主要修复了 llm_prompt_context() 钩子未能完整收集响应链的 bug,该问题对应 GitHub 问题 #7。此次版本发布为用户提供了更稳定和可靠的交互体验。
llm-gemini发布了0.32a0版本。此次更新要求llm版本不低于0.32a0的alpha版,其核心变化是新增了流式处理推理token的功能。
项目 llm-gemini 发布了 0.32 版本,本次更新主要新增了对谷歌最新发布的模型 gemini-3.5-flash 的支持。发布信息同步提供了关于 Gemini 3.5 Flash 的技术笔记,以及作者使用升级后的插件绘制的图像示例,展示了该模型的实际应用效果。
Forge – Guardrails 是一个开源工具,通过集成防护栏机制,将8B参数AI模型在代理任务中的准确率从53%大幅提升至99%。这一改进显著增强了模型在复杂任务中的可靠性和效率,降低了错误率。该工具于2026年5月19日在Hacker News社区发布,获得100个点赞,代码已托管在GitHub上供开发者使用。
Forge 是一个为自托管大语言模型设计的可靠性层,专注于提升工具调用能力。它通过错误解析、重试提示、步骤强制等防护机制以及高效的上下文管理,成功将8B参数模型在复杂多步骤智能体任务中的表现从53%大幅提升至99%。其核心配置(Ministral-3 8B模型)在自建的26项评估中综合得分达86.5%。Forge 提供三种集成方式:作为全托管工作流运行器、多智能体架构的共享调度器,或嵌入自有编排循环的防护中间件,并附带一个可透明接入的OpenAI兼容代理服务器。
OlmoEarth v1.1 是新一代地球观测模型家族,将计算成本降低最多 3 倍,同时保持与 v1 相近的性能。通过将 Sentinel‑2 不同分辨率(10m、20m、60m)的 token 合并为单个 token,大幅缩短输入序列长度,从而减少预训练、微调和推理所需算力。提供 Base、Tiny、Nano 三种尺寸,权重与训练代码已开源。该模型已在红树林变化追踪、森林退化成因分类、国家级作物图绘制等任务中得到验证。
InsForge是一个专为AI编码智能体设计的一站式开源后端平台。它通过MCP Server和CLI+Skills两种接口,让智能体能像后端工程师一样直接操作数据库、认证、存储、边缘函数、模型网关等全套后端服务,从而端到端地构建全栈应用。平台支持云托管与基于Docker的自托管,可一键部署至Railway、Zeabur等主流平台。
NVIDIA研究员开源LongLive 2.0,这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。其核心技术包括FP4量化与并行加速,在5B模型上实现45.7 FPS的生成速度。该框架支持真实视频训练、蒸馏、多镜头生成、序列并行、KV缓存优化及异步解码部署,旨在解决以往长视频生成速度慢或仅限短片的瓶颈。
🚀 Excited to release LongLive 2.0! 🎬 An end-to-end infrastructure for long video generation, with FP4 and parallelism ...
Hugging Face 发布六个 Ettin Reranker 重排序模型(17m、32m、68m、150m、400m、1b),基于 Ettin ModernBERT 编码器,蒸馏 self-mxbai-rerank-large-v2 分数训练,在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供,三行代码可调用。同时发布 train-sentence-transformers Agent Skill(v5.5.0),允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。
We built one skill that connects any agent to any API. Stripe. NASA Mars Rover. The ISS tracker. The Evil Insult Generat...
开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。
http://x.com/i/article/2053129966217277440
summary_zh
Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, ...
介绍一款名为 seo-audit 的AI技能工具,可通过命令行安装,用于快速分析网站SEO状况。该工具能检测 Sitemap 状态、301重定向、noindex和canonical标签设置等常见基础问题,适用于初步排查网站收录不佳的原因。实际案例显示其生成的报告质量可靠,能有效发现潜在的技术SEO缺陷。
作者利用GPT-Image-2模型,批量生成了超过380位艺术家的画风作品。为便于直观学习和借鉴(用于AI生图提示),他创建了一个可体验的网站,将蒙德里安、葛饰北斋等不同风格的创作并置展示,帮助用户快速建立对艺术风格的认知。该项目代码已在GitHub开源。
一个GitHub项目引发关注,据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司,包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令,将这些“员工”全部集成到Claude Code中,从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。
Phew, Grok Build is really thorough, pretty incredible. Relay feature for PasteLocal is done, pushing to Github now. And...
同一事件,精选展示《Grok Build 0.1 on API》Hugging Face 发布开放 AI 智能体排行榜,用于比较完整智能体系统而非仅底层模型,并同时报告成功率和每次任务成本。排行榜统一了六项已有基准测试(SWE-Bench Verified、BrowseComp+、AppWorld、tau2-Bench Airline & Retail、tau2-Bench Telecom),覆盖代码修复、网络研究、个人任务、客服和技术支持。通过统一协议,各智能体系统以相同接口连接所有基准。结果显示相同模型搭配不同智能体系统会产生显著不同的分数和成本。配套 Exgentic 框架用于运行和复现评估,相关论文开源。
ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。
@vista8 我做了个skill,支持飞书机器人之间稳定相互at,支持自定义停止方式,比如x轮、手动停止。并且内置了自由讨论、头脑风暴、评审、辩论4种模式。支持跨openclaw、Hermes的机器人相互at,可以试试。就算用不上,我把飞...
xAI算法开源后,专家岚叔@LufzzLiz深入研究了xai-org/x-algorithm仓库源码,使用Opus-4.7创建了带有明确源码出处的完整wiki。这与引用推文所指出的现状形成对比:市面上95%的分析是AI批量生产的同质化废话,缺乏对源码的真正理解。岚叔的工作提供了有价值的算法拆解,GitHub仓库和在线阅读地址已公开。
xAI 算法开源后,解读内容铺天盖地。 我敢说一句颠覆多数人认知的实话: 市面上 95% 的分析,是 AI 批量生产的同质化废话, 连源码文件名都没翻过一次。 「多互动」「多发帖」「账号要垂直」 这种谁都会说的话,说了等于没说。 真正藏在 ...
姚老师开源了名为 yao-weread-skill 的工具,可将用户导出的微信读书数据在本地自动生成包含26个图表的专业可视化阅读报告。报告涵盖近两年阅读时长与节律、书架书籍深度分析、阅读分类/作者/出版社偏好,以及对笔记、划线、想法进行的语义分析,并生成词云、热力图、雷达图等多种图表。该项目旨在帮助用户将碎片化的阅读数据转化为清晰的自我认知报告,方便复盘阅读习惯与进行知识管理,相关代码已在GitHub开源。
写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...
针对AI API中转站可能存在的“掺水”、“造假”等安全风险,开源项目api-relay-audit通过双论文锚定路线,对AC-1工具调用改写、AC-2错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定,并提供透明日志。对比hvoy.ai和cctest.ai等工具,其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开,并开源了该检测工具。
http://x.com/i/article/2052006162804125696
针对现有城市建筑能耗建模多为预测性、缺乏生成能力且数据稀缺的问题,本文提出了一个名为SENSE的统一生成式框架。该框架能够基于可控扩散模型,联合合成逼真的城市卫星图像以及与之对齐的高质量建筑能耗与高度图。其通过道路网络和城市密度指标进行条件控制,并利用大型视觉模型在潜在空间生成标注信息。在纽约等四个城市的实验表明,SENSE生成的图像视觉保真度高,且符合物理标准。该模型能利用少量标注数据生成合成数据集,显著提升了下游预测任务的性能并降低了误差,为城市可持续规划提供了新方案。
Semble是一款面向AI代理的代码搜索工具,其核心优势在于比传统工具grep节省98%的令牌使用量。该工具已在GitHub开源,并在Hacker News上获得106点热度。这一效率提升旨在降低AI代理处理代码搜索时的计算资源消耗与成本。
写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...
Garry Tan开源的GBrain是一个知识系统,而非简单的RAG工具。它通过8层结构解决AI Agent的记忆缺陷:前4层升级基础检索,后4层实现终身记忆和自我进化,使如OpenClaw、Hermes等Agent能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据,用户可通过安装链接或命令行快速集成,并以Markdown为最高优先级数据源,推动个人AI成为可能。
What is GBrain? My open source project is a knowledge system, not RAG in a box. It gives agents 8 layers that work toget...
Oppo 的 Multi-X 团队发布了开源 AI 代理 X-OmniClaw,该代理可直接在 Android 设备上运行。它整合摄像头、屏幕和语音输入,在真实应用程序中实时处理任务。系统主要依赖本地传感器执行操作,仅将推理任务交由云端计算。用户的操作路径可被克隆为可复用技能,代理下次能通过深度链接直接跳转到应用深层页面,无需重复操作。
一个技术项目成功在8位微控制器上托管了网站,突破了此类设备资源有限、难以运行网络服务的传统限制。该项目在Hacker News上获得102点高分,引发技术社区广泛关注。实现基于代码优化和资源压缩,以适应微控制器的低内存和处理能力,为物联网和嵌入式开发提供了新思路。详细内容可通过maurycyz.com链接访问,展示了实际部署和性能指标。
Vercel 发布了为 Agent 设计的编程语言 Zero 为什么说它是为 Agent 设计的编程语言呢? 因为 ... 我们人类不用看 👀 各位 Agent 请看这里: https://github.com/vercel-labs/zero
Introducing Zero The programming language for agents. I wanted a systems language that was faster, smaller, and easier f...
Zerostack是一款采用纯Rust语言编写、受Unix哲学启发的编程代理工具,已正式发布1.0.0版本并在Rust包管理平台crates.io上提供。该发布在技术社区Hacker News上获得115点关注,反映出开发者对其的高度兴趣。Rust语言以内存安全和性能见称,Unix设计强调简洁与模块化,Zerostack结合两者优势,旨在提升编程效率,为代码辅助领域带来新选择。
Vercel Labs近日推出了专为AI agents设计的编程语言Zero。该语言由Chris Tate主导开发,旨在创建一个更快、更小、且更易于agents编写、修复和维护的系统语言。其核心设计理念是从第一天起就为agents原生构建,而非让agents学习人类语言。关键特性包括显式能力声明、JSON格式的结构化诊断信息以及类型安全的自动修复功能。此举旨在解决当前agents使用Rust或Python等语言时容易产生幻觉和难以调试的问题,试图从语言层面消除这些痛点。项目已在GitHub上开源,鼓励开发者参与和贡献。
Introducing Zero The programming language for agents. I wanted a systems language that was faster, smaller, and easier f...
作者为准备PyCon US闪电演讲,使用first_line_history.py工具追溯了OpenClaw项目自2025年11月首次提交以来的名称演变。根据Git历史记录,该项目在短短两个多月内经历了六次更名:从最初的Warelay,依次变为CLAWDIS、CLAWDBOT、Clawdbot、Moltbot,最终定名为OpenClaw。其定位也从基于Twilio的WhatsApp中继命令行工具,逐步演变为支持WhatsApp和Telegram的AI代理网关,最终定型为“个人AI助手”。
🎉 Congrats on the release of Ring-2.6-1T, a trillion-parameter flagship for complex, real-world tasks. Day-0 support is...
开发者发布了一个名为“烧吧,宝贝,烧吧”的开源项目,旨在通过销毁代币来应对加密货币领域的通胀问题。该项目提供了一个工具,允许用户主动销毁自己持有的代币,从而减少总供应量。此举可能提升剩余代币的稀缺性与潜在价值。项目已在GitHub上开源,并在Hacker News上获得了100点的社区热度。
CODEX SKILL THAT FINDS COMPLEXITY HOTSPOTS IN YOUR CODEBASE! I made a Codex skill that analyzes your codebase and report...
刚刚花三分钟装了飞书官方那个 CLI 工具, 跑了一句话,建群、建文档、发通知,一次性全做完了, 我盯着终端看了几秒钟, 才反应过来这玩意儿真的能让 AI 直接操作飞书。 装的过程没啥可说的, 一行 npx @larksuite/cli@l...
Orthrus-Qwen3项目在Qwen3模型上实现了每次前向传播最高可处理7.8个令牌的性能,同时确保输出分布与原版模型完全一致。该项目已在GitHub开源,并在Hacker News社区获得102点热度。这一优化显著提升了模型推理效率,且保持了生成结果的准确性。