AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 526 条
全部一手资讯X论文
标签「开源/仓库」清除
向阳乔木@vista8 · 5月21日72

Suno 生成 Skill 做了优化,增加了近6000个音乐风格检索,让生成的音乐更准确。 用谷歌CDP刷新获取登录Token,完全不用打开网站就能创作歌曲了。 开源地址:https://github.com/joeseesun/qiaomu-suno-master Skill 安装指令:npx skills add joeseesun/qiaomu-suno-master

译这条推文介绍了一个对Suno AI音乐生成工具进行优化的Skill。该Skill新增了近6000个音乐风格检索,显著提升了生成音乐的准确性。此外,它通过谷歌CDP技术刷新获取登录Token,使用户无需访问网站即可直接创作歌曲。推文提供了该Skill的开源GitHub地址和安装指令。

SemiAnalysis@SemiAnalysis_ · 5月21日60

TPU ALERT: For OSS production Kubernetes distributed inferencing, Google just added nightly CI for llm-d. Great step by Google to start enabling the wider ML community for TPUs. TPU is catching up to NVIDIA for llm-d CI & code quality. In comparison, although AMD's official recommended production kubernetes inferencing solution is llm-d, @AnushElangovan has yet to add any AMD GPUs or AMD NICs into the CI.

译TPU警报:针对开源生产级Kubernetes分布式推理,Google刚为llm-d添加了夜间CI。这是Google推动更广泛ML社区使用TPU的重要一步。TPU在llm-d CI和代码质量方面正追赶NVIDIA。相比之下,尽管AMD官方推荐的生产级Kubernetes推理方案是llm-d,但@AnushElangovan尚未将任何AMD GPU或AMD网卡加入CI。

Rohan Paul@rohanpaul_ai · 5月21日67

Velobase just open-sourced Velobase Harness, an AI SaaS framework. Shows why the product was not the real moat, it's the infrastructure that convert users into revenue. The Velobase Harness is built around the missing layer between a working app and a paid business. Includes server-side ad attribution, usage-based credits, multi-currency billing, double-entry affiliate ledgers, refund clawbacks, USDT cashouts, A/B email campaigns, dual-provider failover, PostHog analytics, payments, and 11 BullMQ workers.

译Velobase宣布开源其AI SaaS框架Velobase Harness。该项目强调,在AI应用时代,产品本身并非真正的护城河,将用户转化为收入的基础设施才是关键。Velobase自身从应用无人问津发展到实现八位数ARR的经历,印证了这一观点。该框架旨在补全从可用应用到盈利业务之间的缺失环节,提供包括支付计费、用户归因、分析与A/B测试在内的全套后端服务。

Rohan Paul@rohanpaul_ai · 5月21日63

Chinese AI lab SenseTime just open-sourced SenseNova U1, a unified multimodal model that can understand, reason, and generate images + text inside 1 model. The interesting part is the architecture: it removes the usual visual encoder and variational auto-encoder setup, then handles image and language inside a shared representation space, instead of being passed between separate modules. That means less handoff between modules, less information loss, and better consistency when creating dense visual content like infographics, guides, posters, comics, and image-text workflows. That’s how the model can generate coherent text and images together in one flow, which is why it is strong for infographics, guides, comics, posters, and step-by-step visual content. For infographic generation specifically, it is also around 2x faster than Qwen-Image-2.0 / Seedream-4.5 while staying in the same rough quality band, based on the client benchmark chart. 1/n

译商汤科技近日开源了SenseNova U1,其核心创新在于架构设计。该模型摒弃了传统的视觉编码器与变分自编码器分离结构,采用单一共享表示空间原生处理图像与文本,极大减少了模块间转换导致的信息损耗。这一设计使模型能够连贯地同时生成图文内容,在信息图、海报、漫画等需要高一致性的密集视觉内容创作上优势显著。性能方面,其信息图生成速度在同等质量下约为Qwen-Image-2.0/Seedream-4.5的两倍。

Artificial Analysis@ArtificialAnlys · 5月21日69

Cohere launches open weights model Command A+ that achieves 37 on the Artificial Analysis Intelligence Index The release of Command A+ places @Cohere in line with Claude 4.5 Haiku on the Intelligence Index, and just above NVIDIA Nemotron 3 Super and Gemini 3.1 Flash-Lite. Key Takeaways: ➤ Command A+ ranks first on AA-Omniscience Non-Hallucination at 86%, ~3 percentage points ahead of the next-best model. Its AA-Omniscience Accuracy is 9%, so the headline AA-Omniscience score lands at -4, demonstrating a similar archetype to Claude 4.5 Haiku, where the model knows its limits ➤ On Cohere’s API, Command A+ (~281 output tokens per second) is faster than several comparable open-weights and small to mid-sized proprietary models (e.g., GPT-5.4 nano, Claude 4.5 Haiku, and Grok 4.3), but still slower than Gemini 3.1 Flash-Lite Preview, which outputs 304 tokens per second ➤ Command A+ trails its peer set on scientific reasoning (HLE ~11%, GPQA Diamond ~76%) and on coding (Terminal-Bench Hard ~25%, SciCode ~38%), consistent with gaps on the hardest science and agentic coding benchmarks ➤ It supports visual reasoning and scores 63% on MMMU-Pro (between Claude 4.5 Haiku at 59% and GPT-5.4 nano (xhigh) at 65%)

译Cohere发布了开源权重模型Command A+,其在AI分析智能指数上的得分与Claude 4.5 Haiku持平。该模型核心优势为极低的幻觉率,在相关榜单上以86%领先,体现出模型“知其不知”的可靠性。在速度方面,其API输出速度超过GPT-5.4 nano等多款模型,但仍略逊于Gemini 3.1 Flash-Lite。模型在科学推理与代码生成等高难度任务上表现稍弱,但具备视觉推理能力,性能位于Claude 4.5 Haiku与GPT-5.4 nano之间。

向阳乔木@vista8 · 5月21日75

这个项目牛逼啊,增强(Hack)你的 Codex App。 即使你用API 登录Codex,也可以通过安装插件方式用上 Computer Use、添加上Goal指令。 界面样式也能调整,比如变成类似Chrome的顶部Tab。 设置任务开始、完成的声音提醒等等。 开源项目地址见评论区

译一个开源项目允许用户增强Codex App的功能。即使通过API登录,也能通过安装插件的方式启用Computer Use特性并添加Goal指令。项目还支持界面自定义,例如调整为类似Chrome浏览器的顶部Tab样式,并可设置任务开始和完成的提醒音效。相关开源项目地址已在评论区提供。

elvis@omarsar0 · 5月20日73

Self-improving AI is a big deal! As a first step, I've been exploring how much of the post-training can be automated. Here is a first post on how I am using @FireworksAI_HQ Agent to automate LLM fine-tuning itself. Dataset + Skill file included. For the use case, I took inspiration from @karpathy's tweet on LLM Knowledge Bases. I asked Claude Code to interact with Fireworks Agent to fine-tune a small Qwen model to get the right output style to efficiently keep growing my PaperWiki (https://x.com/omarsar0/status/2042286186920550498?s=20). All done via natural language. This is obviously the future of improving AI systems. The next step with the PaperWiki project is how to tune a model to better "know" the data. Harder to do, but if possible, then we have an incredibly powerful system that can recursively self-improve and can be extremely useful for things like knowledge discovery and automating all kinds of research end-to-end. More on this soon. Thanks to the Fireworks team for allowing me to test this early. Super excited about this.

译作者探索利用Fireworks AI Agent,通过自然语言交互自动化完成大语言模型的微调流程。他以Qwen小模型为例,调整其输出风格以优化PaperWiki项目的扩展效率。这一方法灵感源于@karpathy关于LLM知识库的推文,强调微调是让模型更“懂”数据的关键步骤。核心观点是自动化微调可推动构建可递归自我改进的AI系统,最终目标是打造一个能自我优化、用于知识发现和端到端自动化研究的强大工具。

Berryxia.AI@berryxia · 5月20日68

兄弟们,这个PaddleOCR更新可以啊. 直接弥补了之前模型的不足没有使用LLM推理! 这次PaddleOCR这次直接把Hugging Face生态彻底打通了! PaddlePaddle官方刚刚宣布:PaddleOCR 3.5正式支持Transformers作为推理后端。 PP-OCRv5和PaddleOCR-VL 1.5模型,现在可以直接在Hugging Face生态里跑起来。 以前想把PaddleOCR塞进RAG或者Document AI项目,还得自己搭一套服务栈,折腾半天。 Hugging Face团队也亲自参与了这波合作。 OCR工具和主流Transformer生态,终于从两条平行线变成了一条路。 Blog在这里:https://huggingface.co/blog/PaddlePaddle/paddleocr-transformers 这样对于输出的结果可以更加精准和可靠,不然还得依赖LLM来补齐。

译PaddleOCR 3.5版本正式支持Transformers作为推理后端。更新后,PP-OCRv5和PaddleOCR-VL 1.5模型可在Hugging Face生态内直接运行,实现了与主流Transformer技术栈的无缝集成。此举解决了此前将OCR工具整合进RAG或Document AI项目时需要额外搭建服务栈的繁琐问题,大幅降低了开发门槛,让OCR能力更自然地融入现有AI应用开发流程。

Berryxia.AI@berryxia · 5月20日72

乔帮主出品,必属精品。 都是非常使用的小工具,你不会相信在2026年的今天。 微信、小红书、抖音都不知道直接粘贴图片上传发表内容。 乔帮主直接用了油猴插件来完成这些小操作。 项目地址: https://github.com/joeseesun/qiaomu-userscripts

译开发者“乔帮主”开源了一套日常使用的油猴脚本项目,旨在解决多个主流平台(如微信、小红书、抖音)在内容发布时缺少便捷图片粘贴上传功能等操作痛点。该脚本集主要功能包括:支持在多个内容平台通过截图粘贴自动上传图片;提供YouTube网页版的字幕复制、播放倍速调节,并方便将字幕内容传递给NotebookLM、ChatGPT等工具进行处理;同时支持调整小宇宙网页版的播放速度。项目代码已在GitHub公开。

向阳乔木@vista8 · 5月20日73

快速录个视频演示下Youtube油猴脚本的效果。 只有有字幕,点击按钮能复制或下载,然后交给Raycast AI用自己提示词生成一篇总结文章。 还可以调节播放倍速,复制字幕跳转到ChatGPT或NotebookLM进行加工处理。

译该开源油猴脚本(qiaomu-userscripts)增强了YouTube的观看体验,核心功能包括一键复制或下载视频字幕、调节播放倍速。用户可便捷地将字幕发送至Raycast AI、ChatGPT或NotebookLM,利用自定义提示词快速生成总结或进行深度加工。此外,脚本还扩展了对小红书、抖音、微信的截图自动上传,以及小宇宙网页版的倍速调整功能,旨在优化多平台内容处理的效率。

向阳乔木@vista8 · 5月20日76

让抖音、小红书、微信公众号支持截图上传。 搞好这个以后,有动力同步 X 内容过去了,虽然一些平台有点垃圾。

译开源油猴脚本实现小红书、抖音、微信公众号的截图粘贴自动上传,并支持YouTube字幕复制、倍速调节及内容导出至NotebookLM、ChatGPT等工具。主推文作者表示,该工具增强了将X平台内容同步至国内平台的意愿,尽管部分平台体验欠佳。

向阳乔木@vista8 · 5月20日69

完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https://github.com/joeseesun/qiaomu-userscripts

译作者开源了自己常用的油猴脚本,主要功能包括小红书、抖音等平台的截图自动上传,以及YouTube字幕复制与倍速调节,方便与NotebookLM、ChatGPT等工具配合使用,同时支持小宇宙网页版调速。这是其个人工作清单的一项,作者感叹不上班后的日程(如测试AI产品、体验谷歌新模型等)反而更满,但核心在于所有事务都是自主选择并乐在其中。

向阳乔木@vista8 · 5月20日72

来晚了,终于有空体验 Multica,太像产品开发标准熟悉流程了,Cool @jiayuan_jy 任务还是熟悉的类 Trello 看板,不过任务分类从人变成了Agent智能体。 本地如配了 Claude Code和 Codex CLI、Hermes等,直接用,不需额外花钱。 并行 AI Coding 提效必备,掌控感十足(能看智能体执行细节)。 开源地址和客户端安装见评论

译Multica 是一款开源的 AI 工作流引擎,其创新在于将传统 Trello 看板的任务执行者从“人”替换为“Agent智能体”。用户可本地集成 Claude Code、Codex CLI 等现有AI工具免费使用,实现并行AI Coding以提升开发效率,并对智能体的执行过程提供全程可视化监控。

Berryxia.AI@berryxia · 5月20日78

兄弟们,NVIDIA研究员Yukang Chen刚刚把LongLive 2.0直接开源了! 这是全球第一个端到端、支持4-bit的超长视频生成基础设施,训练和推理全流程打通。 核心技术:FP4量化 + 并行加速,在5B模型上硬生生跑到45.7 FPS! 它还能做真实视频训练、few-step蒸馏、多shot训练/推理、序列并行、NVFP4 KV cache、异步VAE解码部署…… 全套高效打法一次给你安排明白。 以前做长视频生成,要么慢得要死,要么只能生成短片,现在NVIDIA直接把4-bit长视频实时生成推向开源。 代码见评论区👇

译NVIDIA研究员开源LongLive 2.0,这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。其核心技术包括FP4量化与并行加速,在5B模型上实现45.7 FPS的生成速度。该框架支持真实视频训练、蒸馏、多镜头生成、序列并行、KV缓存优化及异步解码部署,旨在解决以往长视频生成速度慢或仅限短片的瓶颈。

Rohan Paul@rohanpaul_ai · 5月19日78

The big problem with AI agents is that they still need custom integration work before they can do anything useful, and Membrane is trying to collapse that work into a single skill for 100,000+ APIs that an agent can call from one command. So Claude Code, ChatGPT, Cursor, Replit, and other agents can call external APIs without every team rebuilding the same integration logic.

译AI代理在实际应用中需为每个外部服务重复构建集成逻辑,成为其发展的主要瓶颈。针对此问题,Membrane推出了一种通用“技能”解决方案。通过该单一技能,Claude Code、ChatGPT、Cursor等主流AI代理能够用一条指令调用超过10万个不同的API,涵盖从Stripe支付服务到NASA火星车数据等各类服务。这极大简化了开发流程,将定制化集成转变为通用的连接能力,降低了使用门槛。同时,Membrane正发起社区挑战,鼓励用户提交小众API以获得演示和免费额度激励,旨在持续扩展其连接生态。

AYi@AYi_AInotes · 5月19日67

说个可能会被骂的判断, 过去十年我们被 Markdown 宠坏了,以为它就是内容交付的终极形态, 但昨晚翻完 html-anything 这个开源项目,上线 7 天,已经 3.3k 星,我突然想通了一件事,就是 AI 时代输出格式的真正的终点应该是 HTML。 这个项目来自 nexu-io,就是那个 4 万星 Open Design 的团队, 它做的事说起来也很简单: 你把任何内容丢进去(MD、CSV、JSON、笔记都行), 按 ⌘+Enter,本地 AI agent 直接生成生产级 HTML,然后一键发到微信、X、知乎,或者下载 HTML/PNG, 整个过程零 API Key、完全本地、流式渲染、随时能中断, 但我真正被吸引住的不是上面这些功能,而是它的设计哲学, 75 个 Skill 模板,每一个都写死了硬约束:8px 网格、CJK 字体栈、对比度 ≥4.5、必须用真实数据,不许放 lorem ipsum, 这些看起来是在限制创意,但实际是把 AI 从 slop 泥潭里拽出来的唯一办法, 没有约束的 AI 永远在 freestyle,花里胡哨、排版崩、字体乱, 有约束的 AI 反而能输出惊艳作品,因为你帮它划定了“设计纪律”的边界, 其实这件事跟我现在对 AI 最大的一个判断完全吻合:AI 最需要的不是自由,是一套合适的枷锁, 继续往下看,三个反直觉的点开始越来越清晰, 第一个,越老的格式在 AI 时代反而越先进, HTML 是 1993 年的东西,但它是 Web 原生、天生响应式、支持动画和暗黑模式,AI 写代码最强的地方就是 HTML/CSS/JS, Markdown 反而成了瓶颈——你写完还得排版、截图、导出、适配不同平台,这些全是损耗, 第二个,不用云 API,生产力反而更高, 零 API Key 听起来像省钱,但你用起来才发现本质是极致的自由:无限调用、零延迟、流式中断不浪费 token, 甚至你本地 用claude login / cursor login 过,它直接复用 session,边际成本 $0, 所以真正的高手往往并不是用最贵的模型,而是用最省的 workflow, 第三个,交付介质的轻量度才是真正的护城河, 几百 KB 的 HTML vs 2MB 的 docx,在微信和手机端加载速度差 10 倍,很多人还在卷内容质量,但很少有人意识到——你交付的介质有多重,读者的打开率就被压得有多低, 以前内容交付是 Markdown → 排版 → 截图 → 调格式 → 发出去, 现在 ⌘+Enter → HTML 直接进剪贴板 → 发出去,中间全砍了, 我才意识到,html-anything 真正在做的不是文档工具,是 Agent 时代的内容生产操作系统——它把创作的终点从草稿拉到了成品,把交付成本直接打到零, 真的强烈推荐,这个项目值得所有内容创作者现在就去 clone 跑起来,选一个 Skill 试试 deck-swiss-international 或 doc-kami-parchment,你会立刻感受到原来内容还可以这么发!

译开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi@AYi_AInotes · 5月19日65

为什么这个项目全网爆火, 拿下10万star,成为2026 AI领域增长最快的开源项目?why?! 先说结论,因为它戳中了咱们所有AI用户的痛点! 现在大家用AI写代码, 最大的问题就是泛泛而谈加幻觉, 让它帮你写个组件,结果给你一堆能用但到处是坑的垃圾🗑 你说帮我做个方案,它给你一堆正确的废话😑 而这个仓库呢,直接把prompt engineering做成了工业级产品, 每个角色都有独特的人格, 标准的工作流程,明确的交付物, 相当于把雇一个10年经验专家的成本降到了0,damn! 所以大家知道我们身边正在发生什么了吧, 未来不会是一个全能AI取代我们所有人, 而是一群专精AI组成的虚拟公司,取代传统公司, 这就是现在以及未来即将发生的事,拭目以待。 #AI趋势 #prompt工程

向阳乔木@vista8 · 5月19日67

如果你的网站SEO收录不好,可安装这个Skill:seo-audit 让 AI 抓取网站做一个初步分析,能发现不少基础问题。 安装指令:npx skills add https://github.com/coreyhaines31/marketingskills --skill seo-audit 刚帮朋友公司网站做了个分析,报告质量还可以,能找到Sitemap、301定向、noindex、canonical 标签等问题。

译介绍一款名为 seo-audit 的AI技能工具,可通过命令行安装,用于快速分析网站SEO状况。该工具能检测 Sitemap 状态、301重定向、noindex和canonical标签设置等常见基础问题,适用于初步排查网站收录不佳的原因。实际案例显示其生成的报告质量可靠,能有效发现潜在的技术SEO缺陷。

向阳乔木@vista8 · 5月19日74

你是不是也好奇艺术家都是什么风格? 如蒙德里安、葛饰北斋、凯斯•哈林都是牛逼的名字,但有些画风对不上? 昨天写了个网站,用GPT-Image-2 生成了 380+艺术家风格。 方便了解学习艺术家风格,也能借鉴(偷)AI生图。 提示词用刻在人类基因里最有安全感的画面之一:远山、近水和小树林。 体验网站 https://style.qiaomu.ai/ 开源 Github:https://github.com/joeseesun/qiaomu-artist-style

译作者利用GPT-Image-2模型,批量生成了超过380位艺术家的画风作品。为便于直观学习和借鉴(用于AI生图提示),他创建了一个可体验的网站,将蒙德里安、葛饰北斋等不同风格的创作并置展示,帮助用户快速建立对艺术风格的认知。该项目代码已在GitHub开源。

AYi@AYi_AInotes · 5月19日72

Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, 从前端开发到安全审计,从产品经理到增长黑客, 不用发工资,不用请假,24小时在线。 #AI #AIAgent #ClaudeCode

译一个GitHub项目引发关注,据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司,包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令,将这些“员工”全部集成到Claude Code中,从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。

OpenClaw🦞@openclaw · 5月19日50

OpenClaw 2026.5.18 is live 🤖 xAI/Grok OAuth + sidecar auth fixes 🎙️ Realtime Android Talk Mode 💬 Telegram media + forum-topic delivery fixes 🪟 Browser dialogs visible + answerable A week of polish, plumbing, and fewer papercuts. https://github.com/openclaw/openclaw/releases/tag/v2026.5.18

译OpenClaw 2026.5.18 已上线 🤖 xAI/Grok OAuth + sidecar 认证修复 🎙️ 实时 Android 对话模式 💬 Telegram 媒体 + 论坛主题推送修复 🪟 浏览器对话框可见且可应答 一周的打磨、优化,减少小问题。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.18

Elon Musk@elonmusk · 5月19日71

Please help make Grok Build great! Much appreciated, Elon.

译马斯克在推文中请求帮助提升 Grok Build。用户 @morganlinton 分享了使用 Grok Build 完成 PasteLocal 项目中 relay 功能开发的体验,称赞其全面性令人惊叹。该功能实现周期短,且包含了端到端加密、数据持久化、自动同步、双向命令行交互等关键技术特性,并经过了多轮严格的代码审查与修复。马斯克此举意在收集更广泛的反馈,以持续改进该开发工具。

Alibaba Cloud@alibaba_cloud · 5月18日62

AgentScope Java 1.1 launches with workspace-driven persistence, pluggable filesystems, auto-context management, and secure sandbox orchestration for scalable enterprise Agents 🚀 Learn more: https://int.alibabacloud.com/m/1000413005/ #Java #AI #AgentScope

译AgentScope Java 1.1发布,支持工作区驱动持久化、可插拔文件系统、自动上下文管理以及安全沙箱编排,用于构建可扩展的企业级Agent 🚀 了解更多:https://int.alibabacloud.com/m/1000413005/ #Java #AI #AgentScope

向阳乔木@vista8 · 5月18日64

又一个开源的 Agent IDE:ORCA 优势是直接提供iOS和安装移动客户端,支持多账号切换(比如多ChatGPT订阅),Token消耗、5小时重置显示。 也是检测电脑里装好的各种Cli,比如Claude Code CLI、Codex CLI、Gemini CLI、Hermes、OpenClaw等。 支持目录和文件拖拽对话,内置Markdown预览渲染。 开源地址:https://github.com/stablyai/orca 官网: https://www.onorca.dev/ 解决了很多Tui工具小痒点,但缺点明显,安装包好大...

译ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。

向阳乔木@vista8 · 5月18日67

马上安装试试,飞书机器人本身是不能互相@的,但这个方法估计可行,感谢 @kentzhu 的探索。

译用户推荐安装@kentzhu开发的skill,以解决飞书机器人不能互相@的限制。该工具支持飞书机器人之间稳定相互@,提供自定义停止方式,并内置自由讨论、头脑风暴、评审、辩论四种交互模式。同时,它支持跨openclaw和Hermes的机器人相互@,已开源在GitHub上供试用和参考。

Berryxia.AI@berryxia · 5月18日56

兄弟们,今天必需卧槽一下了! 昨晚发完这条推文后,终于等到了… xAI算法开源后,终于有人把源码真正啃完了。 岚叔@LufzzLiz (某大厂架构师,多模态与模型私有化领域专家)直接上手,把xai-org/x-algorithm仓库的每一行结论都追溯到源码,用Opus-4.7花了两天时间,搞出了一个完整wiki。 所有页面都有明确源码出处,跟市面上很多“AI批量生成”的解读完全不一样,直接Wiki库整起来了… 就是不一样啊! 这才是真正有价值的算法拆解。 GitHub仓库:https://github.com/cclank/x-algorithm-wiki 在线阅读地址:https://lansu-wiki-web.lank.workers.dev/wiki/cclank/x-algorithm-wiki#index

译xAI算法开源后,专家岚叔@LufzzLiz深入研究了xai-org/x-algorithm仓库源码,使用Opus-4.7创建了带有明确源码出处的完整wiki。这与引用推文所指出的现状形成对比:市面上95%的分析是AI批量生产的同质化废话,缺乏对源码的真正理解。岚叔的工作提供了有价值的算法拆解,GitHub仓库和在线阅读地址已公开。

Berryxia.AI@berryxia · 5月18日75

今天给大家分享一个“牛逼”开源项目! 兄弟们,这次微信读书终于有自己的“数据大脑”了。 姚老师刚开源了一个叫 yao-weread-skill 的神器。 你只需要把微信读书数据导出来,它就能本地生成一份26个图表的专业可视化阅读报告。 近2年阅读时长和节律、书架书籍深度分析、阅读分类偏好、作者偏好、出版社偏好、笔记划线想法的语义分析、词云、热力图、雷达图……全都有。 以前想看清楚自己到底读了什么、怎么读的,得手动Excel抠半天,还容易漏掉关键洞见。 现在一句话+一个Skill,直接把碎片阅读数据变成清晰的自我认知报告。 GitHub已经开源,感兴趣的直接去拉下来用。 对每天用微信读书、想复盘阅读习惯、或者做知识管理的兄弟来说,姚老师的开源太实用了。 地址见评论区~

译姚老师开源了名为 yao-weread-skill 的工具,可将用户导出的微信读书数据在本地自动生成包含26个图表的专业可视化阅读报告。报告涵盖近两年阅读时长与节律、书架书籍深度分析、阅读分类/作者/出版社偏好,以及对笔记、划线、想法进行的语义分析,并生成词云、热力图、雷达图等多种图表。该项目旨在帮助用户将碎片化的阅读数据转化为清晰的自我认知报告,方便复盘阅读习惯与进行知识管理,相关代码已在GitHub开源。

Berryxia.AI@berryxia · 5月18日73

前几天大家一起聊中转站的“暴利”、“捡钱”、“掺水”、“造假”等等 但是,有个核心问题,我给小菜鸟如何判断呢? 这不巧了韭二(以下简称92)把他搞了个项目,还特么开源了。 他最近把2026年中文市场涌现的三个AI API中转站安全检测工具全部跑了一遍。 他发现一个让人大跌眼镜的事儿:你花钱买的“直连”Claude或GPT,很可能早已被安静地动手脚。 92对比了三款工具的核心检测能力、方法论和透明度后,发现差距极大。 开源工具api-relay-audit走的是双论文锚定路线,把AC-1工具调用改写、AC-2错误响应泄漏、上下文截断等常见攻击全部拆成可验证步骤,每一步都给出clean/anomaly/inconclusive三态判定,还自带透明日志。 hvoy. ai更适合小白用户,cctest. ai则主打一键黑盒检测,但完全闭源。 92认为,最靠谱的还是api-relay-audit的透明度和可审计性,安全工具本身必须可被审计。 他把完整对比、方法论、短板和功能速查表写成一篇长文,并把自己的工具完全开源。 感兴趣的可以安装,地址评论区。 记得给给他一颗Star~

译针对AI API中转站可能存在的“掺水”、“造假”等安全风险,开源项目api-relay-audit通过双论文锚定路线,对AC-1工具调用改写、AC-2错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定,并提供透明日志。对比hvoy.ai和cctest.ai等工具,其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开,并开源了该检测工具。

向阳乔木@vista8 · 5月18日80

姚老师出手写了一个微信读书Skill,看展示效果非常棒! 可以用来分析自己的读书数据

译开发者姚老师开源了微信读书Skill——yao-weread-skill。该工具能将用户的微信读书数据生成本地可视化报告,核心功能包括分析近两年的阅读时长与节律、书架书籍构成、阅读分类与作者偏好,并对笔记和想法进行语义分析。报告最终通过词云、热力图、雷达图等26种图表形式呈现,所有代码已在GitHub公开。

AYi@AYi_AInotes · 5月17日74

Damn,Garry Tan刚放出来的这个东西,直接把个人AI的天花板捅破了🤯 这意味着所有AI Agent一直以来都有的致命缺陷,现在终于被解决了。 Garry Tan昨天发布的GBrain,不是又一个RAG玩具,我们可以认为它是一个完整的个人知识操作系统。 给你的OpenClaw 或者Hermes 或者Claude Code装上它,就能一直记得你的人际关系,你的决策轨迹,你的长期认知演化。 大多数人以为RAG只有4层, GBrain直接把它干到了8层, 前4层是基础检索的全面升级, 真正的杀手级差异在后面4层, 相当于把个人AI从每次对话从零开始,升级成终身记忆加自我进化。 Garry自己的生产环境已经跑了17888页,4383人,723家公司。 而且现在就能用: 1. 把安装链接直接丢给你的Agent,它会自动搞定一切。 2. 命令行版按GitHub上的步骤走,30分钟搞定。 3. 永远先改Markdown再同步,这是最高优先级数据源。 #GBrain #AI代理 #个人AI

译Garry Tan开源的GBrain是一个知识系统,而非简单的RAG工具。它通过8层结构解决AI Agent的记忆缺陷:前4层升级基础检索,后4层实现终身记忆和自我进化,使如OpenClaw、Hermes等Agent能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据,用户可通过安装链接或命令行快速集成,并以Markdown为最高优先级数据源,推动个人AI成为可能。

meng shao@shao__meng · 5月17日66

Vercel 发布了为 Agent 设计的编程语言 Zero 为什么说它是为 Agent 设计的编程语言呢? 因为 ... 我们人类不用看 👀 各位 Agent 请看这里: https://github.com/vercel-labs/zero

Berryxia.AI@berryxia · 5月17日68

🔥专门属于AI Agent 的编程语言来了!兄弟们! Vercel Labs 直接扔出一个专为 AI agents 设计的编程语言——Zero。 Chris Tate 想造一个 systems language:更快、更小、更容易让 agents 去写、去修、去维护。 它从第一天起就为 agents 而生,不是给人类先写好再让 agents 去学的妥协方案。 核心设计: - Explicit capabilities(能力显式声明) - JSON 格式的 diagnostics(诊断结果结构化) - Typed safe fixes(类型安全的自动修复) 以前 agents 写 Rust、Python 还容易 hallucinate、修 bug 修半死,现在 Zero 把这些痛点直接从语言层面干掉。 Star 它、Fork 它,一起加入这个实验。 GitHub:https://github.com/vercel-labs/zero

译Vercel Labs近日推出了专为AI agents设计的编程语言Zero。该语言由Chris Tate主导开发,旨在创建一个更快、更小、且更易于agents编写、修复和维护的系统语言。其核心设计理念是从第一天起就为agents原生构建,而非让agents学习人类语言。关键特性包括显式能力声明、JSON格式的结构化诊断信息以及类型安全的自动修复功能。此举旨在解决当前agents使用Rust或Python等语言时容易产生幻觉和难以调试的问题,试图从语言层面消除这些痛点。项目已在GitHub上开源,鼓励开发者参与和贡献。

Ant Ling@AntLingAGI · 5月17日74

🥳You could always experience the latest, fastest and the most easy to use open model on SGLang, this time for our latest reasoning model release of Ring-2.6-1T (limited 75% discount on OR https://openrouter.ai/inclusionai/ring-2.6-1t) Thanks to @lmsysorg for another top notch day0 collaboration! 🥳

译Ring-2.6-1T万亿参数旗舰模型正式发布,专注于处理复杂现实世界任务,并在SGLang平台获得Day-0即时支持,得益于与@lmsysorg的合作。该模型具备增强的智能体执行能力,可稳定处理多步骤、工具调用和长流程工作。用户可通过推理努力控制的高与极高模式,灵活调节推理深度、速度和成本。训练采用异步强化学习与IcePop技术,确保万亿参数强化学习训练的效率和稳定性。目前,该模型在OpenRouter平台提供限时75%折扣,供用户体验最新功能。

Greg Brockman@gdb · 5月16日45

codex for improving computational complexity

译Codex技能能够分析代码库,识别计算复杂性高的区域,如O(n²)、O(n*m)模式和重复扫描检测。它提供前后复杂性估计和安全优化建议,包括风险级别和所需测试,默认以报告模式运行,支持一键安装。该工具专注于检测循环、重复查找和N+1模式等,旨在在不破坏行为的前提下减少复杂性,且完全开源。

AYi@AYi_AInotes · 5月16日60

ChatGPT 有一个股票交易模式功能。 你可以用它来研究和交易任意股票, 就像专业的股票市场分析师一样, 以下是启用该功能的 7 个提示词:

译飞书官方 CLI 工具 lark-cli 开源45天后 GitHub star 数突破1万,成为国内首个破万星的办公套件开源项目。其核心在于允许 AI 通过命令行直接操作飞书,执行建群、建文档等任务,且每一步操作都可见、可预览、可审查,与 MCP 等云端不可见模式形成对比。更关键的生态指标是,飞书主干已合并了10位外部开发者的代码,而同类产品钉钉和企业微信则为零,体现了真实的开发者参与。这种透明可控的特性是开发者放心将任务交给 AI Agent 的重要前提。

AYi@AYi_AInotes · 5月16日66

Damn,当所有人都在按token涨价的时候,OpenAI做了一件完全相反的事, OpenAI把ChatGPT订阅额度借给Zed了,不用额外花钱, 分享个最实用的细节: 限额是共享的,在Zed里用掉的额度会同步到ChatGPT,用完之后还能回网页版继续用,

译在多数AI服务按token涨价之际,OpenAI采取了相反策略,将其ChatGPT的订阅额度共享给了代码编辑器Zed。用户无需额外付费,即可在Zed中直接使用该额度。关键细节在于,Zed中消耗的额度与ChatGPT网页版的订阅限额是共享且实时同步的。这意味着用户在Zed中用尽额度后,仍可返回ChatGPT网页版继续使用其服务。这一合作被形象地比作Codex(OpenAI的代码生成模型)与Zed编辑器的深度结合。

Rohan Paul@rohanpaul_ai · 5月16日70

X has released the latest "For You" feed algorithm to GitHub. Moving the feed closer to a Grok-style AI ranking system than a rule-heavy social media sorter. The system first gathers posts from accounts you follow through Thunder, then adds outside posts through Phoenix, which searches for content that looks relevant even if you do not follow the author. Ranking now behaves less like a checklist of likes, reposts, and keywords, and more like a transformer model that reads the user, the post, and past behavior as one prediction problem. Instead of asking “is this post good,” the model predicts multiple possible actions, such as whether you might reply, like, repost, watch, or skip. Thunder is the fast “people you follow” system. It keeps a live memory-store of recent posts, replies, reposts, and videos from users, then quickly pulls posts from accounts you follow when your For You feed is built. It is basically the in-network candidate source. Phoenix is the AI recommendation system. It has 2 jobs: first, Phoenix Retrieval finds outside posts from the global X corpus using similarity search, and then Phoenix Ranking scores both followed-account posts and outside posts using a Grok-based transformer model.

译X平台(原推特)已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序,转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子,再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量,而是像Transformer模型一样,将用户、帖子和历史行为作为一个整体进行预测,评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性,从而实现更个性化的内容推荐。

Microsoft Research@MSFTResearch · 5月15日67

New tools, models, repos, and papers out of Microsoft Research are here. Use AI and agents? It's worth watching: • MagenticLite from MSR AI Frontiers • Agentic GitHub workflows • Verification‑first agents • Meaning‑matching fine‑tuning • AI transition + the economy

译微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先智能体 • 意义匹配微调 • AI转型与经济发展

小互@xiaohu · 5月15日74

你敢把 Opus 和 GPT 接入到小龙虾里跑吗? 反正我是不敢,跑不起... 但是不接入这些顶级模型,有些复杂任务,国产模型真的搞不定。 发现一个以前不知道的团队做的开源项目 @OpenSquilla 脑洞很大的用 Python 重写了一个【智能省钱+智能安全】小龙虾 更省钱还更安全... 用一个本地路由器,把简单任务丢给便宜模型,复杂任务才上 Opus 4.7 同一套测试跑下来分数和 OpenClaw 几乎一样(0.9251 vs 0.9255),但成本从 6 美元降到 6 毛8,差快十倍。 四层记忆:模仿人脑分四层存东西。手头正在干的、过去干过的、知识和规则、原始日志,分开放。还会「做梦」,定期把零碎记忆整理成系统知识 按需加技能:自带 16 个工具(写 PPT、查 GitHub、跑定时任务等等),用哪个加哪个,不一股脑全塞进去 三档沙箱:跑代码的时候关进小黑屋,分三个安全等级。要是连续被拦下来好几次,Agent 自己就停了,不让它继续乱搞 一个入口管所有:网页、命令行、Slack、飞书、钉钉、Discord、Telegram、QQ 全都连进同一套后端,行为一致 20 多家模型随便挑:OpenAI、Claude、Gemini、DeepSeek、Qwen、Kimi、智谱、火山,国内外主流的都接了,挂一个用另一个

译开源项目OpenSquilla通过智能路由架构,在保持与OpenClaw相近性能(0.9251分)的同时,将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型,仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知,支持按需加载16种工具,并设有三档代码沙箱安全防护。项目提供统一后端,支持网页、命令行及Slack、飞书等平台接入,兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。

Berryxia.AI@berryxia · 5月15日65

兄弟们,老马将𝕏 的最新算法最新公布。 已经开源到Github上,对于我们普通人这玩意有啥用呢? 🤔 创作者真的可以通过算法而“有利可图?” 创作迎合算法的内容还是.....? 地址:https://github.com/xai-org/x-algorithm 我已经让opus 4.7 拉满跑起来了

译兄弟们,老马将𝕏的最新算法公布了。 已经开源到Github上,对于我们普通人这东西有啥用呢? 🤔 创作者真的可以通过算法而“有利可图?” 创作迎合算法的内容还是.....? 地址:https://github.com/xai-org/x-algorithm 我已经让opus 4.7 拉满跑起来了

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月21日
10:34
向阳乔木@vista8
72
Suno AI音乐工具新增6000种风格检索并支持免登录创作

这条推文介绍了一个对Suno AI音乐生成工具进行优化的Skill。该Skill新增了近6000个音乐风格检索,显著提升了生成音乐的准确性。此外,它通过谷歌CDP技术刷新获取登录Token,使用户无需访问网站即可直接创作歌曲。推文提供了该Skill的开源GitHub地址和安装指令。

开源/仓库教程/实践语音
10:11
SemiAnalysis@SemiAnalysis_
60
TPU警报:针对开源生产级Kubernetes分布式推理,Google刚为llm-d添加了夜间CI。这是Google推动更广泛ML社区使用TPU的重要一步。TPU在llm-d CI和代码质量方面正追赶NVIDIA。相比之下,尽管AMD官方推荐的生产级Kubernetes推理方案是llm-d,但@AnushElangovan尚未将任何AMD GPU或AMD网卡加入CI。
Google开源/仓库推理部署/工程
01:36
Rohan Paul@rohanpaul_ai
67
Velobase开源AI SaaS商业基础设施框架

Velobase宣布开源其AI SaaS框架Velobase Harness。该项目强调,在AI应用时代,产品本身并非真正的护城河,将用户转化为收入的基础设施才是关键。Velobase自身从应用无人问津发展到实现八位数ARR的经历,印证了这一观点。该框架旨在补全从可用应用到盈利业务之间的缺失环节,提供包括支付计费、用户归因、分析与A/B测试在内的全套后端服务。

Velobase: Everyone can build an app now. Almost no one makes a dollar from it. We went from the same problem to 8-figure ARR. The ...

开源/仓库开源生态部署/工程
00:36
Rohan Paul@rohanpaul_ai
63
商汤开源统一多模态模型SenseNova U1

商汤科技近日开源了SenseNova U1,其核心创新在于架构设计。该模型摒弃了传统的视觉编码器与变分自编码器分离结构,采用单一共享表示空间原生处理图像与文本,极大减少了模块间转换导致的信息损耗。这一设计使模型能够连贯地同时生成图文内容,在信息图、海报、漫画等需要高一致性的密集视觉内容创作上优势显著。性能方面,其信息图生成速度在同等质量下约为Qwen-Image-2.0/Seedream-4.5的两倍。

图像生成多模态开源/仓库模型发布
00:06
Artificial Analysis@ArtificialAnlys
69
Cohere推出开源权重模型Command A+,智能指数得分达37

Cohere发布了开源权重模型Command A+,其在AI分析智能指数上的得分与Claude 4.5 Haiku持平。该模型核心优势为极低的幻觉率,在相关榜单上以86%领先,体现出模型“知其不知”的可靠性。在速度方面,其API输出速度超过GPT-5.4 nano等多款模型,但仍略逊于Gemini 3.1 Flash-Lite。模型在科学推理与代码生成等高难度任务上表现稍弱,但具备视觉推理能力,性能位于Claude 4.5 Haiku与GPT-5.4 nano之间。

开源/仓库模型发布评测/基准
00:02
向阳乔木@vista8
精选75
开源插件为Codex App增添高级功能

一个开源项目允许用户增强Codex App的功能。即使通过API登录,也能通过安装插件的方式启用Computer Use特性并添加Goal指令。项目还支持界面自定义,例如调整为类似Chrome浏览器的顶部Tab样式,并可设置任务开始和完成的提醒音效。相关开源项目地址已在评论区提供。

智能体MCP/工具OpenAI开源/仓库

推荐理由:这不只是个插件,它把 Codex 从只能聊天变成了能动手的 Agent,用 API 登录也能开 Computer Use,是给开发者装上了超能力的实用补丁。
5月20日
23:33
elvis@omarsar0
73
自我改进的AI是件大事!

作者探索利用Fireworks AI Agent,通过自然语言交互自动化完成大语言模型的微调流程。他以Qwen小模型为例,调整其输出风格以优化PaperWiki项目的扩展效率。这一方法灵感源于@karpathy关于LLM知识库的推文,强调微调是让模型更“懂”数据的关键步骤。核心观点是自动化微调可推动构建可递归自我改进的AI系统,最终目标是打造一个能自我优化、用于知识发现和端到端自动化研究的强大工具。

elvis: http://x.com/i/article/2056851733582880768

智能体开源/仓库教程/实践数据/训练
22:08
Berryxia.AI@berryxia
68
PaddleOCR 3.5支持Hugging Face生态

PaddleOCR 3.5版本正式支持Transformers作为推理后端。更新后,PP-OCRv5和PaddleOCR-VL 1.5模型可在Hugging Face生态内直接运行,实现了与主流Transformer技术栈的无缝集成。此举解决了此前将OCR工具整合进RAG或Document AI项目时需要额外搭建服务栈的繁琐问题,大幅降低了开发门槛,让OCR能力更自然地融入现有AI应用开发流程。

PaddlePaddle: 🚀 PaddleOCR 3.5: Transformers Backend Support Now Live! We're excited to share that PaddleOCR 3.5 now supports Hugging ...

Hugging Face开源/仓库部署/工程
15:07
Berryxia.AI@berryxia
72
乔帮主开源实用油猴脚本套件

开发者“乔帮主”开源了一套日常使用的油猴脚本项目,旨在解决多个主流平台(如微信、小红书、抖音)在内容发布时缺少便捷图片粘贴上传功能等操作痛点。该脚本集主要功能包括:支持在多个内容平台通过截图粘贴自动上传图片;提供YouTube网页版的字幕复制、播放倍速调节,并方便将字幕内容传递给NotebookLM、ChatGPT等工具进行处理;同时支持调整小宇宙网页版的播放速度。项目代码已在GitHub公开。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库
14:31
向阳乔木@vista8
73
开源油猴脚本提升YouTube观看效率与AI协作

该开源油猴脚本(qiaomu-userscripts)增强了YouTube的观看体验,核心功能包括一键复制或下载视频字幕、调节播放倍速。用户可便捷地将字幕发送至Raycast AI、ChatGPT或NotebookLM,利用自定义提示词快速生成总结或进行深度加工。此外,脚本还扩展了对小红书、抖音、微信的截图自动上传,以及小宇宙网页版的倍速调整功能,旨在优化多平台内容处理的效率。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库编码
14:31
向阳乔木@vista8
精选76
开源油猴脚本实现小红书、抖音、微信公众号的截图粘贴自动上传,并支持YouTube字幕复制、倍速调节及内容导出至NotebookLM、ChatGPT等工具。主推文作者表示,该工具增强了将X平台内容同步至国内平台的意愿,尽管部分平台体验欠佳。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库开源生态

推荐理由:向阳乔木开源了一套油猴脚本,让截图直接粘贴上传到小红书、抖音等平台,对多平台内容分发的人来说是一个小而实在的时间节省利器。
14:01
向阳乔木@vista8
69
开源实用油猴脚本,不上班却更忙更充实

作者开源了自己常用的油猴脚本,主要功能包括小红书、抖音等平台的截图自动上传,以及YouTube字幕复制与倍速调节,方便与NotebookLM、ChatGPT等工具配合使用,同时支持小宇宙网页版调速。这是其个人工作清单的一项,作者感叹不上班后的日程(如测试AI产品、体验谷歌新模型等)反而更满,但核心在于所有事务都是自主选择并乐在其中。

向阳乔木: 今天的 Todolist 清单: 1. 上架一个快捷提示词 Chrome 插件 2. 开源几个油猴脚本 3. 测朋友的 AI 产品,写个简单评测 4. 准备周六直播问题 5. 去海河钓鱼 6. 体验谷歌昨天的发布模型和工具 ... 不上班比...

开源/仓库开源生态
13:31
向阳乔木@vista8
72
Multica:将Trello看板中的"人"替换为"Agent"的AI工作流引擎

Multica 是一款开源的 AI 工作流引擎,其创新在于将传统 Trello 看板的任务执行者从“人”替换为“Agent智能体”。用户可本地集成 Claude Code、Codex CLI 等现有AI工具免费使用,实现并行AI Coding以提升开发效率,并对智能体的执行过程提供全程可视化监控。

智能体开源/仓库编码
00:02
Berryxia.AI@berryxia
精选78
NVIDIA开源首个4-bit超长视频生成基础设施

NVIDIA研究员开源LongLive 2.0,这是首个支持4-bit量化、覆盖训练与推理全流程的端到端长视频生成基础设施。其核心技术包括FP4量化与并行加速,在5B模型上实现45.7 FPS的生成速度。该框架支持真实视频训练、蒸馏、多镜头生成、序列并行、KV缓存优化及异步解码部署,旨在解决以往长视频生成速度慢或仅限短片的瓶颈。

Yukang Chen: 🚀 Excited to release LongLive 2.0! 🎬 An end-to-end infrastructure for long video generation, with FP4 and parallelism ...

开源/仓库部署/工程

推荐理由:NVIDIA研究员把4-bit长视频生成的全套设施端出来了,45.7FPS跑5B模型,做视频工程的可以直接拿来魔改,这是把长视频的成本打下来的关键一步。
5月19日
21:29
Rohan Paul@rohanpaul_ai
精选78
AI代理在实际应用中需为每个外部服务重复构建集成逻辑,成为其发展的主要瓶颈。针对此问题,Membrane推出了一种通用"技能"解决方案。通过该单一技能,Claude Code、ChatGPT、Cursor等主流AI代理能够用一条指令调用超过10万个不同的API,涵盖从Stripe支付服务到NASA火星车数据等各类服务。这极大简化了开发流程,将定制化集成转变为通用的连接能力,降低了使用门槛。同时,Membrane正发起社区挑战,鼓励用户提交小众API以获得演示和免费额度激励,旨在持续扩展其连接生态。

Membrane: We built one skill that connects any agent to any API. Stripe. NASA Mars Rover. The ISS tracker. The Evil Insult Generat...

智能体MCP/工具开源/仓库

推荐理由:Membrane 把十万个 API 集成压缩成一行命令,做 agent 的人不用再写胶水代码,直接拿来用就行,省心。
14:51
AYi@AYi_AInotes
67
AI时代内容交付的真正终点是HTML

开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi: http://x.com/i/article/2053129966217277440

智能体开源/仓库现象/趋势
13:50
AYi@AYi_AInotes
65
为什么这个GitHub项目全网爆火并拿下10万star?

summary_zh

AYi: Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, ...

智能体AnthropicGitHubMCP/工具
13:44
向阳乔木@vista8
67
AI助力SEO审计:一键检测网站基础问题

介绍一款名为 seo-audit 的AI技能工具,可通过命令行安装,用于快速分析网站SEO状况。该工具能检测 Sitemap 状态、301重定向、noindex和canonical标签设置等常见基础问题,适用于初步排查网站收录不佳的原因。实际案例显示其生成的报告质量可靠,能有效发现潜在的技术SEO缺陷。

GitHubMCP/工具开源/仓库
10:34
向阳乔木@vista8
74
AI批量生成艺术风格,一键浏览380+大师作品

作者利用GPT-Image-2模型,批量生成了超过380位艺术家的画风作品。为便于直观学习和借鉴(用于AI生图提示),他创建了一个可体验的网站,将蒙德里安、葛饰北斋等不同风格的创作并置展示,帮助用户快速建立对艺术风格的认知。该项目代码已在GitHub开源。

GitHub图像生成开源/仓库
09:45
AYi@AYi_AInotes
72
GitHub爆火项目一键构建AI公司,集成Claude Code

一个GitHub项目引发关注,据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司,包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令,将这些“员工”全部集成到Claude Code中,从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。

智能体GitHub开源/仓库编码
06:55
OpenClaw🦞@openclaw
50
OpenClaw 2026.5.18 已上线 🤖 xAI/Grok OAuth + sidecar 认证修复 🎙️ 实时 Android 对话模式 💬 Telegram 媒体 + 论坛主题推送修复 🪟 浏览器对话框可见且可应答 一周的打磨、优化,减少小问题。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.18
智能体开源/仓库部署/工程
00:50
Elon Musk@elonmusk
同事件精选71
马斯克在推文中请求帮助提升 Grok Build。用户 @morganlinton 分享了使用 Grok Build 完成 PasteLocal 项目中 relay 功能开发的体验,称赞其全面性令人惊叹。该功能实现周期短,且包含了端到端加密、数据持久化、自动同步、双向命令行交互等关键技术特性,并经过了多轮严格的代码审查与修复。马斯克此举意在收集更广泛的反馈,以持续改进该开发工具。

Morgan: Phew, Grok Build is really thorough, pretty incredible. Relay feature for PasteLocal is done, pushing to Github now. And...

xAI产品更新开源/仓库
同一事件,精选展示《Grok Build 0.1 on API》
推荐理由:below_threshold:T2 推文门槛 75,当前 finalScore=71
5月18日
16:37
Alibaba Cloud@alibaba_cloud
62
AgentScope Java 1.1发布,支持工作区驱动持久化、可插拔文件系统、自动上下文管理以及安全沙箱编排,用于构建可扩展的企业级Agent 🚀 了解更多:https://int.alibabacloud.com/m/1000413005/ #Java #AI #AgentScope
智能体开源/仓库
15:32
向阳乔木@vista8
64
开源Agent IDE ORCA发布:支持移动端与多账号切换

ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。

智能体MCP/工具开源/仓库开源生态
12:02
向阳乔木@vista8
67
用户推荐安装@kentzhu开发的skill,以解决飞书机器人不能互相@的限制。该工具支持飞书机器人之间稳定相互@,提供自定义停止方式,并内置自由讨论、头脑风暴、评审、辩论四种交互模式。同时,它支持跨openclaw和Hermes的机器人相互@,已开源在GitHub上供试用和参考。

kentzhu: @vista8 我做了个skill,支持飞书机器人之间稳定相互at,支持自定义停止方式,比如x轮、手动停止。并且内置了自由讨论、头脑风暴、评审、辩论4种模式。支持跨openclaw、Hermes的机器人相互at,可以试试。就算用不上,我把飞...

智能体GitHub开源/仓库
09:54
Berryxia.AI@berryxia
56
xAI算法开源深度解析,专家创建完整源码wiki

xAI算法开源后,专家岚叔@LufzzLiz深入研究了xai-org/x-algorithm仓库源码,使用Opus-4.7创建了带有明确源码出处的完整wiki。这与引用推文所指出的现状形成对比:市面上95%的分析是AI批量生产的同质化废话,缺乏对源码的真正理解。岚叔的工作提供了有价值的算法拆解,GitHub仓库和在线阅读地址已公开。

Berryxia.AI: xAI 算法开源后,解读内容铺天盖地。 我敢说一句颠覆多数人认知的实话: 市面上 95% 的分析,是 AI 批量生产的同质化废话, 连源码文件名都没翻过一次。 「多互动」「多发帖」「账号要垂直」 这种谁都会说的话,说了等于没说。 真正藏在 ...

GitHubxAI开源/仓库教程/实践
08:54
Berryxia.AI@berryxia
75
微信读书数据可视化开源工具yao-weread-skill发布

姚老师开源了名为 yao-weread-skill 的工具,可将用户导出的微信读书数据在本地自动生成包含26个图表的专业可视化阅读报告。报告涵盖近两年阅读时长与节律、书架书籍深度分析、阅读分类/作者/出版社偏好,以及对笔记、划线、想法进行的语义分析,并生成词云、热力图、雷达图等多种图表。该项目旨在帮助用户将碎片化的阅读数据转化为清晰的自我认知报告,方便复盘阅读习惯与进行知识管理,相关代码已在GitHub开源。

姚金刚: 写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...

GitHub开源/仓库
08:54
Berryxia.AI@berryxia
73
开源工具揭露AI API中转站安全风险与检测差异

针对AI API中转站可能存在的“掺水”、“造假”等安全风险,开源项目api-relay-audit通过双论文锚定路线,对AC-1工具调用改写、AC-2错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定,并提供透明日志。对比hvoy.ai和cctest.ai等工具,其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开,并开源了该检测工具。

李韭二: http://x.com/i/article/2052006162804125696

开源/仓库部署/工程
01:00
向阳乔木@vista8
精选80
开发者姚老师开源了微信读书Skill--yao-weread-skill。该工具能将用户的微信读书数据生成本地可视化报告,核心功能包括分析近两年的阅读时长与节律、书架书籍构成、阅读分类与作者偏好,并对笔记和想法进行语义分析。报告最终通过词云、热力图、雷达图等26种图表形式呈现,所有代码已在GitHub公开。

姚金刚: 写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...

GitHubMCP/工具开源/仓库开源生态

推荐理由:姚老师这个开源的微信读书skill,能直接拉取你的阅读数据,生成热力图、词云等26张可视化图表,读完就能装,做个人报告的可以直接抄作业。
5月17日
18:44
AYi@AYi_AInotes
74
Garry Tan发布的GBrain直接捅破个人AI天花板

Garry Tan开源的GBrain是一个知识系统,而非简单的RAG工具。它通过8层结构解决AI Agent的记忆缺陷:前4层升级基础检索,后4层实现终身记忆和自我进化,使如OpenClaw、Hermes等Agent能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据,用户可通过安装链接或命令行快速集成,并以Markdown为最高优先级数据源,推动个人AI成为可能。

Garry Tan: What is GBrain? My open source project is a knowledge system, not RAG in a box. It gives agents 8 layers that work toget...

智能体开源/仓库
10:53
meng shao@shao__meng
66
Vercel发布专为Agent设计的编程语言Zero

Vercel 发布了为 Agent 设计的编程语言 Zero 为什么说它是为 Agent 设计的编程语言呢? 因为 ... 我们人类不用看 👀 各位 Agent 请看这里: https://github.com/vercel-labs/zero

Chris Tate: Introducing Zero The programming language for agents. I wanted a systems language that was faster, smaller, and easier f...

智能体开源/仓库
06:54
Berryxia.AI@berryxia
68
专门属于AI Agent的编程语言Zero发布

Vercel Labs近日推出了专为AI agents设计的编程语言Zero。该语言由Chris Tate主导开发,旨在创建一个更快、更小、且更易于agents编写、修复和维护的系统语言。其核心设计理念是从第一天起就为agents原生构建,而非让agents学习人类语言。关键特性包括显式能力声明、JSON格式的结构化诊断信息以及类型安全的自动修复功能。此举旨在解决当前agents使用Rust或Python等语言时容易产生幻觉和难以调试的问题,试图从语言层面消除这些痛点。项目已在GitHub上开源,鼓励开发者参与和贡献。

Chris Tate: Introducing Zero The programming language for agents. I wanted a systems language that was faster, smaller, and easier f...

智能体GitHub产品更新开源/仓库
00:51
Ant Ling@AntLingAGI
74
Ring-2.6-1T万亿参数旗舰模型正式发布,专注于处理复杂现实世界任务,并在SGLang平台获得Day-0即时支持,得益于与@lmsysorg的合作。该模型具备增强的智能体执行能力,可稳定处理多步骤、工具调用和长流程工作。用户可通过推理努力控制的高与极高模式,灵活调节推理深度、速度和成本。训练采用异步强化学习与IcePop技术,确保万亿参数强化学习训练的效率和稳定性。目前,该模型在OpenRouter平台提供限时75%折扣,供用户体验最新功能。

LMSYS Org: 🎉 Congrats on the release of Ring-2.6-1T, a trillion-parameter flagship for complex, real-world tasks. Day-0 support is...

智能体开源/仓库推理模型发布
5月16日
22:05
Greg Brockman@gdb
45
Codex技能能够分析代码库,识别计算复杂性高的区域,如O(n2)、O(n*m)模式和重复扫描检测。它提供前后复杂性估计和安全优化建议,包括风险级别和所需测试,默认以报告模式运行,支持一键安装。该工具专注于检测循环、重复查找和N+1模式等,旨在在不破坏行为的前提下减少复杂性,且完全开源。

Kappaemme: CODEX SKILL THAT FINDS COMPLEXITY HOTSPOTS IN YOUR CODEBASE! I made a Codex skill that analyzes your codebase and report...

GitHubMCP/工具OpenAI开源/仓库
20:42
AYi@AYi_AInotes
60
飞书官方 CLI 工具 lark-cli 开源45天后 GitHub star 数突破1万,成为国内首个破万星的办公套件开源项目。其核心在于允许 AI 通过命令行直接操作飞书,执行建群、建文档等任务,且每一步操作都可见、可预览、可审查,与 MCP 等云端不可见模式形成对比。更关键的生态指标是,飞书主干已合并了10位外部开发者的代码,而同类产品钉钉和企业微信则为零,体现了真实的开发者参与。这种透明可控的特性是开发者放心将任务交给 AI Agent 的重要前提。

AYi: 刚刚花三分钟装了飞书官方那个 CLI 工具, 跑了一句话,建群、建文档、发通知,一次性全做完了, 我盯着终端看了几秒钟, 才反应过来这玩意儿真的能让 AI 直接操作飞书。 装的过程没啥可说的, 一行 npx @larksuite/cli@l...

智能体MCP/工具OpenAI开源/仓库
16:42
AYi@AYi_AInotes
66
OpenAI向Zed编辑器共享ChatGPT订阅额度

在多数AI服务按token涨价之际,OpenAI采取了相反策略,将其ChatGPT的订阅额度共享给了代码编辑器Zed。用户无需额外付费,即可在Zed中直接使用该额度。关键细节在于,Zed中消耗的额度与ChatGPT网页版的订阅限额是共享且实时同步的。这意味着用户在Zed中用尽额度后,仍可返回ChatGPT网页版继续使用其服务。这一合作被形象地比作Codex(OpenAI的代码生成模型)与Zed编辑器的深度结合。

Tibo: Codex🫸🫷Zed

OpenAI产品更新开源/仓库编码
01:37
Rohan Paul@rohanpaul_ai
70
X平台开源最新"For You"信息流推荐算法

X平台(原推特)已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序,转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子,再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量,而是像Transformer模型一样,将用户、帖子和历史行为作为一个整体进行预测,评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性,从而实现更个性化的内容推荐。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHubxAI开源/仓库开源生态
5月15日
23:35
Microsoft Research@MSFTResearch
精选67
微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先智能体 • 意义匹配微调 • AI转型与经济发展
智能体Microsoft开源/仓库行业动态

推荐理由:微软研究院这波把 agent 工具链摊开了,MagenticLite 轻量框架和 verification-first 思路值得跟,做智能体的可以去 GitHub 翻翻。
22:57
小互@xiaohu
74
开源项目OpenSquilla:智能路由降低AI成本近十倍,兼容多平台与模型

开源项目OpenSquilla通过智能路由架构,在保持与OpenClaw相近性能(0.9251分)的同时,将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型,仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知,支持按需加载16种工具,并设有三档代码沙箱安全防护。项目提供统一后端,支持网页、命令行及Slack、飞书等平台接入,兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。

智能体MCP/工具开源/仓库
22:54
Berryxia.AI@berryxia
65
X算法开源发布,普通人创作者用途引思考

兄弟们,老马将𝕏的最新算法公布了。 已经开源到Github上,对于我们普通人这东西有啥用呢? 🤔 创作者真的可以通过算法而“有利可图?” 创作迎合算法的内容还是.....? 地址:https://github.com/xai-org/x-algorithm 我已经让opus 4.7 拉满跑起来了

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHubxAI开源/仓库
‹ 上一页
1…678910…14
下一页 ›