AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 526 条
全部一手资讯X论文
标签「开源/仓库」清除
Artificial Analysis@ArtificialAnlys · 5月5日52

Who do you think created the Peanut 🥜 Image model? 👀 Join the discussion on Discord and share your take: https://discord.gg/8bhAmNw5Z2

译匿名文生图模型Peanut在Artificial Analysis文生图竞技场中首次亮相即位列第八。其模型权重预计很快发布,届时将成为领先的开源权重文生图模型。Peanut被定位为新的开源领导者,性能预计将超越Z-Image Turbo、Qwen-Image和FLUX.2 [dev]等现有模型。更多细节和权重文件即将公布。

Artificial Analysis@ArtificialAnlys · 5月5日69

A new anonymous model debuts at #8 in the Artificial Analysis Text to Image Arena! Peanut’s weights are expected to be released soon, which would make it the leading Text to Image Open Weights Model. Peanut is positioned to be the new leading open weights Text to Image model, surpassing Z-Image Turbo, Qwen-Image, and FLUX.2 [dev]. Further details (and weights) coming soon. See example generations from Peanut in the Artificial Analysis Image Arena below 🧵

译一款新的匿名模型在Artificial Analysis文本转图像竞技场中首次亮相,位列第8!Peanut的权重预计即将发布,这将使其成为领先的文本转图像开源权重模型。 Peanut定位为新的领先开源权重文本转图像模型,超越了Z-Image Turbo、Qwen-Image和FLUX.2 [dev]。 更多详细信息(及权重)即将公布。 查看下方🧵中Artificial Analysis图像竞技场里Peanut的生成示例。

向阳乔木@vista8 · 5月4日58

躺平神器开源!Xbox手柄秒变Mac万能遥控器~ 躺床上就能控制播放Youtube、B站视频,全屏、快进、快退、调整音量。 支持微信读书、浏览器,甚至任意Mac软件Tab切换,上下滚动、翻页等操作。 欢迎fork改造Switch手柄等其他硬件。 https://github.com/joeseesun/xbox-mac-ctrl

译一款名为“xbox-mac-ctrl”的开源工具,可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放(全屏、快进、音量调节),并操作微信读书、浏览器及任意Mac软件(如Tab切换、滚动翻页)。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现,旨在满足躺卧时遥控刷小说、看视频的需求,并鼓励开发者fork以适配Switch手柄等其他硬件。

Berryxia.AI@berryxia · 5月4日60

AI agent终于有专属的Slide框架了。 open-slide 直接把“prompt一下就出一整套精美幻灯片”变成了现实。 它不是简单生成Markdown,而是把每张幻灯片做成React组件,固定1920×1080画布,内置agent技能: - /create-slide:一句话prompt就能生成完整deck - /apply-comments:在浏览器里点元素留评论,agent一键应用所有修改 - 内置演示模式、演讲者笔记、定时器 - 一键导出HTML/PDF - 支持Claude Code、Cursor、Codex等任意编码agent 最重要的是,它把agent从“聊天生成文字”升级成了“真正能输出可呈现成品”的生产力工具。 GitHub:https://github.com/1weiho/open-slide Demo:https://demo.open-slide.dev/ 这波操作,直接填补了agent和真实产出之间的最后一公里。 你觉得agent时代,Slide生成会不会成为标配技能?

译open-slide是一款专为AI agent设计的幻灯片框架,能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件,并在固定画布上工作,而非简单生成Markdown。框架内置多项agent技能:通过/create-slide指令一句话生成整套幻灯片;支持在浏览器中对元素添加评论,并由agent通过/apply-comments一键应用所有修改;同时集成演示模式、演讲者笔记和定时器,并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent,其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”,填补了AI代理与真实生产应用之间的关键空白。

Peter Steinberger 🦞@steipete · 5月4日74

This is the most useful tooling I built for OpenClaw to date. It's open source, runs on codex and you can fork and use it for any repo. For all the hard working oss folks that drown in issues and PRs, this is for you.

译这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的,运行在 codex 上,你可以 fork 并将其用于任何代码库。 献给所有在 issue 和 PR 中辛勤工作的开源贡献者们,这是为你们准备的。

Peter Steinberger 🦞@steipete · 5月4日58

🦀📦Crabbox 0.4.0. Often I need to quickly recreate conditions on macOS, Linux and Windows and need fast empheral machines. Crabbox are machines for agents on the fly, using AWS spot instances, Hetzner or @useblacksmith. Infinite codex + tests! https://crabbox.sh/

译🦀📦Crabbox 0.4.0。 我经常需要快速在 macOS、Linux 和 Windows 上重建环境,并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器,使用 AWS 竞价实例、Hetzner 或 @useblacksmith。 无限代码库 + 测试! https://crabbox.sh/

Greg Brockman@gdb · 5月4日71

codex for startup ideas

译开发者发布了一款名为“codex-startup-pressure-test-skill”的Codex技能工具,旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户,并定义一个可在两周内完成的MVP(最小可行产品)。用户可通过npm命令直接安装,该工具完全开源,相关代码库已公开。

Rohan Paul@rohanpaul_ai · 5月3日63

World2Agent just open-sourced a protocol that standardizes how Al agents perceive the real world. Install a sensor, your agent gets structured, real-time data. Swap sensors freely — they all speak the same schema. It's trying to give AI agents a standard perception layer, so they can notice outside events before a human writes a prompt. Most agents can already act through tools, but they still need someone to tell them what changed. W2A changes that loop with World → Sensor → Agent, where a sensor watches sources like GitHub, X posts, logs, research drops, meetings, stock moves, or deals, then sends the agent a structured signal. A signal is basically a clean event packet: what happened, where it came from, why it may matter, and what context the agent should read before deciding what to do. That removes a lot of messy glue code, because builders no longer need to rebuild polling, webhooks, schemas, deduping, and delivery logic for every new data source. The useful part is that sensors are reusable, so 1 GitHub sensor or X sensor can feed different agents without each team rewriting the same connector. W2A feels similar in spirit to MCP, but MCP is mainly about what an agent can do, while W2A is about when an agent should wake up and care. W2A now works with any agent (e.g. OpenClaw, Hermes), Claude Code, and Codex. Like agent skills, anyone can build their own W2A sensors and reuse sensors built by others. They’ve also open-sourced the sensors they built, as reference implementations to help developers build more complex sensors for proactive AI agents. W2A Protocol & W2A Sensors are meant to serve as building blocks for the broader proactive AI ecosystem. Architecture World → Sensor → Agent Sensors watch data sources and emit structured data following W2A Protocol. Your agent receives signals and decides what to do.

译World2Agent开源了W2A协议,旨在为AI代理建立标准化的世界感知层。该协议采用“世界→传感器→代理”架构,传感器从GitHub、X帖子、日志等多种数据源中提取信息,并生成包含事件内容、来源及背景的结构化实时信号。这使得AI代理能主动感知外部变化并自主响应,无需等待人类提示。传感器可重复使用,避免了为每个新数据源重复开发轮询、去重等逻辑。与侧重代理能力的MCP不同,W2A主要解决代理“何时应被唤醒”的问题。目前该协议已支持多种主流代理,并邀请开发者共同构建传感器生态。

Greg Brockman@gdb · 5月3日72

gallery for codex pet sharing:

译codex宠物分享的图库: 提交入口已开放,可通过下方链接提交👇

向阳乔木@vista8 · 5月2日59

想让你的博客或网站的中文排版更优雅? 可以让AI开发时参考这两个Github库: ① chinese-copywriting-guidelines,中英文之间的空格,标点符号要怎么用等等,15k Star。 ② 赫蹏(hètí)是专为中文内容展示设计的排版样式增强。它基于通行的中文排版规范而来,可以为网站的读者带来更好的文章阅读体验。 地址见评论区

译推文推荐两个GitHub开源库以提升中文内容的排版质量。其一是“chinese-copywriting-guidelines”,提供中英文混排、标点符号使用等写作规范,已获15k星标。其二是“赫蹏”,一个专门为中文内容展示设计的CSS样式库,旨在遵循通行的中文排版规范,从而显著改善网站文章的阅读体验。开发者可在项目开发中参考这些资源。

阿绎 AYi@AYi_AInotes · 5月2日55

卧槽这个开源金融Agent太狠了,直接帮你干完整份深度研报。 Dexter:开源的金融版 Claude Code, GitHub2万+ ⭐️,MIT 开源,TypeScript 支持 OpenAI / Claude / Gemini / Grok / Ollama 真正能干活的金融研究AI, 不是只会瞎编数据的聊天机器人, 它会自主规划、执行、自我验证 帮你做的事: → 自动拆解"这只股票被低估了吗"这类复杂问题 → 调实时数据(10,000+ 只股票) → 发现结论有问题,自己重来 → 通常 10-20 秒给出结果 你扔给它一个复杂问题,比如对比苹果和微软过去三年自由现金流,评估哪家估值更合理。 它会自动拆解成结构化研究步骤,调用实时财报数据, 自己验证每一个数字的准确性, 最后给你一份有数据支撑的完整分析。 多Agent架构也很香,规划执行验证合成全部分开,从根源上解决了金融领域最致命的幻觉问题。 最绝的是支持WhatsApp网关,扫码登录就能直接在手机上用,不用开电脑。 所有做投资的人都应该去试一下,这才是AI真正能帮你赚钱的地方。 #Dexter #AI金融 #开源Agent #投资工具 #大模型

译Dexter是一款开源金融AI助手,能像Claude Code一样自主处理复杂金融研究。它将“股票是否被低估”等问题自动拆解为步骤,调用超万只股票实时数据,并在发现问题时自我修正,通常10-20秒生成结果。其多Agent架构将规划、执行、验证与合成分离,从根源上缓解了大模型在金融领域的幻觉问题。该项目在GitHub获2万+星,MIT开源,支持多种大模型后端,并可通过WhatsApp网关在移动端便捷使用,为投资分析提供高效工具。

Peter Steinberger 🦞@steipete · 5月1日68

Too many agents, too many test suites, one very tired Mac. Run them remote: Crabbox 0.1.0 🦀 ⚡ Remote Linux test boxes (AWS, Hetzner) 🔁 Dirty checkout sync 🦀 Warm boxes with friendly slugs ⏱️ Idle auto-free brew install openclaw/tap/crabbox http://crabbox.sh

译代理太多,测试套件太多,一台非常疲惫的 Mac。远程运行它们: Crabbox 0.1.0 🦀 ⚡ 远程 Linux 测试盒(AWS、Hetzner) 🔁 脏检出同步 🦀 带有友好 slug 的预热盒 ⏱️ 空闲自动释放 brew install openclaw/tap/crabbox http://crabbox.sh

小互@xiaohu · 5月1日65

好的 兄弟 哈哈哈哈

译一位开发了DeepSeek-TUI终端工具的美国开发者,希望与国内开发者社群建立联系,共同探讨DeepSeek、开源及智能体开发。他因无法自行解决网络问题以使用微信,特请求社区帮助:一是转发推广其开源项目,二是协助验证微信号以便建群交流。作为回报,他承诺工具将通过cargo install方式安装。

宝玉@dotey · 5月1日60

开源无国界

译一位开发了DeepSeek-TUI终端工具的美国开发者表示,希望与中国开发者社区建立联系,但受限于网络访问和微信验证。他请求社区帮助转发推广其开源项目,并协助完成微信验证,以便建立群组共同探讨DeepSeek、开源技术以及改进AI agent。作为回报,他承诺维护cargo install的简洁安装方式。开发者透露,其推文内容经由DeepSeek模型润色完成。

歸藏(guizang.ai)@op7418 · 5月1日67

本来是想随便玩一下的。 没想到 Codex 真的用一下午帮我开发了一个非常完整的类似《杀戮尖塔》的卡牌游戏。 代码和客户端都已经开源了,大家可以试试

译用户原本抱着尝试心态使用Codex,结果该AI工具仅用一个下午就协助开发出了一款非常完整的、类似《杀戮尖塔》的卡牌游戏。目前,该项目的全部代码和客户端均已开源,可供公众体验和测试。这展示了Codex在游戏开发辅助方面的高效与强大能力。

Berryxia.AI@berryxia · 5月1日63

🚀 Geometry 终于成为 AI 在建筑领域的缺失关键层! @Bootsblac 用 OpenGeometry 把 Text → Floorplans → CAD → Render 完整打通,精度控制成为可能! 1. 从文本/平面图直接生成精准 BREP CAD 模型 2. Three.js 实时渲染 + Google AI 驱动,全流程端到端 3.完整开源可用

译推文指出,Geometry(几何)已成为AI在建筑领域缺失的关键层。@Bootsblac开发的OpenGeometry项目,实现了从文本或平面图到最终渲染的完整流程贯通,使得精确控制成为可能。其核心能力包括:直接从文本或平面图生成精确的BREP CAD模型;利用Three.js进行实时渲染,并由Google AI驱动,形成端到端的全流程。该项目已完整开源,可供使用。

Peter Steinberger 🦞@steipete · 5月1日56

If you tried OpenClaw in group chats and got mixed results, you GOTTA try again. I changed how agents talk there, it IS SO GOOD NOW. https://docs.openclaw.ai/channels/groups#visible-replies And if you used GPT and got subpar performance, switch to codex harness. https://docs.openclaw.ai/plugins/codex-harness Enable both and boom.

译OpenClaw宣布其群聊功能已大幅改进,建议用户体验新版对话机制。若此前使用GPT效果不佳,推荐切换至codex harness插件。同时启用两项改进可显著提升性能。此次更新使群聊体验更原生,具体改进包括优化对话感受、增强上下文跟进承诺、提升安全执行与管控、新增NVIDIA供应商及模型目录,并加速启动与修复插件/通道问题。

宝玉@dotey · 5月1日59

试用下来 CodexPotter 不错,推荐下。它不是基于 Codex 插件机制,它本身是一个 cli,然后会后台启动 codex cli,把指令传给 codex,同步显示 codex cli 结果。 CodexPotter 先把想要的结果写进一个 MAIN.md 文件,然后工具在后台不停地启动新的 Codex 会话,每一轮都用全新、干净的上下文,对照 MAIN.md 检查代码、修正、再检查、再修正,直到结果跟你写的一致才停。 默认最多是 6 轮,但是你可以通过配置修改数字。 使用上需要注意,CodexPotter 适合目标明确的任务,比如“按照这个设计文档实现订阅系统”,不适合需要来回讨论的交互式开发。它是个任务执行器,不是聊天伙伴。 顺便说一下:Ralph 这个名字的来源是《辛普森一家》那个爱重复同一句话的小孩 Ralph Wiggum pattern。 https://github.com/breezewish/CodexPotter

译CodexPotter 是一个命令行工具,通过后台启动 Codex CLI 并采用“Ralph Loop”机制执行任务。它先将用户目标写入 MAIN.md 文件,随后在全新上下文中反复启动 Codex 会话,对照该文件检查并修正代码,直至输出与目标一致,默认最多进行 6 轮迭代。该工具适用于目标明确的任务(如按文档实现功能),而非交互式讨论。其名称灵感来源于《辛普森一家》中爱重复说话的 Ralph Wiggum。作者推荐此工具,以回应寻找类似 Claude Code 中 Ralph 插件的需求,并指出其不会像某些插件那样修改用户配置。

阿绎 AYi@AYi_AInotes · 4月30日54

卧槽,Anthropic这次真把开发者当傻子。 知名开发者Theo做了个实验:建了个空Git仓库,只commit一行JSON {"schema": "openclaw.inbound_meta.v1"}, 调用官方Claude Code就直接触发“out of extra usage”错误,要么拒绝要么强制额外付费。 只要最近commit里出现“openclaw”字符串(不管在JSON、文件名还是注释), 官方CLI就会把你当成第三方harness用户,多收一层钱。 不是啥bug,看起来是故意加的字符串匹配规则。 他们4月初已经在API层面封杀OpenClaw的订阅额度, 现在连官方工具都开始检测commit历史。 以前Anthropic靠“不做监控、不做杀戮链”的形象吸粉,现在为了把用户锁在自家Claude Code里,用这种简单粗暴的手段,社区直接炸了🤪🤪🤪 OpenClaw火起来,正是因为第三方工具在agentic体验上比官方更灵活, 他们不优化产品,反而封杀竞品,用户用脚投票的声音已经越来越大,是时候考虑开源替代了🤬🤬🤬🤬

译开发者Theo实验发现,Anthropic的官方工具Claude Code会主动扫描用户Git仓库的近期提交记录。一旦检测到包含“openclaw”字符串(无论出现在JSON、文件名或注释中),便会触发“out of extra usage”错误,导致请求被拒绝或强制额外收费。这证实了Anthropic有意通过字符串匹配规则,打压第三方工具OpenClaw,旨在将用户锁定在其自家产品中。此举与其此前宣称的“不做监控”形象相悖,被社区批评为反竞争行为,并引发了用户转向开源替代方案的强烈呼声。

Berryxia.AI@berryxia · 4月30日59

🚀 Qwen 重磅开源 Qwen-Scope! 稀疏自编码器完整套件正式发布,把 SAE 特性变成真正能落地的实用工具,模型可解释性直接起飞! 1. Inference:直接操纵内部特征实现输出控制,完全无需 prompt engineering 2. Data:用极少种子样本就能分类和合成目标数据,解决长尾能力问题 3. Training:精准追溯 code-switching 和重复生成根源,从源头修复 4. Evaluation:通过特征激活模式分析智能挑选 benchmark,减少冗余 Qwen 模型家族的深度可解释性神器,社区快来挖掘新机制和应用! 项目地址: https://huggingface.co/collections/Qwen/qwen-scope

译Qwen开源了Qwen-Scope,这是一个为Qwen模型家族设计的稀疏自编码器完整套件,旨在将SAE特征转化为实用工具。该套件提供四大核心功能:在推理方面,可直接操纵模型内部特征以控制输出,无需依赖提示工程;在数据方面,能用极少样本对目标数据进行分类和合成,增强模型的长尾能力;在训练方面,能精准追溯代码切换和重复生成等问题的根源并进行修复;在评估方面,可通过分析特征激活模式来智能筛选基准测试,减少冗余。Qwen希望社区能利用此工具深入探索模型内部机制并开发更多应用。

Qwen@Alibaba_Qwen · 4月30日73

Today we’re releasing Qwen-Scope 🔭, an open suite of sparse autoencoders for the Qwen model family. It turns SAE features into practical tools: 🎯 Inference — Steer model outputs by directly manipulating internal features, no prompt engineering needed 📂 Data — Classify & synthesize targeted data with minimal seed examples, boosting long-tail capabilities 🏋️ Training — Trace code-switching & repetitive generation back to their source, fix them at the root 📊 Evaluation — Analyze feature activation patterns to select smarter benchmarks and cut redundancy We hope the community uses Qwen-Scope to uncover new mechanisms inside Qwen models and build applications beyond what we explored.Excited to see what you build! 🚀 🔗🔗 Blog: https://qwen.ai/blog?id=qwen-scope HuggingFace: https://huggingface.co/collections/Qwen/qwen-scope ModelScope: https://modelscope.cn/collections/Qwen/Qwen-Scope Technical Report: https://qianwen-res.oss-accelerate.aliyuncs.com/qwen-scope/Qwen_Scope.pdf

译Qwen团队推出开源稀疏自编码器套件Qwen-Scope,将SAE特征转化为实用工具。该套件支持四大应用方向:无需提示工程即可通过直接操控内部特征引导模型输出;用极少样本对目标数据进行分类与合成,提升长尾能力;追踪代码切换和重复生成问题的根源并进行修复;通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制,并开发出超越现有研究范围的应用。相关资源已开放。

Artificial Analysis@ArtificialAnlys · 4月30日56

Tencent has released Hy3-preview, an open weights reasoning model scoring 42 on the Artificial Analysis Intelligence Index, trailing recent open weights peers Hy3-preview is the latest model from @TencentHunyuan. It is a 295B total / 21B active parameter Mixture-of-Experts model, smaller than its December 2025 predecessor Tencent HY 2.0 (406B total / 32B active). Recent leading open weights reasoning models include Qwen3.6 27B (Reasoning, 46), DeepSeek V4 Flash (Reasoning, Max Effort, 47, 284B / 13B) and GLM-5.1 (Reasoning, 51, 744B / 40B). The Intelligence Index is the Artificial Analysis synthesis metric incorporating 10 evaluations covering agentic tasks, coding and scientific reasoning. Key takeaways: ➤ Hy3-preview trails recent open weights peers on GDPval-AA. Hy3-preview scores an Elo of 1235 on GDPval-AA, our agentic real-world work tasks benchmark, behind Qwen3.6 27B (Reasoning, 1414), DeepSeek V4 Flash (Reasoning, Max Effort, 1388) and GLM-5.1 (Reasoning, 1535). GDPval-AA tests models on real-world tasks across 44 occupations and 9 major industries. ➤ Hy3-preview ties GLM-5.1 (Reasoning) on CritPt despite scoring nearly 10 Intelligence Index points lower. Hy3-preview scores 4.6% on CritPt (research-level physics), matching GLM-5.1 (Reasoning, 51 on the Intelligence Index) and ahead of Qwen3.6 27B (Reasoning, 1.1%) but behind DeepSeek V4 Flash (Reasoning, Max Effort, 7.1%). It trails the open weights leaders, including DeepSeek V4 Pro (Reasoning, Max Effort, 12.9%) and Kimi K2.6 (8.0%). ➤ Hy3-preview used ~125M output tokens to run the Intelligence Index. This is ~12% more than GLM-5.1 (Reasoning, 112M) and less than Qwen3.6 27B (Reasoning, 144M) and DeepSeek V4 Flash (Reasoning, Max Effort, 241M). ➤ AA-Omniscience is a relative weakness compared to peers. Hy3-preview scores -35 on the Artificial Analysis Omniscience Index with 28% accuracy and an 87% hallucination rate. This trails DeepSeek V4 Flash (Reasoning, Max Effort, -23), Qwen3.6 27B (Reasoning, -20) and GLM-5.1 (Reasoning, 2). Other information: ➤ Size: 295B total parameters, 21B active parameters ➤ Context window: 256K tokens ➤ License: Tencent HY Community License Agreement, with restricted commercial use ➤ Availability: Weights are available on @huggingface Face and the model is also available on @SiliconFlowAI at $0/$0 per 1M input/output tokens

译腾讯发布开源混合专家模型Hy3-preview,总参数量2950亿,激活参数量210亿。其在Artificial Analysis综合智能指数上得分42,落后于近期开源的GLM-5.1、DeepSeek V4 Flash及Qwen3.6 27B等推理模型。具体评测表现不均衡:在真实世界任务基准GDPval-AA上落后于主要竞品,但在研究级物理评测CritPt上与高分模型GLM-5.1持平;其相对弱项在于AA-Omniscience指数,幻觉率较高。模型采用Tencent HY社区许可协议,商业使用受限,已在Hugging Face和SiliconFlowAI平台提供。

Berryxia.AI@berryxia · 4月30日63

姚老师又开始分享干货了,全开源!

译姚老师于GitHub开源一款AI教程生成工具。用户只需输入主题并提供参考资料,该工具即可以资料为核心,自动补充高质量素材并过滤低质信息,生成系统性的定制教程。教程支持PDF、Word和HTML格式输出,内容按章节组织,并能根据章节特点自动生成并插入图表。其设计融入了《课程营销学》的底层逻辑,排版借鉴了kami风格,确保了质感与规范。文末附有基于实际文章的生成示例。

歸藏(guizang.ai)@op7418 · 4月30日57

基本上今天晚上或者明天就会有安装包,然后整个代码也会开源

译Codex成功创建了类似《杀戮尖塔》的完整游戏关卡演示,细节精细,除声音外近乎完美。演示中的主要场景和角色素材由GPT-Image生成,其余素材由开发者自行收集。项目方宣布,安装包将于今晚或明天发布,同时整个代码将开源。

向阳乔木@vista8 · 4月30日66

发现一个很实用的开源项目,叫 Beads,GitHub 上已经有 22.6k star 。 核心想解决 AI Agent 处理长任务的「失忆」问题。 现在 AI Agent一般靠 Markdown 做记忆,但Markdown是纯文本,没结构,没依赖关系,没状态追踪。 任务一多,上下文窗口一满,信息就丢了。 Beads 的思路:好好做「任务管理」。 底层用的是 Dolt,是一个「像 Git 一样」的 SQL 数据库,支持分支、合并、版本回溯,甚至有单元格级别的merge。 Beads 用Dolt的好处: ① 多个智能体并发写入时,用哈希 ID(比如 bd-a1b2)避免冲突 ② 任务历史可以回溯,不会凭空消失 ③ 持远程同步,团队协作或多机器使用都没问题 不依赖 Git,Beads 可完全脱离 Git 运行。 上下文压缩设计的也不错,有个「语义记忆衰减」,把关闭任务压缩摘要,节省上下文窗口空间。 适合什么场景 项目说主要给 AI编程Agent用。 实际上,任何要在多个 AI 会话之间保持任务连续性的场景都适用。 不用每次开新会话都要重新交代上下文。 安装方法:把Github的地址丢给你的Agent,告诉他安装这个库,并带我配置使用。 地址见评论区

译开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式,转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库,允许多智能体并发写入且避免冲突,保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制,通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent,也适用于任何需要在多次AI会话间维持任务连续性的场景。

Greg Brockman@gdb · 4月30日61

build your own agents with codex app-server

译使用codex app-server构建你自己的智能体 [引用 @arrakis_ai]:Codex应用服务器被严重低估了。 你可以通过ChatGPT账户将Codex级别的智能注入任何平台。 我把它嵌入到Chrome里…运行完美无瑕。 是的…它100%开源。 https://github.com/GENEXIS-AI/chromex

Ant Ling@AntLingAGI · 4月30日55

It was very much of a pleasant surprise to see all the cool demos by combing the Ling-2.6-1T with capable and well-received harnesses like @opencode. Thanks to @novita_labs for another great launch together~ 👏

译Ling-2.6-1T正式开源,来自@AntLingAGI。该模型拥有1T总参数和63B活跃参数,专为实际生产设计,具有token高效性,便于开发者测试、部署和定制。从Ling-2.6-flash升级到1T规模,实现了从快速推理到更强推理的跨越。主推文强调,结合@opencode等工具展示了酷炫演示,体现了模型与现有工具的兼容性和实用性,并对@novita_labs的合作发布表示感谢。

Ant Ling@AntLingAGI · 4月30日53

Thanks Adina~ Token efficiency is the key characteristic leading to the next stage. We need to burn tokens wisely and efficiently in order to make the whole industry sustainable. 🤗🤗

译谢谢Adina~ Token效率是引领下一阶段的关键特性。我们需要明智且高效地消耗token,才能使整个行业可持续发展。🤗🤗

Rohan Paul@rohanpaul_ai · 4月30日46

Right now AI Agents have a serious missing layer - agents can act, but they still can’t really notice. Most agents still wait for a prompt. World2Agent (W2A) changes the setup: sensors watch real-world events, turn them into structured signals, and send them to agents so they can decide and act without someone manually feeding every update. So W2A has built an open protocol that gives AI agents a standard way to notice real-world events, not just respond after a human tells them something. Sensors provide real-world context. You define the action. Think GitHub trends, stock moves, Steam deals, meeting changes, research drops, X posts, error logs, or any source that can emit a signal. Today’s agents are mostly reactive because they lack a perception layer, and builders currently have to manually stitch together polling, webhooks, auth, schemas, deduplication, and delivery logic every time they want an agent to “notice” something. The important idea is this: tools give agents the ability to act, but sensors give them the ability to know when to act. W2A wants sensors to emit structured signals in one shared format, so an agent can subscribe to them the way software subscribes to events. So basically this is the missing infrastructure layer for proactive agents, similar in spirit to what MCP did for tool use. 🧵 1. In this example here, Andrej Karpathy posts → Sensor catches the signal → Agent auto-reviews your codebase using their insight.

译当前AI智能体缺乏感知层,只能被动响应提示。World2Agent (W2A) 通过构建开放协议解决了这一问题,它将现实世界事件(如GitHub动态、股价变动或社交媒体帖子)通过传感器转化为结构化信号。智能体可订阅这些信号,从而能自主决策和行动,无需人工持续输入。这消除了开发者需手动集成轮询、Webhook等复杂逻辑的负担。本质上,W2A为构建主动型智能体提供了缺失的基础设施层,类似于MCP协议为工具调用所做的标准化工作。例如,当特定人物发帖时,传感器捕捉信号后,智能体可自动触发代码库审查任务,实现了“知道何时行动”的关键能力。

Peter Steinberger 🦞@steipete · 4月30日58

Integrated codex review into clawsweeper. I'm using a very similar system prompt so this gets you the same as /review, and clawsweeper has automerge, loops until it stops finding new issues. https://github.com/openclaw/clawsweeper

译已将代码审查集成到 clawsweeper 中。 我使用了非常相似的系统提示,因此这能提供与 /review 相同的效果,而且 clawsweeper 具备自动合并功能,会循环运行直至不再发现新问题。https://github.com/openclaw/clawsweeper

Ant Ling@AntLingAGI · 4月29日71

Last week, we introduced Ling-2.6-1T. Today, Ling-2.6-1T is officially an open model~ 🤗 1T total parameters · 63B active parameters We bring values to developers by making it easier to test, deploy, customize, and build. It is optimized to be "token efficiency" for real production needs: • Lower token overhead: strong intelligence without long reasoning traces • Reliable multi-step execution: better instruction, tool, context, and workflow control • Production-ready deployment: from code generation to bug fixing, with broad agent framework compatibility A sneak pick into the agentic capability in @opencode

译AntLingAGI正式开源其万亿参数旗舰模型Ling-2.6-1T。该模型采用总参数1万亿、激活参数630亿的架构,核心设计理念是“令牌高效”,旨在以极低的令牌开销实现顶尖智能。它通过“快速思考”机制优化,具备可靠的多步骤执行能力,在指令遵循、工具使用和上下文控制方面表现优异。模型为实际生产需求优化,部署便捷,兼容广泛的智能体框架,适用于从代码生成到错误修复等多种任务。

Qwen@Alibaba_Qwen · 4月29日60

🚀 Introducing FlashQLA: high-performance linear attention kernels built on TileLang. ⚡ 2–3× forward speedup. 2× backward speedup. 💻 Purpose-built for agentic AI on your personal devices. 💡Key insights: 1. Gate-driven automatic intra-card CP. 2. Hardware-friendly algebraic reformulation. 3. TileLang fused warp-specialized kernels. FlashQLA boosts SM utilization via automatic intra-device CP. The gains are especially pronounced for TP setups, small models, and long-context workloads. Instead of fusing the entire GDN flow into a single kernel, we split it into two kernels optimized for CP and backward efficiency. At large batch sizes this incurs extra memory I/O overhead vs. a fully fused approach, but it delivers better real-world performance on edge devices and long-context workloads. The backward pass was the hardest part: we built a 16-stage warp-specialized pipeline under extremely tight on-chip memory constraints, ultimately achieving 2×+ kernel-level speedups. We hope this is useful to the community!🫶🫶 Learn more: 📖 Blog: https://qwen.ai/blog?id=flashqla 💻 Code: https://github.com/QwenLM/FlashQLA

译FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。

Qwen@Alibaba_Qwen · 4月29日66

🚀 Introducing FlashQLA: high-performance linear attention kernels built on TileLang. ⚡ 2–3× forward speedup. 2× backward speedup. 💻 Purpose-built for agentic AI on your personal devices. 💡Key insights: 1. Gate-driven automatic intra-card CP. 2. Hardware-friendly algebraic reformulation. 3. TileLang fused warp-specialized kernels. FlashQLA boosts SM utilization via automatic intra-device CP. The gains are especially pronounced for TP setups, small models, and long-context workloads. Instead of fusing the entire GDN flow into a single kernel, we split it into two kernels optimized for CP and backward efficiency. At large batch sizes this incurs extra memory I/O overhead vs. a fully fused approach, but it delivers better real-world performance on edge devices and long-context workloads. The backward pass was the hardest part: we built a 16-stage warp-specialized pipeline under extremely tight on-chip memory constraints, ultimately achieving 2×+ kernel-level speedups. We hope this is useful to the community!🫶🫶 Learn more: 📖 Blog: https://qwen.ai/blog?id=flashqla 💻 Code: https://github.com/QwenLM/FlashQLA

译FlashQLA是基于TileLang开发的高性能线性注意力内核,专为提升个人设备上智能体AI性能而设计。它实现了2-3倍的前向传播加速和2倍的反向传播加速。其核心技术包括门控驱动的片上自动计算与通信重叠、硬件友好的代数重构,以及TileLang融合的Warp专用内核。该设计通过自动片上通信重叠显著提升了流处理器利用率,在张量并行、小模型和长上下文任务中效果突出。尽管在大批量处理时,其将GDN流程拆分为两个内核的策略会带来额外内存开销,但在边缘设备和长上下文实际场景中性能更优。反向传播部分通过构建16级、严格片上内存限制下的Warp专用流水线,实现了超过2倍的内核级加速。

meng shao@shao__meng · 4月29日56

poolside 发布了 Laguna 系列两个模型:XS.2 和 M.1 在关注模型参数之外, @poolsideai 的页面设计风格也实在太吸引人了,我也是看到 @dingyi 大佬分享,看到了官方网站,设计质感实在是好,已经取代 Zed 成为我心里网站设计 Top1 用我开源的 Brand to DESIGN.md Skill,读取网站的设计风格,提炼成 DESIGN.md,再以它为基础输出复刻版 Demo,大家看看有几分相似。 「Brand to DESIGN.md Skill」开源项目在这: https://github.com/shaom/brand-to-design-md-skill 项目 Showcases/poolside 目录下,我也把 poolside 对应的 DESIGN.md 和 demo.html 放进来了。

译poolside公司发布了Laguna系列模型,包括其首个开源模型XS.2。该模型为33B总参数/3B激活参数的MoE架构,专为智能体编码和长程任务设计,完全内部训练,支持单GPU运行,并采用Apache 2.0许可。同时,推文作者高度赞赏poolside官网的设计风格,并利用其开源的“Brand to DESIGN.md Skill”工具,将网站设计提炼为DESIGN.md文档,进而复刻出设计Demo。相关设计文件与模型资源均已开源,供社区参考使用。

向阳乔木@vista8 · 4月29日29

将 DeepSeek Web 对话能力转换为 OpenAl、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧...

译将 DeepSeek Web 对话能力转换为 OpenAI、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧...

向阳乔木@vista8 · 4月29日43

这个Skill有点意思,提示词优化大师Skill。 像我和姚老师写的元Prompt。 虽然是纯文本Skill,但针对了不同场景做优化,比如哪怕是写代码,也有不同的工具,比如Claude Code还是Cursor,提示词会有差异。 生图提示词会考虑用Midjourney还是其他,给出不同提示词。 目前有6k多Star,等我测试下,地址见评论区

译一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。

Chubby♨️@kimmonismus · 4月29日44

Xiami mimo-v2.5 pro MIT license surpasses Opus 4.5 on arena Amazing achievement.

译Xiami mimo-v2.5 pro MIT许可证在竞技场上超越了Opus 4.5 了不起的成就。

阿绎 AYi@AYi_AInotes · 4月29日59

Damn,这可能是2026年最被低估的开发者生产力工具💻🤖! The harness is the bottleneck,喵个咪,同样的Claude,换个壳,内存省20倍,启动快245倍。 所以信息差不仅省钱,还省 token 啊,你如果觉得用Claude慢,其实不是Claude的问题,是这个harness的问题。 Claude Code单开一个会话吃掉230MB内存,启动一次要3.4秒,你说它慢,它也没法辩解,但换掉harness,同样的Claude,启动快245倍,10个并行会话总内存只用260MB。 这是一个叫jcode的开源项目做到的,作者1jehuang,Rust写的,GitHub repo就在那摆着,benchmark数据完整可查,没有任何营销成分。 有意思的是,它还支持一个叫Self-Dev的模式,代理可以直接改jcode自己的源码,编译,重载,用来迭代自己,这不是demo,作者每天都在把这套跑在生产上。 说白了就是,Anthropic把最好的模型卖给你,但没人说harness必须用他们的,开源社区的进化速度,从来不输大厂,只是他们不打广告。 当然风险是真实的,Anthropic明确禁止OAuth第三方接入,封号灰色地带,建议先拿API Key跑,不要用主号赌,但这个方向依然值得盯着。

译开源项目jcode通过替换Claude的默认调用框架,实现内存占用减少20倍、启动速度加快245倍的惊人提升,并支持AI代理自我迭代的“Self-Dev”模式。同时,蚂蚁发布的Ling-2.6-1T模型以“token效率”为核心,能将成本降至可比模型的四分之一,综合智能接近GPT-5.4非推理水平。这两者共同揭示AI行业竞争重点正从参数规模转向真实生产环境下的成本与效率。

阿绎 AYi@AYi_AInotes · 4月29日47

holy shit,Warp这次真的是把整个行业的桌子给掀了。 发布一天多,GitHub直接冲到31.9k星,速度快到系统都卡了。 兄弟们,这可不是简单把代码扔到GitHub,相当于带来了人类历史上第一个AI原生的开源协作范式🤯🤯🤯 以前开源是靠热情开发者周末肝代码, 现在Oz代理会自动写代码,跑测试,做code review, 甚至生成完整的技术文档。 未来人类只需要做最值钱的三件事,提想法,把关品味,拍板最终方向。 更有意思的是,前几天http://Cal.com刚因为AI风险宣布闭源,Warp反其道而行之,用AI把开源的优势放大到了极致👍👍👍 而且你现在甚至能去http://build.warp.dev,实时围观几百个AI代理同时在写代码,改bug,处理issue。 我感觉这可能是未来十年软件开发方式的一次预演。

译Warp宣布开源后,其GitHub仓库在一天内获得超过3万星标,热度极高。此举被视为开创了“AI原生的开源协作范式”,其核心在于引入AI代理(如Oz代理)自动执行编码、测试、代码审查和技术文档生成等任务。这预示着未来开发者的角色将转向提出创意、把控质量和决策方向。此举与Cal.com因AI风险而闭源的做法形成鲜明对比,Warp通过AI技术将开源协作的优势极大化。用户现可在线实时观察数百个AI代理协同处理代码、修复漏洞的进程,这可能是未来十年软件开发模式的一次重要预演。

Berryxia.AI@berryxia · 4月29日59

我靠!兄弟们?Warp 都要开源了! 官方宣布Warp 正式全面开源啦!🔥 知名现代终端 + Agentic 开发环境 Warp 现在完全开源! • 代码、Roadmap、贡献流程全部开放 • GitHub:https://github.com/warpdotdev/warp • Oz AI agents(GPT 驱动)负责 coding、planning、testing • OpenAI Devs 担任 founding sponsor 开发者福音! 欢迎社区一起共建下一代终端工具 🚀

译我靠!兄弟们?Warp 都要开源了! 官方宣布Warp 正式全面开源啦!🔥 知名现代终端 + Agentic 开发环境 Warp 现在完全开源! • 代码、Roadmap、贡献流程全部开放 • GitHub:https://github.com/warpdotdev/warp • Oz AI agents(GPT 驱动)负责 coding、planning、testing • OpenAI Devs 担任 founding sponsor 开发者福音! 欢迎社区一起共建下一代终端工具 🚀 [引用 @warpdotdev]:Warp is now open-source.

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月5日
07:49
Artificial Analysis@ArtificialAnlys
52
匿名文生图模型Peanut在Artificial Analysis文生图竞技场中首次亮相即位列第八。其模型权重预计很快发布,届时将成为领先的开源权重文生图模型。Peanut被定位为新的开源领导者,性能预计将超越Z-Image Turbo、Qwen-Image和FLUX.2 【dev】等现有模型。更多细节和权重文件即将公布。

Artificial Analysis: A new anonymous model debuts at #8 in the Artificial Analysis Text to Image Arena! Peanut's weights are expected to be r...

图像生成开源/仓库模型发布
03:18
Artificial Analysis@ArtificialAnlys
69
一款新的匿名模型在Artificial Analysis文本转图像竞技场中首次亮相,位列第8!Peanut的权重预计即将发布,这将使其成为领先的文本转图像开源权重模型。 Peanut定位为新的领先开源权重文本转图像模型,超越了Z-Image Turbo、Qwen-Image和FLUX.2 【dev】。 更多详细信息(及权重)即将公布。 查看下方🧵中Artificial Analysis图像竞技场里Peanut的生成示例。
图像生成开源/仓库模型发布评测/基准
5月4日
22:22
向阳乔木@vista8
58
躺平神器开源!Xbox手柄秒变Mac万能遥控器~

一款名为“xbox-mac-ctrl”的开源工具,可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放(全屏、快进、音量调节),并操作微信读书、浏览器及任意Mac软件(如Tab切换、滚动翻页)。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现,旨在满足躺卧时遥控刷小说、看视频的需求,并鼓励开发者fork以适配Switch手柄等其他硬件。

向阳乔木: DeepSeek v4 Pro还是可以的。 几轮对话,实现一个工具,用xbox手柄控制电脑应用和浏览器。 当遥控器,躺床上刷小说和看视频。

MCP/工具开源/仓库教程/实践
09:13
Berryxia.AI@berryxia
60
AI agent专属幻灯片框架open-slide发布

open-slide是一款专为AI agent设计的幻灯片框架,能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件,并在固定画布上工作,而非简单生成Markdown。框架内置多项agent技能:通过/create-slide指令一句话生成整套幻灯片;支持在浏览器中对元素添加评论,并由agent通过/apply-comments一键应用所有修改;同时集成演示模式、演讲者笔记和定时器,并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent,其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”,填补了AI代理与真实生产应用之间的关键空白。

Yiwei Ho: Introducing open-slide - The slide framework built for agents. Prompt your agent, get a polished deck. $ npx @open-slide...

智能体GitHubMCP/工具开源/仓库
03:50
Peter Steinberger 🦞@steipete
精选74
这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的,运行在 codex 上,你可以 fork 并将其用于任何代码库。 献给所有在 issue 和 PR 中辛勤工作的开源贡献者们,这是为你们准备的。

OpenClaw🦞: ClawSweeper 0.2.0 🦞 The OpenClaw maintenance bot now handles the loop: issue → @clawsweeper fix/build → guarded PR → re...

智能体开源/仓库编码

推荐理由:开源维护者的救命稻草,把 issue 到 automerge 的冗长循环扔给 ClawSweeper 自动修复,保守但足够实用,fork 就能用在任何仓库。
03:50
Peter Steinberger 🦞@steipete
58
🦀📦Crabbox 0.4.0。 我经常需要快速在 macOS、Linux 和 Windows 上重建环境,并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器,使用 AWS 竞价实例、Hetzner 或 @useblacksmith。 无限代码库 + 测试! https://crabbox.sh/
智能体开源/仓库编码部署/工程
00:17
Greg Brockman@gdb
精选71
开发者发布了一款名为"codex-startup-pressure-test-skill"的Codex技能工具,旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户,并定义一个可在两周内完成的MVP(最小可行产品)。用户可通过npm命令直接安装,该工具完全开源,相关代码库已公开。

Kappaemme: CODEX SKILL TO BRUTALLY TEST ANY STARTUP IDEA! Most startup ideas sound good. This Codex skill tells you why they probab...

智能体GitHubOpenAI开源/仓库

推荐理由:我觉得种子轮前用它榨干想法很值,Greg Brockman 转发的开源技能,输入创业想法就能自动找出核心假设和致命缺陷。
5月3日
18:12
Rohan Paul@rohanpaul_ai
63
World2Agent开源W2A协议,为AI代理构建标准化感知层

World2Agent开源了W2A协议,旨在为AI代理建立标准化的世界感知层。该协议采用“世界→传感器→代理”架构,传感器从GitHub、X帖子、日志等多种数据源中提取信息,并生成包含事件内容、来源及背景的结构化实时信号。这使得AI代理能主动感知外部变化并自主响应,无需等待人类提示。传感器可重复使用,避免了为每个新数据源重复开发轮询、去重等逻辑。与侧重代理能力的MCP不同,W2A主要解决代理“何时应被唤醒”的问题。目前该协议已支持多种主流代理,并邀请开发者共同构建传感器生态。

LeahW: The future belongs to proactive agents. But without real-time perception, they're stuck reacting. "World2Agent" isn't a ...

智能体MCP/工具开源/仓库
02:17
Greg Brockman@gdb
精选72
codex宠物分享的图库: 提交入口已开放,可通过下方链接提交👇

Hunter ♠️: Built Petdex, a public gallery to discover, share, and install Codex pets with one curl. Submissions open at link below ...

智能体OpenAI开源/仓库编码

推荐理由:Greg Brockman 亲自转发的社区画廊,把 Codex pets 的发现和安装简化成一条 curl 命令,对于正在玩 Codex Agent 的开发者来说是个实用的工具箱。
5月2日
22:49
向阳乔木@vista8
59
两个GitHub库助你优化中文网站排版

推文推荐两个GitHub开源库以提升中文内容的排版质量。其一是“chinese-copywriting-guidelines”,提供中英文混排、标点符号使用等写作规范,已获15k星标。其二是“赫蹏”,一个专门为中文内容展示设计的CSS样式库,旨在遵循通行的中文排版规范,从而显著改善网站文章的阅读体验。开发者可在项目开发中参考这些资源。

大佬观点开源/仓库教程/实践
17:11
阿绎 AYi@AYi_AInotes
55
开源金融AI助手Dexter:自动完成深度研报,10-20秒出结果

Dexter是一款开源金融AI助手,能像Claude Code一样自主处理复杂金融研究。它将“股票是否被低估”等问题自动拆解为步骤,调用超万只股票实时数据,并在发现问题时自我修正,通常10-20秒生成结果。其多Agent架构将规划、执行、验证与合成分离,从根源上缓解了大模型在金融领域的幻觉问题。该项目在GitHub获2万+星,MIT开源,支持多种大模型后端,并可通过WhatsApp网关在移动端便捷使用,为投资分析提供高效工具。

智能体GitHub开源/仓库
5月1日
17:16
Peter Steinberger 🦞@steipete
68
代理太多,测试套件太多,一台非常疲惫的 Mac。远程运行它们: Crabbox 0.1.0 🦀 ⚡ 远程 Linux 测试盒(AWS、Hetzner) 🔁 脏检出同步 🦀 带有友好 slug 的预热盒 ⏱️ 空闲自动释放 brew install openclaw/tap/crabbox http://crabbox.sh
智能体开源/仓库部署/工程
13:17
小互@xiaohu
65
一位开发了DeepSeek-TUI终端工具的美国开发者,希望与国内开发者社群建立联系,共同探讨DeepSeek、开源及智能体开发。他因无法自行解决网络问题以使用微信,特请求社区帮助:一是转发推广其开源项目,二是协助验证微信号以便建群交流。作为回报,他承诺工具将通过cargo install方式安装。

Hunter Bown: 鲸鱼兄弟们好,我是做 DeepSeek-TUI 的那个美国佬。 说真的,特别想跟国内的鲸鱼兄弟们一起混--但我的翻墙技能仅限于写代码,微信到现在都没搞定,属实有点丢人。 求各位大佬帮个忙: 1)帮忙转发扩散一下,让这个开源终端工具翻过高墙被...

DeepSeek开源/仓库开源生态推理
12:16
宝玉@dotey
60
一位开发了DeepSeek-TUI终端工具的美国开发者表示,希望与中国开发者社区建立联系,但受限于网络访问和微信验证。他请求社区帮助转发推广其开源项目,并协助完成微信验证,以便建立群组共同探讨DeepSeek、开源技术以及改进AI agent。作为回报,他承诺维护cargo install的简洁安装方式。开发者透露,其推文内容经由DeepSeek模型润色完成。

Hunter Bown: 鲸鱼兄弟们好,我是做 DeepSeek-TUI 的那个美国佬。 说真的,特别想跟国内的鲸鱼兄弟们一起混--但我的翻墙技能仅限于写代码,微信到现在都没搞定,属实有点丢人。 求各位大佬帮个忙: 1)帮忙转发扩散一下,让这个开源终端工具翻过高墙被...

GitHub开源/仓库编码
10:13
歸藏(guizang.ai)@op7418
67
用户原本抱着尝试心态使用Codex,结果该AI工具仅用一个下午就协助开发出了一款非常完整的、类似《杀戮尖塔》的卡牌游戏。目前,该项目的全部代码和客户端均已开源,可供公众体验和测试。这展示了Codex在游戏开发辅助方面的高效与强大能力。

歸藏(guizang.ai): http://x.com/i/article/2049902517254070272

智能体OpenAI开源/仓库教程/实践
09:10
Berryxia.AI@berryxia
63
Geometry成为AI建筑关键层,OpenGeometry打通文本到CAD全流程

推文指出,Geometry(几何)已成为AI在建筑领域缺失的关键层。@Bootsblac开发的OpenGeometry项目,实现了从文本或平面图到最终渲染的完整流程贯通,使得精确控制成为可能。其核心能力包括:直接从文本或平面图生成精确的BREP CAD模型;利用Three.js进行实时渲染,并由Google AI驱动,形成端到端的全流程。该项目已完整开源,可供使用。

多模态开源/仓库开源生态
07:15
Peter Steinberger 🦞@steipete
56
OpenClaw宣布其群聊功能已大幅改进,建议用户体验新版对话机制。若此前使用GPT效果不佳,推荐切换至codex harness插件。同时启用两项改进可显著提升性能。此次更新使群聊体验更原生,具体改进包括优化对话感受、增强上下文跟进承诺、提升安全执行与管控、新增NVIDIA供应商及模型目录,并加速启动与修复插件/通道问题。

OpenClaw🦞: OpenClaw 2026.4.29 🦞 💬 Group chats feel much better now 📌 Follow-up commitments from context 🔐 Safer exec, pairing, ...

智能体GitHub开源/仓库教程/实践
01:14
宝玉@dotey
59
推荐命令行工具 CodexPotter:基于 Ralph Loop 机制执行明确任务

CodexPotter 是一个命令行工具,通过后台启动 Codex CLI 并采用“Ralph Loop”机制执行任务。它先将用户目标写入 MAIN.md 文件,随后在全新上下文中反复启动 Codex 会话,对照该文件检查并修正代码,直至输出与目标一致,默认最多进行 6 轮迭代。该工具适用于目标明确的任务(如按文档实现功能),而非交互式讨论。其名称灵感来源于《辛普森一家》中爱重复说话的 Ralph Wiggum。作者推荐此工具,以回应寻找类似 Claude Code 中 Ralph 插件的需求,并指出其不会像某些插件那样修改用户配置。

宝玉: 请问有没有好用的 Ralph Loop for Codex? 类似于 Claude Code 的 Ralph Wiggum Plugin https://github.com/anthropics/claude-code/blob/main...

GitHub开源/仓库编码
4月30日
23:10
阿绎 AYi@AYi_AInotes
54
Anthropic被曝检测Git提交以限制第三方工具,引发社区不满

开发者Theo实验发现,Anthropic的官方工具Claude Code会主动扫描用户Git仓库的近期提交记录。一旦检测到包含“openclaw”字符串(无论出现在JSON、文件名或注释中),便会触发“out of extra usage”错误,导致请求被拒绝或强制额外收费。这证实了Anthropic有意通过字符串匹配规则,打压第三方工具OpenClaw,旨在将用户锁定在其自家产品中。此举与其此前宣称的“不做监控”形象相悖,被社区批评为反竞争行为,并引发了用户转向开源替代方案的强烈呼声。

Theo - t3.gg: Fun fact - if you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your reques...

Anthropic开源/仓库行业动态
23:10
Berryxia.AI@berryxia
59
🚀 Qwen 重磅开源 Qwen-Scope!

Qwen开源了Qwen-Scope,这是一个为Qwen模型家族设计的稀疏自编码器完整套件,旨在将SAE特征转化为实用工具。该套件提供四大核心功能:在推理方面,可直接操纵模型内部特征以控制输出,无需依赖提示工程;在数据方面,能用极少样本对目标数据进行分类和合成,增强模型的长尾能力;在训练方面,能精准追溯代码切换和重复生成等问题的根源并进行修复;在评估方面,可通过分析特征激活模式来智能筛选基准测试,减少冗余。Qwen希望社区能利用此工具深入探索模型内部机制并开发更多应用。

Qwen: Today we're releasing Qwen-Scope 🔭, an open suite of sparse autoencoders for the Qwen model family. It turns SAE featur...

Hugging Face开源/仓库开源生态
22:43
Qwen@Alibaba_Qwen
精选73
Qwen-Scope开源套件发布:稀疏自编码器助力模型内部特征操控

Qwen团队推出开源稀疏自编码器套件Qwen-Scope,将SAE特征转化为实用工具。该套件支持四大应用方向:无需提示工程即可通过直接操控内部特征引导模型输出;用极少样本对目标数据进行分类与合成,提升长尾能力;追踪代码切换和重复生成问题的根源并进行修复;通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制,并开发出超越现有研究范围的应用。相关资源已开放。

Hugging Face开源/仓库开源生态数据/训练

推荐理由:可解释性工具从学术走向工程,Qwen-Scope 把内部特征操控、数据合成、问题溯源打包成套装,做模型调试和长尾优化的团队值得立刻上手试试。
22:11
Artificial Analysis@ArtificialAnlys
56
腾讯发布开源推理模型Hy3-preview,综合评分42分落后于近期同类模型

腾讯发布开源混合专家模型Hy3-preview,总参数量2950亿,激活参数量210亿。其在Artificial Analysis综合智能指数上得分42,落后于近期开源的GLM-5.1、DeepSeek V4 Flash及Qwen3.6 27B等推理模型。具体评测表现不均衡:在真实世界任务基准GDPval-AA上落后于主要竞品,但在研究级物理评测CritPt上与高分模型GLM-5.1持平;其相对弱项在于AA-Omniscience指数,幻觉率较高。模型采用Tencent HY社区许可协议,商业使用受限,已在Hugging Face和SiliconFlowAI平台提供。

开源/仓库推理模型发布评测/基准
20:10
Berryxia.AI@berryxia
63
姚老师于GitHub开源一款AI教程生成工具。用户只需输入主题并提供参考资料,该工具即可以资料为核心,自动补充高质量素材并过滤低质信息,生成系统性的定制教程。教程支持PDF、Word和HTML格式输出,内容按章节组织,并能根据章节特点自动生成并插入图表。其设计融入了《课程营销学》的底层逻辑,排版借鉴了kami风格,确保了质感与规范。文末附有基于实际文章的生成示例。

姚金刚: 开源一个教程Skill 打磨了十几版,效果还不错,已推到GitHub 如果想在五一假期高质量充电,或随时给自己生成一份定制高质量教程 欢迎下载 基本逻辑: 1、输入任意主题及参考资料,AI会优先以参考资料为核心,然后根据需要进行高质量素材和...

开源/仓库教程/实践
19:11
歸藏(guizang.ai)@op7418
57
Codex成功创建了类似《杀戮尖塔》的完整游戏关卡演示,细节精细,除声音外近乎完美。演示中的主要场景和角色素材由GPT-Image生成,其余素材由开发者自行收集。项目方宣布,安装包将于今晚或明天发布,同时整个代码将开源。

歸藏(guizang.ai): 太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生成的,其他的素材是他自己找的。

OpenAI开源/仓库编码
09:15
向阳乔木@vista8
66
开源项目Beads:用结构化任务管理解决AI Agent长任务"失忆"问题

开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式,转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库,允许多智能体并发写入且避免冲突,保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制,通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent,也适用于任何需要在多次AI会话间维持任务连续性的场景。

智能体MCP/工具开源/仓库
06:09
Greg Brockman@gdb
61
使用codex app-server构建你自己的智能体 【引用 @arrakis_ai】:Codex应用服务器被严重低估了。 你可以通过ChatGPT账户将Codex级别的智能注入任何平台。 我把它嵌入到Chrome里…运行完美无瑕。 是的…它100%开源。 https://github.com/GENEXIS-AI/chromex

CHOI: The Codex App Server is massively underrated. You can inject Codex-level intelligence into any platform using your ChatG...

OpenAI开源/仓库
01:42
Ant Ling@AntLingAGI
55
Ling-2.6-1T正式开源,来自@AntLingAGI。该模型拥有1T总参数和63B活跃参数,专为实际生产设计,具有token高效性,便于开发者测试、部署和定制。从Ling-2.6-flash升级到1T规模,实现了从快速推理到更强推理的跨越。主推文强调,结合@opencode等工具展示了酷炫演示,体现了模型与现有工具的兼容性和实用性,并对@novita_labs的合作发布表示感谢。

Novita AI: Today, Ling-2.6-1T is officially open-sourced (from @AntLingAGI) 1T total parameters · 63B active parameters Built for r...

开源/仓库推理模型发布
01:42
Ant Ling@AntLingAGI
53
谢谢Adina~ Token效率是引领下一阶段的关键特性。我们需要明智且高效地消耗token,才能使整个行业可持续发展。🤗🤗

Adina Yakup: Ling-2.6-1T just dropped by @AntLingAGI , one day after Ling 2.6 Flash. Both optimized for the same goal: usable intelli...

开源/仓库推理模型发布
00:39
Rohan Paul@rohanpaul_ai
46
World2Agent:为AI智能体补上"感知"层,让它们能主动察觉现实世界事件

当前AI智能体缺乏感知层,只能被动响应提示。World2Agent (W2A) 通过构建开放协议解决了这一问题,它将现实世界事件(如GitHub动态、股价变动或社交媒体帖子)通过传感器转化为结构化信号。智能体可订阅这些信号,从而能自主决策和行动,无需人工持续输入。这消除了开发者需手动集成轮询、Webhook等复杂逻辑的负担。本质上,W2A为构建主动型智能体提供了缺失的基础设施层,类似于MCP协议为工具调用所做的标准化工作。例如,当特定人物发帖时,传感器捕捉信号后,智能体可自动触发代码库审查任务,实现了“知道何时行动”的关键能力。

智能体MCP/工具开源/仓库
00:12
Peter Steinberger 🦞@steipete
58
已将代码审查集成到 clawsweeper 中。 我使用了非常相似的系统提示,因此这能提供与 /review 相同的效果,而且 clawsweeper 具备自动合并功能,会循环运行直至不再发现新问题。https://github.com/openclaw/clawsweeper
GitHub开源/仓库编码
4月29日
23:42
Ant Ling@AntLingAGI
精选71
Ling-2.6-1T万亿参数模型开源,主打令牌高效

AntLingAGI正式开源其万亿参数旗舰模型Ling-2.6-1T。该模型采用总参数1万亿、激活参数630亿的架构,核心设计理念是“令牌高效”,旨在以极低的令牌开销实现顶尖智能。它通过“快速思考”机制优化,具备可靠的多步骤执行能力,在指令遵循、工具使用和上下文控制方面表现优异。模型为实际生产需求优化,部署便捷,兼容广泛的智能体框架,适用于从代码生成到错误修复等多种任务。

Ant Ling: 🚀 Today, we are launching Ling-2.6-1T, a trillion-parameter flagship model designed for precise instruct task execution...

开源/仓库推理模型发布部署/工程

推荐理由:蚂蚁把万亿参数模型开源了,但强调的不是大,而是省 token,这对成本敏感的生产环境是真正的性价比之选,做 agent 的可以上手测测。
20:33
Qwen@Alibaba_Qwen
精选60
闪存QLA:基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。

开源/仓库推理端侧

推荐理由:2 倍加速的背后是 Warp 特化流水线和自动 Copy 策略,像给手机 GPU 开了条专用跑道,做端侧 Agent 的可以直接拉代码试试。
20:33
Qwen@Alibaba_Qwen
精选66
闪速QLA:基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang开发的高性能线性注意力内核,专为提升个人设备上智能体AI性能而设计。它实现了2-3倍的前向传播加速和2倍的反向传播加速。其核心技术包括门控驱动的片上自动计算与通信重叠、硬件友好的代数重构,以及TileLang融合的Warp专用内核。该设计通过自动片上通信重叠显著提升了流处理器利用率,在张量并行、小模型和长上下文任务中效果突出。尽管在大批量处理时,其将GDN流程拆分为两个内核的策略会带来额外内存开销,但在边缘设备和长上下文实际场景中性能更优。反向传播部分通过构建16级、严格片上内存限制下的Warp专用流水线,实现了超过2倍的内核级加速。

GitHub开源/仓库推理端侧

推荐理由:Qwen 把线性注意力的推理效率压到了新台阶,2-3 倍加速对想做本地 Agent 的开发者是实打实的,不是论文灌水,是能跑在设备上的代码。
18:42
meng shao@shao__meng
56
poolside发布Laguna系列模型并获赞官网设计,开源工具助力风格复刻

poolside公司发布了Laguna系列模型,包括其首个开源模型XS.2。该模型为33B总参数/3B激活参数的MoE架构,专为智能体编码和长程任务设计,完全内部训练,支持单GPU运行,并采用Apache 2.0许可。同时,推文作者高度赞赏poolside官网的设计风格,并利用其开源的“Brand to DESIGN.md Skill”工具,将网站设计提炼为DESIGN.md文档,进而复刻出设计Demo。相关设计文件与模型资源均已开源,供社区参考使用。

poolside: Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...

GitHub开源/仓库教程/实践
18:12
向阳乔木@vista8
29
将 DeepSeek Web 对话能力转换为 OpenAI、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧…
DeepSeekMCP/工具开源/仓库
17:11
向阳乔木@vista8
43
提示词优化大师Skill:针对不同AI场景的Prompt工具

一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。

开源/仓库开源生态编码
17:08
Chubby♨️@kimmonismus
44
Xiami mimo-v2.5 pro MIT许可证在竞技场上超越了Opus 4.5 了不起的成就。
开源/仓库模型发布评测/基准
13:35
阿绎 AYi@AYi_AInotes
59
Damn,这可能是2026年最被低估的开发者生产力工具💻🤖!

开源项目jcode通过替换Claude的默认调用框架,实现内存占用减少20倍、启动速度加快245倍的惊人提升,并支持AI代理自我迭代的“Self-Dev”模式。同时,蚂蚁发布的Ling-2.6-1T模型以“token效率”为核心,能将成本降至可比模型的四分之一,综合智能接近GPT-5.4非推理水平。这两者共同揭示AI行业竞争重点正从参数规模转向真实生产环境下的成本与效率。

阿绎 AYi: 说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...

智能体AnthropicGitHub开源/仓库
10:35
阿绎 AYi@AYi_AInotes
47
Warp开源引爆AI原生协作新范式

Warp宣布开源后,其GitHub仓库在一天内获得超过3万星标,热度极高。此举被视为开创了“AI原生的开源协作范式”,其核心在于引入AI代理(如Oz代理)自动执行编码、测试、代码审查和技术文档生成等任务。这预示着未来开发者的角色将转向提出创意、把控质量和决策方向。此举与Cal.com因AI风险而闭源的做法形成鲜明对比,Warp通过AI技术将开源协作的优势极大化。用户现可在线实时观察数百个AI代理协同处理代码、修复漏洞的进程,这可能是未来十年软件开发模式的一次重要预演。

Warp: Warp is now open-source.

智能体开源/仓库开源生态
07:38
Berryxia.AI@berryxia
59
我靠!兄弟们?Warp 都要开源了! 官方宣布Warp 正式全面开源啦!🔥 知名现代终端 + Agentic 开发环境 Warp 现在完全开源! • 代码、Roadmap、贡献流程全部开放 • GitHub:https://github.com/warpdotdev/warp • Oz AI agents(GPT 驱动)负责 coding、planning、testing • OpenAI Devs 担任 founding sponsor 开发者福音! 欢迎社区一起共建下一代终端工具 🚀 【引用 @warpdotdev】:Warp is now open-source.

Warp: Warp is now open-source.

智能体OpenAI开源/仓库
‹ 上一页
1…91011121314
下一页 ›