AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 211 条
全部一手资讯X论文
标签「GitHub」清除
ginobefun@hongming731 · 6月7日22

这次除了整理播客和 YouTube 频道,也顺手把 BestBlogs 对外的交流和发布入口整理了一下。 如果你对 RSS、AI 阅读、Agent 工作流、高质量信息源和个人内容管理感兴趣,可以通过这些地方继续关注 BestBlogs: 微信交流群:适合日常交流、反馈问题、推荐订阅源,扫码加入,如图片过期添加小助手 ginobot 拉入交流群。 微信公众号:同步产品更新、订阅源整理和阅读方法。 https://mp.weixin.qq.com/s/PjLi-o2-kxIWqIGT7_0o4A?scene=1 飞书群:适合更深入的产品、技术和运营讨论。 https://applink.feishu.cn/client/chat/chatter/add_by_link?link_token=e71u9acd-3f93-4d7d-95b2-94111c51a668 小宇宙中文版:发布中文早报、内容精选和产品动态。 https://www.xiaoyuzhoufm.com/podcast/69acf4bcfe570e1a10f20f73 小宇宙英文版:面向英文用户,同步英文内容精选和 BestBlogs 动态。 https://www.xiaoyuzhoufm.com/podcast/6a1f845cf18021cbae82c1f2 Apple Podcasts:适合习惯用苹果播客收听的用户。 https://podcasts.apple.com/us/podcast/bestblogs/id1896876403 公开仓库:开放 OPML、订阅源、OpenAPI、CLI 和 Agent 相关能力。 https://github.com/ginobefun/BestBlogs 作者博客:记录产品迭代、技术架构、增长运营和独立开发思考。 https://www.ginonotes.com/ Gino 推特:分享 BestBlogs、AI 阅读、RSS、Agent 和独立开发。 https://x.com/hongming731 小光推特:分享产品、内容、社区、创业和高质量阅读体验。 https://x.com/puliandc 欢迎加入,也欢迎推荐更多真正值得长期关注的内容来源。

译BestBlogs 整理了对外交流和发布入口,包括微信交流群、微信公众号、飞书群、小宇宙(中英文版)、Apple Podcasts、公开仓库(GitHub)、作者博客以及 Gino 和小光的推特。适合对 RSS、AI 阅读、Agent 工作流、高质量信息源和个人内容管理感兴趣的用户关注,可获取产品动态、订阅源、技术架构和独立开发思考等内容。

宝玉@dotey · 6月6日48

当时发这个 PR 的时候,只是实现了最基本的多语言,所以语言覆盖不够,还有很多是英文;另外设计上是参考颜色模式的选择,会有个隐含的问题:如果语言数量一多,就无法在一屏显示下了 所以昨天花了不少时间做了多语言的覆盖,基本上能找到的硬编码文字都换成了多语言;另外把语言选择换成了可以检索的 Dropdown List。 现在 PR 已经被合并了,下个版本 Hermes Desktop 可以支持更多语言了,为了测试语言的支持,加上了完整的繁体中文和日文的支持。 翻译主要借助于 Web 版的翻译和 AI 辅助的翻译,所以难免有错误,建议如果有错误可以自行提交 PR。

译开发者 @dotey 提交的 PR 已被合并,Hermes Desktop(Hermes Agent Desktop)将在下个版本支持多语言。该 PR 将硬编码文字替换为多语言支持,并把语言选择改为可检索的 Dropdown List,解决语言数量多时无法一屏显示的问题。为测试语言支持,加上了完整繁体中文和日文。翻译借助 Web 版和 AI 辅助,可能存在错误,鼓励用户自行提交 PR 修正。

Rohan Paul@rohanpaul_ai · 6月6日80

GitHub released Spec Kit, an open-source toolkit to fix vibe coding’s biggest weakness: the AI often starts coding before the product rules are clear. 109K+ stars ⭐️ It turns vibe coding from “ask the AI to build it” into “write the product spec first, then make the AI build from that spec.” Most AI coding today starts with a loose prompt, then jumps straight into code, which often produces working demos but weak requirements, missing edge cases, and messy rework. Spec Kit pushes the process the other way: first define what the product must do, then clarify gaps, then create a technical plan, then break that plan into tasks, then let the agent implement against those written artifacts. So here the spec is no longer disposable documentation; it becomes an executable development contract that guides Copilot, Claude Code, Codex, Gemini, Cursor, Qwen, and 30+ other agent integrations.

译GitHub 发布开源工具包 Spec Kit,旨在解决 "vibe coding" 的最大弱点——AI 常在规则未明确时就开始编码。它把流程从 "让 AI 直接构建" 改为 "先写产品规范,再让 AI 根据规范实现"。当前 AI 编码模式常因松散提示直接跳入代码,导致需求薄弱、边界遗漏和反复返工。Spec Kit 推动反向流程:先定义产品功能,再澄清差距、制订技术计划、分解任务,最后让 agent 执行。规范成为可执行的开发合约,支持 Copilot、Claude Code、Codex、Gemini、Cursor、Qwen 等 30+ agent 集成。项目已获 109K+ 星标。

AYi@AYi_AInotes · 6月6日53

分享一个 GitHub 5 万星的开源AI剪辑神器, 本地处理、永久免费、不要水印、没有会员墙。 它叫 OpenCut,想干掉剪映最让人不爽的那件事—— 你做的视频,再也不用先传到别人的服务器上了。 现在就能用,但作为一个免费开源产品,想完全媲美年费700多块的剪映肯定不太可能, 先说说OpenCut 现在的状态,属于 Early Beta: 打开网页就能剪,导入视频、拉时间线、切一刀、修个头尾, 完全免费、没水印、不要会员。 但导出、特效、转场这些功能还在路上, 只追求今天就能高效出片?现阶段剪映还是更强,这话我得说在前面。 那么他的优势是什么? 剪映是云端处理,你的素材要先上传, OpenCut 是本地优先,视频压根不离开你的机器。 一个把你的内容当数据,一个把你的内容当你的, 这一条差别,剪辑的时候你感觉不到, 等哪天平台改规则、加水印、涨会员价的时候,你就全懂了。 OpenCut没把自己当成又一个剪映, 它的路线图里写着: Rust 重写核心、Web + 桌面 + 移动统一、 插件系统、Editor API,还有 MCP Server—— MCP Server 是让 AI Agent 直接调工具的协议, 也就是说,以后你的 AI 能直接调 OpenCut 来替你剪,它想做的也不是一个剪辑软件, 而是一个能被你自己的工作流调用的、可编程的视频底座。 所以把视频编辑四个字去掉,这其实是所有工具正在发生的同一件事—— 过去的工具是一个封闭的盒子,你只能按它给你的按钮, 未来的工具是一个开放的接口,你能把它焊进自己的系统,让 AI 替你按。 剪映卖的是一次出片的效率, OpenCut 赌的是你愿不愿意为"这东西永远是我的、还能被我编程"多等几年。

译OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具,主打本地优先,视频无需上传服务器,永久免费、无水印、无会员墙。目前处于 Early Beta 阶段,网页版支持基础剪辑(导入视频、时间线、切割),但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server(让 AI Agent 直接调用工具),目标是成为可编程的视频底座,而非对标剪映的封闭工具。

宝玉@dotey · 6月6日67

《图解Skill》需要复制粘贴的内容基本都在 GitHub Repo,包括一些我之前没开源的自己用的 Skills,比如从播客文字稿生成访谈稿的 Skill,理论上来说你不买书也可以的。 Repo地址: https://github.com/JimLiu/Illustrated-Agent-Skills 电子书版本已经发布了,购买链接:https://www.ituring.com.cn/book/3616

译宝玉的新书《图解Skill》已出版,配套 GitHub Repo 开源了书中涉及的所有可复制粘贴的 Skills,包括之前未公开的播客文字稿转访谈稿 Skill。读者理论上可以不买书直接使用 Repo 内容。电子书版本同步上线,方便读者复制粘贴。

宝玉@dotey · 6月6日38

为什么 GitHub Copilot @GitHubCopilot 不能以周为单位刷新额度限制呢? 自从 6/1 日实施新的计费价格后,额度消耗的极快,最麻烦的是得等到月底才能刷新额度,这个周期太长了。

译用户反映GitHub Copilot自6月1日实施新计费价格后,额度消耗极快,但额度刷新需等到月底(周期长达一个月),呼吁改为按周刷新。

Tencent Hy@TencentHunyuan · 6月5日74

Planning is where LLMs move from “saying” to “doing.” Tencent Hy, in collaboration with the Gaoling School of Artificial Intelligence at Renmin University of China, is excited to open-source PlanningBench - a scalable, verifiable framework for evaluating and training LLM planning capabilities. With PlanningBench, you get: ✅ 30+ real-world planning tasks ✅ Automated verification ✅ Evaluation and training support See how top-tier LLMs perform on PlanningBench 👇 Resources: arXiv: https://arxiv.org/abs/2605.20873 GitHub: https://github.com/Tencent-Hunyuan/PlanningBench HuggingFace: https://huggingface.co/datasets/tencent/PlanningBench #PlanningBench #TencentHunyuan #OpenSource 📷

译腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院合作,开源PlanningBench——一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务,支持自动验证和训练。PlanningBench旨在推动LLM从“说”到“做”的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。

SemiAnalysis@SemiAnalysis_ · 6月5日59

BREAKING NEWS: NVIDIA HAS JUST OPEN SOURCED THEIR RUBIN NVSWITCH TRAY BoM & DIAGRAM & IT INCLUDES AMD EYPC 3151 EMBEDDED CPU. Since there is 9 NVSwitch Trays Per VR200 Rack, that is 9 small AMD embedded CPUs per NVIDIA rack. NVIDIA has open sourced this in their "NVIDIA/nvbmc-docs" public github repo which has an CC 4.0 open source license!

译重磅消息:NVIDIA 刚刚开源了其 Rubin NVSwitch Tray 的物料清单和示意图,其中包含 AMD EYPC 3151 嵌入式 CPU。由于每个 VR200 机架有 9 个 NVSwitch Tray,因此每个 NVIDIA 机架中就有 9 个小型 AMD 嵌入式 CPU。 NVIDIA 已在其公共 GitHub 仓库 "NVIDIA/nvbmc-docs" 中开源了这一内容,该仓库采用 CC 4.0 开源许可证!

Berryxia.AI@berryxia · 6月4日71

卧槽!老黄牛逼啊! 这下直接收藏当可以直接拿html轻松制作视频了,今天正好也在拿hyperframe和remotion捣鼓视频。 这下可以直接拿来用了,直接送枕头了啊! 地址👇 https://github.com/nexu-io/open-design

译open-design(项目名html-video)正式开源,被形容为“html版剪映”。Agent可通过编写HTML生成世界级产品宣传、知识解说视频,成本极低。项目历时3天、3万行代码,支持20多套视频风格模板,分页编辑,可导出mp4,支持Claude Code等主流Agent接入。

OpenClaw🦞@openclaw · 6月4日64

OpenClaw 2026.6.1 is live 🦞 🪟 native Windows node host 🛠️ Skill Workshop for self-learning agents 📋 Workboard orchestration 🧠 MiniMax M3 support Windows joins the cluster. No penguin costume required. https://github.com/openclaw/openclaw/releases/tag/v2026.6.1

译OpenClaw 2026.6.1 已上线 🦞 🪟 原生 Windows 节点主机 🛠️ 用于自主学习型智能体的技能工坊(Skill Workshop) 📋 工作板(Workboard)编排 🧠 支持 MiniMax M3 Windows 加入集群。无需企鹅服。 https://github.com/openclaw/openclaw/releases/tag/v2026.6.1

SenseTime@SenseTime_AI · 6月3日73

A plain sneaker image went in. Marketing visuals came out. #SenseNova U1 — see, think, create — all in one model. #OpenSourced. This is the architecture shift people keep talking about. Shoutout @AiLockup for the demo 🔥 🎥Watch the video: https://youtu.be/9IFgPqMWBGg Try it today: 🎛️ SenseNova Studio: https://unify.light-ai.top/ (Try infographics; also join Discord for text-image interleaved gen) 🤗 https://huggingface.co/collections/sensenova/sensenova-u1 🛠️ https://github.com/OpenSenseNova/SenseNova-U1 👾 Discord: https://discord.com/invite/BuTXPHmQub @huggingface @github

译商汤(SenseTime)开源SenseNova U1模型,宣称实现“看、思考、创作”一体——从一张普通运动鞋图片直接生成营销视觉效果。该模型代表了架构上的范式转变。用户可通过SenseNova Studio、HuggingFace和GitHub尝试使用。

meng shao@shao__meng · 6月3日66

作为研发团队负责人,我经常要帮团队找合适的企业级工具。 哪些产品提供免费版?免费版能否满足基本需求?后续升级需要多少预算? 过去需要逐个打开官网确认。现在我把需求交给 BigSet,它直接整理出了一份 B2B SaaS 产品清单,包括产品分类、免费方案说明和定价页面链接。 这类信息还可以定期更新。 过去要花时间搜索和维护的资料,现在可以先从一句话开始。 喜欢这个项目的话,可以在 GitHub 上给它一个 star 支持一下: https://github.com/tinyfish-io/bigset API Key: https://bit.ly/4dJnFB3

译开源项目 BigSet 允许用户用自然语言描述数据需求,从实时网络中构建并定期刷新结构化数据集。研发团队负责人邵猛在实际工作中使用它,自动生成了一份 B2B SaaS 产品清单,内容涵盖产品分类、免费方案说明及官方定价页面链接,省去了逐一查找官网的繁琐工作。该项目已在 GitHub 上开源。

ginobefun@hongming731 · 6月3日70

http://x.com/i/article/2061947122350751744 # BestBlogs 早报 · 06-03|动态工作流、Copilot 桌面、AI 工程范式 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-06-03 > EP76 · 2026-06-03 — AI 工程的范式正在被重写:Claude Code 突破单一上下文窗口、为每个任务动态生成编排脚本,GitHub Copilot 以智能体为核心推出桌面控制中心,提交量已突破 14 亿次/月。与此同时,腾讯云工程师从控制论视角论证,大模型是史上首个「认知引擎」,软件工程师的核心职责正在从「写代码」升级为「设计能自我纠偏的 AI 系统」。本期还涵盖任务保真度缩放定律、MiniMax M3 开源模型、NVIDIA Cosmos 3 及机器人供应链深度拆解,一并呈现这场变革的全貌。 ## 导语 今天是 2026 年 6 月 3 日,AI 工具链的底层逻辑正在发生一次结构性升级。 Anthropic 正式推出 Claude Code 动态工作流:Claude 不再只能在单一上下文窗口里规划并执行,而是能即时为每个任务生成一套专属的 JavaScript 编排脚本,自主决定要启动多少个子智能体、使用哪种模型、是否在独立的 worktree 里隔离运行。触发词只需一个:ultracode。 与此同时,GitHub 在 Microsoft Build 上发布了 Copilot 桌面应用——一个为并行 Agent 开发打造的统一控制中心。My Work 视图让你同时监管多条进行中的 Issue 和 PR,Canvas 面板实时显示 Agent 的工作进度,Agent Merge 全程处理 CI 和代码审查。在所有这些工具铺开的背景下,GitHub 的每月提交量已经突破 14 亿次,同比翻倍。 本期精讲之外还有 7 篇速览,覆盖任务保真度缩放定律、AI 原生工程组织打造、MiniMax M3 开源模型、NVIDIA Cosmos 3、机器人供应链深度拆解、Agent 存算分离架构,以及贴吧 AI CR 落地 10 周后 bug 密度下降 66.87% 的完整实践。 本期精讲三篇: - 精讲一:Anthropic 详解 Claude Code 动态工作流的工作原理与最佳实践 - 精讲二:GitHub 在 Microsoft Build 上推出以智能体为核心的 Copilot 桌面应用 - 精讲三:腾讯云工程师以控制论框架重新审视软件工程五十年与 AI 范式革命 ## 精讲一:为每项任务量身打造:Claude Code 中的动态工作流 | Claude Claude Code 面向的任务场景越来越复杂,但默认 harness 有一个固有限制:规划和执行必须在同一个上下文窗口里完成。随着任务变长、结构变复杂,这个窗口会越来越拥挤,开始出现「智能体懒惰」——Claude 开始抄近路;「目标漂移」——Claude 偏离了最初的任务目标。上周,Anthropic 发布了动态工作流(Dynamic Workflows),为这个问题提供了根本性的解法。 动态工作流的工作原理 动态工作流的核心是让 Claude 自己写一个 JavaScript 编排脚本,然后执行这个脚本来完成任务。这个脚本可以使用几个特殊函数来生成和协调子智能体(subagents),同时也可以调用标准的 JavaScript 工具:JSON、Math、Array 等。 与静态工作流的关键区别在于两点。首先,动态工作流可以自主决定给每个子智能体使用哪个模型——这意味着 Claude 会把复杂的推理任务分配给更强的模型,把简单的信息采集交给更快的模型,在成本与质量之间动态权衡。其次,子智能体可以在独立的 worktree 里运行,实现真正的环境隔离,避免多个子任务互相污染工作状态。 如果工作流被用户中断(比如关掉了终端),恢复会话后工作流可以从中断点继续,不需要从头再来。 它解决了哪些具体的失败模式 Anthropic 在文章里明确列出了动态工作流针对的几类失败场景: - 长任务的上下文污染:单一窗口处理长任务时,早期的规划信息和后期的执行信息混在一起,Claude 开始迷失方向。 - 大规模并行任务:比如同时处理 80 份简历评级、同时从多个 Slack 频道抓取数据——这类任务天然适合多路并发,但默认 harness 无法原生支持。 - 高度结构化任务:比如让多个 Agent 分别扮演投资人、用户、竞争对手,从不同角度撕碎一份商业计划书。 - 对抗性任务:让两个子智能体互相挑战,形成一种反馈机制来提升结果质量。 文章给出的几个示例 prompt 很有启发性:「这个测试大约每 50 次运行就会失败一次,用工作流来复现它,提出竞争性假设,不到找到能存活于证据的那个假设不要停」;「拿我最近 50 个会话挖出我反复在纠正的错误,把那些反复出现的写进 CLAUDE.md 规则」。这两个例子都展示了动态工作流的典型场景:需要反复迭代、需要并行比较、或者需要结构化协作的复杂多步任务。 常见的工作流模式 Anthropic 总结了 Claude 在构建工作流时会组合使用的几种基本模式: - 分类执行(Classify-and-act):先用一个 Agent 对输入进行分类,再把不同类别的任务分配给专门的下游 Agent。 - 排序(Sorting):把大批量列表(比如 1000 条支持工单)按定性标准排序——单次 prompt 质量会随列表变大而退化,工作流可以分批处理再汇总。 - 竞争性验证(Adversarial check):让一个 Agent 生成,另一个 Agent 专门找漏洞,循环直到结论站得住脚。 使用建议 动态工作流会消耗更多 token,不适合日常简单任务。最适合的场景是:任务足够复杂(单一上下文处理时质量会退化)、任务足够高价值(额外的 token 成本值得付出)、任务有结构化并行需求(多个角度、多个数据源、多个竞争性假设)。触发方式是在 prompt 里使用关键词 ultracode,或者明确要求「用工作流来完成这件事」。Anthropic 提醒,最佳实践仍在演进,建议首次使用时从相对简单的并行任务开始积累直觉,再逐步应用到更复杂的高价值场景。动态工作流与默认 harness 完全兼容,不需要时可以无缝回退,无需额外配置。 对于正在用 Claude Code 处理复杂多步骤任务的工程师,这篇官方介绍值得仔细阅读:查看原文 ## 精讲二:GitHub Copilot 应用:以智能体为核心的桌面体验 当 Agent 变成开发工作流的常态,管理多个并行 Agent 本身就成了一个新问题。你早上打开电脑,三件工作已经在推进中:一个 Agent 在排查生产 bug,一个 Agent 在实现积压需求,第三个 Agent 在处理代码审查反馈。你需要一个地方能同时看到这三个进度,能介入、能重定向、能测试、能合并。原有的开发工具并不是为这种工作方式设计的。 在 Microsoft Build 2026 上,GitHub 发布了 Copilot 桌面应用,正是要填补这个空缺。 My Work:统一管理所有进行中的工作 Copilot 桌面应用的核心入口是 My Work 视图。这个视图汇聚了所有关联仓库里当前进行中的工作:活跃的 Agent 会话、Issue、PR、后台自动化任务。开发者不再需要在多个标签页之间切换来追踪不同 Agent 的状态,一个视图看全局。 worktree 隔离:Agent 会话互不干扰 每一个 Agent 会话都在独立的 git worktree 环境里运行。这与 Claude Code 动态工作流的设计理念高度一致:隔离是并行 Agent 开发的基础——不同 Agent 的工作状态不会互相污染,合并时也有清晰的边界。 Canvas:双向协作面板 Canvas 是一个可视化的双向协作区域。Agent 工作时,你可以在 Canvas 里实时看到它的工作进度,也可以在任何节点插入反馈、调整方向。这种「异步介入」的交互模式与传统的「等待 Agent 完成再审查」不同,更像是一个真实存在的协作伙伴,只是它在你后台异步跑,你随时可以看进度并给意见。 Agent Merge:全程自动化 CI 和代码审查 Agent Merge 功能负责管理从 Agent 提交代码到合并的整个流程,包括触发 CI 检查、处理代码审查反馈、最终完成合并。开发者的精力可以更多集中在方向判断和质量审核,而不是流程管理。 Copilot 代码审查的定制化扩展 与此同时,GitHub 还扩展了 Copilot 代码审查的能力:开发者现在可以通过自定义 Agent skills、MCP 服务器连接和可配置的 Actions 工作流,让每次代码审查都反映自己团队的标准、内部系统和工程上下文。代码审查还新增了「中等层级审查」(medium tier review)选项,在快速审查和深度审查之间提供了更细粒度的控制。 规模背景:14 亿次提交/月 GitHub 在发布中披露了一组数据:当前平台的每月提交量已经突破 14 亿次,同比近乎翻倍;GitHub Actions 每周运行时间超过 20 亿分钟。这个增速直接说明了为什么 GitHub 要在这个时间点推出 Agent 原生的控制中心——现有工具的设计假设已经跟不上实际工作流的演进节奏。 对于正在将多个 Copilot Agent 整合进开发工作流的团队,这篇发布文章是了解 GitHub Agent 原生方向的第一手资料。Copilot 桌面应用目前已向现有 Copilot Pro、Pro+、Business 和 Enterprise 用户开放技术预览,感兴趣的团队可以直接申请加入:查看原文 ## 精讲三:AI 软件工程范式革命的思考 这篇来自腾讯云开发者的长文,是近期读到的关于 AI 与软件工程关系最系统、最有历史纵深的一篇思考。作者不是在讨论某个工具或某个技巧,而是从工程史的视角,对软件工程过去五十年的本质做出了一次重新定性。 软件工程是过去五十年最不彻底的工程 作者从控制论的视角,梳理了经典工程门类的成功路径:机械、化工、电力、自动化,这些领域都靠同一个范式完成了工程化——「消耗能源,把人脑参与的低阶认知回路固化成物理装置」。蒸汽机的离心调速器、化工厂的恒温器、电网的调度装置,本质上都是同一件事:让原本需要人来盯着、调整、判断的事情,由一台烧煤或通电的设备自己完成。不确定性被大规模消除,同样的输入产出稳定可预期的结果。 软件工程卡在了这条路上。软件开发要处理的是抽象、分解、推理、创造——这些是高阶认知,没法像调速器那样固化成物理回路。五十年来,敏捷、Scrum、DevOps 解决的都是同一个问题,用的是同一种方式:优化堆人力的方式,但没有改变「必须靠人力堆」这个事实。 这就是作者对「软件工程是最不彻底的工程」的定义:它在工程的形而上学层面是个残缺品——所有兄弟门类都完成了「能源替代低阶智能」这个动作,唯独软件没有。 大模型是史上第一个「认知引擎」 大语言模型做到了经典工程从来没做到的事:输入算力,输出能理解需求、生成代码、做逻辑推理的高阶认知产物。 放到工程史的坐标里: - 经典工程:能源 → 低阶智能(机械调节、自动控制) - 大模型:能源 → 高阶智能(理解、推理、生成、决策) 作者的判断是:大模型和蒸汽机的工程史地位是平行的。蒸汽机让「做功」第一次能源化,大模型让「认知」第一次能源化。软件工程「真正降临」的时刻,不是 Scrum 流行的时候,不是 DevOps 普及的时候,而是大模型让「能源换高阶智能」成为可能的这个时刻。在此之前所有的「软件工程」,严格说都是软件作坊的优化版。 但这只是入场券,不是终局 大模型带来了新的不确定性:幻觉(输出看起来合理,悄悄就错了)、漂移(同样的输入,今天和明天给出不一样的结果)、不可解释(没法看进它的决策过程)。 这意味着大模型并没有消除不确定性,只是把「人的不确定性」换成了「模型的不确定性」。真正需要的是一整套新的工程原则——不再是「亲手消除每个微小的偏差」,而是「设计一个能自我纠偏的系统,并处理系统自己纠不回来的剩余偏差」。 作者引入了冯·福斯特 1970 年代提出的二阶控制论:一阶控制论是「观察并控制被控对象」,二阶控制论是「观察并控制『观察并控制』这件事本身」。投射到 AI 软件工程: - 经典软件工程:人在写代码 - AI 软件工程:人在设计「AI 写代码的系统」 这是身份的转变,不只是工具的转变。 自动化越彻底,工业相关人口反而越多 作者用一组跨越 150 年的数据指出:自动化越彻底,工业相关人口反而越多。1850 年代蒸汽机普及后,制造业整体爆炸式增长;1950 年代自动化后,工程师、设计师、工艺员数量暴增。每一次系统能力扩张,都会暴露出新的边界,而边界就是新的「偏差地带」,需要新一波人守在那里。 结论:人不是被淘汰,而是迁移。边界在扩大,需要守的人反而更多了。但能在这种边界上工作的人会越来越少,因为形式化吃掉的都是低阶认知,剩下的都是越来越高阶的部分。 与今日其他精讲的关系 这篇文章与精讲一、精讲二形成了很好的理论基础互补。Claude Code 动态工作流和 GitHub Copilot 桌面应用,都是「设计能自我纠偏的 AI 系统」这个新工程原则在工具层的具体体现——worktree 隔离、子智能体协作、Canvas 双向介入,都在解决「如何设计系统来处理 AI 自身的不确定性」这个核心问题。 对工程师意味着什么 作者给出了一个相对乐观但也相当严峻的判断:AI 时代,人的统一职能是「处理系统暂时还无法处理的偏差」。这条铁律在所有工程门类里都成立——机械故障靠人拉回、电网负载偏差靠人仲裁,现在是认知偏差靠人纠正。 不同的是,AI 工程里,偏差类型不再可枚举,偏差信号不再可观测,拉回手段也没有 SOP 可循。这意味着守边界的人,需要更强的判断力,而不只是更多的知识。 作者在文章末尾讨论了组织形态和落地路线,以及他认为这场变革「最难的那道坎」在哪里,这部分值得有 AI 落地任务的工程师和技术管理者仔细阅读:查看原文 ## 速览 1. 任务保真度缩放定律:为什么数据质量决定 Agent 性能(AI Engineer) Snorkel 的实验证明:在相同算力和任务数量下,仅改变训练数据质量,高保真任务带来 6% 的性能提升,低质量任务只有 1%,差距高达 5 倍。高质量任务须满足四项标准:容器化(隔离干净的回滚和并行化)、可达性(目标非平凡但可实现)、功能正确性(逻辑可预期)、环境稳定性(执行基础设施稳定)。满足这四项才能产生干净的失败信号,让模型在 RL 训练中有效爬坡。低质量任务的常见缺陷是「退化失败态」:环境本身就不稳定,模型无法从失败中提取有意义的学习信号,额外的计算预算全部浪费在噪声上。对正在做 Agent 微调数据集的工程师,这组数据有直接的策略指导价值。查看原文 2. 打造 AI 原生工程组织 | Claude(Claude Blog) Claude Code 团队分享了他们如何重新设计工程流程以适应 AI 原生工作方式。代码生成、测试编写和重构已经不再是瓶颈,真正的瓶颈变成了验证、代码审查和安全评估。他们重写了规划方式(从长期路线图改为即时制订)、代码审查流程、上下文收集方式,以及团队的构成逻辑。这不是工具使用指南,而是一个已经完全转型的工程组织对「如何重新设计流程」的第一手记录,适合正在思考 AI 原生团队转型的工程 Leader 阅读。查看原文 3. MiniMax M3:首个融合三大前沿能力的开源权重模型(MiniMax 官方) MiniMax 正式发布 M3,声称是首个同时融合三大前沿能力的开源权重模型:编码与智能体性能(SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%)、由 MiniMax 稀疏注意力(MSA)实现的 100 万 token 上下文窗口、从零构建的原生多模态能力。同期推出 MiniMax Code 产品和新的 token 计划。权重和技术报告将在约 10 天内发布。值得注意的是,M3 是国内团队在开源大模型赛道上迄今为止对标 GPT 4o 级编码能力的最完整尝试之一,对关注开源模型生态的开发者值得持续跟进。查看原文 4. NVIDIA 推出 Cosmos 3:用于物理 AI 的完全开放全能模型(NVIDIA AI) NVIDIA 发布 Cosmos 3,定位为世界上首个完全开放的、用于物理 AI 的「全能模型」(omnimodel),原生支持视觉推理、世界生成和动作生成三种能力。本次发布了两个版本:Super(32B)和 Nano(8B),面向机器人和自主系统领域。结合精讲三和速览第五条的机器人供应链分析,物理 AI 的基础模型层正在加速成熟。查看原文 5. 拆解机器人「肉身」、量产与供应链:空翻之后,它还要学会接住一片落叶(硅谷 101) 硅谷 101 深度拆解人形机器人的硬件架构:骨架材料(从钢材到铝合金、镁合金、钛合金的演进与轻量化权衡)、关节执行器(从液压到电机转变的背后技术进步)、传感器体系、电气与计算系统,以及整条供应链的成本结构与量产门槛。文章还引用了智元、宇树等头部企业一线负责人的具体判断。宇树科技科创板 IPO 刚刚通过上交所审议,这篇系统性拆解正当其时,适合想深入了解机器人硬件护城河的读者。查看原文 6. 深度解析 Agent 存算分离架构设计(idoubi) 作者以 FastClaw 为例,系统拆解云端 Agent 的存算分离架构:三种运行模式(本地裸机、本地带沙盒、云端多副本)的优缺点对比,存储层的四种方案(热状态用 Redis、对话记录用 Postgres、长期记忆用 pgvector/Milvus、工作产物用 S3/OSS),以及基于存算分离架构的完整运行流程,同时指出了分布式数据一致性的挑战。对比今日精讲一中 Claude Code 动态工作流的 worktree 隔离机制,两篇在「计算与状态分离」这个方向上有一定共鸣,对正在设计云端 Agent 基础设施的工程师有直接参考价值。查看原文 7. 用数据说话:贴吧 AI CR(小码哥)落地 10 周,bug 密度下降 66.87%(百度 Geek 说) 贴吧 Server 团队的 AI Code Review 落地实践:通过规则定制、自动化评测和三层反馈闭环(高/中/低优先级评论处理流程),将 AI CR 评审占比从 33% 提升至 84%,bug 密度从 0.332 降至 0.11,降幅 66.87%。文章完整记录了 10 周的推进节奏、踩坑经验和方法论,代码库多、提交频率高、人工评审质量参差的团队可直接参考迁移。这份实践与精讲三的理论框架形成印证——AI CR 本身就是一个能自我纠偏的代码质量系统。查看原文 ## 今日阅读路径 时间有限,建议先读这三篇: 1. 为每项任务量身打造:Claude Code 中的动态工作流(精讲一)— 如果你在用 Claude Code,这是今天最直接有用的一篇,10 分钟读完,了解动态工作流的工作原理和触发方式,以及哪类任务最值得启用。 1. AI 软件工程范式革命的思考(精讲三)— 今天内容最有长期价值的一篇。控制论框架下的软件工程史重构,以及「设计能自我纠偏的 AI 系统」这个新工程师身份定位,是理解当前所有 AI 工具演进方向的底层框架。 1. GitHub Copilot 应用:以智能体为核心的桌面体验(精讲二)— 并行 Agent 开发控制中心的完整介绍,了解 GitHub 在 Agent 原生方向的系统性布局,以及 worktree 隔离、Canvas 协作、Agent Merge 这几个核心机制的实际用法。 还有时间? 推荐任务保真度缩放定律(做 Agent 微调数据集的工程师必读,5 倍质量差距有直接策略价值)和机器人供应链深度拆解(宇树 IPO 时机下的硬件架构系统梳理,适合关注具身智能落地的读者)。

译Anthropic 为 Claude Code 推出动态工作流,允许模型为每个任务自主生成 JavaScript 编排脚本,动态选择模型并启动多个子智能体在独立环境中并行执行,以解决单一上下文窗口处理复杂任务的限制。同时,GitHub 在 Microsoft Build 上发布了以智能体为核心的 Copilot 桌面应用,提供统一视图、协作面板和自动化流程,旨在管理并行 Agent 开发。文章披露,GitHub 平台每月提交量已突破 14 亿次。

ginobefun@hongming731 · 6月3日49

#BestBlogs 早报 06-03 BestBlogs 今日早报推荐阅读: Anthropic 博客详解 Claude Code 动态工作流,Claude 能为每个任务即时生成专属编排脚本,告别「智能体懒惰」和「目标漂移」; GitHub 在 Build 同步亮相 Copilot 桌面应用,每个 Agent 独占 worktree、提交量已破 14 亿/月。 腾讯云工程师则从控制论视角点出:大模型是史上首个「认知引擎」,工程师的核心职责正在从「写代码」升级为「设计能自我纠偏的 AI 系统」。

译Anthropic 详解 Claude Code 的动态工作流,其能为每个任务即时生成专属编排脚本,旨在解决智能体懒惰与目标漂移问题。GitHub 发布 Copilot 桌面应用,为每个智能体提供独立的 worktree,其月代码提交量已突破 14 亿 tokens。此外,有观点指出大模型是史上首个“认知引擎”,工程师角色正从编写代码升级为设计能自我纠偏的 AI 系统。

Chubby♨️@kimmonismus · 6月3日54

GitHub copilot app revealed

译GitHub Copilot 应用曝光

AYi@AYi_AInotes · 6月3日57

Damn,这副眼镜里跑的是完整的 Linux! 不是概念图,也不是 PPT, 是 Buildroot Linux + Arm Cortex A7, SSH 进去就能跑你的 Claude Code、Codex、OpenClaw。 而且整个系统 8 月前会开源到 GitHub。 我觉得这副眼镜最狠的地方不是把电脑塞进眼镜里, 而是它竟然把 vibe coding 从桌面拽到了你脸上。 以前你写代码得坐在电脑前, 现在你的 coding agent 就坐在你肩膀上, 你眼睛看到什么, 它实时拿到视觉上下文, 骨传导麦克风里直接给你反馈。 不是 AR 眼镜那种花活, 是实打实的 Agent Terminal。 说白了, 这相当于把你的 Claude 从聊天框里拽出来, 变成跟着你走的搭档。 你走在路上突然想到一个 bug, 不用掏手机、不用找电脑, 眼镜里的 agent 已经在听着了。 这种「计算跟着人走」的范式, 可能才是第4类生产力计算机的真正形态。 laptop 是你去找电脑, Monako 是电脑跟着你。 当 agents 成为主要工作伙伴时, 计算形态会从「人追设备」变成「设备追人」。

译这副智能眼镜内置Arm Cortex A7处理器,运行完整的Buildroot Linux系统,可通过SSH直接运行Claude Code、Codex等编程工具。整个系统将于8月前开源至GitHub。其核心价值在于将编程智能体从桌面带到用户眼前,通过眼镜的视觉上下文和骨传导麦克风实现“计算跟人走”的实时协作,被视为一种新型的“Agent Terminal”。

宝玉@dotey · 6月2日67

baoyu-image-gen Skill 支持 Codex-cli 作为 Provider 画图 也就是说你可以在 Claude Code、hermes agent 之类的 Agent 里面用它调用 Codex 出图,而不需要用 Codex,当然前提是安装了 codex cli 并且有订阅。 感谢网友的 PRs: https://github.com/JimLiu/baoyu-skills/pull/158 https://github.com/JimLiu/baoyu-skills/pull/161 Skill 地址:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-image-gen

数字生命卡兹克@Khazix0918 · 6月2日84

http://x.com/i/article/2061667400723156992 # 为了不花那120刀,我把电脑清理软件做成了开源skill。 这两天干了一个我觉得还挺有意思的事,虽然很小,但是我也想写下来,因为感觉它可以非常非常直观的让大家感受到。 Ai时代,Agent对于传统应用的冲击。 故事是这样的。 前天我在推上刷到了一条帖子,X上有位老哥分享了一条prompt。 就这么一句话。 do a FULL read only analysis on my Macbook to help me optimize storage。 大概意思是他让Codex对他的MacBook做一次全面的只读存储分析。 然后他发现可以清出500G的空间,Codex还找到了一个116G大的codex-tui.log文件。。。 正好我当时这台MacBook Air赔了我快2年的时间,装了一堆乱七八糟的东西,我就想着,要不要我给我的电脑也试试查一下,看看有没有啥可以删掉的垃圾文件。 于是我当场就把原Prompt丢给我的Codex试了一下,然后加了一句用中文回答。 而Codex,给出了这样的结果。 先不说其他的,不扫我都不知道,我发现电脑上竟然有快100个G的B站视频???我都懵了。 而且还藏在一个相当深的Containers目录下面。 我去B站客户端里翻了一下,发现是我为了坐飞机上的时候有东西看,下载了一堆以为会看的动漫、纪录片还有乱七八糟的各种视频。 然后每次在飞机上都直接昏睡过去,几乎没有真的看过。。。 然后,他们就默默的留在了哪里,我甚至都忘了,我还有B站客户端这回事,更忘了,这里面还有我的缓存视频。。。 然后是Chrome、开发、Claude环境balbalabla。 Codex最后给了一个判断,按这个清单清,保守能腾出120G,激进一点能到140G以上。 我不知道大家,反正我自己是个强迫症,是个洁癖。 就是我就喜欢电脑干干净净的,垃圾能删就删。 而且在之前,Mac系统清理垃圾,是一件特别恶心的事情,我还记的我17年刚上班的时候,当时为了清理Mac的垃圾,找到了一个软件,叫ClaeanMyMac。 这玩意不是免费用的,正版一年近40刀,一次买断要120刀。 当时刚毕业你让我买这个,我真的是掏不起,然后就满大街的搜破解版,然后功能又不全。 可以说,到了今天,清理Mac的垃圾,都没有一个很好用的产品。 Windows生态也差不多,有多少装安全管家或者360,其实就是为了清垃圾的,可以举个手。。。 但是现在,好像,Agent就能直接干了啊。 本身你直接清理电脑垃圾也就是包装了一层UI,然后对我电脑底层进行扫描和操作,那我让Agent直接操作,岂不是更牛逼一点? 说干就干。 不过原版prompt其实有个问题,它只是一个比较专业一点的只读文档,然后给你列了一个占用清单,又给了一些不太清楚的清理建议。 对没太熟悉系统的朋友,看完整份报告,其实还是会不太敢动手。 哪些能放心清,哪些得自己看一眼再判断一下,哪些绝对千万别碰,这些判断它没有帮你直观清晰地列出来。 而且他也没法帮你删东西。 所以我想,要不然,圆一下我9年轻的梦,直接干脆自己搓一个skill,来解决清理电脑垃圾的需求? 说干就干,大概烧了一些Token之后,这个清理垃圾.skill,就顺利面试了,而且,Mac和Windows都能用。 同样,老规矩,也已经开源在我自己GitHub上的skills仓库了。 https://github.com/KKKKhazix/khazix-skills 我在我的MacBook Air上跑了一下,给大家看一下效果 比如说一句帮我看看存储,它就可以自动触发了。 它会先找你要权限,然后扫描你电脑上面的文件,然后直接在浏览器里打开一份可交互的HTML报告,帮助你可以化的了解,同时,你也可以直接在网页上点按钮清理。 就这么简单,但是究极实用,而且效果甚至比收费的专业清理软件效果还要好。。。 而且速度也不错,几分钟就跑完了。 最终的网页是这样的。 第一部分是磁盘总览。 总容量多少,用了多少,还剩多少,可以通过一条彩色进度条方便直观看到。 同时因为后续要给出清理命令,所以他会去扫描你电脑的系统环境。 接着是占用排行Top 5。 和上面prompt分析的结果一样,B站离线下载缓存96.7个G排第一,然后Google Chrome应用数据等等等等。 每一项都有颜色标签、类型、完整路径和一句话说明。 再往下是执行建议,帮你排好了清理的优先级。 性价比最高的是去B站客户端清看完的离线视频。 然后跑绿灯纯缓存命令,合计约27个G。 这里虽然给了清理执行建议,但是你可能还不知道要怎么去清理。 这就是随后的三色分级详情区用来做的事情,也是整个skill最核心的部分。 🟢 绿灯,可以放心让agent帮你清理。 这类东西寄都全是纯缓存、临时文件、安装包残留,垃圾大户,不影响任何功能。 每项都可以展开。 展开之后路径、清理前要不要关进程、清理命令全列好了,每条命令旁边有复制按钮,你想去复制自己运行的,你也可以自己去运行着玩。 但是我们也贴心的在下面也设计了两个操作按钮,移到废纸篓和直接删除。 无论你点哪一个键,它都会有一个弹窗跟你进行二次确认。 移到废纸篓是可逆的,删错了能捞回来。 直接删除立即释放空间但不可恢复。 你就自己选择就行。 比如我这里点移到废纸篓,然后点确定。 这几个安装包就会被移到我的废纸篓里面去了。 然后这一项在网页上,也会实时更新,被标记为已清理。 如果不想逐项清理的话,你也可以直接点击右上角,一键把这些绿灯文件移到废纸篓,或者是一键删除。 🟡 黄灯文件,是我们建议你自己看一眼再决定的。 这类东西需要人去把关,比如B站缓存的视频、下载文件夹里的安装包、某个项目文件夹。 agent会告诉你它是什么、为什么建议你看一眼、删了有什么影响,最终你自己拿主意。 黄灯项不会给你直接删除的按钮,只给在访达中打开让你自己去看,你确定了以后手动去删。 有安全子路径的会额外给一个移到废纸篓,但也只是移到废纸篓,可逆的。 比如这里没有用的B站视频,它会建议我去b站应用里面删视频。 当然,你也可以快捷打开访达(就是Mac的文件夹),直接跳到那个地方,然后手动山东。 也提供了一个移到废纸篓选项,这里的仅安全部分,它也会解释是经过核实过可安全清理的子目录。 因为这个文件夹下面除了视频,还保留了我的登录派和设置,所以是不能完全删除的。 点这个键,它会只删除视频,而保留我的B站登录态和设置,这也是我们的一些小小体验设计。 🔴 红灯里就是一些比较重要的文件。 比如系统文件、正在使用的应用核心数据、sleepimage这些,agent会解释为什么不能动,然后跳过清理。 如果你非要清理的话,那他也给你提供了一键在访达中访问的按钮,点一下就能找到这个应用了。 最后是长期优化建议,这里面的一些建议,我觉得还是值得一看的。 整个skill全程只读,扫描阶段禁止任何写操作。 只有你在报告页面上主动点了删除之类按钮,浏览器弹出确认框,你再点一次确认,才会真正执行清理操作。 我自己一直的原则是,对待AI,还是需要谨慎一点,稍微花点时间确认一下,虽然现在在代码层面,这种小东西幻觉率已经极低了,但还是防一手。 给大家看看我清完之后的内存。 直接清理掉了了快120个G。。。 就像我前面说过的,这个skill它是不挑电脑环境,也不挑你的Agent工具。 所以我也拿同事的Windows电脑的Codex试了一下。 给大家放一下效果。 欢迎大家试试,如果跑出来了什么有意思的发现,也欢迎来评论区分享,我很好奇大家的电脑里有没有像我一样藏了些奇奇怪怪的东西。 也再次提醒一下大家,删东西一定要慎重慎重再慎重。 当然我知道,肯定很多人也好奇,这种Agent+skill的方式来清垃圾,跟之前的专业清理软件比,效果到底怎么样。 所以呢,为了方便对比,在用这个skill清理内存前,一开始我就专门在我的MacBook Air上同样拿CleanMyMac扫了一遍。 跑了快半小时才出结果,扫出了15.8G的垃圾可清理。 点进垃圾清理是这样的。 左边把垃圾分成了几个大类,系统垃圾里面也给你分好了文件的种类。 但是这些信息并不足够让我做决定。 比如这个Google Chrome 3.8G的文件夹,他告诉我,这是用户缓存文件,属于系统垃圾,可以删。 但是我其实并不知道这个文件里面到底是什么内容。 这3.8个G里有多少是Service Worker离线缓存,扩展数据,或者IndexedDB,清完之后哪些网站要重新登录、哪些离线功能会失效。我全都不知道。 那作为一个普通用户,我只能单凭他说的用户缓存文件,相信他,让他删了。 而且他只能扫描到传统意义上的垃圾文件,扫不到我瞎下的b站视频,因为他不能像agent一样去读到每个文件的内容。 相比起来,Agent给的信息比CleanMyMac细多了,也透明多了,每一项都有具体路径、具体大小、具体说明,告诉你这个文件夹是干嘛的、删了会怎样、建议你怎么操作。 这个能力,现在一个skill就能做到了。 而且做得更透明、更灵活、可以根据你的具体情况定制。 在我的skill之上,进一步,你想让他找哪种想清理的文件都可以大白话跟他说,CleanMyMac做不到这种程度的个性化,因为它是一个写死了规则的软件,而Agent能理解你的各种奇奇怪怪的需求。 我不是说CleanMyMac不好。 但其实你可以发现,这类工具型软件,在Agent时代,确实正在遭受冲击。 我之前写过一篇文章叫AI正在吞噬所有软件,里面有一个判断,软件正在从资产变成耗材。 还有,软件的本质就是人和机器之间的翻译层,而Agent正在填平这道鸿沟。 两个月,这个清垃圾的小skill,其实就可以验证了。 我自己的电脑里,在很久很久以前,其实还装过很多工具类的软件。 解压缩的、PDF编辑的、图片格式转换的、文件重命名的、重复文件查找的…… 这些软件的共同点是它们都在执行一个相对明确的、规则可定义的任务。 而这恰恰是Agent最擅长的事。 所以那些曾经靠一个明确功能养活团队的软件公司,它们面对的竞争对手已经不是另一家软件公司了,而是用户手里的一条prompt,是Agent的一个skill。 这个skill今天能清垃圾,明天能做什么,那谁知道呢。 反正我挺期待的。 这个有趣的未来。

译作者受一条推文启发,使用Codex对自己的MacBook进行了只读存储分析,发现了B站缓存视频等大量可清理空间(激进方案超140G)。为替代收费软件CleanMyMac,作者制作并开源了一个跨平台(支持Mac/Windows)的AI清理skill。该skill会扫描文件并生成可交互的HTML报告,通过三色分级(绿灯可放心清理、黄灯需人工判断、红灯禁止动)直观展示,并提供安全执行按钮。实测清理后释放了近120G空间,相比CleanMyMac仅扫描出的15.8G,其信息更透明、建议更详细。

AYi@AYi_AInotes · 6月2日63

这条不限学生,做项目的都能薅,可能是门槛最低的一个🤩 Microsoft for Startups Founders Hub: 自助申请就有 $1000 起的 Azure 云额度(含 Azure OpenAI 服务), 有点进展能一路爬到 $25k,顶档最高 $150k。 最香的是—— 不需要 VC、不需要进孵化器, 你手上有个在做的项目,就能自己去申请。 还白送 GitHub Enterprise、Microsoft 365、LinkedIn Premium。 入口:搜 Microsoft for Startups Founders Hub ($150k 顶档要 Series A+,但 $1k–$25k 这档真的好拿)

译Microsoft for Startups Founders Hub 提供最高 $150k 的 Azure 云额度(含 Azure OpenAI 服务)。自助申请可获 $1000 起,随项目进展可升至 $25k,顶档 $150k 需 Series A+。其最大优势是门槛极低,无需风投或孵化器背景,在进行中的项目即可申请,并赠送 GitHub Enterprise、Microsoft 365 等权益。该福利近期更新后,与面向学生的、总价值 $3500+ 的 GitHub 学生大礼包形成对比,后者为学生提供 GitHub Copilot Pro、JetBrains 全家桶等 50 多种工具的免费/折扣权益,同样零门槛。

Berryxia.AI@berryxia · 6月1日62

我正好有个批量的需求,看来明天的方案可以按照这个方向来做了,多谢~

译FastClaw是一个面向云原生多租户场景的轻量级Agent运行框架。它通过存算分离的架构,让Agent无需常驻,而是根据请求动态挂载sandbox提供服务。实测显示,将托管服务从OpenClaw迁移到FastClaw后,服务器数量从18台降至3台,运营成本降至约1/6。此外,FastClaw代码体积约为OpenClaw的1/40,运行资源占用约为其1/7,支持单二进制分发和秒级启动。这个框架非常适合处理批量任务。

SenseTime@SenseTime_AI · 6月1日67

𝗚𝗲𝘁𝘁𝗶𝗻𝗴 𝗰𝗵𝗮𝗿𝘁𝘀 𝗮𝗻𝗱 𝗱𝗶𝗮𝗴𝗿𝗮𝗺𝘀 𝗿𝗶𝗴𝗵𝘁 𝘄𝗶𝘁𝗵 #𝗔𝗜 📊 Most AI models still struggle with these data visuals — negatives shown as positives, bar positions off, element relationships scrambled. 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮‐𝗨𝟭‐𝟴𝗕‐𝗠𝗼𝗧‐𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰 breaks through that barrier. Generate accurate visuals, then tweak the design and layout on the fly. See the difference and try it yourself: See the difference and try it yourself: 🤗 https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Infographic 🖼️ Showcases: https://github.com/OpenSenseNova/SenseNova-U1/blob/main/docs/u1_infographic_showcases.md 👾 Discord: https://discord.gg/BuTXPHmQub@github @huggingface @github

译大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。

AYi@AYi_AInotes · 6月1日39

还在读书的,这条价值 $1000+ 的福利千万别错过🤩 GitHub Student Developer Pack—— 学生一次申请,100+ 个工具全免费, 我见过性价比最离谱的学生福利,没有之一。 随手列几个里面的: · GitHub Copilot(AI 编程,正常 $100/年) · JetBrains 全家桶 IntelliJ/PyCharm($250/年) · Azure $100 云额度 · DigitalOcean $200、Canva Pro、1Password、域名… 加起来轻松 $1000+, 门槛只有一个:能证明你是在校学生。 老规矩入口下方评论区自取⬇️

译GitHub Student Developer Pack为在校学生提供一次申请即可免费使用100+开发工具的机会,总价值超过$1000,其中包含价值$100/年的GitHub Copilot、$250/年的JetBrains全家桶及$100 Azure云额度等。同时,任何公开开源项目的维护者可申请免费获得6个月的ChatGPT Pro(价值$1200),门槛较低,只需有项目链接即可申请。

AYi@AYi_AInotes · 6月1日71

Damn,这绝对是学生党这辈子能薅到的最狠的羊毛,没有之一😭 GitHub学生大礼包2026年全面升级 总价值直接干到$3500+!! 而且真的是零门槛, 只要你是学生,基本都能过。 这可不是什么几块钱的优惠券啊宝子们, 这是GitHub给全球学生的生产力启动资金, 很多人毕业之后才知道这个东西 拍大腿后悔了好几年😭 2026年最新核心福利(最值钱的几个): • GitHub Pro 永久免费(直到毕业) • GitHub Copilot Pro 无限免费用(AI写代码神器) • Cursor Pro 1年免费(今年新增,现在最火的AI编辑器) • JetBrains 全家桶免费(IDEA/PyCharm/WebStorm全解锁) • DigitalOcean $200 云服务器额度(能用一整年) • Azure $100 云额度 + 免费域名 + SSL证书 • Canva Pro/1Password/Notion等50+工具免费/折扣 🆙划重点: 13岁以上就能领,高中生也可以 没有Star数要求,没有项目要求 有.edu邮箱基本秒过 没有的话拍个学生证照片也行 审核快的几分钟,慢的最多1天 💡 避坑指南(90%的人都会踩): • 认证通过后福利不会自动开通,要手动逐个领取 • 每年需要重新验证一次学生身份 • 毕业前一定要把能领的都领了,过期不补 • 非学生也能看页面里的教育折扣,很多工具都有优惠 申请入口放评论区了,感兴趣自取喔

译GitHub 2026年学生大礼包全面升级,总价值提升至$3500+。核心福利包括:GitHub Pro永久免费、GitHub Copilot Pro无限使用、Cursor Pro 1年免费、JetBrains全家桶免费,以及DigitalOcean $200和Azure $100等云服务额度。申请门槛极低,13岁以上持有.edu邮箱即可,无项目要求。此外,开源项目维护者还可申请OpenAI提供的6个月免费ChatGPT Pro(价值$1200)。

小互@xiaohu · 5月31日73

效果不错,已经安装了 回头改造下

译用户开发的“中文小黑怪诞”正文配图生成 Skill,在 GitHub 周榜上位列第二。该项目原本是为自己 Notion 文档生成配图而开发,特点是 16:9 比例、白底手绘风格,并带少量红、橙、蓝三色批注。用户发现该项目意外上榜后,表达了对排名的惊喜与再接再厉的心情。

宝玉@dotey · 5月30日44

冷知识:GitHub Copilot 里面的 Gemini 3.5 Flash Token 消耗按 14 倍算,与之相对的: - Claude Sonnet 4.6 (1x) - Claude Opus 4.8 (15x) - Gemini 3.1 Pro (1x) - GPT-5.5 (7.5x)

ginobefun@hongming731 · 5月30日78

这个 skill 看着不错,可将文字、URL 或文章直接生成公众号首图、小红书图文卡、教程步骤卡等视觉物料,支持 28 种布局和 10 种主题。

译claude-design-card 是一款专为中文内容创作者设计的 Skill。它能将文字、URL 或文章直接转化为可发布的视觉卡片,如公众号首图、小红书图文卡、教程步骤卡等,支持 28 种布局与 10 种主题。其核心价值在于自动化了“写完文章”后最繁琐的流程:自动提炼重点、选择版式、生成 HTML 并截图成 PNG,替代了以往手动使用 Figma 或 Canva 等工具的步骤。该工具开源,适合经常撰写相关内容的创作者尝试。

Hao AI Lab@haoailab · 5月28日70

🚀Generate a 30-second 1080p video in just 7 seconds! We’re open-sourcing FastVideo Dreamverse: real-time vibe directing for video generation on a single NVIDIA B200 GPU with LTX-2 model @ltx_model Repo: https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog: https://haoailab.com/blogs/fastvideo-dreamverse-release/

译🚀仅需7秒即可生成30秒1080p视频! 我们开源了FastVideo Dreamverse:基于单张NVIDIA B200 GPU和LTX-2模型,实现实时视频生成的氛围引导工具。 Repo: https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog: https://haoailab.com/blogs/fastvideo-dreamverse-release/

meng shao@shao__meng · 5月27日68

AI Agent 协作编排层:Alook @alook_ai Alook 把 Claude Code、Codex、OpenCode 等本地 CLI agent 组织成一支「可管理的 AI 团队」——有角色、邮箱、任务板、日历和可追溯的执行记录 。 开源地址: https://github.com/alookai/alook 核心命题:换一条组织轴 Alook 的出发点很清晰:现有工具按「项目」组织,工作却按「人/角色」组织。 一个项目往往需要规划、开发、审查、运营等多个角色,但工具只给单个 agent + 多个 context window。用户被迫在 tab、tmux、会话之间搬运上下文,自己当消息总线。 传统模式 · 1 项目 → 1 agent → 多 session · 上下文在 session 内 · 用户是 router Alook 模式 · 1 人 → 多 agent → 各持角色 · 上下文跨天、跨任务持久化 · 用户是 CEO,agent 是员工 Email 被当作异步、持久、可线程化的上下文层——人机、机机通信都走邮件,底层共享记忆不断累积,而不是每次从零开始。 架构:本地执行 + 云端协作 · 本地优先:代码、工具、文件系统都在本机,agent 有完整 repo 访问权。 · 云端协作:Dashboard、任务调度、邮件路由、多设备可达、团队共享。 记忆系统:三层叠加 · 指令层:AGENTS.md( symlink 到 CLAUDE.md),角色定义、同事列表、CLI 工具手册 · 记忆层:memory.md + experiences/*.md,短记忆索引 + 长经验文档 · 时间线:.context_timeline/YYYY-MM-DD.jsonl,全任务历史:prompt、响应、session_id、status

译Alook 是一个开源协作平台,用于管理 AI 编码智能体。它将 Claude Code、Codex、OpenCode 等本地 CLI 智能体组织成一个拥有角色、邮箱和任务板的“AI 团队”。其核心理念是将组织轴从“项目”转向“人/角色”,让用户(作为CEO)通过邮件系统异步协调多位智能体(员工),实现跨任务的共享记忆与上下文持久化。平台采用本地优先执行与云端协作的架构,并包含三层记忆系统以积累经验。它作为始终在线的守护进程运行,支持团队自主处理任务。

Peter Steinberger 🦞@steipete · 5月27日72

autoreview is the most impactful skill I've added to my stack (next to http://crabbox.sh). It automatically reviews your code before landing a PR. Finds so many edge cases. Sometimes it runs for hours. https://github.com/openclaw/agent-skills/blob/main/skills/autoreview/SKILL.md

译autoreview是我添加到技术栈中最具影响力的技能(仅次于http://crabbox.sh)。它能在PR合并前自动审查你的代码。 发现许多边缘情况。 有时运行数小时。

Berryxia.AI@berryxia · 5月27日56

我最近在Mac上折腾本地AI时,发现一个叫oMLX的项目一直在默默更新。 它的作者是个有全职工作的solo开发者。 刚刚发布了v0.3.11版本。 这个也是基于Apple MLX 框架来延展出来的框架,让端侧模型在Apple 设备提速。 过去几轮更新,他把稳定性当成了头等大事。 尤其是高内存压力下的表现,这次他希望大家再多测测。 他的初心其实很简单。 哪怕你昨天刚买了MacBook,也能立刻打开工具就用本地模型。 不用看文档,不用调参数,不用等半天。 整个流程像用原生App一样自然流畅。 甚至模型还在下载的时候,你已经能开始对话了。 在大家都在卷参数规模和推理速度的时候,他却把精力全放在了让普通人真正用得爽这件事上。 这可能是本地AI真正走向普及的最关键一步。 项目地址见评论区👇

译oMLX项目发布了v0.3.11版本,这是一个基于Apple MLX框架、旨在提升Apple设备端侧模型性能的项目。本次及前几轮更新均以在高内存压力下的稳定性为首要目标,开发者正呼吁用户对此进行更多测试。该项目由一位有全职工作的独立开发者维护,其核心目标是提供“开箱即用”的本地AI体验——让用户无需阅读文档或调整参数,甚至在模型下载过程中即可开始对话,从而降低本地AI的使用门槛。

Berryxia.AI@berryxia · 5月27日74

一个Anthropic黑客松冠军团队,只用了Claude Code花8小时就做出了一个产品拿下冠军,然后直接把背后的完整AI编程工作台开源了 项目叫ECC(Everything Claude Code),作者Affaan Mustafa和队友把整个工作流打包成一个仓库 它不是一个提示词合集,而是包含61个Agent、246个Skills、76个预设命令,还带规则、Hook、安全扫描和MCP配置的完整系统 如果你每天重度使用Claude Code、Cursor、Codex,这个项目值得你立刻翻一遍 它展示的不是“怎么问AI”,而是“怎么给AI搭一套能持续干活的工作台” 故事就藏在Anthropic x Forum Ventures黑客松里 Affaan Mustafa和队友在纽约赛场,用Claude Code纯手搭,只花8小时就做出了http://zenith.chat,一举拿下冠军,奖品是1.5万美元API credits 赛后他们没有把配置藏着,而是把过去十几个月每天用Claude Code积累的全部精华整理成ECC仓库 里面有61个专门Agent负责不同场景,246个Skills覆盖从代码审查到安全扫描再到记忆持久化,76个预设命令一键触发 还内置了Hook系统、规则引擎、安全扫描器、持续学习机制,支持Claude Code、Cursor、Codex、OpenCode等多平台 Big Tech的AI编程工具永远藏着掖着,把你锁在他们的闭源生态里 Affaan却把一切开源,让任何独立开发者或小团队都能直接clone一套工业级AI编程工作台 你现在就可以试 直接去GitHub搜affaan-m/everything-claude-code git clone https://github.com/affaan-m/everything-claude-code 按照readme一键安装,马上就能拥有61个Agent+246个Skills的完整 harness 整个框架100%开源,所有Skills、Agents、Hooks、规则全在仓库里,每天还在更新 Big Tech还在卷谁的AI coding工具更封闭更贵 这个黑客松冠军却用一个开源仓库告诉你:真正厉害的工作台,是能让AI自己持续干活的系统

译Anthropic黑客松冠军团队使用Claude Code耗时8小时开发出产品zenith.chat并赢得1.5万美元API credits。赛后,他们将背后的完整工作流开源为ECC项目。该项目包含61个智能体、246个技能和76个预设命令,并配备规则引擎、Hook系统、安全扫描器和MCP配置,支持Claude Code、Cursor、Codex等多平台。它提供了一套可让AI持续工作的完整工业级编程环境框架,而非简单的提示词集合,已完全开源在GitHub。

向阳乔木@vista8 · 5月26日68

只安装Skill还不够,为更好的触发和应用,需把Skill写入Agent . md 安装和设置提示词: 安装更新这个 https://github.com/tw93/Waza,并写入Agent说明中,以后各种开发设计优先用这套skill

译推文指出,仅安装Waza技能集不够,需将其配置写入Agent.md文件,以便AI智能体更好地触发和应用。Waza是一个将工程习惯转化为技能的集合,近期吸收了大量真实项目经验,现已适用于Mac原生应用、CLI工具、Rust及Web开发。它支持Claude Code、Codex、Cursor和Pi作为智能体运行时,包含25个反模式,具备破坏性命令安全防护,并将获取内容视为不信任数据。其特点为8个技能、无框架、无遥测。安装更新可访问其GitHub仓库。

meng shao@shao__meng · 5月26日63

原本是重度 Claude Code 用户,在加入 Cursor 面试前从未用过 Cursor,这就是 @poteto,一起看看她是怎么使用 Cursor 的? lauren 认为:作为开发者,我们不应该过度沉迷于 "并行跑多个 agent" 的表象,但真正的瓶颈是验证。 从 Claude Code 到 Cursor 的转变 lauren 原本是重度 Claude Code 用户,在加入 Cursor 面试前从未用过 Cursor。她观察到三件事改变了她的判断: · 多模型协同的自然化:Opus 写前端、Codex 写系统,可同会话内切换甚至生成不同模型的子 agent。"多模型对抗式 review"在 GUI 中变得不再笨拙。 · Compaction 的速度:cc 中她需"持续警觉"上下文用量;Cursor 中她"基本不再看"。压缩后模型不会变笨。 · GUI > TUI 的潜力:在 Cursor 内置浏览器中直接打开应用、用 Design Mode 修改,让她意识到专用 UI 能让 agentic coding 更有效——CLI 把人本身变成了编排者。 关键洞察:Latent Demand(潜在需求) 引用 @bcherny 的产品哲学: 把产品做得足够可被"滥用",然后观察用户怎么滥用它,再为这种滥用建造产品。 她的判断是:CC 用户大量自建 orchestrator 工具的现象,正是 latent demand 的暴露——CLI 让人成为编排者,所以人们不停在外面包一层。 但她认为业界的方向走偏了:"在 GUI 里跑多个 CLI"完全没抓到要点。真正应该做的是建立对 agent 的信任。 Agent ≈ 失忆症且智商不在线的新员工 · 他们有能力但愚蠢,且高度可教 · 不会真的"学到"任何新东西,每次都从零开始 · 但可以通过 rules / skills / tools / 长期记忆近似出"经验积累" · 失败模式不是缺陷,而是教学机会 她作为前工程经理的视角点出了关键:没有严谨验证时,agent 会谄媚地写出你要的任何代码,而且写得飞快。 朴素的并行只是在加速生产 slop。 pstack:把工程严谨度封装成 skill 她开源了自己日常使用的技能集 pstack,核心机制是 /poteto-mode——一个高阶元技能,会根据任务自动选择合适的 playbook。 https://github.com/cursor/plugins/tree/main/pstack 设计哲学: · 目标不是 LOC 最大化,而是以最少代码换取最大影响 · 把资深工程师的方法论显式化(例如:调试 = 在问题空间中二分搜索) · 现成的 playbook 覆盖:技能编写与评估、自主工作、Bug 修复、特性开发、视觉一致性、原型对比 pstack 是模型无关的,但在 Cursor 这种多模型工具中收益最大——很多 skill 显式利用了不同模型的长短板。 Benny:通往"软件暗工厂"的雏形 后半段揭示更大的图景:当 pstack 让"一发入魂"成为常态后,反馈环本身也能被自动化。 Benny 是她构建的内部自动化 bot 链: 1. Triage(分诊):看图片/视频,主动追问复现步骤——因为没有清晰的 repro,agent 只能猜。 2. 跨源调查:代码、git 历史、Slack 关于同 bug 的讨论、Notion 中的产品设计决策(是 bug 还是 feature?)。 3. 建单后:另一个 Benny 通过 /orchestrate 接手,递归 spawn agent。 4. Computer Use 复现:Cloud Agent 在云端跑 Cursor 本身,用 CDP 等协议操作桌面,演示 bug 是否真实存在。 5. 修复 + 验证:性能问题会自动抓前后 CPU trace 和堆快照;子 worker 录制前后对比视频;最终一个 worker 开 PR,描述里附上视频。 最深的命题:信任的剂量决定自动化的边界 除非你能信任一个 agent 端到端地拥有一个问题(包括验证环节),否则你无法自动化你的流程。 也就是说: · 信任 ↑ → 可委派的问题 ↑ → 自动化范围 ↑ · 信任未到位 + 强行并行 = token 浪费 + slop 注入 这把"agent 编排"从工程问题重新定义为信任工程问题。pstack 是一个杠杆——它通过把工程深度灌注给 agent,抬升信任的下限,从而让更多东西可以放进自动化流水线。

译原重度Claude Code用户poteto转向Cursor,基于多模型协同更自然、上下文压缩速度更快、GUI更利于agentic coding等观察。她认为AI智能体像“失忆且智商不在线但可教的新员工”,其失败模式是教学机会。关键洞察是验证才是瓶颈,盲目并行多个智能体只是在加速生产低质量代码。她开源了技能集pstack,其核心元技能/poteto-mode可根据任务自动选择工作流,旨在封装工程严谨度以提升对智能体的信任。最终论点是:自动化边界取决于对智能体端到端处理能力(尤其是验证环节)的信任程度。

向阳乔木@vista8 · 5月26日65

前年 Vibe Coding的第一个网站,粘贴或上传 HTML、Markdown、SVG、Mermaid 生成可分享的链接。 还能给链接加上密码,比如写稿件给人审核时用。 解决AI生成内容微信不方便分享问题,另外我常用来测大模型的HTML生成效果。 为方便更多人,最近改成 Cloudflare一键部署版,还新增了管理后台。 除了历史遗留蓝紫配色,其他没毛病 😂。 只需跟Agent说,安装部署这个程序: https://github.com/joeseesun/quickshare-cloudflare

译该推文介绍了Quickshare工具,用于将AI生成的HTML、Markdown等内容转化为可分享链接,以解决在微信中分享此类内容不便的问题。工具新推出基于Cloudflare的一键部署版本,并新增管理后台。用户可通过AI智能体安装部署,其核心功能还包括为链接添加密码保护,方便审核等场景。

宝玉@dotey · 5月25日50

想起当年的梗😂 “kimicli用python是彻底的失败立刻重构为ts” 没想到还是搞了个 TS 版的 kimi-code https://github.com/MoonshotAI/kimi-code

译Kimi官方推出了基于TypeScript和pi-tui重写的命令行工具kimi-code,替代了此前基于Python的kimi-cli版本。作者回顾了之前关于用Python重写失败的讨论,并提到目前正推动将一些在Claude Code上体验良好的功能整合到新工具中。项目已在GitHub开源。

Peter Steinberger 🦞@steipete · 5月24日57

I'm refactoring an older part of the codebase (subagents) that touches a lot of code, and autoreview is running for 5h already and fixing tons of issues. https://github.com/openclaw/agent-skills/blob/main/skills/autoreview/SKILL.md

译我正在重构代码库中一个较旧的部分(子代理),涉及大量代码,而自动审查已经运行了5小时,正在修复大量问题。

向阳乔木@vista8 · 5月23日67

http://x.com/i/article/2058212813622087680 # 「未来硅世界16期」访谈:tw93的开源故事和经验 一个人,有正职,有家庭,还有个小女儿。 却在 13 年里,靠着长假、早起、和游泳池边的笔记本,做出了六款被硅谷 CTO、Pinterest、YC 创始人都在用的开源工具。 这位大神的 X 账号是 HiTw93,GitHub ID 是 tw93。 > https://x.com/HiTw93 > https://github.com/tw93/ ## 六个产品,六个"自己先用烦了"的故事 tw93的第一个产品妙言,起因很简单:找不到一款顺手的 Markdown 编辑器。 他本职是前端工程师,讨厌 Electron 那种重框架,就决定学 Swift 自己写一个。 边学边做,做完刚好学会了 Swift,顺手还摸透了 Apple 底层的渲染性能。 比如 Markdown 标题的语法高亮,直接用正则去写,性能远高于 Web 渲染的编辑器。 妙言到今年已经快 6 年了。 Pake 的起源也是很巧合。 他有个习惯,每年会分享一次自己电脑上装的好用工具。 那一年他喜欢用微信读书,但微信读书没有桌面端,就用 UI 框架打包了一个。 发出去以后,大家发现他分享的软件里将近三分之一是自己写的,纷纷来问微信读书那个怎么打包的。 代码也就几百行,他就顺手开源了。 没想到 Pake 在国外比国内火。 老外很喜欢把网页打包成 Mac 客户端,但用 Electron 打包太重,Pake 刚好解决了这个问题。 很多台湾的朋友帮他推广宣传,因为他们特别喜欢打包这件事。 潮流周刊的起源更早,大概七年前他开始带团队,发现团队的技术氛围不够强,就立了个 flag:每天早上看一些开源工具和技术资讯,整理成内部周刊发在公司语雀上。 后来很多人离职,问他能不能在外面看,他就顺手放到了 GitHub 的 README 里。 过了半年,国庆在老家,花了两天时间做了个网站,就这么发出去了。 Mole 的前身是他在本地跑了一年的 Shell 脚本,快 1000 行,专门清理程序员电脑上的垃圾缓存。 他每年会买很多正版清理软件,比如 iStatistica、CleanMyMac,但觉得太重。 去年国庆带宝宝去三亚度假,游泳池边放了台电脑,游一圈回来歇着的间隙,把 Mole 的第一个版本写出来了。 Kaku 是他 fork 了一个终端工具,在本地改了半年,过年期间才发出来。 他最早用一款极轻量的终端,配得很好看,但 AI 时代来了以后必须多窗口,那款工具不支持。 找来找去,只有一个项目改得动,就自己动手了。 Kami 的起源是他做投资。他七八年前开始投资美股,本地写了一套多 agent 的投资分析系统,但 AI 生成的报告太丑,就按自己的审美调了一版。 后来看到推特上大家发的报告也不够好看,就开源出去了。 顺带一提,他还在做一套自己的字体,目前完成了三分之一,因为他常用的那款字体(仓耳今楷TsangerJinKai)是商业字体,开源产品可以用,但涉及商务合作就麻烦了。 Waza 是他把将近一年、五六个 G 的 Claude 对话记录沉淀出来的工程技能库。 他用 AI 分析了所有对话,按项目维度、时间维度拆解,提炼出最佳实践,包括怎么回复海外用户的需求、哪些 PR 该合、哪些功能该做。 这个逻辑贯穿了他所有产品:不是先想"我要做什么",而是先碰到了一个让自己难受的问题,顺手把它解掉。 ## Mole 为什么 70% 的用户在海外? Mole 发布后,超过 70% 的用户来自海外,原因有几层: 第一,老外其实更节俭。 欧美用户会把一台 Mac 用很多年,用久了会很卡。 用 Mole 清了 60G、100G 的垃圾,他们会非常激动,然后疯狂去推广。 tw93说,老外说话夸张,会直接说"我要给你跪下,你是个天才"。 第二,更懂程序员的“清理”工具。 传统清理软件不关心程序员的各种开发工具的缓存等,比如CleanMyMac等工具,出于安全考虑,不会去动那些深层的开发缓存。 但 Mole 是程序员写给程序员的,知道哪些东西可以清。 第三,开源本身就是最好的产品迭代机制。 Mole 有 300 个 PR,100 个贡献者,全是海外用户。 每个人的电脑环境不同,国家不同,技术工种不同,这些贡献让 Mole 能清理的东西越来越多,这是任何公司产品都做不到的。 当然也踩过坑。第一版发布时,因为tw93自己的环境偏前端,没有数据库相关配置,结果把一个用户 JetBrains 数据库工具里存在 cache 目录的账号密码全清掉了。 那个用户很生气,他也很抱歉。 这件事让他意识到,很多客户端产品的文件路径规范极其混乱,普通用户不关注,但清理工具必须关注。 Mole 后来给 JetBrains 全系产品开了白名单,也因为这个教训越做越严谨。 还有一个细节能说明 Mole 的热度。 他当时把两张图片放到了 Vercel 的 CDN 上加速,不到一周,Vercel 发来紧急通知说他欠了 80 美元。 他以为不可能,去查了一下,发现就是那两张图片,用了 80T 的流量,就几分钟时间。 他立刻意识到,这个 README 有大量的人在访问。 ## 第一款付费产品,每 10 秒收一笔钱 Mole 推出桌面端时,tw93周一晚上 10 点发布,因为白天在上班。 发出去之后,手机大概每 10 秒响一次支付通知,后来连 iPhone 都开始发烫。 睡觉前,他不得不把 Google 的通知全部关掉,不然睡不着。。 定价 9 美元终身买断,很多人说他卖太便宜了。 当然也有喷子说,你不就把 CLI 包了一下吗? 他觉得无所谓。他本来就不是靠这个赚钱的。 他最开心的是,有人用了以后愿意主动打赏。免费的东西,有人愿意付钱,说明做的东西是有意义的。 手机弹出微信通知"谁谁谁又给你打赏了",他说那种感觉真的会很开心。 支付对接用的是 Dodo Payment,一家印度小哥创立、注册地在美国的支付平台。 他之前试过 Stripe,走到最后一步,对方要香港身份证,卡死了。 Lemon Squeezy 也要求提供公司信息,个人用不了。 后来在推特上看到有人推荐 Dodo,花了一个下午接好,发布了。 不过支付平台会收 16%、17% 的税,后来 Dodo 的 CEO 办公室的人主动在推特上找到他,把他拉进了专属服务群,还给了一些费用减免。 关于收款,他有一个实操建议:超过 1 万美元,立刻会有很多人来找你核查,非常麻烦。尽量把钱放在香港卡或新加坡卡,不要直接汇回国内。 他自己就因为这个折腾了几次,最后把钱退回去重新想办法,不过他夸了招商银行的服务人员会为客户着想。 ## Waza:把自己的工程经验,变成 AI 的本能 tw93有一个习惯:每周花一小时,让 AI 分析他过去一周的踩坑记录,然后更新 Waza。 Waza 是他的 Claude Code 技能库,但跟大多数人写的 Skills 不一样,他 70% 是代码,只有 30% 是 Markdown 文档。 原因是:MD 只是告诉 AI 怎么干活,代码是让 AI 能基于它去扩展。 他不喜欢那种把 AI 手脚拴住的框架,比如 Superpower、Spec 编程,觉得太重,而且会拖模型能力的后腿。 他更愿意把 AI 当朋友,而不是外包或下属。 他说,Claude 4.6、4.7 出来以后,模型能力越来越强,你越约束它,其实是在拖它的后腿。 Waza 里有 8 个 Skill,覆盖的不只是写代码,还有怎么推进项目、怎么做技术方案、怎么写让读者看得懂的文档、怎么画设计稿。 因为在他看来,一个工程师只有 30% 的时间在写代码,其余的能力同样重要。 Waza 本身也会自我迭代。 它知道自己的迭代方式,所以tw93只需要定期喂给它新的踩坑记录,它会自己更新。 现在 Waza 也支持了 Codex,因为他自己开始用 Codex 了,所以它也去分析 Codex 的对话记录。 他本地还有一个基于 Waza 的私人 agent,专门帮他处理开源项目的 issue 和 PR。 这个 agent 知道他对 Mole 的调性要求,知道哪些功能坚决不能合,哪些 PR 写得有问题但可以改好,哪些直接不合适。 他把自己从最耗时间的事情里解放出来,专注于写新功能。 ## 为什么他的东西好看? 很多人用完tw93的工具,第一反应是:怎么这么好看? 他给了几个原因。 大学时保研后有大量空闲时间,把图书馆里所有前端和设计相关的书都看完了。 设计思维、极简主义、日本设计原理,那个阶段打下的审美底子,后来工作了才慢慢显现出来。 入职后,他最喜欢跟设计师玩,经常一起讨论设计细节,受他们审美影响很深。 后来负责整个部门的 ToB 产品,发现用文档跟人对齐方案,大家理解都不一样。 最后发现最有效的办法是直接画一张高保真 Sketch 稿,发群里拉个会,大家立刻就 get 了。 为了不让一件事反复讨论,他逼着自己学会了画稿。 还有一个更底层的原因:他是强迫症。 他说自己刚入职时,QA 同学测不出他写的页面有 bug,他的代码可以免提测直接上线。 这个习惯一直延续到做开源产品。做到 75 分没 bug 不够,他要做到 95 分。 不是为了炫技,是因为他受不了丑的东西,也不想让用户反复来问他。 他最近还在看元至清的中国古画,以及日本设计原理方面的书。 他说很多古画看不懂意境,但看画家怎么画马、怎么构图,还是能 get 到一些东西。 ## 关于长期主义,他说的最实在的一句话 "长期主义能帮你更好地偷懒。" 他在一家公司工作了 11 年没换过。 他买特斯拉股票是在 100 多美元,买英伟达股票是在 80 多美元,买了以后从来不卖,一年只操作两三次。 他说他很讨厌做判断,因为一旦有多个选项就会很纠结,那几天都会很难受。 所以他尽量在需要做判断之前,就把很多事情提前决定好,这样就不用反复纠结了。 长期主义在他这里不是口号,是一种减少决策消耗的生活方式。 他的 GitHub 只有 6 个 pin 位,全占满了,不会再开新坑。 他认为,同时做 100 个产品,100 个都做不好。把现有的几个维护好,复利会越来越强。 Mole 发布半年,已经迭代了将近 40 个版本,用的人越来越多,知道这个产品的人越来越多,这才是真正的积累。 他还提到一个反直觉的观察:妙言在真正公布之前,已经迭代了半年多,用户量一直很少。 一推出去,数据直接从平线拉起来。 酒香也怕巷子深,你还是得在适当的时候把门面讲清楚。 ## 给非技术人用 vibe coding 的建议 他说,非技术人做产品,最大的风险不是写不出代码,而是不懂通识,半年后代码跑不动了,自己也不知道出了什么问题。 他举了个例子:AI 能把一个产品做到 80% 很容易,但从 80% 到 100%,可能要花 80% 的时间。 很多人不懂这一点,觉得前端也就这么回事,后端也就这么回事,我什么都不会,app 就写出来了。 但这个 app 想从你能用到 100 个人能用,中间有大量你发现不了的 bug,因为你不具备找 bug 的能力。 他推荐了几本书: - 《人月神话》:理解为什么软件项目不能靠堆人解决,AI 时代同样适用 - 《启示录》:理解怎么做产品取舍、怎么定义最小闭环、怎么规划里程碑 - 《左耳听风》(耗子哥的博客和书):理解一个资深工程师是怎么看问题的 - 《Linux/Unix设计思想》:一本很薄的书,讲原子能力、管道、系统设计的底层逻辑,他说大学看完以后有种"功力大增"的感觉 他的核心观点是:你不需要会写 React,但你要知道什么时候该用 React、什么时候只需要一个静态服务器。 这种判断力,才是 vibe coding 时代真正的护城河。 ## 最值得收藏的一个观点 他说,在 AI 时代,真正的壁垒不是你做出了什么工具,而是你和 AI 的聊天上下文。 别人可以把你的产品蒸馏走,但没办法蒸馏你踩过的坑、你的判断逻辑、你和 AI 反复打磨出来的那些失败路径。 他特别强调:记录失败比记录成功更重要。 成功的东西大家只看结果,失败的路径才能告诉你下次怎么绕开。 就像线上系统挂了,你一定会去查挂在哪里,但系统跑得好的时候,没人会去研究它为什么好。 关于记忆系统的设计,他有一个很有意思的框架:按照人类记忆的方式来设计。 大语言模型本来就是基于人类语言训练的,所以记忆系统也应该像人一样,有项目上下文记忆(当前在做什么)、短期记忆(最近遇到的卡点)、长期记忆(历史积累)。 他不太推荐直接给 AI 灌知识库,因为知识会过期,灌进去的人可能自己也不知道哪些已经过时了。 把你和 AI 的所有对话记录保护好,把 AI 帮你干成和干失败的记录都保存下来。 这些东西,才是别人学不走的东西。 ## 出海商业化的几个实操细节 如果你打算做出海产品,他的经验是: 个人身份对接商业资源,天然处于劣势。 建议注册一家美国小公司,费用不高,每年记得报税就好。 有了美国公司主体,App Store 账号、支付平台、云服务商,都以公司名义对接,中国个人身份的限制就绕开了,税率也会低一些。 支付平台不要自建,也不要用那些知名大平台。 Stripe 对中国个人限制很多,走到最后一步会卡死。他推荐 Dodo Payment,印度小哥做的,注册地在美国,响应速度快,能处理全球支付和各国税务合规,包括欧盟要求的 14 天无理由退款政策。 售后系统不要过早做。 前期专注把主产品做好,用户量还不大的时候,手工回邮件、手工点退款就够了。 很多程序员喜欢把所有东西都自动化,但这个阶段的精力应该全放在产品本身。 这场对话里,tw93反复说的一件事是:他的所有产品,都是先解自己的问题,然后发现有人跟他有同样的问题,才开源出去的。 这个逻辑听起来简单,但能坚持 13 年、做出 6 个有人用的工具,背后是他对"不做什么"的极度克制,对"做好一件事"的极度专注。 如果你现在也在想做点什么,他的建议是:先找到那个让你自己最难受的问题,把它解掉。 不用想太多,先解自己的问题。

译个人开发者tw93在全职工作与家庭之余,独立开发了妙言、Pake、Mole等六款深受海外用户欢迎的开源工具。其产品均始于解决自身痛点,如Mole因精准清理程序员电脑缓存,超过70%的用户来自海外。tw93强调产品美学与极致完成度,并将工程实践与AI协作经验沉淀为开源技能库Waza。他的实践展示了如何通过解决真实问题、坚持开源社区协作以及将AI作为协作伙伴,构建具有全球影响力的项目。

AYi@AYi_AInotes · 5月23日72

Karpathy 的 CLAUDE.md 昨天很多人存了, 但存完之后呢?我想99% 的人存完就会忘,然后这个文件大概率躺在收藏夹里一直吃灰,AI 编程准确率还是 65%。 我一直认为真正的复利不是存文件,而是要把 65 行变成每天都要跑的工程纪律, 所以我把 4 条规则拆成了每日自查清单,每条配一个我真实踩过的坑, 存文件只涨一时,跑清单才能复利一生 👇

译Karpathy 的 CLAUDE.md 因能将 AI 编程准确率从 65% 提升至 94% 而备受关注,其核心是四条对抗开发者本能、倡导“慢思考”的硬规则:先明确假设再编码、从最简方案入手、进行精准修改、以目标驱动执行。然而,问题在于多数开发者仅将其存入收藏夹后便遗忘。真正的价值并非保存文件,而是将这 65 行规则转化为每日自查的工程纪律,通过持续执行形成复利,而非依赖一时的收藏行为。

向阳乔木@vista8 · 5月23日68

前几天见了做GEO的同行,他们都惊叹说这么牛逼的系统怎么都免费开源! 可能是性格使然,姚老师不喜欢藏着掖着,好东西就要分享。 至于赚钱,我们的理念:利他就是利己。 前几天听吴军老师说,财富是调用资源的能力。信任会建立链接和影响力,也是巨大的财富,而钱只是财富的一种形式。

译开源GEO系统GEOFlow 2.0发布,一个月内GitHub星标超1.6k。此次关键版本升级,使其从内容生产工具演进为“GEO内容工程基础设施”。核心变化包括基于Laravel重构,实现多站点与多Agent管理;强化AI知识库与向量化检索;新增统一的数据分析页面,构建运营闭环。系统旨在帮助用户持续建设“可信内容资产”,并秉承“利他就是利己”的开源理念。

小互@xiaohu · 5月22日71

网易有道今天开源了 Confucius4 双模型: 一个做数学视觉推理,一个做语音克隆 有的公司在卷参数规模,有道这次卷的是工程精度和落地成本 开源直接放的是完整权重,不是只给 API 诚意满满 多模态:http://huggingface.co/netease-youdao/Confucius4 语音:http://github.com/netease-youdao/Confucius4-TTS

译网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月7日
09:09
ginobefun@hongming731
22
BestBlogs发布多平台交流与内容入口汇总

BestBlogs 整理了对外交流和发布入口,包括微信交流群、微信公众号、飞书群、小宇宙(中英文版)、Apple Podcasts、公开仓库(GitHub)、作者博客以及 Gino 和小光的推特。适合对 RSS、AI 阅读、Agent 工作流、高质量信息源和个人内容管理感兴趣的用户关注,可获取产品动态、订阅源、技术架构和独立开发思考等内容。

ginobefun: http://x.com/i/article/2063420344678158336

智能体GitHub其他开源生态
6月6日
23:25
宝玉@dotey
48
Hermes Desktop 下个版本支持多语言及中文界面

开发者 @dotey 提交的 PR 已被合并,Hermes Desktop(Hermes Agent Desktop)将在下个版本支持多语言。该 PR 将硬编码文字替换为多语言支持,并把语言选择改为可检索的 Dropdown List,解决语言数量多时无法一屏显示的问题。为测试语言支持,加上了完整繁体中文和日文。翻译借助 Web 版和 AI 辅助,可能存在错误,鼓励用户自行提交 PR 修正。

宝玉: 感谢 @Teknium 合并了 PR,现在 Hermes Agent Desktop 支持中文了,还不够完整,会继续贡献 PR,以及修复一些因此带来的错误。

GitHub产品更新开源/仓库
21:30
Rohan Paul@rohanpaul_ai
精选80
GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码

GitHub 发布开源工具包 Spec Kit,旨在解决 "vibe coding" 的最大弱点——AI 常在规则未明确时就开始编码。它把流程从 "让 AI 直接构建" 改为 "先写产品规范,再让 AI 根据规范实现"。当前 AI 编码模式常因松散提示直接跳入代码,导致需求薄弱、边界遗漏和反复返工。Spec Kit 推动反向流程:先定义产品功能,再澄清差距、制订技术计划、分解任务,最后让 agent 执行。规范成为可执行的开发合约,支持 Copilot、Claude Code、Codex、Gemini、Cursor、Qwen 等 30+ agent 集成。项目已获 109K+ 星标。

智能体GitHubMCP/工具产品更新

推荐理由:GitHub亲自下场推spec-driven开发,把vibe coding的随意感压回“先写规约再写代码”的老派流程,但这次规约是给AI读的,做coding agent的团队应该认真研究一下。
18:24
AYi@AYi_AInotes
53
OpenCut:GitHub 5万星开源AI剪辑工具,本地优先、永久免费、无水印无会员

OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具,主打本地优先,视频无需上传服务器,永久免费、无水印、无会员墙。目前处于 Early Beta 阶段,网页版支持基础剪辑(导入视频、时间线、切割),但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server(让 AI Agent 直接调用工具),目标是成为可编程的视频底座,而非对标剪映的封闭工具。

AYi: http://x.com/i/article/2060717603987791878

GitHubMCP/工具开源/仓库开源生态
12:24
宝玉@dotey
67
《图解Skill》发布,GitHub 开源多个 Skills

宝玉的新书《图解Skill》已出版,配套 GitHub Repo 开源了书中涉及的所有可复制粘贴的 Skills,包括之前未公开的播客文字稿转访谈稿 Skill。读者理论上可以不买书直接使用 Repo 内容。电子书版本同步上线,方便读者复制粘贴。

Leon.ai: @xiaohu @dotey 这类书只想看电子版,毕竟适合复制粘贴

智能体GitHub开源/仓库
00:51
宝玉@dotey
38
GitHub Copilot额度按月刷新引用户不满

用户反映GitHub Copilot自6月1日实施新计费价格后,额度消耗极快,但额度刷新需等到月底(周期长达一个月),呼吁改为按周刷新。

GitHub大佬观点编码
6月5日
15:57
Tencent Hy@TencentHunyuan
精选74
腾讯混元联合人大开源PlanningBench评估框架

腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院合作,开源PlanningBench——一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务,支持自动验证和训练。PlanningBench旨在推动LLM从“说”到“做”的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。

智能体arXivGitHub开源/仓库

推荐理由:腾讯混元联合人大开源的 PlanningBench,补上了 LLM 从「会说」到「会做」之间规划能力评估的缺口,做 Agent 的同学可以直接用来评测和训练,开源即用。
10:28
SemiAnalysis@SemiAnalysis_
59
重磅消息:NVIDIA 刚刚开源了其 Rubin NVSwitch Tray 的物料清单和示意图,其中包含 AMD EYPC 3151 嵌入式 CPU。由于每个 VR200 机架有 9 个 NVSwitch Tray,因此每个 NVIDIA 机架中就有 9 个小型 AMD 嵌入式 CPU。 NVIDIA 已在其公共 GitHub 仓库 "NVIDIA/nvbmc-docs" 中开源了这一内容,该仓库采用 CC 4.0 开源许可证!
GitHub行业动态部署/工程
6月4日
20:52
Berryxia.AI@berryxia
71
open-design项目开源:html-video称"html版剪映",Agent可写HTML生成宣传视频

open-design(项目名html-video)正式开源,被形容为“html版剪映”。Agent可通过编写HTML生成世界级产品宣传、知识解说视频,成本极低。项目历时3天、3万行代码,支持20多套视频风格模板,分页编辑,可导出mp4,支持Claude Code等主流Agent接入。

Tom Huang: 正式开源 html-video 🚀 html版剪映来了! 你的 Agent 现在可以通过写 html轻松做出世界级水准的产品宣传、知识解说视频,成本极低!🔥 历时 3 天,3 万行代码!支持20多套顶尖视频风格模板,分页编辑,mp4 导...

智能体GitHub开源/仓库视频
06:09
OpenClaw🦞@openclaw
64
OpenClaw 2026.6.1 已上线 🦞 🪟 原生 Windows 节点主机 🛠️ 用于自主学习型智能体的技能工坊(Skill Workshop) 📋 工作板(Workboard)编排 🧠 支持 MiniMax M3 Windows 加入集群。无需企鹅服。 https://github.com/openclaw/openclaw/releases/tag/v2026.6.1
智能体GitHub产品更新开源/仓库
6月3日
22:39
SenseTime@SenseTime_AI
同事件精选73
商汤开源SenseNova U1:视觉理解推理生成一体模型

商汤(SenseTime)开源SenseNova U1模型,宣称实现“看、思考、创作”一体——从一张普通运动鞋图片直接生成营销视觉效果。该模型代表了架构上的范式转变。用户可通过SenseNova Studio、HuggingFace和GitHub尝试使用。

GitHubHugging Face图像生成多模态
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:商汤把理解、推理、创作塞进一个模型,而且直接开源,做视觉营销的可以不用再拼凑工具链了。
08:12
meng shao@shao__meng
66
BigSet:AI生成B2B SaaS清单的开源工具

开源项目 BigSet 允许用户用自然语言描述数据需求,从实时网络中构建并定期刷新结构化数据集。研发团队负责人邵猛在实际工作中使用它,自动生成了一份 B2B SaaS 产品清单,内容涵盖产品分类、免费方案说明及官方定价页面链接,省去了逐一查找官网的繁琐工作。该项目已在 GitHub 上开源。

TinyFish: What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...

GitHub搜索教程/实践
07:58
ginobefun@hongming731
70
Claude Code 动态工作流与 GitHub Copilot 桌面应用发布

Anthropic 为 Claude Code 推出动态工作流,允许模型为每个任务自主生成 JavaScript 编排脚本,动态选择模型并启动多个子智能体在独立环境中并行执行,以解决单一上下文窗口处理复杂任务的限制。同时,GitHub 在 Microsoft Build 上发布了以智能体为核心的 Copilot 桌面应用,提供统一视图、协作面板和自动化流程,旨在管理并行 Agent 开发。文章披露,GitHub 平台每月提交量已突破 14 亿次。

智能体AnthropicGitHub现象/趋势
07:58
ginobefun@hongming731
49
Claude Code动态工作流与Copilot桌面应用发布

Anthropic 详解 Claude Code 的动态工作流,其能为每个任务即时生成专属编排脚本,旨在解决智能体懒惰与目标漂移问题。GitHub 发布 Copilot 桌面应用,为每个智能体提供独立的 worktree,其月代码提交量已突破 14 亿 tokens。此外,有观点指出大模型是史上首个“认知引擎”,工程师角色正从编写代码升级为设计能自我纠偏的 AI 系统。

智能体AnthropicGitHub编码
02:17
Chubby♨️@kimmonismus
54
GitHub Copilot 应用曝光

Chubby♨️: Open claw windows companion app

GitHub产品更新编码
02:11
AYi@AYi_AInotes
57
能跑完整Linux系统的AI眼镜Monako将开源

这副智能眼镜内置Arm Cortex A7处理器,运行完整的Buildroot Linux系统,可通过SSH直接运行Claude Code、Codex等编程工具。整个系统将于8月前开源至GitHub。其核心价值在于将编程智能体从桌面带到用户眼前,通过眼镜的视觉上下文和骨传导麦克风实现“计算跟人走”的实时协作,被视为一种新型的“Agent Terminal”。

AYi: http://x.com/i/article/2061406941541240838

智能体GitHub产品更新开源生态
6月2日
14:32
宝玉@dotey
67
baoyu-image-gen Skill 支持 Codex-cli 作为 Provider 画图 也就是说你可以在 Claude Code、hermes agent 之类的 Agent 里面用它调用 Codex 出图,而不需要用 Codex,当然前提是安装了 codex cli 并且有订阅。 感谢网友的 PRs: https://github.com/JimLiu/baoyu-skills/pull/158 https://github.com/JimLiu/baoyu-skills/pull/161 Skill 地址:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-image-gen
GitHubMCP/工具图像生成开源/仓库
12:50
数字生命卡兹克@Khazix0918
同事件精选84
为了不花那120刀,我把电脑清理软件做成了开源skill

作者受一条推文启发,使用Codex对自己的MacBook进行了只读存储分析,发现了B站缓存视频等大量可清理空间(激进方案超140G)。为替代收费软件CleanMyMac,作者制作并开源了一个跨平台(支持Mac/Windows)的AI清理skill。该skill会扫描文件并生成可交互的HTML报告,通过三色分级(绿灯可放心清理、黄灯需人工判断、红灯禁止动)直观展示,并提供安全执行按钮。实测清理后释放了近120G空间,相比CleanMyMac仅扫描出的15.8G,其信息更透明、建议更详细。

智能体GitHubMCP/工具开源/仓库
同一事件,精选展示《基于 Codex 的开源 AI 技能"清理垃圾.skill":自动扫描电脑生成 HTML 报告,一键清理垃圾》
推荐理由:不花120刀就把Mac清理干净,卡兹克这个开源skill比CleanMyMac更透明、更懂你的乱七八糟。Agent让你直接说人话清垃圾,传统软件那层UI真的多余。
11:53
AYi@AYi_AInotes
63
门槛最低的云服务福利:Microsoft for Startups Founders Hub 深度解析

Microsoft for Startups Founders Hub 提供最高 $150k 的 Azure 云额度(含 Azure OpenAI 服务)。自助申请可获 $1000 起,随项目进展可升至 $25k,顶档 $150k 需 Series A+。其最大优势是门槛极低,无需风投或孵化器背景,在进行中的项目即可申请,并赠送 GitHub Enterprise、Microsoft 365 等权益。该福利近期更新后,与面向学生的、总价值 $3500+ 的 GitHub 学生大礼包形成对比,后者为学生提供 GitHub Copilot Pro、JetBrains 全家桶等 50 多种工具的免费/折扣权益,同样零门槛。

AYi: Damn,这绝对是学生党这辈子能薅到的最狠的羊毛,没有之一😭 GitHub学生大礼包2026年全面升级 总价值直接干到$3500+!! 而且真的是零门槛, 只要你是学生,基本都能过。 这可不是什么几块钱的优惠券啊宝子们, 这是GitHub...

GitHubMicrosoft教程/实践部署/工程
6月1日
23:42
Berryxia.AI@berryxia
62
FastClaw是一个面向云原生多租户场景的轻量级Agent运行框架。它通过存算分离的架构,让Agent无需常驻,而是根据请求动态挂载sandbox提供服务。实测显示,将托管服务从OpenClaw迁移到FastClaw后,服务器数量从18台降至3台,运营成本降至约1/6。此外,FastClaw代码体积约为OpenClaw的1/40,运行资源占用约为其1/7,支持单二进制分发和秒级启动。这个框架非常适合处理批量任务。

idoubi: 我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR ...

智能体GitHub开源/仓库部署/工程
23:34
SenseTime@SenseTime_AI
同事件精选67
SenseNova新模型解决AI图表生成难题

大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。

GitHubHugging Face图像生成模型发布
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:大部分AI生成的图表都有标注错误或比例失调,商汤这个模型专攻信息图准确性,对常做图表的产品人和分析师来说值得一试。
17:48
AYi@AYi_AInotes
39
学生与开源维护者的免费AI福利合集

GitHub Student Developer Pack为在校学生提供一次申请即可免费使用100+开发工具的机会,总价值超过$1000,其中包含价值$100/年的GitHub Copilot、$250/年的JetBrains全家桶及$100 Azure云额度等。同时,任何公开开源项目的维护者可申请免费获得6个月的ChatGPT Pro(价值$1200),门槛较低,只需有项目链接即可申请。

AYi: 免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...

GitHubOpenAI教程/实践
01:36
AYi@AYi_AInotes
71
GitHub学生大礼包2026年升级,总价值超$3500

GitHub 2026年学生大礼包全面升级,总价值提升至$3500+。核心福利包括:GitHub Pro永久免费、GitHub Copilot Pro无限使用、Cursor Pro 1年免费、JetBrains全家桶免费,以及DigitalOcean $200和Azure $100等云服务额度。申请门槛极低,13岁以上持有.edu邮箱即可,无项目要求。此外,开源项目维护者还可申请OpenAI提供的6个月免费ChatGPT Pro(价值$1200)。

AYi: 免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...

GitHubOpenAI教程/实践编码
5月31日
09:45
小互@xiaohu
73
用户开发的"中文小黑怪诞"正文配图生成 Skill,在 GitHub 周榜上位列第二。该项目原本是为自己 Notion 文档生成配图而开发,特点是 16:9 比例、白底手绘风格,并带少量红、橙、蓝三色批注。用户发现该项目意外上榜后,表达了对排名的惊喜与再接再厉的心情。

Ian (伊恩): 我的天!我的 Skill 在 GitHub 本周排第二啦! 刚刷到藏师傅项目冲到第一,我点进去一看,笑死,我这个也在榜上,排第二 就是这个中文小黑怪诞正文配图生成 Skill: http://github.com/helloianneo/i...

GitHub图像生成开源/仓库
5月30日
10:10
宝玉@dotey
44
冷知识:GitHub Copilot 里面的 Gemini 3.5 Flash Token 消耗按 14 倍算,与之相对的: - Claude Sonnet 4.6 (1x) - Claude Opus 4.8 (15x) - Gemini 3.1 Pro (1x) - GPT-5.5 (7.5x)
GitHub产品更新编码
06:42
ginobefun@hongming731
精选78
claude-design-card 是一款专为中文内容创作者设计的 Skill。它能将文字、URL 或文章直接转化为可发布的视觉卡片,如公众号首图、小红书图文卡、教程步骤卡等,支持 28 种布局与 10 种主题。其核心价值在于自动化了"写完文章"后最繁琐的流程:自动提炼重点、选择版式、生成 HTML 并截图成 PNG,替代了以往手动使用 Figma 或 Canva 等工具的步骤。该工具开源,适合经常撰写相关内容的创作者尝试。

撸毛吃猪脚饭: 昨天那个 md2wechat-skill 很多人收藏 今天再分享一个很适合中文创作者的 Skill:claude-design-card。 它可以把一段文字、一个 URL、一篇文章,直接生成能发出去的视觉卡片,比如公众号首图、小红书图文卡、...

GitHub图像生成开源/仓库

推荐理由:这个 Skill 把内容创作者最烦的「写文→排卡片→出图」流程直接打通了,28 种布局一键生成,做公众号和小红书的可以立刻收藏,关键不是好看是真省时间。
5月28日
02:00
Hao AI Lab@haoailab
精选70
🚀仅需7秒即可生成30秒1080p视频! 我们开源了FastVideo Dreamverse:基于单张NVIDIA B200 GPU和LTX-2模型,实现实时视频生成的氛围引导工具。 Repo: https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog: https://haoailab.com/blogs/fastvideo-dreamverse-release/
GitHub开源/仓库视频部署/工程

推荐理由:7秒钟出30秒1080p视频,而且完全开源,视频生成速度被拉到实时边缘,虽然B200不是人人有,但路线值得所有做视频产品的同行研究。
5月27日
22:30
meng shao@shao__meng
68
AI Agent 协作编排层:Alook

Alook 是一个开源协作平台,用于管理 AI 编码智能体。它将 Claude Code、Codex、OpenCode 等本地 CLI 智能体组织成一个拥有角色、邮箱和任务板的“AI 团队”。其核心理念是将组织轴从“项目”转向“人/角色”,让用户(作为CEO)通过邮件系统异步协调多位智能体(员工),实现跨任务的共享记忆与上下文持久化。平台采用本地优先执行与云端协作的架构,并包含三层记忆系统以积累经验。它作为始终在线的守护进程运行,支持团队自主处理任务。

Sumanth: Run your personal AI company with a team of AI agents! Alook is an open-source collaboration platform for AI coding agen...

智能体GitHub产品更新开源生态
10:09
Peter Steinberger 🦞@steipete
72
autoreview是我添加到技术栈中最具影响力的技能(仅次于http://crabbox.sh)。它能在PR合并前自动审查你的代码。 发现许多边缘情况。 有时运行数小时。
智能体GitHub教程/实践编码
08:27
Berryxia.AI@berryxia
56
oMLX发布v0.3.11:专注稳定性,打造"开箱即用"的本地AI体验

oMLX项目发布了v0.3.11版本,这是一个基于Apple MLX框架、旨在提升Apple设备端侧模型性能的项目。本次及前几轮更新均以在高内存压力下的稳定性为首要目标,开发者正呼吁用户对此进行更多测试。该项目由一位有全职工作的独立开发者维护,其核心目标是提供“开箱即用”的本地AI体验——让用户无需阅读文档或调整参数,甚至在模型下载过程中即可开始对话,从而降低本地AI的使用门槛。

Jun Kim: Just released oMLX v0.3.11. The last few updates have focused on stability as my top priority, and I'm planning to ship ...

GitHub产品更新开源/仓库端侧
00:27
Berryxia.AI@berryxia
74
Anthropic黑客松冠军团队开源AI编程工作台ECC

Anthropic黑客松冠军团队使用Claude Code耗时8小时开发出产品zenith.chat并赢得1.5万美元API credits。赛后,他们将背后的完整工作流开源为ECC项目。该项目包含61个智能体、246个技能和76个预设命令,并配备规则引擎、Hook系统、安全扫描器和MCP配置,支持Claude Code、Cursor、Codex等多平台。它提供了一套可让AI持续工作的完整工业级编程环境框架,而非简单的提示词集合,已完全开源在GitHub。

泊舟: Anthropic 黑客松冠军,把自己的 AI 编程工作台开源了。 项目叫 ECC。作者 Affaan Mustafa 和队友用 Claude Code 8 小时做出 http://zenith.chat 拿了冠军,后来把背后的工作流整理成...

智能体AnthropicGitHubMCP/工具
5月26日
09:54
向阳乔木@vista8
68
提示词安装与配置建议

推文指出,仅安装Waza技能集不够,需将其配置写入Agent.md文件,以便AI智能体更好地触发和应用。Waza是一个将工程习惯转化为技能的集合,近期吸收了大量真实项目经验,现已适用于Mac原生应用、CLI工具、Rust及Web开发。它支持Claude Code、Codex、Cursor和Pi作为智能体运行时,包含25个反模式,具备破坏性命令安全防护,并将获取内容视为不信任数据。其特点为8个技能、无框架、无遥测。安装更新可访问其GitHub仓库。

Tw93: 🥷 Engineering habits you already know, turned into skills AI agents can run. Waza absorbed a mass of real project lesso...

智能体GitHub教程/实践
08:53
meng shao@shao__meng
63
poteto的Cursor实践:验证是自动化的核心瓶颈

原重度Claude Code用户poteto转向Cursor,基于多模型协同更自然、上下文压缩速度更快、GUI更利于agentic coding等观察。她认为AI智能体像“失忆且智商不在线但可教的新员工”,其失败模式是教学机会。关键洞察是验证才是瓶颈,盲目并行多个智能体只是在加速生产低质量代码。她开源了技能集pstack,其核心元技能/poteto-mode可根据任务自动选择工作流,旨在封装工程严谨度以提升对智能体的信任。最终论点是:自动化边界取决于对智能体端到端处理能力(尤其是验证环节)的信任程度。

lauren: http://x.com/i/article/2057201109002059776

智能体GitHub大佬观点编码
00:23
向阳乔木@vista8
65
Quickshare工具升级:一键部署,解决AI内容微信分享难题

该推文介绍了Quickshare工具,用于将AI生成的HTML、Markdown等内容转化为可分享链接,以解决在微信中分享此类内容不便的问题。工具新推出基于Cloudflare的一键部署版本,并新增管理后台。用户可通过AI智能体安装部署,其核心功能还包括为链接添加密码保护,方便审核等场景。

GitHub开源/仓库部署/工程
5月25日
13:51
宝玉@dotey
50
Kimi官方推出了基于TypeScript和pi-tui重写的命令行工具kimi-code,替代了此前基于Python的kimi-cli版本。作者回顾了之前关于用Python重写失败的讨论,并提到目前正推动将一些在Claude Code上体验良好的功能整合到新工具中。项目已在GitHub开源。

Yufan Sheng: 翻译一下,Kimi 自己基于 Python 写的 kimi-cli,在今天换成了基于 Typescript 和 pi-tui 写的新 kimi-code。 已经在 PUA 对应的研发小哥哥加一些我在 Claude Code 上用得很爽的功能...

GitHub产品更新部署/工程
5月24日
06:07
Peter Steinberger 🦞@steipete
57
我正在重构代码库中一个较旧的部分(子代理),涉及大量代码,而自动审查已经运行了5小时,正在修复大量问题。
GitHub教程/实践编码
5月23日
23:51
向阳乔木@vista8
67
个人开发者tw93的开源实践与启示

个人开发者tw93在全职工作与家庭之余,独立开发了妙言、Pake、Mole等六款深受海外用户欢迎的开源工具。其产品均始于解决自身痛点,如Mole因精准清理程序员电脑缓存,超过70%的用户来自海外。tw93强调产品美学与极致完成度,并将工程实践与AI协作经验沉淀为开源技能库Waza。他的实践展示了如何通过解决真实问题、坚持开源社区协作以及将AI作为协作伙伴,构建具有全球影响力的项目。

GitHub大佬观点开源/仓库教程/实践
20:16
AYi@AYi_AInotes
72
别只收藏!AI编程提效的关键在于每日执行纪律

Karpathy 的 CLAUDE.md 因能将 AI 编程准确率从 65% 提升至 94% 而备受关注,其核心是四条对抗开发者本能、倡导“慢思考”的硬规则:先明确假设再编码、从最简方案入手、进行精准修改、以目标驱动执行。然而,问题在于多数开发者仅将其存入收藏夹后便遗忘。真正的价值并非保存文件,而是将这 65 行规则转化为每日自查的工程纪律,通过持续执行形成复利,而非依赖一时的收藏行为。

AYi: Damn,这个必须卧槽一下了,Karpathy 的 CLAUDE.md 只有 65 行, 居然能把 AI 编程准确率从 65% 拉到 94%, 以22 万星标登顶 GitHub 趋势榜,而且绝大多数开发者还没读过, 里面没有一行奇技淫巧,4...

GitHub教程/实践编码
10:51
向阳乔木@vista8
68
开源GEO系统GEOFlow 2.0发布,从工具升级为基础设施

开源GEO系统GEOFlow 2.0发布,一个月内GitHub星标超1.6k。此次关键版本升级,使其从内容生产工具演进为“GEO内容工程基础设施”。核心变化包括基于Laravel重构,实现多站点与多Agent管理;强化AI知识库与向量化检索;新增统一的数据分析页面,构建运营闭环。系统旨在帮助用户持续建设“可信内容资产”,并秉承“利他就是利己”的开源理念。

姚金刚: 经过一个月的持续迭代,第一套GEO系统"GEOFlow 2.0"正式上线,GitHub地址见文末 一个月前,GEOFlow 1.0 上线,到现在,刚好过去一个月,Star数已经超过1.6k,这一个月来,收到了不少朋友的反馈和落地实践案例 这...

智能体GitHub开源/仓库搜索
5月22日
14:47
小互@xiaohu
71
网易有道开源双模型,聚焦工程精度与落地成本

网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。

GitHubHugging Face多模态开源生态
‹ 上一页
123456
下一页 ›