AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 526 条
全部一手资讯X论文
标签「开源/仓库」清除
Berryxia.AI@berryxia · 5月10日54

推荐,可以试试。 docu. md 阅读插件👇

译针对“HTML比Markdown更适合AI”的言论,开发者@xicilion表示反对,并力荐其开发的docu.md阅读插件。他开发此插件旨在证明Markdown同样优秀,并希望推广这个自认为非常强大的工具。主推文作者对此表示认可并进行了推荐。

阿绎 AYi@AYi_AInotes · 5月10日72

Damn,房地产行业要被掀翻了。 有个老哥直接用手机把一整栋房子给扫描了,然后上传到网上, 现在,全世界任何地方的任何人,打开浏览器就能进去溜达。 不用装App,不用VR头盔,不用中介,不用约时间。 点一下 → 你就进去了, 每个房间,每个角度,每处阴影,照片级的真实。 数据夸张到离谱: •一套50万刀的房,中介费:1.5万刀 •做一次这种扫描的成本:大概200刀 •“看完”50套房的时间:一个晚上 •文件大小:比一个TikTok视频还小 背后的技术更野: 这叫“3D高斯泼溅”,不是用多边形(游戏那种渲染),它用了数百万个微小的、带颜色和深度的“光点”。 AI直接用你拍的照片重建现实。结果在手机上就能加载,看着就跟身临其境一样。 搞钱的机会更是野疯了: 自由职业者已经开始接活了,给房产中介、Airbnb房东、活动场地、车行、博物馆做扫描,一次收300到800刀。 一个人 + 一部手机 + 一个周末 = 一门生意。 开源项目。基于 PlayCanvas 构建。GitHub 上免费,地址老规矩评论区自取👇

译一项名为“3D高斯泼溅”的技术,允许用户仅用手机扫描整栋房屋,即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧,为房产等行业带来新机会。同时,AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平,其通过构建专用工具集而非依赖通用模型硬记规则的方法,为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

Berryxia.AI@berryxia · 5月9日76

YC CEO Garry的这套知识复利效应就像滚雪球一样! 系统开源免费,逻辑清晰。 强烈按头学习了! Garry Tan(Y Combinator CEO)深夜 coding 到 2AM 的真实原因来了! AI 让他重新变回 builder,亲手造了一个 复利效应 的个人 AI 操作系统——GBrain。 他不再把 AI 当聊天窗口,而是当成了真正的“第二大脑 / 神经系统”。 过去 5 个月,他用这个系统完成了 20+ 本书的深度镜像、每次会议的自动预习、实体自动传播更新,以及 100,000 页结构化知识的持续生长。 核心案例拆解: 1. Book Mirror(书读我):拿 Pema Chödrön 的《When Things Fall Apart》为例,系统把 22 章全部提取出来,每章同时生成作者观点 + 针对 Garry 个人生活(移民家庭背景、YC 工作、治疗师对话、创始人对话)的精准映射。 整个过程 40 分钟完成,输出 3 万字双栏对照。后面每本书都会自动调用之前的镜像,上下文越来越厚。 2. Meeting Prep(会议自预习):Demis Hassabis 来 YC 聊天前,2 分钟内系统就拉出 Demis 完整脑页、AGI 时间线观点、 最新传记要点、与 Garry 观点的重叠/分歧,以及 3 个演示脚本和对话钩子。 3. Skillify 元技能:遇到重复工作流就说“技能化它”,系统自动把一次手动操作提炼成可复用 skill(含触发器、边缘案例、测试),注册到 resolver。 Book Mirror、Meeting Ingestion、Enrich 等 100+ skills 就是这样迭代出来的。 架构极简清晰: - Thin Harness:OpenClaw / Hermes Agent,只负责路由,几千行代码。 - Fat Skills:每个 skill 是一个 markdown 文件,专注单一任务,可组合、可迭代。 - Fat Data:100,000 页结构化脑页(人、公司、会议、书、文章全部链接),每天 100+ cron 自动更新。 - 模型可换:Opus 4.7 1M 做 precision,GPT-5.5 做 recall,DeepSeek V4-Pro 做创意,按 skill 自动选择。 Garry 直接把整套栈开源:GBrain + GStack + OpenClaw / Hermes Agent,GitHub 上 87k+ stars 的 coding 框架也包含在内。 他核心观点是:未来属于那些把 AI 建成 复利系统的人,不属于只用大厂聊天工具的人。 区别就像日记 vs. 真正的神经系统。 对所有想把 AI 真正融入工作流、做个人知识管理、或者构建 Agent 系统的 builder 来说,这篇长文 + 开源项目干货拉满,值得立刻去读和 fork。

译Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain,旨在将AI打造成具备复利效应的“第二大脑”。该系统通过“Book Mirror”、“Meeting Prep”等模块化技能,在五个月内深度处理了20多本书、自动预习会议,并管理着超10万页持续增长的结构化知识。其架构清晰,分为轻量路由层、可组合技能层与丰富数据层,并能按任务智能调用不同AI模型。Garry Tan强调,未来属于能构建此类复利系统的建造者,而非仅使用通用聊天工具的用户。

阿绎 AYi@AYi_AInotes · 5月9日82

Damn,Redis创始人用一个C文件,干翻了大厂烧几十亿的GPU集群。 Antirez,那个写出Redis的传奇黑客,昨天开源了ds4。 一个专门为DeepSeek V4 Flash写的原生推理引擎,只有几千行C代码。 它做到了一件很多人都觉得不可能的事: 把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型,完整跑在一台普通的128GB MacBook Pro上。 YC CEO Garry Tan看完直接转发,只说了一句话: “正在下载… 1M上下文+可用的coding agent能力,全在一台128GB MacBook上,这太疯狂了🤯” 这已经不是一个普通的量化项目那么简单了铁汁们, 属于顶级黑客用极致的系统工程,把闭源实验室烧几十亿才能玩的东西,压到了每个人的笔记本里。 他的三个黑客级操作,每一个都颠覆了行业常识: 1. 不对称2-bit量化: 只对MoE里占90%体积的专家部分做2-bit压缩,所有关键路径保持全精度。 质量损失极小,Antirez本人亲测“coding agent工作良好,能可靠调用工具”。 2. 把KV Cache扔到SSD: 很多人都觉得KV Cache必须放内存,1M上下文会直接炸掉128GB内存。 他直接把KV Cache搬到了苹果的高速SSD上,用磁盘当扩展内存,彻底突破了硬件天花板。 3. 纯Metal原生优化: 没有任何多余的封装, 没有通用框架的开销, 所有代码只为Apple Silicon写, 只为DeepSeek V4 Flash写。 实测性能:M3 Max 128GB上稳定27 tok/s。 不算快,但对本地跑agent循环来说,完全够用了。 你不用再给OpenAI付API费,不用再担心数据泄露,不用再忍受网络延迟。 所有的AI能力,完完全全在你自己的电脑里。 卧槽,这才是真正的革命, 过去AI的权力攥在少数几家大厂手里,他们有GPU集群,定价格,甚至说删就删。 现在,一个黑客用几千行C代码,就把这个权力还给了每一个开发者。 开源AI真的是不可阻挡的, 大厂烧几十亿训练出来的模型,只要权重一开源, 全世界的黑客就会用你想象不到的方式,把它优化到每一个能跑的设备上。 今天是MacBook,明天是手机,后天是手表,太让人兴奋了! 2026年5月9日,AI终于从云端的神坛,落到了每个人的笔记本里。 或许这一天,会被写进历史!

译Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。

向阳乔木@vista8 · 5月9日47

刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具,开源的一些项目。 很多人问各种工具和文档地址,我贴在评论区,方便大家使用。

Peter Steinberger 🦞@steipete · 5月9日31

We're working on some clever caching, @obviyus making Telegram loops 5-100x faster in @openclaw

译我们正在开发一些智能缓存技术,@obviyus 让 @openclaw 中的 Telegram 循环速度提升 5-100 倍。

SemiAnalysis@SemiAnalysis_ · 5月8日61

POV of @vllm_project maintainers optimizing DeepSeekv4 performance on day 0 and merging their initial model support PR over the weekend. SPEED IS THE MOAT

译@vllm_project 维护者在第0天优化DeepSeekv4性能 并在周末合并了他们的初始模型支持PR。 速度就是护城河

Rohan Paul@rohanpaul_ai · 5月8日78

atomic[.]chat just made Gemma 4 26B faster inside LLaMA.cpp. making token generation about 40% faster in its MacBook Pro M5 Max test. Great news for local llms, because LLaMA.cpp and GGUF sit close to the local AI user base, where support often spreads into desktop apps, coding agents, and private on-device assistants. MTP (maltai token prediction) is like a smaller assistant drafting the next few words, while the main model checks whether those words are acceptable. If the draft is correct, the system accepts several tokens quickly. If the draft is wrong, the system rejects the wrong part and falls back to normal generation.

译atomic.chat通过为LLaMA.cpp引入多令牌预测技术,大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案,由主模型进行验证。在MacBook Pro M5 Max上测试时,使Gemma 4 26B模型的令牌生成速度加快约40%,整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位,为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案。

Berryxia.AI@berryxia · 5月8日65

兄弟们,这项目真的有点意思啊! SuperSplat直接把3D Gaussian Splatting变成了真正能被大众分发的创作平台。 以前大家只能在线看,现在创作者一键开启“可下载”开关,观众就能直接把Gaussian splat文件拉回家 还能附加六种CC 4.0许可证,自动生成署名文字;个人页面还能加上网站、X、LinkedIn、YouTube链接,瞬间变成3D作品集。 下载后的splat还能直接拖进PlayCanvas引擎,马上开始做交互体验。 免费开源、零门槛,这波更新直接把3DGS从实验室玩具推向了普通创作者。

译SuperSplat项目将3D Gaussian Splatting技术转化为大众可用的创作与分发平台。其核心功能是允许创作者一键开启文件下载,观众可直接获取Gaussian splat文件。平台支持附加多种CC 4.0许可证并自动生成署名,个人页面可集成社交链接,成为3D作品集。下载的文件能直接导入PlayCanvas引擎快速创建交互体验。该项目免费开源,旨在降低技术门槛,推动3DGS从实验室走向普通创作者的实际应用。

凡人小北@frxiaobei · 5月8日81

好东西,我的龙虾已经用上了✌️

译作者宣布,将新书《AI营销:从SEO到GEO》中配套的25个AI营销与GEO相关提示词开源至GitHub。此次更新还补充了部分短视频和文案相关的提示词,所有资源已在指定仓库公开,供用户下载使用或重新拉取。

Berryxia.AI@berryxia · 5月7日76

现在这个AI的节骨眼上! 生成速度的突破,比单纯堆参数量重要多了。 SenseNova-U1刚刚开源了一个8-step distilled LoRA,直接把100步生成过程压到8步,GPU推理时间从23秒暴降到2秒,速度直接提升11倍。 更实用的是,他们还完整支持了 ComfyUI,并放出了一整套现成workflow:文本生图、图像编辑、交错生成全都有,开箱即用。 这波操作,直接把扩散模型从“实验室玩具”拉到了“真能日常用”的阶段。 你觉得未来扩散模型的竞赛,是继续卷参数,还是卷速度和实用性?

译SenseNova-U1开源了一项8步蒸馏LoRA技术,将扩散模型的生成步骤从100步压缩至8步,使GPU推理时间从23秒大幅缩短至2秒,速度提升达11倍。该技术同时完整支持ComfyUI,并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化,引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论。

小互@xiaohu · 5月7日82

好东西,收藏了

译开发者@yaojingang将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词,包括简易版和进阶版。开发者表示后续将持续在该仓库更新经过验证的有价值提示词。

Berryxia.AI@berryxia · 5月7日73

刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊! OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。 完全不用联网、不用交月费,还支持131K超长上下文。 日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。 非常适合公司的一些部门使用啊! 以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。 模型直达👉 https://huggingface.co/manjunathshiva/gpt-oss-20b-tq3

向阳乔木@vista8 · 5月7日76

Open Slide:让 AI 来写你的 PPT 代码 看到个开源项目,用React框架写PPT,整个工作流完全为AI Agent设计。 相比HTML生成PPT,React组件更多,扩展性更好,各种图表组件都能用。 1. 提供可视化编辑器,每个元素都能手动修改。 2. 用户给出修改评论,AI自己读评论,一起修改。 集成 SVGL,一个收录了 1500+ 品牌 Logo 的库,写技术PPT就不用到处找Claude、Codex、Cursor、Gemini CLI的Logo了。 本地跑了下,感觉是想要的产品! Github见评论

译开源项目 Open Slide 基于 React 框架构建 PPT,其工作流专为 AI Agent 设计。它利用丰富的 React 组件库实现更强扩展性,便于集成各类图表。核心功能包括可视化编辑器支持手动修改,以及 AI 能直接读取用户评论并协同修改内容。项目还集成了包含 1500+ 品牌 Logo 的 SVGL 库,方便技术演示,旨在提升 PPT 制作的效率与自动化程度。

向阳乔木@vista8 · 5月7日70

Flue :又一个Agent开发框架。 开发类似Claude Code风格的智能体,基于TypeScript。 想折腾开发自己Agent的朋友可以试试。 安装超级简单,官方提供了Prompt: fetch https://flueframework.com/start.md to create a new agent

OpenClaw🦞@openclaw · 5月7日48

OpenClaw 2026.5.6 🦞 🩺 doctor leaves Codex OAuth routes alone 🔌 plugin fetch handles odd headers 🌐 web_fetch cleans up timeouts Small maintenance release: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

译OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置 小型维护版本发布: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

Rohan Paul@rohanpaul_ai · 5月7日68

A new open-source tool is trying to make LLM bad behavior measurable. iFixAi is an open-source test kit (Github link in comment) for checking whether an AI agent behaves reliably before a company ships it to real users. You get a repeatable, fixture-driven diagnostic with 32 inspection-tests across 5 risk categories. Those tests ask practical questions: does the AI invent facts, follow unsafe instructions, change answers for no good reason, hide uncertainty, or act differently when the wording slightly changes? A fixture is just the test scene, meaning the fake users, roles, tools, permissions, documents, and rules that mimic the company’s real product. The big deal is repeatability, because iFixAi saves the exact model, prompts, rubrics, judge setup, and test inputs, so another engineer can rerun the same test and verify the same result. The point is not to prove an AI is “safe,” but to catch regressions, compare vendors fairly, and give compliance teams evidence instead of screenshots and opinions. Run the same fixtures, compare the same categories, and see whether the system’s behavior has moved.

译开源测试套件iFixAi通过模拟真实产品场景的测试夹具,为AI代理在部署前提供可重复、标准化的可靠性评估。它在五大风险类别下运行32项检查,评估模型是否捏造事实、遵循不安全指令、无故更改答案、隐藏不确定性或在措辞微调时行为不一致。其核心价值在于可重复性,能完整保存模型、提示词、评判标准和输入,确保不同工程师可复现相同结果。该工具主要目标并非证明AI绝对安全,而是用于捕捉性能退化、公平比较不同供应商模型,并为合规团队提供基于证据的客观报告。

Chubby♨️@kimmonismus · 5月7日76

OrcaRouter-Lite just launched open source. MIT. BYOK. Self-hosted. Zero markup. The real unlock: model="auto" picks the cheapest capable model, with deterministic prompt caching across providers. Every LLM team has been hand-rolling some messy version of this for the last two years. Now it’s basically one base_url change. Your keys, cache and router ♥

译OrcaRouter-Lite 现已开源,这是一个采用MIT许可、可自托管的大型语言模型路由工具。它支持用户自带密钥,无需外部数据库,并能对接OpenAI、Anthropic、Google、Groq等多种服务提供商。其核心创新是model="auto"模式,可自动为每次请求选择成本最低且能力匹配的模型,并具备跨提供商的确定性提示缓存功能,使得重复的相同请求能在毫秒内以零成本返回。该项目旨在解决开发团队手动编写复杂模型选择逻辑的痛点,通过简单的Docker部署即可实现路由功能,托管版本将于本周稍晚推出。

宝玉@dotey · 5月7日58

OpenAI 把训练 ChatGPT 用的网络协议开源了。https://x.com/OpenAI/status/2052025533937103102/video/1 这套协议叫 MRC(Multipath Reliable Connection,多路径可靠连接),由 OpenAI 联合 AMD、博通、英特尔、微软、英伟达共同开发,通过 OCP(开放计算项目,业内最大的开源硬件标准组织)开放给全行业。AMD、博通、微软、英伟达同步发了配套博文。 训练大模型,几万到十几万张 GPU 要保持步调一致。一次训练步可能涉及几百万次数据传输,只要有一笔晚到,所有 GPU 都得干等。集群越大,链路抖动和故障越频繁。 传统网络的麻烦:一条链路挂了,整个训练任务可能崩掉,得回到上一个检查点重跑;交换机重新算路由要花好几秒甚至几十秒。OpenAI 在搭 Stargate(其大型算力基础设施项目)这种规模的集群时,遇到的第一个瓶颈就是网络。 过去一笔传输只走一条路径,MRC 改成把数据包拆散,同时分头走几百条路径,目的地再按内存地址重新拼起来。 链路出问题,微秒级就能绕开,不需要交换机重算路由表。OpenAI 还把动态路由协议(BGP)整个砍掉,改用 SRv6 源路由:发送方直接指定每个包走哪条路,交换机退化成"无脑"转发器,故障面大幅缩小。 网络结构因此简化。原本要 3 到 4 层交换机才能连起十几万张 GPU,MRC 的多平面设计 2 层就够,功耗、成本、故障点全降。 MRC 已经部署在 OpenAI 所有最大的英伟达 GB200 超算上,包括 Stargate 在德州 Abilene 与甲骨文合建的站点,以及微软 Fairwater 数据中心。多个 OpenAI 模型用它训练出来。 最直观的例子:最近一次前沿模型训练(服务 ChatGPT 和 Codex)期间,团队重启了 4 台核心交换机,不需要跟训练团队协调;每分钟还有多次链路抖动,对训练任务也没有可测量的影响。换以前,这种事故足以让整个任务崩溃。

译OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。

Berryxia.AI@berryxia · 5月7日66

Agent team 各自展示技能! 来吧!

译Downy是一个开源的自托管多agent协作平台,运行在Cloudflare Durable Objects上。它允许用户搭建具有不同性格、技能和工具的agent团队,所有管理操作均通过应用程序完成,无需使用CLI或Obsidian等外部工具。该平台支持跨设备访问,旨在简化多agent系统的部署和协作流程。

Berryxia.AI@berryxia · 5月6日74

我靠!高手果然在民间! 比Google 官方还快3 x,那真的要起飞了。

译一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

Berryxia.AI@berryxia · 5月6日75

我靠!Warp 这个Skills 太顶了! 直接官方开源啊! Warp团队居然把他们日常用来大幅提效的内部「Skills」全部开源了! 一条命令就能直接装上15个高质量生产级技能: npx skills add warpdotdev/oz-skills 里面包含: • SEO & 无障碍审计 • 文档自动写作 • Terraform / DevOps 配置 • GitHub Issue 处理 ……等等真实能落地的工具 视频里演示的SEO审计已经能直接给出具体优化建议。 他们没把这些好东西藏着当私有武器,而是直接扔给整个社区。 这才是真正的开放精神。 想贡献自己的Skill?GitHub已开放: https://github.com/warpdotdev/oz-skills

译Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 `npx skills add warpdotdev/oz-skills` 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区,而非私有化,体现了开放精神。项目 GitHub 仓库已开放,并鼓励社区贡献。

SenseTime@SenseTime_AI · 5月6日71

🚀 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮-𝗨𝟭 𝘂𝗽𝗱𝗮𝘁𝗲: ⚡ 𝗢𝗽𝗲𝗻-𝘀𝗼𝘂𝗿𝗰𝗲𝗱 𝗮𝗻 𝟴-𝘀𝘁𝗲𝗽 𝗱𝗶𝘀𝘁𝗶𝗹𝗹𝗲𝗱 𝗟𝗼𝗥𝗔: 100 NFE → 8 NFE, cutting H100 inference from 𝟮𝟯𝘀 𝘁𝗼 𝟮𝘀 🧩 𝗖𝗼𝗺𝗳𝘆𝗨𝗜 𝗶𝘀 𝗻𝗼𝘄 𝘀𝘂𝗽𝗽𝗼𝗿𝘁𝗲𝗱, with ready-to-run workflows for t2i, image editing, and interleaved generation Try it out 👇 https://github.com/OpenSenseNova/SenseNova-U1/

译🚀 SenseNova-U1 更新: ⚡ 开源8步蒸馏LoRA:100 NFE降至8 NFE,H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI,提供文生图、图像编辑和交错生成的即用工作流 试用链接 👇 https://github.com/OpenSenseNova/SenseNova-U1/

小互@xiaohu · 5月6日63

嫌弃你的Codex 宠物太丑? 这个项目能帮你,它能给你的 Codex 换“终端小宠物” Petdex:一个Codex Pets 的宠物商店 你可以预览、下载、提交各种可以在 Codex 里使用的动态小宠物 用法很简单,选择你喜欢的宠物比如: npx petdex install boba 意思就是把一个叫 boba 的宠物装到你的 Codex 里... 然后你可以在 Codex 里进入 Settings → Appearance → Pets 选择宠物,也可以用 /pet 命令唤出或收起宠物。

译Petdex是一个专为Codex设计的宠物商店项目,允许用户更换终端小宠物。用户可预览、下载和提交各种动态宠物,通过命令行工具如'npx petdex install <宠物名>'快速安装。在Codex中,可通过Settings → Appearance → Pets界面选择宠物,或使用/pet命令唤出或收起宠物,实现个性化终端体验。

Chubby♨️@kimmonismus · 5月6日54

NVIDIA just open-sourced a transport protocol that powers OpenAI's Blackwell clusters. It opened MRC, a new RDMA transport protocol for massive AI training clusters. Instead of pushing GPU traffic through one fragile path, MRC spreads a single connection across multiple network paths. If one path fails or gets congested, traffic can be rerouted in hardware within microseconds. This is important because frontier training is no longer only about GPUs. The network is becoming one of the biggest bottlenecks in AI factories. OpenAI is already using MRC on Blackwell clusters. Microsoft and Oracle are also named by NVIDIA as major deployments. NVIDIA is pushing Ethernet into territory historically associated with InfiniBand. And by opening MRC through OCP, while optimizing it first for Spectrum-X, NVIDIA is making a smart platform move: more open standard on the surface, stronger full-stack NVIDIA advantage underneath.

译NVIDIA通过OCP开源了MRC协议,这是一种专为大规模AI训练集群设计的新型RDMA传输协议。其核心创新在于将单一连接分散到多条网络路径上,当某条路径出现故障或拥塞时,能在微秒级时间内通过硬件重路由流量,以解决前沿AI训练中日益严峻的网络瓶颈问题。该协议已应用于OpenAI的Blackwell集群,微软和Oracle也是其主要部署方。NVIDIA此举在表面推动更开放标准的同时,优先为自家Spectrum-X平台优化,实则强化了其全栈竞争优势,并将以太网技术推向传统上由InfiniBand主导的高性能计算领域。

小互@xiaohu · 5月6日69

Mininglamp-AI @Mininglamp 开源了两个很有意思的项目: Cider 和 Mano-P 一个解决“Mac 本地跑 AI 怎么更快” 一个解决“AI 怎么真正操作电脑” 可以让你的 Mac 不只是运行 AI,而是成为本地 AI 工作站 很多人用 Mac 跑本地模型,会遇到一个问题: 芯片很强,但模型跑起来没有想象中那么快 Cider 做的事情,就是把 M5 芯片里的 INT8 TensorOps 更充分用起来,让 LLM / VLM 推理更快、更省内存 Mano-P 则是一个 GUI-VLA Agent,面向端侧设备,可以在 Mac mini / MacBook 上本地推理 它不是只能操作浏览器,还能操作桌面软件、网页界面、专业工具和复杂图形化工作流 支持复杂 GUI 自动化、跨系统数据整合、长任务规划执行、智能报告生成、自主应用构建 技术路径是纯视觉 GUI 操作,截图和任务数据可以不出设备 Cider 解决的是: Mac 本地模型怎么跑得更快、更省内存 Mano-P 解决的是: AI 怎么像人一样看屏幕、操作电脑、完成任务 一个是端侧推理加速框架 一个是端侧 GUI Agent 模型 合起来,就是一套私有 AI 的本地基础设施 下面是 Mano-P系统在麻将游戏中的应用:通过纯视觉理解游戏界面,自主完成识牌、分析和决策。

译Mininglamp-AI开源了两个核心项目,旨在将Mac打造为本地AI工作站。Cider是一个端侧推理加速框架,通过更充分利用M系列芯片的INT8 TensorOps,显著提升LLM/VLM等模型在Mac上的运行速度并降低内存占用。Mano-P则是一个端侧GUI-VLA Agent模型,采用纯视觉方式理解屏幕,能在本地操作各类桌面软件、网页、专业工具及复杂图形化工作流,实现自动化任务执行与数据整合。两者结合,为私有AI提供了高效的本地基础设施。

Xiaomi MiMo@XiaomiMiMo · 5月6日59

MiMo V2.5 🥰🥰

译MiMo V2.5 🥰🥰 [引用 @Designarena]:突发:小米MiMo-V2.5在设计竞技场开放权重模型中综合排名第六! 其Elo评分为1297,与@Kimi_Moonshot的Kimi K2.5(思考版)处于同一性能区间。 祝贺@XiaomiMiMo团队发布成功!

向阳乔木@vista8 · 5月6日70

搞定了,随时粘贴排版多张图,完成后插入文章或导出。

译针对教程写作中拼接多张图片需借助Figma等工具过于笨重的问题,开发者通过与AI讨论,获得使用HTML5 Canvas库的解决方案。现已将该功能整合到Markdown编辑器中,用户可直接在编辑器内完成多图拼接,随后将拼合好的图片插入文章或导出。相关代码已开源至Github项目。

向阳乔木@vista8 · 5月6日47

写教程时,经常需要拼接多张图,如果打开Figma处理就很笨重。 跟AI讨论,它推荐了一个HTML5 Canvas库。 打算把它整合到Markdown编辑器,拼好图再插入文章中。 Github项目见评论区

译作者在撰写教程时,常需拼接多张图片,但使用Figma等工具较为笨重。在与AI讨论后,其推荐了一个HTML5 Canvas库来解决此问题。作者计划将该库整合到Markdown编辑器中,以便直接在编辑环境内完成图片拼接,再将结果插入文章,从而简化工作流程。相关Github项目链接可在评论区查看。

Peter Steinberger 🦞@steipete · 5月6日68

Me and codex were busy. 🔊 http://sonoscli.sh — Sonos 🗃️ http://wacli.sh — WhatsApp 🪶 http://birdclaw.sh — X archive 🧰 http://gitcrawl.sh — GitHub archive 🛰️ http://discrawl.sh — Discord archive 🎧 http://spogo.sh — Spotify 💬 http://imsg.sh — iMessage 🧳 http://mcporter.sh — MCP to CLI 🗣️ http://sag.sh — ElevenLabs voice 🧿 http://askoracle.sh — second opinion Upgrading the 🦞 OpenClaw army.

译我和codex正忙着。 🔊 http://sonoscli.sh — Sonos 🗃️ http://wacli.sh — WhatsApp 🪶 http://birdclaw.sh — X存档 🧰 http://gitcrawl.sh — GitHub存档 🛰️ http://discrawl.sh — Discord存档 🎧 http://spogo.sh — Spotify 💬 http://imsg.sh — iMessage 🧳 http://mcporter.sh — MCP转CLI 🗣️ http://sag.sh — ElevenLabs语音 🧿 http://askoracle.sh — 第二意见 升级🦞 OpenClaw大军。

Peter Steinberger 🦞@steipete · 5月6日36

CodexBar 0.24 is live 🤖 New Windsurf, Codebuff + DeepSeek providers 👥 Copilot multi-account switching 🧹 Opt-in local storage breakdowns 🔋 Hung Codex RPC + redraw battery drain fixed Tiny menu bar, ridiculous changelog. https://github.com/steipete/CodexBar/releases/tag/v0.24

译CodexBar 0.24 已发布 🤖 新增 Windsurf、Codebuff + DeepSeek 提供商 👥 Copilot 多账户切换功能 🧹 可选本地存储详情查看 🔋 修复 Hung Codex RPC 及重绘导致的电量消耗问题 小巧的菜单栏,离谱的更新日志。 https://github.com/steipete/CodexBar/releases/tag/v0.24

SemiAnalysis@SemiAnalysis_ · 5月6日58

For the past 12 years, cuDNN has been completely closed sourced (besides the .h files), until this week! OVER 20 MoE kernels & NSA sparse attention kernels from cuDNN has been open sourced! Great work to @manicely6005 & the rest of the team on seeing that parts of NVIDIA are moving towards open kernels! open source kernels drive innovation! (1/3) 🧵

译过去12年间,cuDNN一直完全闭源(除.h文件外),直到本周!超过20个MoE内核及NSA稀疏注意力内核已从cuDNN开源!感谢@manicely6005及团队其他成员的卓越工作,让我们看到英伟达的部分技术正朝着开放内核的方向迈进!开源内核驱动创新!(1/3) 🧵

meng shao@shao__meng · 5月6日80

Warp 团队这是要把开源进行到底了,在 Warp、Doc 开源后,又把团队用于加速工作流的 Oz Skills 开源了 @warpdotdev 👏🏻👏🏻 # Warp 团队的 15 个 Skills https://github.com/warpdotdev/oz-skills 1. Git/GitHub 协作流(最成熟的一类) · create-pull-request:检查 gh CLI、分析 commits、按项目惯例生成 PR 描述。 · ci-fix:定位失败的 GitHub Actions run → 拉日志 → 最小化修复 → 推到 ci-fix/<branch> 分支验证。强调"最小 diff"和不放宽 workflow 权限的安全约束。 · github-bug-report-triage:照 issue template 评估 bug 报告的可执行性,反馈缺失信息。 · github-issue-dedupe:用 gh search + 关键词/语义混合策略找重复 issue,可挂到 GitHub Action 里自动跑。 2. 数据/分析 · dbt-model-index:一份模板化的 dbt 模型索引(不是现成数据,而是教用户填自己的仓库结构),让 Agent 写 BigQuery SQL 前先选对表。 · analysis-artifacts:把"深度分析"流程标准化——analyses/<name>/ 目录下产出 SQL、可视化、README,确保结果可复现可分享。 3. Web 质量审计(直接调用 MCP 工具) · web-performance-audit:依赖 chrome-devtools-mcp,跑 Core Web Vitals、网络优化。 · web-accessibility-audit:按 WCAG POUR 原则审 a11y。 · seo-aeo-audit:技术 SEO + AI 引用优化(AEO,面向 LLM 检索时代的新概念)。 · webapp-testing:用原生 Playwright 脚本测本地 web 应用,自带 with_server.py 管服务生命周期。 4. 基础设施 / 工程规范 · terraform-style-check:照 HashiCorp 官方风格生成/审查 Terraform。 · mcp-builder:最厚的一个 skill——四阶段教 Agent 构建高质量 MCP server(Python FastMCP 或 TS SDK),重点强调 "workflow tools" 比 "API coverage" 更重要的设计哲学。 5. 通用生产力 · docs-update:扫描近 24h commits → 识别需要更新文档的变更 → 适配 Mintlify/Docusaurus/GitBook 等平台。 · scheduler:本地定时提醒(明确不做云端 agent 调度,划清边界)。 · slack-qa-investigate:只读模式深度调查代码并回答问题,强调"先验证再回答"。

译Warp团队在开源终端和文档工具后,进一步开源了内部使用的15个“Oz Skills”工作流加速工具集。这些工具覆盖五大领域:Git/GitHub协作(如自动创建PR、修复CI问题)、数据分析与标准化、Web质量审计(性能、无障碍访问、SEO/AEO)、基础设施规范(如Terraform风格检查)以及通用生产力(如文档更新、本地定时提醒)。团队强调其设计哲学是构建“工作流工具”而非简单API覆盖,并提供了便捷安装命令,旨在将提升内部效率的实践分享给开源社区。

Berryxia.AI@berryxia · 5月6日72

OpenAI这次居然主动把Agent的“控制权”彻底交给了开发者,而不是继续藏在黑盒里。 Agents SDK重磅升级,专为长时运行Agent量身打造三大杀手级能力: • 在受控沙箱里运行(支持Cloudflare、Vercel、Modal、E2B等多家提供商) • 可完全检查和自定义开源harness • 精准控制什么时候创建记忆、存在哪里 文件、凭证、执行状态全在你自己的环境里,模型只拿到经过批准的上下文。 这意味着: 以前Agent动不动就“失控”或“失忆”的时代,正式结束了。 从demo玩具到生产级基础设施,只差这一步。 OpenAI这次直接把Agent的工程化门槛又拉低了一大截。

译OpenAI对其Agents SDK进行重大升级,旨在为构建长时运行Agent提供更强的执行控制能力。核心在于将控制权交给开发者,打破黑盒状态。新功能包括:在受控沙箱环境中运行Agent,支持多家云服务商;允许完全检查和自定义开源harness;以及精准控制记忆的创建时机与存储位置。所有文件、凭证和执行状态均保留在开发者自有环境中,模型仅能访问经批准的上下文。此举解决了Agent易“失控”或“失忆”的问题,显著降低了工程化门槛,推动其从演示原型迈向生产级基础设施。

宝玉@dotey · 5月6日77

open-slide 这个开源的 Slides 项目不错,可以通过 Agent + Skills 制作 Slides,然后还有一个 Web 程序可以编辑生成好的 Slides。 并且可以支持动画,以及网页直接播放 slides。 期待完善: - 更好的编辑 - 导出 pptx https://github.com/1weiho/open-slide

Peter Steinberger 🦞@steipete · 5月5日74

🤖 Kept hitting @github rate limits across my agents. Shipped two things: – RepoBar got a JUICE METER – gitcrawl is now also a drop-in gh cache → symlink it as gh, reads served from local SQLite https://gitcrawl.sh/ https://repobar.app/

译🤖 我的多个智能体一直遇到 @github 的速率限制问题。现已发布两项更新: – RepoBar 新增了 JUICE METER 功能 – gitcrawl 现已可作为即插即用的 gh 缓存 → 将其符号链接为 gh,即可从本地 SQLite 读取数据 https://gitcrawl.sh/ https://repobar.app/

Peter Steinberger 🦞@steipete · 5月5日60

gog 0.16 is out. Google Workspace CLI for humans and agents. Lossless raw API output, sanitized Gmail reads, safer command profiles, Drive inventory, Docs tabs, Sheets tables, Gmail filter export, and official Docker images. https://gogcli.sh

译gog 0.16 版本现已发布。 面向人类与智能体的 Google Workspace 命令行工具。 无损原始 API 输出、净化的 Gmail 读取功能、更安全的命令配置、Drive 库存管理、Docs 标签页、Sheets 表格处理、Gmail 过滤器导出,以及官方 Docker 镜像。https://gogcli.sh

Berryxia.AI@berryxia · 5月5日75

Tom 总的最新 开源项目! 正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71 套 设计系统,支持所有的 code agent,包括 claude code、codex、openclaw 等 🔥 open design 可能是最全面复刻 claude design 的开源替代品,后续将保持持续的更新,开源地址 👉 https://github.com/nexu-io/open-design

译开发者 Tom 开源了 open claude design 项目,宣称对 Claude Design 的还原度超过 95%。该项目历时 72 小时开发,包含超过 18700 行代码和 30 多种设计技能,支持 71 套以上设计系统,并能兼容多种主流代码代理工具。项目旨在成为 Claude Design 的开源替代品,后续将持续更新,代码已托管于 GitHub。

阿绎 AYi@AYi_AInotes · 5月5日74

分享一个免费下载任何 YouTube 视频的GitHub开源项目,非常实用🔥 能做的事,放在一起看有点夸张, 输入:任意 YouTube 链接 ↓ 自动下载视频 ↓ 人声分离(干净去除背景音) ↓ 语音转文字 ↓ 翻译成 100+ 种语言 ↓ 克隆原始声线 ↓ 自动配音合成 输出:完整配音视频 全程:< 2 分钟 以前这条流水线要什么,先用yt-dlp 下载,再用Audacity 分离人声,然后用Whisper 转录,再用DeepL 翻译,接着用ElevenLabs 克隆声线,最后再手动合成, 光订阅费加起来就不便宜, Voice-Pro 把这六步压成一个本地工具,100% 跑在自己机器上,数据不出门,免费, 我觉得对做多语言内容的创作者来说,这个工作流改变挺明显的, 老规矩GitHub地址评论区自取👇

译开源项目Voice-Pro将多语言视频创作流程大幅简化。用户输入YouTube链接后,该工具可在本地自动完成视频下载、人声分离、语音转文字、翻译、声线克隆及配音合成,全程不到两分钟。它将原本需要多个付费工具协作的复杂流程,整合为一个免费、本地化的高效解决方案,显著提升了创作者的工作效率。

meng shao@shao__meng · 5月5日66

KroWork 最值得关注的点,是它的 chat-to-software:利用内置 20+ Skills 端到端自动化执行完成任务。 每一次对话都会变成本地运行的 Kro App,像本地软件一样安装使用,一键复用——节省 token 和时间。 想法进,软件出。原生桌面级体验。零代码。

译KroWork的核心创新在于“chat-to-software”模式,旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体,能通过20多种内置技能端到端自动化执行任务,并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单,像常规软件一样运行,且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成,保障数据隐私,无需云端依赖,用户也无需具备编程背景即可创建属于自己的可复用软件。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月10日
07:44
Berryxia.AI@berryxia
54
针对"HTML比Markdown更适合AI"的言论,开发者@xicilion表示反对,并力荐其开发的docu.md阅读插件。他开发此插件旨在证明Markdown同样优秀,并希望推广这个自认为非常强大的工具。主推文作者对此表示认可并进行了推荐。

响马: 我为什么反对 html 比 markdown 更适合 ai 的言论呢? 因为我费老大劲开发了 https://docu.md 我要让更多人知道这个超腻害的阅读插件。😇

产品更新开源/仓库部署/工程
00:32
阿绎 AYi@AYi_AInotes
72
手机扫描与AI Agent技术颠覆房地产与专业领域

一项名为“3D高斯泼溅”的技术,允许用户仅用手机扫描整栋房屋,即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧,为房产等行业带来新机会。同时,AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平,其通过构建专用工具集而非依赖通用模型硬记规则的方法,为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

阿绎 AYi: 卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...

智能体GitHub开源/仓库教程/实践
5月9日
23:43
Berryxia.AI@berryxia
精选76
YC CEO开源个人AI操作系统GBrain,构建知识复利"第二大脑"

Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain,旨在将AI打造成具备复利效应的“第二大脑”。该系统通过“Book Mirror”、“Meeting Prep”等模块化技能,在五个月内深度处理了20多本书、自动预习会议,并管理着超10万页持续增长的结构化知识。其架构清晰,分为轻量路由层、可组合技能层与丰富数据层,并能按任务智能调用不同AI模型。Garry Tan强调,未来属于能构建此类复利系统的建造者,而非仅使用通用聊天工具的用户。

Garry Tan: http://x.com/i/article/2052898104039657472

智能体MCP/工具开源/仓库

推荐理由:Garry Tan这套个人AI系统不是PPT产品,是他每天用到凌晨2点的大脑外挂,开源且逻辑清晰,做AI工作流的值得立刻fork。
23:32
阿绎 AYi@AYi_AInotes
精选82
Redis创始人用C语言引擎将大模型"装进"个人电脑

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。

Garry Tan: Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is ...

DeepSeek开源/仓库推理端侧

推荐理由:Antirez用几千行C代码把DeepSeek V4 Flash塞进128G Mac,本地跑1M上下文coding agent,这才是真正的AI民主化时刻,开发者必试。
22:13
向阳乔木@vista8
47
刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具,开源的一些项目。 很多人问各种工具和文档地址,我贴在评论区,方便大家使用。
开源/仓库开源生态编码
20:27
Peter Steinberger 🦞@steipete
31
我们正在开发一些智能缓存技术,@obviyus 让 @openclaw 中的 Telegram 循环速度提升 5-100 倍。
开源/仓库编码
5月8日
11:06
SemiAnalysis@SemiAnalysis_
61
@vllm_project 维护者在第0天优化DeepSeekv4性能 并在周末合并了他们的初始模型支持PR。 速度就是护城河
DeepSeek开源/仓库推理部署/工程
08:06
Rohan Paul@rohanpaul_ai
精选78
atomic.chat为LLaMA.cpp引入多令牌预测技术,显著加速本地模型推理

atomic.chat通过为LLaMA.cpp引入多令牌预测技术,大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案,由主模型进行验证。在MacBook Pro M5 Max上测试时,使Gemma 4 26B模型的令牌生成速度加快约40%,整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位,为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案。

atomic.chat: Multi-Token Prediction (MTP) for LLaMA.cpp! Running Gemma4 local model 1.5x faster. We patched LLaMA.cpp. Quantized Gemm...

开源/仓库推理教程/实践端侧

推荐理由:在笔记本上把 Gemma 26B 的生成速度拉高 40% 是个真实的体验提升,atomic.chat 把 MTP 带入 LLaMA.cpp 生态,本地 AI 玩家可以直接拿去用。
07:21
Berryxia.AI@berryxia
65
SuperSplat将3D高斯泼溅变为大众创作平台

SuperSplat项目将3D Gaussian Splatting技术转化为大众可用的创作与分发平台。其核心功能是允许创作者一键开启文件下载,观众可直接获取Gaussian splat文件。平台支持附加多种CC 4.0许可证并自动生成署名,个人页面可集成社交链接,成为3D作品集。下载的文件能直接导入PlayCanvas引擎快速创建交互体验。该项目免费开源,旨在降低技术门槛,推动3DGS从实验室走向普通创作者的实际应用。

产品更新多模态开源/仓库
00:06
凡人小北@frxiaobei
精选81
作者宣布,将新书《AI营销:从SEO到GEO》中配套的25个AI营销与GEO相关提示词开源至GitHub。此次更新还补充了部分短视频和文案相关的提示词,所有资源已在指定仓库公开,供用户下载使用或重新拉取。

姚金刚: 和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https:...

GitHub开源/仓库搜索

推荐理由:不是又一个提示词合集,而是把《AI营销》书里的实操技巧拆成了现成指令,短视频和GEO部分尤其解渴,做内容营销的建议直接fork。
5月7日
23:21
Berryxia.AI@berryxia
精选76
SenseNova-U1开源8步蒸馏LoRA,扩散模型推理提速11倍

SenseNova-U1开源了一项8步蒸馏LoRA技术,将扩散模型的生成步骤从100步压缩至8步,使GPU推理时间从23秒大幅缩短至2秒,速度提升达11倍。该技术同时完整支持ComfyUI,并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化,引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论。

Ziwei Liu: 🚀SenseNova-U1 Update🚀 ⚡Open-source an 8-step distilled LoRA: 100 NFE → 8 NFE, cutting GPU inference from 23s to 2s 🧩C...

图像生成开源/仓库部署/工程

推荐理由:这个LoRA把扩散模型推理从23秒压到2秒,还带全套ComfyUI工作流,玩图像生成的人今天就应该装上去试试,速度飞升11倍是真的能立刻用上。
18:11
小互@xiaohu
精选82
开发者@yaojingang将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词,包括简易版和进阶版。开发者表示后续将持续在该仓库更新经过验证的有价值提示词。

姚金刚: 开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方便大家更好的下载和迭代,今天抽空,把公开的提示词整理了下,通过GitHub开源给大家 目...

开源/仓库教程/实践

推荐理由:一个把提示词真正用起来的实战者,把压箱底的100个prompt开源了,九个场景全覆盖。尤其元提示词把写提示词的思路直接拆给你,比收藏模板更有用。
17:20
Berryxia.AI@berryxia
73
开源20B参数MoE模型本地流畅运行

刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊! OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。 完全不用联网、不用交月费,还支持131K超长上下文。 日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。 非常适合公司的一些部门使用啊! 以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。 模型直达👉 https://huggingface.co/manjunathshiva/gpt-oss-20b-tq3

Hugging Models: A new GPT model just dropped for Apple Silicon. The gpt-oss-20b-tq3 is a 20B parameter MoE text generator, optimized wit...

Hugging FaceOpenAI开源/仓库部署/工程
10:12
向阳乔木@vista8
精选76
Open Slide:让 AI 来写你的 PPT 代码

开源项目 Open Slide 基于 React 框架构建 PPT,其工作流专为 AI Agent 设计。它利用丰富的 React 组件库实现更强扩展性,便于集成各类图表。核心功能包括可视化编辑器支持手动修改,以及 AI 能直接读取用户评论并协同修改内容。项目还集成了包含 1500+ 品牌 Logo 的 SVGL 库,方便技术演示,旨在提升 PPT 制作的效率与自动化程度。

智能体GitHub开源/仓库

推荐理由:用 React 写 PPT 的思路很妙,加上 1500+ 品牌 Logo 库,AI 生成演示文稿终于不是一坨屎了。做技术的可以 clone 下来跑跑看。
09:42
向阳乔木@vista8
70
Flue :又一个Agent开发框架。 开发类似Claude Code风格的智能体,基于TypeScript。 想折腾开发自己Agent的朋友可以试试。 安装超级简单,官方提供了Prompt: fetch https://flueframework.com/start.md to create a new agent
智能体开源/仓库
03:08
OpenClaw🦞@openclaw
48
OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置 小型维护版本发布: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6
智能体产品更新开源/仓库
02:04
Rohan Paul@rohanpaul_ai
68
开源工具iFixAi旨在量化评估AI代理的可靠性

开源测试套件iFixAi通过模拟真实产品场景的测试夹具,为AI代理在部署前提供可重复、标准化的可靠性评估。它在五大风险类别下运行32项检查,评估模型是否捏造事实、遵循不安全指令、无故更改答案、隐藏不确定性或在措辞微调时行为不一致。其核心价值在于可重复性,能完整保存模型、提示词、评判标准和输入,确保不同工程师可复现相同结果。该工具主要目标并非证明AI绝对安全,而是用于捕捉性能退化、公平比较不同供应商模型,并为合规团队提供基于证据的客观报告。

CyrilXBT: http://x.com/i/article/2052027135619919876

安全/对齐开源/仓库评测/基准
02:01
Chubby♨️@kimmonismus
精选76
OrcaRouter-Lite 现已开源,这是一个采用MIT许可、可自托管的大型语言模型路由工具。它支持用户自带密钥,无需外部数据库,并能对接OpenAI、Anthropic、Google、Groq等多种服务提供商。其核心创新是model="auto"模式,可自动为每次请求选择成本最低且能力匹配的模型,并具备跨提供商的确定性提示缓存功能,使得重复的相同请求能在毫秒内以零成本返回。该项目旨在解决开发团队手动编写复杂模型选择逻辑的痛点,通过简单的Docker部署即可实现路由功能,托管版本将于本周稍晚推出。

OrcaRouter: Every product team has a 30-line file in their codebase called pick_model.py. Nine if/else branches. Three retry decorat...

GitHub开源/仓库开源生态部署/工程

推荐理由:每个 LLM 团队都在手搓那个叫 pick_model.py 的烂摊子,现在改个 base_url 就搞定了。BYOK 自托管零加价,设计干净到反常,值得所有做产品的开发者立刻尝试。
00:34
宝玉@dotey
58
OpenAI 联合多家巨头开源 AI 训练网络协议 MRC

OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。

OpenAI: We've partnered with @AMD, @Broadcom, @Intel, @Microsoft, and @NVIDIA, to release Multipath Reliable Connection (MRC), a...

OpenAI开源/仓库部署/工程
00:20
Berryxia.AI@berryxia
66
Downy是一个开源的自托管多agent协作平台,运行在Cloudflare Durable Objects上。它允许用户搭建具有不同性格、技能和工具的agent团队,所有管理操作均通过应用程序完成,无需使用CLI或Obsidian等外部工具。该平台支持跨设备访问,旨在简化多agent系统的部署和协作流程。

Geek: 让你搭一个多 agent 团队,每个 agent 有自己的性格和技能,随便哪个设备都能用。 自托管的多 agent 协作平台,跑在 Cloudflare Durable Objects 上。每个 agent 有自己的性格、技能、工具和工作区...

智能体MCP/工具开源/仓库
5月6日
23:20
Berryxia.AI@berryxia
74
一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人: 这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash

Google开源/仓库开源生态推理
23:20
Berryxia.AI@berryxia
75
Warp 开源内部高效工具集 Skills,包含15个生产级技能

Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 npx skills add warpdotdev/oz-skills 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区,而非私有化,体现了开放精神。项目 GitHub 仓库已开放,并鼓励社区贡献。

Warp: The Warp team uses a lot of Skills to speed up our workflow, so we open-sourced them. > npx skills add warpdotdev/oz-ski...

MCP/工具开源/仓库部署/工程
22:36
SenseTime@SenseTime_AI
精选71
🚀 SenseNova-U1 更新: ⚡ 开源8步蒸馏LoRA:100 NFE降至8 NFE,H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI,提供文生图、图像编辑和交错生成的即用工作流 试用链接 👇 https://github.com/OpenSenseNova/SenseNova-U1/
图像生成开源/仓库推理模型发布

推荐理由:从100步到8步,23秒压到2秒,商汤这个蒸馏LoRA把U1的推理成本打下来了,做实时图像应用的可以认真看看,ComfyUI一接就能跑。
22:08
小互@xiaohu
63
Petdex:Codex终端宠物自定义商店

Petdex是一个专为Codex设计的宠物商店项目,允许用户更换终端小宠物。用户可预览、下载和提交各种动态宠物,通过命令行工具如'npx petdex install <宠物名>'快速安装。在Codex中,可通过Settings → Appearance → Pets界面选择宠物,或使用/pet命令唤出或收起宠物,实现个性化终端体验。

MCP/工具开源/仓库编码
21:29
Chubby♨️@kimmonismus
54
NVIDIA开源支撑OpenAI Blackwell集群的新型网络传输协议

NVIDIA通过OCP开源了MRC协议,这是一种专为大规模AI训练集群设计的新型RDMA传输协议。其核心创新在于将单一连接分散到多条网络路径上,当某条路径出现故障或拥塞时,能在微秒级时间内通过硬件重路由流量,以解决前沿AI训练中日益严峻的网络瓶颈问题。该协议已应用于OpenAI的Blackwell集群,微软和Oracle也是其主要部署方。NVIDIA此举在表面推动更开放标准的同时,优先为自家Spectrum-X平台优化,实则强化了其全栈竞争优势,并将以太网技术推向传统上由InfiniBand主导的高性能计算领域。

OpenAI开源/仓库数据/训练部署/工程
19:07
小互@xiaohu
69
Mininglamp-AI开源Cider与Mano-P,将Mac变为本地AI工作站

Mininglamp-AI开源了两个核心项目,旨在将Mac打造为本地AI工作站。Cider是一个端侧推理加速框架,通过更充分利用M系列芯片的INT8 TensorOps,显著提升LLM/VLM等模型在Mac上的运行速度并降低内存占用。Mano-P则是一个端侧GUI-VLA Agent模型,采用纯视觉方式理解屏幕,能在本地操作各类桌面软件、网页、专业工具及复杂图形化工作流,实现自动化任务执行与数据整合。两者结合,为私有AI提供了高效的本地基础设施。

智能体开源/仓库端侧
18:07
Xiaomi MiMo@XiaomiMiMo
59
MiMo V2.5 🥰🥰 【引用 @Designarena】:突发:小米MiMo-V2.5在设计竞技场开放权重模型中综合排名第六! 其Elo评分为1297,与@Kimi_Moonshot的Kimi K2.5(思考版)处于同一性能区间。 祝贺@XiaomiMiMo团队发布成功!

Design Arena: BREAKING: MiMo-V2.5 by @Xiaomi is #6 overall out of open weight models on Design Arena! This has an Elo of 1297 and is i...

开源/仓库模型发布评测/基准
16:36
向阳乔木@vista8
70
针对教程写作中拼接多张图片需借助Figma等工具过于笨重的问题,开发者通过与AI讨论,获得使用HTML5 Canvas库的解决方案。现已将该功能整合到Markdown编辑器中,用户可直接在编辑器内完成多图拼接,随后将拼合好的图片插入文章或导出。相关代码已开源至Github项目。

向阳乔木: 写教程时,经常需要拼接多张图,如果打开Figma处理就很笨重。 跟AI讨论,它推荐了一个HTML5 Canvas库。 打算把它整合到Markdown编辑器,拼好图再插入文章中。 Github项目见评论区

开源/仓库编码
15:36
向阳乔木@vista8
47
利用HTML5 Canvas库在Markdown编辑器中便捷拼图

作者在撰写教程时,常需拼接多张图片,但使用Figma等工具较为笨重。在与AI讨论后,其推荐了一个HTML5 Canvas库来解决此问题。作者计划将该库整合到Markdown编辑器中,以便直接在编辑环境内完成图片拼接,再将结果插入文章,从而简化工作流程。相关Github项目链接可在评论区查看。

图像生成开源/仓库
14:04
Peter Steinberger 🦞@steipete
68
我和codex正忙着。 🔊 http://sonoscli.sh - Sonos 🗃️ http://wacli.sh - WhatsApp 🪶 http://birdclaw.sh - X存档 🧰 http://gitcrawl.sh - GitHub存档 🛰️ http://discrawl.sh - Discord存档 🎧 http://spogo.sh - Spotify 💬 http://imsg.sh - iMessage 🧳 http://mcporter.sh - MCP转CLI 🗣️ http://sag.sh - ElevenLabs语音 🧿 http://askoracle.sh - 第二意见 升级🦞 OpenClaw大军。
MCP/工具开源/仓库编码
12:34
Peter Steinberger 🦞@steipete
36
CodexBar 0.24 已发布 🤖 新增 Windsurf、Codebuff + DeepSeek 提供商 👥 Copilot 多账户切换功能 🧹 可选本地存储详情查看 🔋 修复 Hung Codex RPC 及重绘导致的电量消耗问题 小巧的菜单栏,离谱的更新日志。 https://github.com/steipete/CodexBar/releases/tag/v0.24
产品更新开源/仓库编码
12:30
SemiAnalysis@SemiAnalysis_
58
过去12年间,cuDNN一直完全闭源(除.h文件外),直到本周!超过20个MoE内核及NSA稀疏注意力内核已从cuDNN开源!感谢@manicely6005及团队其他成员的卓越工作,让我们看到英伟达的部分技术正朝着开放内核的方向迈进!开源内核驱动创新!(1/3) 🧵
开源/仓库开源生态推理
11:34
meng shao@shao__meng
精选80
Warp团队开源15个内部工作流加速工具"Oz Skills"

Warp团队在开源终端和文档工具后,进一步开源了内部使用的15个“Oz Skills”工作流加速工具集。这些工具覆盖五大领域:Git/GitHub协作(如自动创建PR、修复CI问题)、数据分析与标准化、Web质量审计(性能、无障碍访问、SEO/AEO)、基础设施规范(如Terraform风格检查)以及通用生产力(如文档更新、本地定时提醒)。团队强调其设计哲学是构建“工作流工具”而非简单API覆盖,并提供了便捷安装命令,旨在将提升内部效率的实践分享给开源社区。

Warp: The Warp team uses a lot of Skills to speed up our workflow, so we open-sourced them. > npx skills add warpdotdev/oz-ski...

智能体MCP/工具开源/仓库

推荐理由:Warp把自己团队日常用的15个Skills全开源了,从Git协作到性能审计,一条命令就能装。搞AI工具链的可以直接抄作业,不用从零写。
08:17
Berryxia.AI@berryxia
72
OpenAI将Agent控制权交予开发者,SDK升级赋能长时运行

OpenAI对其Agents SDK进行重大升级,旨在为构建长时运行Agent提供更强的执行控制能力。核心在于将控制权交给开发者,打破黑盒状态。新功能包括:在受控沙箱环境中运行Agent,支持多家云服务商;允许完全检查和自定义开源harness;以及精准控制记忆的创建时机与存储位置。所有文件、凭证和执行状态均保留在开发者自有环境中,模型仅能访问经批准的上下文。此举解决了Agent易“失控”或“失忆”的问题,显著降低了工程化门槛,推动其从演示原型迈向生产级基础设施。

OpenAI Developers: Build long-running agents with more control over agent execution. New capabilities in the Agents SDK: • Run agents in co...

智能体OpenAI产品更新开源/仓库
00:57
宝玉@dotey
精选77
开源幻灯片框架open-slide支持AI智能生成

open-slide 这个开源的 Slides 项目不错,可以通过 Agent + Skills 制作 Slides,然后还有一个 Web 程序可以编辑生成好的 Slides。 并且可以支持动画,以及网页直接播放 slides。 期待完善: - 更好的编辑 - 导出 pptx https://github.com/1weiho/open-slide

Yiwei Ho: Introducing open-slide - The slide framework built for agents. Prompt your agent, get a polished deck. $ npx @open-slide...

智能体GitHub开源/仓库

推荐理由:让 agent 直接生成可编辑的 slides,npx 一行命令就能跑,还支持动画和网页播放,是产品人和开发者的提效刚需小工具,宝玉推荐的质量一般不差。
5月5日
16:56
Peter Steinberger 🦞@steipete
74
🤖 我的多个智能体一直遇到 @github 的速率限制问题。现已发布两项更新: - RepoBar 新增了 JUICE METER 功能 - gitcrawl 现已可作为即插即用的 gh 缓存 → 将其符号链接为 gh,即可从本地 SQLite 读取数据 https://gitcrawl.sh/ https://repobar.app/
智能体GitHub开源/仓库编码
16:26
Peter Steinberger 🦞@steipete
60
gog 0.16 版本现已发布。 面向人类与智能体的 Google Workspace 命令行工具。 无损原始 API 输出、净化的 Gmail 读取功能、更安全的命令配置、Drive 库存管理、Docs 标签页、Sheets 表格处理、Gmail 过滤器导出,以及官方 Docker 镜像。https://gogcli.sh
MCP/工具产品更新开源/仓库
15:14
Berryxia.AI@berryxia
精选75
Tom 开源 open claude design 项目,高还原度复刻 Claude Design

开发者 Tom 开源了 open claude design 项目,宣称对 Claude Design 的还原度超过 95%。该项目历时 72 小时开发,包含超过 18700 行代码和 30 多种设计技能,支持 71 套以上设计系统,并能兼容多种主流代码代理工具。项目旨在成为 Claude Design 的开源替代品,后续将持续更新,代码已托管于 GitHub。

Tom Huang: 正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...

MCP/工具开源/仓库部署/工程

推荐理由:Tom总用72小时逆向出Claude Design开源版,30+设计Skills、71套设计系统,直接塞进Claude Code或Codex就能用,前端开发者省下大量造轮子时间。
10:14
阿绎 AYi@AYi_AInotes
精选74
分享一个免费下载任何 YouTube 视频的GitHub开源项目,非常实用🔥

开源项目Voice-Pro将多语言视频创作流程大幅简化。用户输入YouTube链接后,该工具可在本地自动完成视频下载、人声分离、语音转文字、翻译、声线克隆及配音合成,全程不到两分钟。它将原本需要多个付费工具协作的复杂流程,整合为一个免费、本地化的高效解决方案,显著提升了创作者的工作效率。

GitHub开源/仓库视频语音

推荐理由:一个开源工具把 yt-dlp + Whisper + 翻译 + 声线克隆六步压缩成一条本地流水线,之前每月烧几百刀订阅费的事现在免费跑在自己机器上,做多语言视频的人可以直接换掉整套工具链。
08:26
meng shao@shao__meng
66
KroWork:通过"对话生成软件"模式,将AI对话转化为本地持久应用

KroWork的核心创新在于“chat-to-software”模式,旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体,能通过20多种内置技能端到端自动化执行任务,并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单,像常规软件一样运行,且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成,保障数据隐私,无需云端依赖,用户也无需具备编程背景即可创建属于自己的可复用软件。

KroWork: Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...

智能体产品更新开源/仓库端侧
‹ 上一页
1…89101112…14
下一页 ›