5月10日

07:44

Berryxia.AI@berryxia

针对"HTML比Markdown更适合AI"的言论，开发者@xicilion表示反对，并力荐其开发的docu.md阅读插件。他开发此插件旨在证明Markdown同样优秀，并希望推广这个自认为非常强大的工具。主推文作者对此表示认可并进行了推荐。

响马: 我为什么反对 html 比 markdown 更适合 ai 的言论呢? 因为我费老大劲开发了 https://docu.md 我要让更多人知道这个超腻害的阅读插件。😇

产品更新开源/仓库部署/工程

00:32

阿绎 AYi@AYi_AInotes

手机扫描与AI Agent技术颠覆房地产与专业领域

一项名为“3D高斯泼溅”的技术，允许用户仅用手机扫描整栋房屋，即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧，为房产等行业带来新机会。同时，AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平，其通过构建专用工具集而非依赖通用模型硬记规则的方法，为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

阿绎 AYi: 卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...

智能体 GitHub 开源/仓库教程/实践

5月9日

23:43

Berryxia.AI@berryxia

精选76

YC CEO开源个人AI操作系统GBrain，构建知识复利"第二大脑"

Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain，旨在将AI打造成具备复利效应的“第二大脑”。该系统通过“Book Mirror”、“Meeting Prep”等模块化技能，在五个月内深度处理了20多本书、自动预习会议，并管理着超10万页持续增长的结构化知识。其架构清晰，分为轻量路由层、可组合技能层与丰富数据层，并能按任务智能调用不同AI模型。Garry Tan强调，未来属于能构建此类复利系统的建造者，而非仅使用通用聊天工具的用户。

Garry Tan: http://x.com/i/article/2052898104039657472

智能体 MCP/工具开源/仓库

推荐理由：Garry Tan这套个人AI系统不是PPT产品，是他每天用到凌晨2点的大脑外挂，开源且逻辑清晰，做AI工作流的值得立刻fork。

23:32

阿绎 AYi@AYi_AInotes

精选82

Redis创始人用C语言引擎将大模型"装进"个人电脑

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码，通过三项关键技术：对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化，成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型，实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力，通过极致工程优化 democratize 至个人设备，展现了开源社区推动技术平民化的强大潜力。

Garry Tan: Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is ...

DeepSeek 开源/仓库推理端侧

推荐理由：Antirez用几千行C代码把DeepSeek V4 Flash塞进128G Mac，本地跑1M上下文coding agent，这才是真正的AI民主化时刻，开发者必试。

22:13

向阳乔木@vista8

刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具，开源的一些项目。很多人问各种工具和文档地址，我贴在评论区，方便大家使用。

开源/仓库开源生态编码

20:27

Peter Steinberger 🦞@steipete

我们正在开发一些智能缓存技术，@obviyus 让 @openclaw 中的 Telegram 循环速度提升 5-100 倍。

开源/仓库编码

5月8日

11:06

SemiAnalysis@SemiAnalysis_

@vllm_project 维护者在第0天优化DeepSeekv4性能并在周末合并了他们的初始模型支持PR。速度就是护城河

DeepSeek 开源/仓库推理部署/工程

08:06

Rohan Paul@rohanpaul_ai

精选78

atomic.chat为LLaMA.cpp引入多令牌预测技术，显著加速本地模型推理

atomic.chat通过为LLaMA.cpp引入多令牌预测技术，大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案，由主模型进行验证。在MacBook Pro M5 Max上测试时，使Gemma 4 26B模型的令牌生成速度加快约40%，整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位，为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案。

atomic.chat: Multi-Token Prediction (MTP) for LLaMA.cpp! Running Gemma4 local model 1.5x faster. We patched LLaMA.cpp. Quantized Gemm...

开源/仓库推理教程/实践端侧

推荐理由：在笔记本上把 Gemma 26B 的生成速度拉高 40% 是个真实的体验提升，atomic.chat 把 MTP 带入 LLaMA.cpp 生态，本地 AI 玩家可以直接拿去用。

07:21

Berryxia.AI@berryxia

SuperSplat将3D高斯泼溅变为大众创作平台

SuperSplat项目将3D Gaussian Splatting技术转化为大众可用的创作与分发平台。其核心功能是允许创作者一键开启文件下载，观众可直接获取Gaussian splat文件。平台支持附加多种CC 4.0许可证并自动生成署名，个人页面可集成社交链接，成为3D作品集。下载的文件能直接导入PlayCanvas引擎快速创建交互体验。该项目免费开源，旨在降低技术门槛，推动3DGS从实验室走向普通创作者的实际应用。

产品更新多模态开源/仓库

00:06

凡人小北@frxiaobei

精选81

姚金刚: 和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https:...

GitHub 开源/仓库搜索

推荐理由：不是又一个提示词合集，而是把《AI营销》书里的实操技巧拆成了现成指令，短视频和GEO部分尤其解渴，做内容营销的建议直接fork。

5月7日

23:21

Berryxia.AI@berryxia

精选76

SenseNova-U1开源8步蒸馏LoRA，扩散模型推理提速11倍

SenseNova-U1开源了一项8步蒸馏LoRA技术，将扩散模型的生成步骤从100步压缩至8步，使GPU推理时间从23秒大幅缩短至2秒，速度提升达11倍。该技术同时完整支持ComfyUI，并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化，引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论。

Ziwei Liu: 🚀SenseNova-U1 Update🚀 ⚡Open-source an 8-step distilled LoRA: 100 NFE → 8 NFE, cutting GPU inference from 23s to 2s 🧩C...

图像生成开源/仓库部署/工程

推荐理由：这个LoRA把扩散模型推理从23秒压到2秒，还带全套ComfyUI工作流，玩图像生成的人今天就应该装上去试试，速度飞升11倍是真的能立刻用上。

18:11

小互@xiaohu

精选82

开发者@yaojingang将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词，覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词，包括简易版和进阶版。开发者表示后续将持续在该仓库更新经过验证的有价值提示词。

姚金刚: 开源一套我的提示词合集前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错这一年来,公开分享了不少提示词,一直沉淀在飞书文档为了方便大家更好的下载和迭代,今天抽空,把公开的提示词整理了下,通过GitHub开源给大家目...

开源/仓库教程/实践

推荐理由：一个把提示词真正用起来的实战者，把压箱底的100个prompt开源了，九个场景全覆盖。尤其元提示词把写提示词的思路直接拆给你，比收藏模板更有用。

17:20

Berryxia.AI@berryxia

开源20B参数MoE模型本地流畅运行

刚刚刷到Hugging Face上这个gpt-oss-20b-tq3，真的有点爽啊！ OpenAI自己开源的20B参数MoE模型，被社区用TurboQuant 3-bit量化 + MLX优化后，竟然能直接在普通MacBook上本地丝滑跑起来。完全不用联网、不用交月费，还支持131K超长上下文。日常聊天、写作、写代码这些日常需求，现在都能在自己笔记本上搞定。非常适合公司的一些部门使用啊！以前本地跑大模型还得配高端显卡，现在一台M系列Mac就够了。模型直达👉 https://huggingface.co/manjunathshiva/gpt-oss-20b-tq3

Hugging Models: A new GPT model just dropped for Apple Silicon. The gpt-oss-20b-tq3 is a 20B parameter MoE text generator, optimized wit...

Hugging Face OpenAI 开源/仓库部署/工程

10:12

向阳乔木@vista8

精选76

Open Slide：让 AI 来写你的 PPT 代码

开源项目 Open Slide 基于 React 框架构建 PPT，其工作流专为 AI Agent 设计。它利用丰富的 React 组件库实现更强扩展性，便于集成各类图表。核心功能包括可视化编辑器支持手动修改，以及 AI 能直接读取用户评论并协同修改内容。项目还集成了包含 1500+ 品牌 Logo 的 SVGL 库，方便技术演示，旨在提升 PPT 制作的效率与自动化程度。

智能体 GitHub 开源/仓库

推荐理由：用 React 写 PPT 的思路很妙，加上 1500+ 品牌 Logo 库，AI 生成演示文稿终于不是一坨屎了。做技术的可以 clone 下来跑跑看。

09:42

向阳乔木@vista8

Flue ：又一个Agent开发框架。开发类似Claude Code风格的智能体，基于TypeScript。想折腾开发自己Agent的朋友可以试试。安装超级简单，官方提供了Prompt： fetch https://flueframework.com/start.md to create a new agent

智能体开源/仓库

03:08

OpenClaw🦞@openclaw

OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置小型维护版本发布： https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

智能体产品更新开源/仓库

02:04

Rohan Paul@rohanpaul_ai

开源工具iFixAi旨在量化评估AI代理的可靠性

开源测试套件iFixAi通过模拟真实产品场景的测试夹具，为AI代理在部署前提供可重复、标准化的可靠性评估。它在五大风险类别下运行32项检查，评估模型是否捏造事实、遵循不安全指令、无故更改答案、隐藏不确定性或在措辞微调时行为不一致。其核心价值在于可重复性，能完整保存模型、提示词、评判标准和输入，确保不同工程师可复现相同结果。该工具主要目标并非证明AI绝对安全，而是用于捕捉性能退化、公平比较不同供应商模型，并为合规团队提供基于证据的客观报告。

CyrilXBT: http://x.com/i/article/2052027135619919876

安全/对齐开源/仓库评测/基准

02:01

Chubby♨️@kimmonismus

精选76

OrcaRouter-Lite 现已开源，这是一个采用MIT许可、可自托管的大型语言模型路由工具。它支持用户自带密钥，无需外部数据库，并能对接OpenAI、Anthropic、Google、Groq等多种服务提供商。其核心创新是model="auto"模式，可自动为每次请求选择成本最低且能力匹配的模型，并具备跨提供商的确定性提示缓存功能，使得重复的相同请求能在毫秒内以零成本返回。该项目旨在解决开发团队手动编写复杂模型选择逻辑的痛点，通过简单的Docker部署即可实现路由功能，托管版本将于本周稍晚推出。

OrcaRouter: Every product team has a 30-line file in their codebase called pick_model.py. Nine if/else branches. Three retry decorat...

GitHub 开源/仓库开源生态部署/工程

推荐理由：每个 LLM 团队都在手搓那个叫 pick_model.py 的烂摊子，现在改个 base_url 就搞定了。BYOK 自托管零加价，设计干净到反常，值得所有做产品的开发者立刻尝试。

00:34

宝玉@dotey

OpenAI 联合多家巨头开源 AI 训练网络协议 MRC

OpenAI 联合 AMD、博通、英特尔、微软和英伟达，通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输，实现微秒级故障绕行，无需交换机重算路由。这简化了网络架构，将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层，降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算，并成功用于训练多个模型，显著提升了训练任务的鲁棒性。

OpenAI: We've partnered with @AMD, @Broadcom, @Intel, @Microsoft, and @NVIDIA, to release Multipath Reliable Connection (MRC), a...

OpenAI 开源/仓库部署/工程

00:20

Berryxia.AI@berryxia

Downy是一个开源的自托管多agent协作平台，运行在Cloudflare Durable Objects上。它允许用户搭建具有不同性格、技能和工具的agent团队，所有管理操作均通过应用程序完成，无需使用CLI或Obsidian等外部工具。该平台支持跨设备访问，旨在简化多agent系统的部署和协作流程。

Geek: 让你搭一个多 agent 团队,每个 agent 有自己的性格和技能,随便哪个设备都能用。自托管的多 agent 协作平台,跑在 Cloudflare Durable Objects 上。每个 agent 有自己的性格、技能、工具和工作区...

智能体 MCP/工具开源/仓库

5月6日

23:20

Berryxia.AI@berryxia

一个名为dFlash的GitHub项目宣称，能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速，并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注，被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人: 这个项目能让Gemma 4 推理提速到6倍比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash

Google 开源/仓库开源生态推理

23:20

Berryxia.AI@berryxia

Warp 开源内部高效工具集 Skills，包含15个生产级技能

Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 npx skills add warpdotdev/oz-skills 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区，而非私有化，体现了开放精神。项目 GitHub 仓库已开放，并鼓励社区贡献。

Warp: The Warp team uses a lot of Skills to speed up our workflow, so we open-sourced them. > npx skills add warpdotdev/oz-ski...

MCP/工具开源/仓库部署/工程

22:36

SenseTime@SenseTime_AI

精选71

🚀 SenseNova-U1 更新： ⚡ 开源8步蒸馏LoRA：100 NFE降至8 NFE，H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI，提供文生图、图像编辑和交错生成的即用工作流试用链接 👇 https://github.com/OpenSenseNova/SenseNova-U1/

图像生成开源/仓库推理模型发布

推荐理由：从100步到8步，23秒压到2秒，商汤这个蒸馏LoRA把U1的推理成本打下来了，做实时图像应用的可以认真看看，ComfyUI一接就能跑。