全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「开源/仓库」清除

5月13日周三

08:49Berryxia.AI65Jina同步发布MLX格式嵌入模型，端侧AI部署迎来新趋势

08:12Nathan Lambert65Jinja聊天模板需社区主导构建

08:00HuggingFace Daily Papers（社区热门论文）67PRISM：基于扩散模型的文本图像超分辨率框架，实现先验校正与不确定性感知的结构建模

07:53Simon Willison 博客66LLM 命令行工具发布 0.32a2 alpha 版本

07:53Simon Willison 博客40datasette 1.0a29 版本发布

00:52向阳乔木68开源多agent讨论Skill基于HeavySkill论文提升AI推理

00:34🚨 AI News | TestingCatalog65holaOS Beta 0.1 发布：为持续性工作设计的AI工作空间操作系统

5月12日周二

21:44HuggingFace Daily Papers（社区热门论文）69键值均值注意力机制

20:49Berryxia.AI73导出消费数据赋能AI Agent个性化服务

18:44HuggingFace Daily Papers（社区热门论文）57Muon能微调Adam预训练的模型吗？

17:22向阳乔木62SkillsVote：解决AI Agent技能发现与安全运行痛点的基建工具

15:44HuggingFace Daily Papers（社区热门论文）59DECO：面向终端设备的稀疏混合专家模型，实现媲美稠密模型的性能

12:44HuggingFace Daily Papers（社区热门论文）65Shepherd：一个为元智能体提供形式化执行追踪的运行时基板

09:49Berryxia.AI57Apple押注端侧AI，开源小模型MiniCPM-V 4.6实现高效边缘部署

08:00HuggingFace Daily Papers（社区热门论文）69ShapeCodeBench：一个用于合成形状场景感知到程序重建的可再生基准

5月11日周一

22:54Runway：News（网页）68精选告别编写YAML：使用confingy配置机器学习系统

21:31凡人小北75精选AI工具批量生成知识产权申请材料引关注

18:48Berryxia.AI56个人工具库开源，集成一键收藏与AI搜索

13:34阿绎 AYi65大神用Claude Code复刻完整游戏开发工作室，48个AI智能体覆盖全岗位

09:33meng shao67这个为 iOS App 创建用户 Onboarding Video 的 Skill 很有启发

08:44向阳乔木70OpenCLI打通微信等私域信息流，聚合个人数据

08:00HuggingFace Daily Papers（社区热门论文）61GLiNER-Relex：用于联合命名实体识别与关系抽取的统一框架

07:30Peter Steinberger 🦞63CodexBar 0.25发布新增多款AI提供商

06:45Berryxia.AI60科研利器：Hugging Face CLI安装指南

03:43Hugging Face：Blog（RSS）74精选MachinaCheck：基于AMD MI300X构建多智能体CNC可制造性分析系统

5月10日周日

19:29Peter Steinberger 🦞76精选推出BlackBar菜单栏工具

18:29Peter Steinberger 🦞46OpenClaw实现视频问题验证自动化

18:29Peter Steinberger 🦞31提议为项目完成设立预测市场

14:59Orange AI60反蒸馏工具：对抗AI技能提取，保护个人核心知识

11:29Peter Steinberger 🦞25Spotify CLI 更新提速，Codex 化身 DJ

09:44Berryxia.AI65字节跳动开源桌面GUI智能体UI-TARS-desktop，获31.4K星标

07:44Berryxia.AI54开发者力推docu.md插件，挑战HTML更适合AI的观点

00:32阿绎 AYi72手机扫描与AI Agent技术颠覆房地产与专业领域

5月9日周六

23:43Berryxia.AI76精选YC CEO开源个人AI操作系统GBrain，构建知识复利"第二大脑"

23:32阿绎 AYi82精选Redis创始人用C语言引擎将大模型"装进"个人电脑

22:13向阳乔木47刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具，开源的一些项目。很多人问各种工具和文档地址，我贴在评论区，方便大家使用。

20:27Peter Steinberger 🦞31优化缓存技术提升Telegram循环效率

15:50Hacker News 热门（buzzing.cc 中文翻译）71精选Show HN：适用于人工智能代理的 Git

14:29IT之家（RSS）58英伟达发布 CUDA-Oxide 0.1，邀请开发者使用 Rust 开发 CUDA 内核

08:00HuggingFace Daily Papers（社区热门论文）66基于超群相对策略优化拓展生物分子效用-多样性前沿

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月13日

08:49

Berryxia.AI@berryxia

65

Jina同步发布MLX格式嵌入模型，端侧AI部署迎来新趋势

Jina在其新版嵌入模型发布首日，即同步提供了全套MLX格式变体，改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标，背后应有自动化流程支持。这一动向反映了MLX生态的崛起：Qwen、DeepSeek等主流模型官方开始集成MLX，Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性，尤其适合在Mac的M系列统一内存上运行，为本地RAG等场景提供了理想的端侧AI解决方案。

Berryxia.AI: https://huggingface.co/collections/jinaai/jina-embeddings-v5-omni

Hugging Face 开源/仓库模型发布现象/趋势

08:12

Nathan Lambert@natolambert

65

Jinja聊天模板一直感觉像是一个临时平衡，所以我们需要有人来接手，并尝试在社区内构建它。对此感到兴奋！

Prime Intellect: Introducing Renderers RL trainers work in tokens. Environments work in messages. Going back and forth corrupts sampled t...

智能体开源/仓库数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

67

PRISM：基于扩散模型的文本图像超分辨率框架，实现先验校正与不确定性感知的结构建模

针对严重退化下文本图像超分辨率任务中全局先验不可靠与笔画边界模糊的挑战，本文提出PRISM框架。它通过流匹配先验校正模块，将退化嵌入映射至面向复原的先验空间，提供更准确的全局文本引导；同时利用结构引导的不确定性感知残差编码器，预测结构残差以选择性融合可靠的局部边界线索。该设计在单步扩散过程中同步实现了全局先验校正与局部结构细化。在合成与真实场景基准测试中，PRISM取得了最先进的性能，并保持毫秒级推理速度。相关代码与数据集已开源。

图像生成开源/仓库论文/研究

07:53

Simon Willison 博客

66

LLM 命令行工具发布 0.32a2 alpha 版本

LLM 命令行工具发布了 0.32a2 alpha 版本。本次更新的核心是，大多数具备推理能力的 OpenAI 模型将改用新的 /v1/responses API 端点，替代原有的 /v1/chat/completions 端点。这一变更为 GPT-5 级别的模型启用了跨工具调用的交错推理能力。现在，用户在使用 OpenAI 模型运行提示词时，可以看到以不同颜色高亮显示的、经过汇总的推理令牌。如果不想显示这些推理信息，可以使用 -R 或 --hide-reasoning 标志来隐藏。

OpenAI 产品更新开源/仓库推理

07:53

Simon Willison 博客

40

datasette 1.0a29 版本发布

datasette 发布了 1.0a29 版本。本次更新新增了用于创建“_r”字典的 TokenRestrictions.abbreviated() 工具方法。界面改进方面，现在即使表格行数为零，表头和列选项也会正常显示，并修复了移动版 Safari 上列操作对话框的显示问题。此外，还解决了一个严重的段错误 bug，该问题源于 Datasette.close() 方法在多线程环境下可能引发的竞态条件。开发者通过 Codex CLI 配合 GPT-5.5 xhigh 创建了能复现问题的 Dockerfile，从而定位并修复了此问题。

产品更新开源/仓库部署/工程

00:52

向阳乔木@vista8

68

HeavySkill论文提出让多个AI agent并行独立思考同一问题，再通过综合推理得出更优答案，能显著提升回答质量。基于这一思路，开发者开源了一个免费Skill，部署3-5个完全独立的Sub agent进行并行推理，然后由Codex主持讨论，以识别每个agent的视角盲点，最终生成比单一推理更好的结论。该Skill的开源代码和Demo已公开提供。

向阳乔木: 读了一篇叫HeavySkill的论文,非常有意思。让多个 AI先并行"独立思考",生成多条独立推理。再用另一轮推理来综合所有思路,得出最终答案。按论文测试结果,回答质量会提升非常多。正在按这个思路写一个Skill,Claude Co...

智能体开源/仓库推理

00:34

🚨 AI News | TestingCatalog@testingcatalog

65

holaOS Beta 0.1 正式发布，这是一个专为长期持续性工作设计的操作系统。它基于开源的Agent Computer构建，核心目标是解决当前AI智能体仅适用于单次会话、缺乏记忆与延续性的问题，旨在成为随时间展开的"活"工作空间。系统主要特性包括：具备独立上下文、规则与记忆的多工作空间；可并行处理复杂任务的子智能体；以及用于追踪执行状态、审查任务和规划下一步的可定制化仪表盘。该版本标志着AI从一次性会话工具向可长期协作的"队友"转变的尝试。目前仍处早期测试阶段，开发者建议用户将其应用于每周重复进行的持续性工作流中进行体验。

Jeffrey Li: We just launched holaOS Beta 0.1 - the first product version of what started as our open-source agent computer. I record...

智能体产品更新开源/仓库

5月12日

21:44

HuggingFace Daily Papers（社区热门论文）

69

键值均值注意力机制

研究团队提出键值均值注意力机制，这是一种支持固定或可增长状态的新型分块循环注意力。在强Transformer基线中引入固定大小的KVM层，仅需极少参数即可构建高效的O(N)分块RNN。使用可增长KVM缓存训练的模型在长上下文任务中表现优异，仅需次二次方预填充时间和次线性状态增长。该机制基于标准操作实现，无需定制内核，支持分块并行化训练与预填充，兼具传统Transformer与线性RNN的优势。它可应用于每一层以节省KV缓存内存，并在O(N)到O(N²)之间提供灵活的预填充时间复杂度选择，也可与线性RNN层混合部署以增强长上下文解码能力。相关代码与模型已开源。

开源/仓库论文/研究部署/工程

20:49

Berryxia.AI@berryxia

73

AI Agent需要用户消费上下文才能充当个人管家，作者调研了主流消费平台的订单导出方法。淘宝提供导出功能；京东无官方支持，但通过Codex定制Chrome插件实现一键导出，并开源在Github；闪购（饿了么）可申请导出Excel；美团外卖暂无方法；大众点评通过定制插件导出收藏列表。作者开源了京东和大众点评的导出工具，鼓励用户利用这些数据让AI Agent进行个性化分析，以提升服务实用性。

paulwei: AI Agent 连你平时买啥、吃啥的上下文都没有, 怎么了解你的消费品味?怎么做你的个人管家? 想拥有吃货Agent、买手Agent、导购Agent? 我又搓了个通宵,替你们调研实操了: 淘宝/京东/闪购(饿了么)/美团外卖/大众点评.....

智能体开源/仓库教程/实践

18:44

HuggingFace Daily Papers（社区热门论文）

57

Muon能微调Adam预训练的模型吗？

本研究探讨了在微调Adam预训练模型时，若将优化器直接切换为Muon会导致性能下降的问题，并将其归因于两者不同的隐式偏差造成的优化器不匹配。这种不匹配会破坏预训练知识，且其影响程度与参数更新强度成正比。实验表明，通过采用LoRA等参数高效微调方法来约束更新，可以有效缓解该问题。在语言和视觉任务中，LoRA显著缩小了全参数微调下Adam与Muon之间的性能差距。对LoRA秩、灾难性遗忘及变体的进一步研究证实，不匹配的严重程度确实与更新强度相关。相关代码已开源。

开源/仓库数据/训练论文/研究

17:22

向阳乔木@vista8

62

SkillsVote：解决AI Agent技能发现与安全运行痛点的基建工具

AI Agent面临技能发现难、匹配不准及运行安全等挑战。SkillsVote利用GPT-5.4分析了Github上超160万个技能，筛选出79万多个，并提取功能、环境及权限等关键信息。它不仅提供精准推荐，还能记录执行步骤、反馈结果以优化技能，并生成工作流组合建议，提升技能价值。相比Vercel仅支持发现安装，SkillsVote覆盖了从发现、适配、归因到迭代的全流程，支持多种Agent客户端，是AI Agent的重要基础设施工具。

智能体 MCP/工具开源/仓库

15:44

HuggingFace Daily Papers（社区热门论文）

59

DECO：面向终端设备的稀疏混合专家模型，实现媲美稠密模型的性能

为克服混合专家模型参数量大导致的存储与访存瓶颈，研究团队提出稀疏MoE架构DECO，以适配终端设备对高性能、低计算成本和小存储开销的需求。DECO采用基于可学习专家级缩放的ReLU可微分灵活路由，自适应平衡路由专家与共享专家的贡献，并引入NormSiLU激活函数提升路由稳定性与稀疏度。实验表明，在总参数量和训练数据量相同的情况下，DECO仅激活20%的专家即可匹配稠密Transformer性能，且超越现有MoE基线；其专用加速内核在真实硬件上实现了相比稠密推理3.00倍的加速。代码与模型将开源。

开源/仓库推理端侧论文/研究

12:44

HuggingFace Daily Papers（社区热门论文）

65

Shepherd：一个为元智能体提供形式化执行追踪的运行时基板

Shepherd提出了一种函数式编程模型，将元智能体对目标智能体的操作形式化为函数，其核心操作在Lean中实现。该系统将所有智能体-环境交互记录为类似Git的类型化执行追踪，支持对任意历史状态进行分支与重放。其分支智能体进程及文件系统的速度比Docker快5倍，重放时提示缓存复用率超过95%。应用案例表明，其实时监督可将结对编程通过率从28.8%提升至54.7%；反事实元优化在四个基准测试中最高超出基线11个百分点，同时减少高达58%的挂钟时间；在Tree-RL训练中，于选定轮次进行分支展开将性能从34.2%提高至39.4%。该系统已开源。

智能体 arXiv MCP/工具开源/仓库

09:49

Berryxia.AI@berryxia

57

Apple押注端侧AI，开源小模型MiniCPM-V 4.6实现高效边缘部署

推文指出Apple的统一内存架构是端侧AI的理想平台。同时，OpenBMB发布了专为消费级硬件优化的1.3B多模态模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术，将视觉编码成本降低55%，实现了高效的边缘原生部署。其在多项关键基准测试中超越了更大的模型，且token消耗仅为对比模型的2.5%。在RTX 4090上处理高分辨率图像时，首token延迟仅75.7ms，速度快2.2倍。模型技术亮点包括Intra-ViT早期压缩和混合视觉压缩，有效平衡了分辨率与延迟。其部署友好，支持iOS、Android、HarmonyOS及多种主流推理框架与量化格式，相关资源已在各大平台开源。

OpenBMB: 1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...

多模态开源/仓库模型发布端侧

08:00

HuggingFace Daily Papers（社区热门论文）

69

ShapeCodeBench：一个用于合成形状场景感知到程序重建的可再生基准

ShapeCodeBench是一个用于感知到程序重建的合成基准测试。给定一张渲染的光栅图像，模型必须输出一个可执行的绘图程序，由确定性评估器重新渲染并与目标图像比对。其v1版本在512x512黑白画布上定义了四种基本图形，每个实例均由随机数生成器生成，可创建全新的测试集以减少数据污染。基准发布了一个包含150个样本的固定评估集，涵盖简单、中等和困难三个级别，评估指标包括精确匹配、像素精度、前景IoU等。测试结果显示，传统计算机视觉启发式方法在简单场景中表现尚可，但在图形重叠时失效；最强的多模态配置能保留大部分前景结构，但因细微参数误差仍无法达到精确匹配。目前最佳精确匹配率仍然很低，表明该基准远未饱和。相关代码、数据集及论文资源均已开源。

多模态开源/仓库推理论文/研究

5月11日

22:54

Runway：News（网页）

精选68

告别编写YAML：使用confingy配置机器学习系统

Runway开源了Python库confingy，旨在解决机器学习系统配置的长期痛点。该库允许开发者用纯Python代码（支持懒加载、类型检查和序列化）替代传统YAML配置文件，从而摆脱YAML作为图灵完备领域特定语言所带来的维护困境。confingy无需重构现有代码，即可满足跟踪构造函数参数、避免实例化昂贵对象（如大语言模型）等核心需求，有效改善了因复杂YAML配置导致的无法跳转定义、类型提示失效和重构困难等开发体验问题。

开源/仓库部署/工程

推荐理由：Runway把自家ML训练的YAML坑填平了，开源了confingy。如果你还在用YAML管实验参数，这可能是今年最该装的pip包。

21:31

凡人小北@frxiaobei

精选75

知识产权全面沦陷。发明专利生成 skill https://github.com/handsomestWei/patent-disclosure-skill 软著生成 skill https://github.com/Fokkyp/SoftwareCopyright-Skill 设计专利/实用新型更容易，claude desgin/ image2

scavin: 中国软件著作权申请材料生成器 Skills https://meta.appinn.net/t/topic/85159

开源/仓库开源生态

推荐理由：发明和软著生成 skill 直接把知识产权的门槛打到地板，虽然质量可能粗糙，但这套自动化流水线会让审批系统面临海量申请，值得关注。

18:48

Berryxia.AI@berryxia

56

开发者开源了个人手动积累的工具库网页，内容涵盖审美、AI艺术与网页设计相关资源。为解决资源过多、难以查找的问题，该系统集成了一键收藏功能，并支持Notion数据库备份、Obsidian备份以及AI精准搜索。网页界面经过精心设计，现公开分享供用户探索使用。

小耳👂Jane|Xiaoer: 🌞我的私人工具库web开源了👹 ⚔️不是爬虫爬的合集 ⚔️不是随意收的合集而是 🐝一个一个手动拷贝 🐝记录在我notion的 🦋很多跟审美相关 🦠也跟AI艺术相关做个酷网页相关自己一路的累积实在太多了存的时候没时间记录...

13:34

阿绎 AYi@AYi_AInotes

65

大神用Claude Code复刻完整游戏开发工作室，48个AI智能体覆盖全岗位

开源项目Claude Code Game Studios利用Claude Code构建了完整的虚拟游戏开发工作室。该项目包含48个AI智能体，1:1还原从创意总监到关卡设计师等全部岗位，覆盖游戏开发全流程。系统提供36条斜杠指令一键启动工作流，适配Godot、Unity、Unreal三大游戏引擎，并集成自动化校验钩子及28套行业标准文档模板。所有AI仅负责梳理方案，最终决策权由用户掌握。项目采用MIT开源协议，可免费商用，克隆仓库即可快速部署。

智能体 Anthropic 开源/仓库开源生态

09:33

meng shao@shao__meng

67

这个为 iOS App 创建用户 Onboarding Video 的 Skill 很有启发

一款开源Skill“Create Onboarding Video”利用AI（通过Remotion）为iOS App生成高质量的用户引导视频。它强制遵循一套“反AI油腻感”的硬性规则，以制作出具有“App Store预览”级质感的片段。核心规则包括：视频需聚焦于证明功能在工作的特定UI组件，而非展示完整屏幕；字幕需有固定的位置、大小和入场动画；光标交互必须真实自然，禁止瞬移。该Skill定义了从素材采集、分镜规划到编码实现的四步工作流，强调“展示而非叙述”，旨在快速引导用户达成“aha moment”。

ROFI: http://x.com/i/article/2053059568121282560

智能体 GitHub 开源/仓库教程/实践

08:44

向阳乔木@vista8

70

OpenCLI项目实现了对微信、Telegram和Discord三大平台内容的命令行读取，通过wx-cli、tg-cli和discord-cli工具，用户可直接获取群消息、聊天记录、朋友圈及收藏夹等私域数据。这标志着个人信息流聚合的关键突破，使得AI Agent不仅能监控外部资讯网站，还能整合个人私密的社交聊天信息，构建真正统一的个人数据流。此举可能引发平台方如微信的关注或反应。

kabikabi: OpenCLI 现在可以读取微信、Telegram、Discord 的内容了!!! wx-cli / tg-cli / discord-cli 全部接入。群消息、聊天记录、朋友圈、收藏夹--全部可以用 CLI 直接拿到。以前 Agent...

智能体开源/仓库开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

61

GLiNER-Relex：用于联合命名实体识别与关系抽取的统一框架

GLiNER-Relex 是一个统一框架，扩展自 GLiNER，能在单一模型中同时执行命名实体识别和关系抽取。它利用共享的双向 Transformer 编码器联合表示文本、实体与关系类型标签，支持在推理时零样本抽取任意指定类型。模型通过专用模块从识别出的实体构建配对表示并进行关系评分。在 CoNLL04、DocRED 等四个标准基准测试中，其性能与专用关系抽取模型及大语言模型相当，同时保持了 GLiNER 系列的高计算效率。该模型已开源，提供简洁的 API，允许用户通过单次调用获取实体及关系三元组。

开源/仓库论文/研究

07:30

Peter Steinberger 🦞@steipete

63

🎚️ CodexBar 0.25 已上线 🧩 新增提供商：Manus、MiMo、Qwen、Doubao、Venice 等 🔔 配额预警通知 👥 堆叠式 Codex 账户切换器 📊 通过 http://models.dev 获取更快的成本记录重大更新。菜单栏依旧小巧。 https://github.com/steipete/CodexBar/releases/tag/v0.25

产品更新开源/仓库编码

06:45

Berryxia.AI@berryxia

60

这个太方便了啊！！！搞科研读论文的不要错过啦！如何安装Hugging face的CLI？ curl -LsSf http://hf.co/cli/install.sh | bash 直接开干就完了！支持arxiv和hugging face…

向阳乔木: 如果你喜欢到Huggingface读最新的AI论文。可以安装官方的cli: curl -LsSf https://hf.co/cli/install.sh | bash 安装好以后,提示词: hf papers read [论文编号或论文...

Hugging Face 开源/仓库教程/实践

03:43

Hugging Face：Blog（RSS）

精选74

MachinaCheck：基于AMD MI300X构建多智能体CNC可制造性分析系统

MachinaCheck是一款基于多智能体AI的系统，旨在革新小型CNC机加工车间的报价分析流程。传统上，车间经理需花费30-60分钟手动分析图纸，而该系统在上传STEP文件及材料、公差等简单输入后，能在30秒内生成完整的可制造性报告，明确指出零件能否制造、所需工具及生产前需采取的行动。其核心在AMD MI300X加速卡上本地运行Qwen 2.5 7B模型，利用192GB HBM3显存确保客户设计数据无需离开本地，满足了制造业对数据隐私的严格要求。系统采用五组件流水线，结合精确的几何特征提取与LLM的制造知识推理，最终输出结构化报告。

智能体 Hugging Face 开源/仓库端侧

推荐理由：虽然是hackathon项目，但用多Agent做CNC可行性分析，把推理全压在本地AMD显卡上保护图纸隐私，还给了可跑的代码和Space，制造业AI落地就该这么直接。

5月10日

19:29

Peter Steinberger 🦞@steipete

精选76

为@useblacksmith开发了BlackBar菜单栏 https://github.com/openclaw/BlackBar/releases/tag/v0.1.0

开源/仓库编码

推荐理由：为 Blacksmith 做了个菜单栏小工具，虽不是重大更新，但胜在即装即用，对 Blacksmith 用户来说是个实在的便利插件。

18:29

Peter Steinberger 🦞@steipete

46

作为质量保证自动化工作的一部分，我们现在已为OpenClaw的问题提供视频验证生成功能。 Codex 【或GH工作流】生成前后对比记录（屏幕录制由crabbox完成）。特别感谢@obviyus实现了真实的Telegram登录自动化！ https://github.com/openclaw/openclaw/pull/76999#issuecomment-4415012577

GitHub 开源/仓库编码

18:29

Peter Steinberger 🦞@steipete

31

我们应该为它完成时设立一个预测市场。 https://github.com/openclaw/openclaw/pull/78595

GitHub 开源/仓库编码

14:59

Orange AI@oran_ge

60

反蒸馏工具：对抗AI技能提取，保护个人核心知识

为应对公司要求将工作经验提炼为AI可执行技能（即“技能蒸馏”）的做法，有开发者提出了“反蒸馏”工具。用户可将写好的技能文件输入，工具会生成一份表面完整但核心知识已被抽离的“清洗版”用于提交，同时私密备份被移除的关键经验与知识，以保护个人真正的职业资产。例如，将具体技术实践“Redis key必须设TTL”泛化为“缓存使用遵循团队规范”。该项目旨在帮助从业者在AI时代维护自身知识价值。

GitHub 开源/仓库教程/实践

11:29

Peter Steinberger 🦞@steipete

25

最新版 spogo （Spotify 命令行工具）速度大幅提升，codex 现在是我的 DJ。 https://spogo.sh 若想将 YouTube 音乐播放至 Sonos，请查看 https://sonoscli.sh

开源/仓库编码

09:44

Berryxia.AI@berryxia

65

字节跳动开源桌面GUI智能体UI-TARS-desktop，获31.4K星标

字节跳动开源的UI-TARS-desktop是一个本地运行的桌面GUI智能体，允许用户通过自然语言指令操控电脑。它通过截屏和视觉模型理解屏幕内容，并精准控制鼠标键盘来操作各类应用，如打开VS Code或浏览网页，全程保障数据隐私。项目支持Windows和macOS，可操作本地或远程电脑及浏览器，并提供了SDK供开发者构建自动化工具。近期发布的v0.3.0版本增强了CLI功能。该项目在GitHub上已获得31.4K星标，增长迅速。

智能体开源/仓库部署/工程

07:44

Berryxia.AI@berryxia

54

针对"HTML比Markdown更适合AI"的言论，开发者@xicilion表示反对，并力荐其开发的docu.md阅读插件。他开发此插件旨在证明Markdown同样优秀，并希望推广这个自认为非常强大的工具。主推文作者对此表示认可并进行了推荐。

响马: 我为什么反对 html 比 markdown 更适合 ai 的言论呢? 因为我费老大劲开发了 https://docu.md 我要让更多人知道这个超腻害的阅读插件。😇

产品更新开源/仓库部署/工程

00:32

阿绎 AYi@AYi_AInotes

72

手机扫描与AI Agent技术颠覆房地产与专业领域

一项名为“3D高斯泼溅”的技术，允许用户仅用手机扫描整栋房屋，即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧，为房产等行业带来新机会。同时，AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平，其通过构建专用工具集而非依赖通用模型硬记规则的方法，为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

阿绎 AYi: 卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...

智能体 GitHub 开源/仓库教程/实践

5月9日

23:43

Berryxia.AI@berryxia

精选76

YC CEO开源个人AI操作系统GBrain，构建知识复利"第二大脑"

Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain，旨在将AI打造成具备复利效应的“第二大脑”。该系统通过“Book Mirror”、“Meeting Prep”等模块化技能，在五个月内深度处理了20多本书、自动预习会议，并管理着超10万页持续增长的结构化知识。其架构清晰，分为轻量路由层、可组合技能层与丰富数据层，并能按任务智能调用不同AI模型。Garry Tan强调，未来属于能构建此类复利系统的建造者，而非仅使用通用聊天工具的用户。

Garry Tan: http://x.com/i/article/2052898104039657472

智能体 MCP/工具开源/仓库

推荐理由：Garry Tan这套个人AI系统不是PPT产品，是他每天用到凌晨2点的大脑外挂，开源且逻辑清晰，做AI工作流的值得立刻fork。

23:32

阿绎 AYi@AYi_AInotes

精选82

Redis创始人用C语言引擎将大模型"装进"个人电脑

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码，通过三项关键技术：对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化，成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型，实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力，通过极致工程优化 democratize 至个人设备，展现了开源社区推动技术平民化的强大潜力。

Garry Tan: Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is ...

DeepSeek 开源/仓库推理端侧

推荐理由：Antirez用几千行C代码把DeepSeek V4 Flash塞进128G Mac，本地跑1M上下文coding agent，这才是真正的AI民主化时刻，开发者必试。

22:13

向阳乔木@vista8

47

刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具，开源的一些项目。很多人问各种工具和文档地址，我贴在评论区，方便大家使用。

开源/仓库开源生态编码

20:27

Peter Steinberger 🦞@steipete

31

我们正在开发一些智能缓存技术，@obviyus 让 @openclaw 中的 Telegram 循环速度提升 5-100 倍。

开源/仓库编码

15:50

Hacker News 热门（buzzing.cc 中文翻译）

精选71

Show HN：适用于人工智能代理的 Git

开源项目“适用于人工智能代理的 Git”发布，旨在为AI代理提供类似Git的版本控制系统。该系统允许AI代理跟踪和管理其代码、提示词、模型权重等资产的变更历史，支持分支、合并与回滚操作。项目已在GitHub开源，并在Hacker News上获得100点热度。这一工具试图解决AI开发中工作流复杂、迭代难以追溯的问题，为多代理协作与实验管理提供标准化方案。

智能体开源/仓库

推荐理由：AI 代理的 Git，开源且能直接用。Agent 开发的版本控制痛点被正面解决，做复杂代理的值得试一下。

14:29

IT之家（RSS）

58

英伟达发布 CUDA-Oxide 0.1，邀请开发者使用 Rust 开发 CUDA 内核

英伟达实验室发布了实验性开源项目CUDA-Oxide 0.1编译器，允许开发者使用Rust语言直接为NVIDIA GPU编写CUDA内核。该编译器将标准Rust代码输出为CUDA生态的底层中间表示PTX，支持单源码编译并提供设备端抽象，旨在通过Rust的类型系统和内存安全优势，减少传统CUDA开发中的常见错误。项目采用自定义的rusc编译器后端，首个版本已开源发布。

开源/仓库开源生态编码

08:00

HuggingFace Daily Papers（社区热门论文）

66

基于超群相对策略优化拓展生物分子效用-多样性前沿

研究团队提出超群相对策略优化（SGRPO），以解决生物分子生成器因优化任务效用而导致生成候选分子过于集中的问题。该框架直接从集合层面构建多样性奖励：为每个条件采样候选分子超群，比较相同条件下的多样性，并通过留一法将群体奖励分配至单个生成轨迹，再与效用奖励结合。SGRPO不依赖特定生成器或评估指标，可灵活与不同GRPO风格方法集成。在多个生物分子设计任务上的评估表明，SGRPO能有效拓展效用-多样性的帕累托前沿，相对于基线方法取得更优的前沿水平指标，并有助于在训练后保持更广泛的生成分布覆盖。

开源/仓库数据/训练论文/研究

1…13 141516 17…25