5月16日

20:42

AYi@AYi_AInotes

飞书官方 CLI 工具 lark-cli 开源45天后 GitHub star 数突破1万，成为国内首个破万星的办公套件开源项目。其核心在于允许 AI 通过命令行直接操作飞书，执行建群、建文档等任务，且每一步操作都可见、可预览、可审查，与 MCP 等云端不可见模式形成对比。更关键的生态指标是，飞书主干已合并了10位外部开发者的代码，而同类产品钉钉和企业微信则为零，体现了真实的开发者参与。这种透明可控的特性是开发者放心将任务交给 AI Agent 的重要前提。

AYi: 刚刚花三分钟装了飞书官方那个 CLI 工具, 跑了一句话,建群、建文档、发通知,一次性全做完了, 我盯着终端看了几秒钟, 才反应过来这玩意儿真的能让 AI 直接操作飞书。装的过程没啥可说的, 一行 npx @larksuite/cli@l...

智能体 MCP/工具 OpenAI 开源/仓库

19:01

Hacker News 热门（buzzing.cc 中文翻译）

Orthrus-Qwen3：在Qwen3上每步最多可处理7.8个令牌，输出分布与原版完全一致

Orthrus-Qwen3项目在Qwen3模型上实现了每次前向传播最高可处理7.8个令牌的性能，同时确保输出分布与原版模型完全一致。该项目已在GitHub开源，并在Hacker News社区获得102点热度。这一优化显著提升了模型推理效率，且保持了生成结果的准确性。

GitHub 开源/仓库推理

16:42

AYi@AYi_AInotes

OpenAI向Zed编辑器共享ChatGPT订阅额度

在多数AI服务按token涨价之际，OpenAI采取了相反策略，将其ChatGPT的订阅额度共享给了代码编辑器Zed。用户无需额外付费，即可在Zed中直接使用该额度。关键细节在于，Zed中消耗的额度与ChatGPT网页版的订阅限额是共享且实时同步的。这意味着用户在Zed中用尽额度后，仍可返回ChatGPT网页版继续使用其服务。这一合作被形象地比作Codex（OpenAI的代码生成模型）与Zed编辑器的深度结合。

Tibo: Codex🫸🫷Zed

OpenAI 产品更新开源/仓库编码

06:31

Hacker News 热门（buzzing.cc 中文翻译）

Image-blaster：仅凭一张图片即可生成3D场景、特效和网格

Image-blaster是一款开源工具，能够仅凭单张输入图片自动生成对应的3D场景、特效和网格模型。该项目已在GitHub平台发布，获得了开发者社区的关注，在Hacker News上收获了102个投票。这一技术简化了3D内容创作流程，有望降低相关领域的制作门槛。

图像生成多模态开源/仓库

01:37

Rohan Paul@rohanpaul_ai

X平台开源最新"For You"信息流推荐算法

X平台（原推特）已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序，转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子，再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量，而是像Transformer模型一样，将用户、帖子和历史行为作为一个整体进行预测，评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性，从而实现更个性化的内容推荐。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHub xAI 开源/仓库开源生态

5月15日

23:35

Microsoft Research@MSFTResearch

精选67

微软研究院的新工具、模型、代码库和论文现已发布。使用AI和智能体？值得关注： • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先智能体 • 意义匹配微调 • AI转型与经济发展

智能体 Microsoft 开源/仓库行业动态

推荐理由：微软研究院这波把 agent 工具链摊开了，MagenticLite 轻量框架和 verification-first 思路值得跟，做智能体的可以去 GitHub 翻翻。

22:57

小互@xiaohu

开源项目OpenSquilla：智能路由降低AI成本近十倍，兼容多平台与模型

开源项目OpenSquilla通过智能路由架构，在保持与OpenClaw相近性能（0.9251分）的同时，将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型，仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知，支持按需加载16种工具，并设有三档代码沙箱安全防护。项目提供统一后端，支持网页、命令行及Slack、飞书等平台接入，兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。

智能体 MCP/工具开源/仓库

22:54

Berryxia.AI@berryxia

X算法开源发布，普通人创作者用途引思考

兄弟们，老马将𝕏的最新算法公布了。已经开源到Github上，对于我们普通人这东西有啥用呢？ 🤔 创作者真的可以通过算法而“有利可图？” 创作迎合算法的内容还是.....? 地址：https://github.com/xai-org/x-algorithm 我已经让opus 4.7 拉满跑起来了

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHub xAI 开源/仓库

22:42

IT之家（RSS）

高德推出"华为鸿蒙 HarmonyOS 首个生成式 UI 开源框架"AGenUI，利用通用协议适配多终端界面

高德发布鸿蒙系统首个生成式UI开源框架AGenUI。该框架基于谷歌A2UI协议，以C++为核心，能将AI大模型生成的界面意图直接转化为鸿蒙原生组件，实现手机、平板、车机等多终端无缝适配。它深度适配鸿蒙全场景架构，直连系统渲染与分布式能力，无中间层损耗。性能上，相比iOS和Android版本，其渲染性能提升20%，内存占用降低18%。AGenUI已全面开源，旨在推动生成式UI成为鸿蒙生态的系统级标准能力。

开源/仓库部署/工程

22:04

Greg Brockman@gdb

开发者发布了一款开源的Codex技能，旨在将本地搜索转化为潜在客户线索。该工具能自动搜索附近的各类本地商户，并分析其是否拥有独立网站或仅依赖社交媒体页面，以此判断其建站需求。核心功能包括潜在客户挖掘、网站与纯社交媒体状态检查、线索评分、提取联系方式，并支持聊天或CSV格式输出。用户可通过一条命令快速安装使用。

Kappaemme: CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...

智能体 MCP/工具开源/仓库

20:49

HuggingFace Daily Papers（社区热门论文）

Sat3DGen：从单张卫星图像生成全面的街景级3D场景

Sat3DGen提出了一种从单张卫星图像生成街景级3D场景的新方法。针对现有方法在几何保真度与语义丰富性间的权衡难题，该方法采用“几何优先”策略，通过整合新颖的几何约束与视角训练策略，有效缓解了因视角差异大、监督稀疏导致的几何失真。在基于VIGOR-OOD测试集与新构建的高分辨率DSM基准上，该方法将几何RMSE从6.76米显著降至5.20米，同时大幅提升视觉真实感（FID从约40优化至19）。所生成的高质量3D资源可支持语义地图转3D合成、多相机视频生成等多种下游应用。代码已开源。

图像生成开源/仓库论文/研究

20:30

Hacker News 热门（buzzing.cc 中文翻译）

精选78

Show HN：根据基准测试排名，为您的硬件寻找最适合的本地 LLM

一个名为“WhichLLM”的开源工具已在GitHub发布，可根据用户硬件配置推荐最适合的本地大语言模型。该工具通过基准测试对各类模型进行排名，帮助用户依据自身设备的性能指标选择最优模型。项目在Hacker News上获得116点热度，显示出社区对本地化AI部署效率工具的积极关注。

开源/仓库端侧部署/工程

推荐理由：选本地 LLM 不再靠猜，这个工具把基准测试和硬件匹配做得像查配置表，刚接触端侧的人也能立刻上手。

19:30

Hacker News 热门（buzzing.cc 中文翻译）

精选71

克劳德（法律事务）

Anthropic公司在GitHub上开源了专为法律领域优化的AI模型“Claude for Legal”。该模型能更准确地处理法律文本、合同及案例摘要，旨在提升法律从业者效率。此消息在Hacker News上获得105个投票点数，显示出技术社区对其在法律科技领域应用潜力的关注。

Anthropic 开源/仓库推理

推荐理由：Anthropic 把 Claude 在法律场景的提示和工具打包成仓库，对法律人来说比 API 文档更直接可用，垂直落地信号明显。

12:06

Orange AI@oran_ge

开源一个月的时间，飞书 CLI 在 Github 破万星了。相比同期的一些 CLI，飞书这个确实是群里口碑最好的。为 Agent 做软件这件事，飞书践行得很好。

智能体开源/仓库部署/工程

11:54

歸藏(guizang.ai)@op7418

藏师傅的 PPT Skills，感觉 GitHub star 马上就要破万了呀！没点 star 的朋友点点 star 吧，谢谢了。顺便让 Codex 分析了一下安装的数据，还挺有意思的。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

智能体开源/仓库

11:02

蚂蚁 inclusionAI：HuggingFace 新模型

精选56

蚂蚁集团提出 ARGenSeg-8B：基于自回归图像生成模型的图像分割框架

蚂蚁集团推出 ARGenSeg-8B，一种将多模态理解与像素级感知统一的自回归图像生成分割框架。它利用多模态大语言模型（MLLM）输出视觉 token，并通过通用 VQ-VAE 解码为分割掩码，使分割完全依赖 MLLM 的像素级理解。采用 next-scale-prediction 策略并行生成视觉 token，降低推理延迟。在多个分割数据集上超越此前最优方法，推理速度显著提升。论文已被 NeurIPS 2025 接收，模型已发布在 HuggingFace。

Hugging Face 多模态开源/仓库模型发布

推荐理由：蚂蚁提出用自回归生成做分割，把理解和像素级感知统一到一个框架里，多个数据集SOTA且速度更快，做CV的值得看看。

09:51

Berryxia.AI@berryxia

精选75

牛津大学博士后开源视频翻译工具Violin，支持多语言翻译与视频对话

牛津大学博士后Kevin Lin开源视频翻译工具Violin，旨在打破高质量视频内容的语言壁垒。该工具将语音识别、大语言模型翻译与语音合成整合为自动化流水线，支持多语言互译与个性化翻译风格调整，例如将学术报告转化为儿童易懂版本。用户还能直接与视频内容进行对话并获取相关答案。Violin提供Web应用、命令行界面和Agent Skill三种使用方式，所有功能基于MIT协议开源，由Together Compute提供技术支持，适用于内容创作、教育及多模态智能体开发等领域。

Kevin Lin: 🌟Introducing🎻Violin - an Open-source Video Translation Skill. 📹Video is the dominant medium on the internet, yet most...

GitHub 多模态开源/仓库语音

推荐理由：视频翻译过去得拼几个 API，Violin 一个开源 Skill 把 ASR、翻译、TTS 全通了，还加上视频对话和风格定制，做多语言内容传播的必须收藏。