5月15日

16:39

Peter Steinberger 🦞@steipete

为discrawl（存储媒体）构建了一个新功能， codex说它已完成，然后我使用了我的codex审查技能… https://github.com/steipete/agent-scripts/blob/main/skills/codex-review/SKILL.md

智能体 GitHub 教程/实践编码

14:37

蚂蚁 inclusionAI：GitHub 新仓库

ARGenSeg：基于自回归图像生成模型的全新图像分割方法

研究团队在NeurIPS 2025上提出ARGenSeg，将图像分割转化为自回归生成过程，逐像素预测分割掩码。该方法利用大规模预训练自回归图像生成模型（如GPT风格视觉模型）的表征与序列建模能力，无需专门架构设计或大量标注数据。实验证明，其在多个标准数据集上性能具有竞争力，展现了生成式基础模型处理判别式视觉任务的潜力。

GitHub 图像生成论文/研究

12:42

宝玉@dotey

精选79

微信群聊总结Skill"毒舌版"提示词详解

该提示词要求Claude基于普通版总结骨架，以毒舌、尖锐但不恶毒的风格重写微信群聊总结。具体包括扮演专业评论员，为发言排行添加毒舌备注、将群友画像改为“不留情面版”，并用戏谑口吻撰写概览。同时设定了创作红线，如不涉及人身攻击、私人信息或医学诊断，仅针对群内公开行为进行调侃。技术实现依赖于wx-cli，推荐使用Claude Code和Claude Opus 4.6模型以达到最佳效果。

宝玉: baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...

智能体 Anthropic GitHub 教程/实践

推荐理由：宝玉这个毒舌版 prompt 把群聊总结从工具变成了社交玩具，红线设计和「先放飞再审查」的写作顺序值得所有写 prompt 的人抄一遍。

10:54

歸藏(guizang.ai)@op7418

GitHub 发布了 GitHub Copilot 桌面端的技术预览版。看起来跟 Codex 长得有点像，在 GitHub 相关功能上露出的也比较多。现在需要申请 waitlist

GitHub: Cooking up something new 🧑🍳 Join the waitlist for early access to technical preview of the GitHub Copilot app 👇 https...

GitHub 产品更新编码

09:51

Berryxia.AI@berryxia

精选75

牛津大学博士后开源视频翻译工具Violin，支持多语言翻译与视频对话

牛津大学博士后Kevin Lin开源视频翻译工具Violin，旨在打破高质量视频内容的语言壁垒。该工具将语音识别、大语言模型翻译与语音合成整合为自动化流水线，支持多语言互译与个性化翻译风格调整，例如将学术报告转化为儿童易懂版本。用户还能直接与视频内容进行对话并获取相关答案。Violin提供Web应用、命令行界面和Agent Skill三种使用方式，所有功能基于MIT协议开源，由Together Compute提供技术支持，适用于内容创作、教育及多模态智能体开发等领域。

Kevin Lin: 🌟Introducing🎻Violin - an Open-source Video Translation Skill. 📹Video is the dominant medium on the internet, yet most...

GitHub 多模态开源/仓库语音

推荐理由：视频翻译过去得拼几个 API，Violin 一个开源 Skill 把 ASR、翻译、TTS 全通了，还加上视频对话和风格定制，做多语言内容传播的必须收藏。

08:51

Berryxia.AI@berryxia

开发者Yetone将一篇关于桌面应用开发"最佳实践"的文章转化为一个名为"native-feel-skill"的Agent Skill。该Skill旨在帮助开发者利用Coding Agent，轻松地重构或开发跨平台桌面应用，并使其获得极其接近Native原生应用的性能体验。项目代码已开源在GitHub上。

yetone: 由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...

智能体 GitHub 开源/仓库编码

08:51

Berryxia.AI@berryxia

开源3D生成工具包：单张图片快速构建可交互3D世界

开发者@neilsonks开源了一套专为Claude Code设计的完整3D生成工具包。该工具能将输入的单张图片自动拆解，生成包含环境、网格、物理、灯光和音频的全套可交互3D场景。其流程首先利用图像与3D生成技术提取物体并生成高质量网格，随后移除物体以得到静态背景，最后为整个场景添加物理模拟、实时灯光和环境音效。配套查看器支持对生成物体的点击编辑与一键导出。此工具将以往需数天的2D转3D工作流程缩短至几分钟，适用于游戏开发、世界构建和产品可视化等项目。项目已在GitHub开源。

neilson: open-sourcing a 3D gen toolkit for Claude Code input image → environment, meshes, physics, lighting, & audio

Anthropic GitHub 产品更新多模态

08:48

HuggingFace Daily Papers（社区热门论文）

精选73

迈向自我进化的智能文献检索系统

针对传统检索无法理解复杂意图、而前沿大语言模型成本高且存在幻觉的问题，研究团队提出了自我进化的智能文献检索系统PaSaMaster。该系统通过迭代式意图分析、检索与排序，将文献检索转变为动态演进的过程，并采用三项关键设计：利用排序证据揭示信息缺口以优化搜索；将检索定义为意图-论文相关性排序任务，从根本上杜绝虚假文献；通过分离规划与检索来提升效率，仅用大模型理解意图，而将大规模检索与评分交由轻量模型处理。在涵盖38个学科的基准测试中，该系统将传统关键词检索的F1分数提升15.6倍，完全消除了文献幻觉，且性能超越GPT-5.2达30%，计算成本仅为后者的1%。

智能体 GitHub 检索增强论文/研究

推荐理由：学术文献检索一直被关键词和LLM幻觉两头堵，这个系统用规划与检索分离做到了零幻觉，F1暴涨15.6倍，比GPT-5.2强30%却只花1%算力，做科研的可以马上跑起来。