AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「GitHub」清除
6月19日周五
07:48Berryxia.AI66Browser Use 开源浏览器 agent 模板 B
07:47HuggingFace Daily Papers(社区热门论文)51REVES:基于修订与验证的测试时扩展训练框架
6月18日周四
22:52The Decoder:AI News(RSS)78精选Nature两篇研究:MIRA和AMIE诊断与治疗计划媲美甚至超越医生
20:44HuggingFace Daily Papers(社区热门论文)57STARE:基于惊喜度的Token级优势重加权实现策略熵稳定
09:14IT之家(RSS)50苹果游戏移植工具包 4 测试,《赛博朋克 2077》帧率提升 10%
08:00HuggingFace Daily Papers(社区热门论文)41停车位占用识别的自监督方法
07:14MiniMax (official)51MiniMax M3 视觉能力:截图即生成黑洞模拟器
04:42Hacker News 热门(buzzing.cc 中文翻译)69Launch HN: Adam(YC W25)--开源人工智能CAD
04:13AYi76精选Matt Pocock 开源 skills v1:将技能描述 Token 成本降低 63%
04:12GitHub Blog61精选GitHub 发布 CC0-1.0 开源多语言仓库级数据集,覆盖 README、Issue 和 PR
6月17日周三
23:15meng shao60CC Switch:在 Coding Agent 中切换任意模型
19:44Rohan Paul54知名仓库的Claude Fable 5系统提示词
12:26Hacker News 热门(buzzing.cc 中文翻译)64让 ast.walk 的运行速度提升 220 倍
08:27宝玉75精选baoyu-design 本地动画视频导出功能更新
05:55jason65NVIDIA GEAR实验室发布ENPIRE:首次实现物理世界自动研究
02:28HuggingFace Daily Papers(社区热门论文)50SproutRAG:基于注意力引导的树搜索与渐进式嵌入的长文档RAG
6月16日周二
20:29meng shao60LandingAI 推出 Agentic Document Extraction 的 Agent Skills
15:38宝玉50用Llama 3.3 70B扫描代码库误报问题遭批评
12:37Hacker News 热门(buzzing.cc 中文翻译)76精选微软旗下GitHub遭遇AI算力短缺,转而向AWS寻求支持
09:19meng shao66Vercel Labs 推出 HarnessAgent:为 Coding Agent 提供生成式 UI
08:49meng shao66@mattpocockuk 提出 AI 驱动开发七阶段及 /grill-with-docs 升级
04:59GitHub Blog59精选GitHub Copilot CLI 初学者指南:常用斜杠命令概览
04:36宝玉73宝玉发布《图解Skill》配套Repo中的info-digest Skill
03:59GitHub Blog54GitHub 发布新开源数据集,加速多语言 AI 研究与开发
00:13elvis73DAIR AI 开源 /learn skill,用 Agent 学习任何主题
6月15日周一
23:24宝玉39宝玉《图解 Skill》微信读书飙升版排名第15,抽10人送书
21:12凡人小北62AI Agent全自动协作:从发现Bug到修复Merge全程零人类编码
17:54Peter Steinberger 🦞43clawsweeper自动审核Issue并创建PR
11:23Berryxia.AI59pm-skills GitHub项目获1.3万星标
09:56Orange AI74Oran Ge 推出橙线插画.skill 长文自动插图工具
08:26Orange AI70橙线插画.skill开源:用AI生成纽约客风配图
08:00HuggingFace Daily Papers(社区热门论文)54基于梯度的 RLVR 稳定性分析与 WAPO
07:55karminski-牙医53Qwen3.6-27B在Iterative-Contextual-Refinements框架下超越Anthropic Fable5
02:17elvis73Elvis Saravia 发布 LLM Council 技能
6月14日周日
22:44向阳乔木82精选乔木小说创作 Skill 开源发布
09:51Orange AI73pi+DeepSeek架构图绘制Skill
08:00HuggingFace Daily Papers(社区热门论文)42SSync:面向视频目标中心学习的选择性协同学习方法
6月13日周六
21:08meng shao65邵猛更新 infocard-skills,优化多比例布局
17:54公众号:龙猫LongCat(美团)54WBench:面向交互式视频世界模型的首个系统性多轮评测基准
09:14Berryxia.AI73开发者开源一键开启国行 Mac Siri AI 工具
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月19日
07:48
Berryxia.AI@berryxia
66
Browser Use 开源浏览器 agent 模板 B

Browser Use 开源了基于 Vercel Eve 构建的浏览器 agent 模板 B。该模板让任意 agent 接入真实云端浏览器(Browser Use Cloud),实现网页浏览、点击、填表等操作,并通过 browser-harness 实时可视化执行过程,支持调试。模板已发布在 GitHub,可直接 clone 使用,支持初始化 skills 和 MCPs。开源免费,降低了开发可观测、可干预的 browser agent 的门槛。

Browser Use: Introducing B, a browser agent template! Built on Eve by @vercel. Give any agent a real Browser Use Cloud browser. Watch...

智能体GitHubMCP/工具产品更新
07:47
HuggingFace Daily Papers(社区热门论文)
51
REVES:基于修订与验证的测试时扩展训练框架

REVES是一种两阶段迭代训练框架,通过将成功恢复轨迹中的中间步骤转化为独立的修订与验证提示,聚焦于答案变换与错误识别,相比标准多轮强化学习降低了长程采样的计算开销。在LiveCodeBench上,使用公开测试用例作为反馈,较RL基线提升+6.5点,较标准多轮训练提升+4.0点。在circle packing任务上,仅用4B参数基础模型即匹配此前报告的SOTA结果。该方法还泛化到n_queens、mini_sudoku等分布外约束满足问题。代码已开源。

arXivGitHub推理数据/训练
6月18日
22:52
The Decoder:AI News(RSS)
精选78
Nature两篇研究:MIRA和AMIE诊断与治疗计划媲美甚至超越医生

德国团队开发的MIRA智能体在模拟电子病历中操作85,000种选项,500余例急诊诊断准确率88.9%,对比测试(311例)得分87.8%,高于资深专科医生(78.1%)和混合团队(71.1%)。MIRA在阑尾炎(98.6%)和胰腺炎(92.3%)最佳,未发现危险药物交互或剂量错误,性能不受语言影响,代码已公开。谷歌AMIE采用双智能体架构,在100个多访视病例中治疗计划适切率95%(初级保健医生72%),并在药物知识基准RxQA上超过医生。两项研究均警告模拟环境与现实存在差距,实际性能可能更低。

智能体GitHubGoogleOpenAI

推荐理由:两项 Nature 研究把 AI 诊断推到了和医生掰手腕的水平,但更值得关注的是那个被埋起来的实验:更强的模型一上来,精心搭建的 double-agent 架构几乎归零。医疗 AI 的护城河可能不是架构而是接入院内系统的能力。
20:44
HuggingFace Daily Papers(社区热门论文)
57
STARE:基于惊喜度的Token级优势重加权实现策略熵稳定

STARE是一种基于惊喜度的token级优势重加权方法,用于解决GRPO等可验证奖励强化学习中常见的策略熵崩溃问题。通过对GRPO下token级熵动态的一阶梯度分析,STARE识别出熵关键token子集并选择性重加权其有效优势,同时引入目标熵闭环门控实现稳定熵调节。在1.5B至32B参数的模型上,覆盖短思维链、长思维链和多轮工具使用三类任务,STARE能稳定训练数千步,保持策略熵在目标带内。在AIME24和AIME25基准上,STARE平均准确率高出DAPO等基线4%–8%,且反思token和响应长度协同增长。代码已开源。

GitHub数据/训练论文/研究
09:14
IT之家(RSS)
50
苹果游戏移植工具包 4 测试,《赛博朋克 2077》帧率提升 10%

苹果 GPTK 4 引入 Agentic AI 能力,通过 GitHub 开源智能体技能自动应用 Metal 最佳实践。测试显示,在 M3 Max MacBook Pro(48GB 内存/40 核 GPU)上,《赛博朋克 2077》通过 DirectX 12 转 Metal 4 帧率比 Metal 3 提升 10%;《反恐精英 2》帧率高于上一版。MacBook Neo 低设置运行《荒野大镖客 2》,GPTK 4 平均 35fps,较 GPTK 3 的 28fps 提升 25%。《007 初露锋芒》在 GPTK 3 下崩溃,现可运行至 60–70fps(1080p/中画质/FSR 质量),但每次启动需等待 20 分钟着色器编译。

GitHub开源生态评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
41
停车位占用识别的自监督方法

提出一种无需目标停车场标注样本的自监督占用识别方法。训练策略包含两个自监督阶段(先在未标注通用数据上预训练,再在未标注目标数据上微调),然后仅在通用停车场标签上监督微调。采用SimCLR与ResNet-50编码器,在PKLot、CNRPark-EXT和PLds三个数据集上通过留一法交叉环境评估。还引入两阶段部署策略:先部署强通用模型,再结合部署前N天收集的未标注图像自监督训练专用模型。强通用模型平均准确率97.2%,两阶段策略提升至97.8%。模型和代码已开源。

GitHub数据/训练论文/研究
07:14
MiniMax (official)@MiniMax_AI
51
MiniMax 官方转发用户 @coldopn 的体验:前沿模型已不再仅限于 Anthropic 和 OpenAI。通过将一张插图截图输入 Kilo Code,切换至 MiniMax M3 模型,仅凭一句"将此截图动画化为可工作的黑洞模拟器"的提示词,M3 即生成了完整的黑洞模拟器。整个推理过程仅花费 0.53 美元,展现了 M3 强大的视觉理解与生成能力。

Brian Turcotte: Frontier doesn't only mean Anthropic and OpenAI anymore. I built this black hole simulator by simply dropping an illustr...

GitHub多模态编码评测/基准
04:42
Hacker News 热门(buzzing.cc 中文翻译)
69
Launch HN: Adam(YC W25)--开源人工智能CAD

Adam 是一个开源 AI CAD 工具,可将自然语言和图像输入转化为 3D 模型。它完全在浏览器中运行(基于 WebAssembly),提供参数化滑块调节和实时预览(Three.js),支持导出 .STL、.SCAD、.DXF 格式,内置 BOSL、BOSL2 和 MCAD 库。基准测试显示,从单一提示词即可生成全参数化 OpenSCAD 模型,包括 V8 发动机、9 缸径向航空发动机、高旁通比涡轮风扇发动机等复杂多部件机器,以及六角扭曲花瓶、M12 螺栓与螺母等参数化零件,每个模型附带可调节维度和颜色数量。

GitHub产品更新多模态开源生态
04:13
AYi@AYi_AInotes
精选76
Matt Pocock 开源 skills v1:将技能描述 Token 成本降低 63%

Matt Pocock(Total TypeScript 作者)开源了 skills v1,将技能描述的 Token 成本降低 63%。该工具包将技能分为模型可调用和用户可调用,新增 /codebase-design、/domain-modeling、/grilling 三项技能;重写 /writing-great-skills;将 /diagnose 更新为 /diagnosing-bugs 并改为模型可调用;新增 /ask-matt 路由技能,帮助 AI 自动判断时机触发合适工程流程。主推文评价其将 prompt 从咒语拆解为纪律性流程。

Matt Pocock: Announcing mattpocock/skills v1 - Achieved a 63% reduction in token cost for skill descriptions - Split skills into mode...

GitHubMCP/工具开源/仓库编码

推荐理由:mattpocock 把资深工程师的编码流程拆成可复用的技能,Token 砍 63% 只是个结果,更有价值的是 AI 自触发技能的设计,vibe coding 进阶者必看。
04:12
GitHub Blog
精选61
GitHub 发布 CC0-1.0 开源多语言仓库级数据集,覆盖 README、Issue 和 PR

GitHub 推出一个新的仓库级数据集,采用 CC0-1.0 许可证,旨在帮助研究人员和开发者发现跨 README、Issue 和 Pull Request 的多语言开发者内容,加速多语言 AI 开发。

GitHub开源/仓库数据/训练

推荐理由:GitHub 发布了一个多语言开发者内容数据集,CC0 许可,对于训练跨语言代码模型和辅助翻译有直接价值,做多语言 Copilot 的团队应该会关注。
6月17日
23:15
meng shao@shao__meng
60
邵猛推荐 @Jason_Young1231 的开源项目 CC Switch,GitHub 获 103K 星。该项目解决 OpenAI Codex Responses API 与多数第三方 API Chat Completions 接口不兼容的问题,使更多模型可在 Codex 中直接使用,完全开源免费。

Jason Young: Love this direction from OpenAI. That's what we call being open. In practice, though, many third-party APIs are still Ch...

GitHubMCP/工具开源/仓库编码
19:44
Rohan Paul@rohanpaul_ai
54
来自@elder_plinius的那个著名仓库 Claude Fable 5 - 系统提示词
AnthropicGitHub教程/实践
12:26
Hacker News 热门(buzzing.cc 中文翻译)
64
让 ast.walk 的运行速度提升 220 倍

作者为优化 AI 生成 Python 代码的 lint 效率,发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理,实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑,并直接读取 __dict__ 及预缓存 AST 子类类型信息,最终将 ast.walk 速度提升约 220 倍。

GitHub教程/实践编码部署/工程
08:27
宝玉@dotey
精选75
baoyu-design 本地动画视频导出功能更新

baoyu-design(本地运行 Claude Design 的 Skill)新增动画视频导出功能。其声明式动画引擎基于 f(t) 设计:任意时间点 t 可绝对确定画面状态。导出采用无头 Chromium 逐帧截图 + ffmpeg 编码,每帧等待两帧 requestAnimationFrame 确保渲染完成。截图以 2 倍 DPR(3840×2160)再缩回 1080p,保证细节清晰。95 秒 30fps 动画需 2850 次截图循环,帧帧精确。项目已开源(MIT),获 1.2K star。此前 baoyu-design 已支持 PPT 本地生成和导出可编辑 PPTX。

宝玉: baoyu-design skill(让你本地运行 Claude Design 的 Skill)更新,本地生成 PPT 的效果,可以借助 Cursor、Codex 内置的浏览器预览 PPT,也可以直接用它们的标记工具修改 PPT 细节。按 ...

GitHub多模态开源/仓库视频

推荐理由:宝玉把 Claude Design 动画导出能力做成了本地 skill,原理讲得很透,声明式引擎加 f(t) 直接抽帧的思路让开发者能零成本复现,想要高质量 AI 动画输出的创作者可以立即用起来。
05:55
jason@jxnlco
65
NVIDIA GEAR实验室推出ENPIRE项目,首次实现物理世界自动研究。8个Codex智能体被授权控制机器人舰队、GPU及token预算,自主完成绑扎带、整理精密插针、安装GPU等高精度任务。系统无需人类干预,agent可自学视觉线索、复位场景、调参、翻阅论文、辩论反思,并直接硬件试错。团队发现"物理规模扩展"效应:8台机器人并行探索效率显著高于少数台。部分实验室已实现夜间自主改进,每天早上看报告。ENPIRE将全部开源,支持在家搭建自运行机器人实验室。

Jim Fan: Today, we enable AutoResearch in the physical world for the first time! Introducing ENPIRE: we give 8 Codex agents a fle...

GitHub产品更新具身智能开源/仓库
02:28
HuggingFace Daily Papers(社区热门论文)
50
SproutRAG:基于注意力引导的树搜索与渐进式嵌入的长文档RAG

SproutRAG是一个注意力引导的层次化RAG框架,通过学习句子间注意力构建二分块树,将句子级块组织成语义连贯的渐增单元。检索时使用层次化波束搜索获取多粒度候选,无需额外LLM调用或压缩摘要。框架端到端联合训练,优化嵌入和树结构。在科学、法律和开放域四个基准上,平均信息效率(IE)提升6.1%。代码已开源。

GitHub检索增强论文/研究
6月16日
20:29
meng shao@shao__meng
60
LandingAI 推出 Agentic Document Extraction 的 Agent Skills

LandingAI 将 Agentic Document Extraction 升级为 Agent Skills,支持在 Codex、Claude Code、Cursor 等 coding agent 的对话中直接调用,实现零脚本文档处理流水线。两个 Skill 分工明确:document-extraction 提供结构化 Markdown/层级 JSON 解析、基于 JSON Schema/Pydantic 的字段抽取、按文档类型拆分、按页分类路由(预览)、目录生成(预览)、异步大文件处理(最高约 1GB/6000 页)及元素级坐标与置信度可视化;document-workflows 封装并行批处理、Classify→Extract 混合流水线、RAG 准备(语义分块、embedding、ChromaDB/FAISS)、DataFrame/CSV/Snowflake 导出、bbox 标注叠加及 Streamlit 交互 UI。安装命令:/plugin marketplace add landing-ai/ade-document-processing-skills。

LandingAI: Turn Claude Code into a Document Processing Agent! We just released Agentic Document Extraction (ADE) skills for AI codi...

智能体GitHubMCP/工具产品更新
15:38
宝玉@dotey
50
用Llama 3.3 70B扫描代码库误报问题遭批评

用户指责某人使用Llama 3.3 70B扫描代码库,生成的错误报告全是错误的,认为这种行为纯粹是在制造互联网垃圾,并决定将其拉黑。该推文附带了相关GitHub issues链接。

GitHub大佬观点编码
12:37
Hacker News 热门(buzzing.cc 中文翻译)
精选76
微软旗下GitHub遭遇AI算力短缺,转而向AWS寻求支持

微软旗下GitHub面临AI算力短缺,微软因此转向亚马逊AWS寻求计算资源支持。原文来自Hacker News热门讨论,标题为“Microsoft turns to AWS as GitHub faces AI capacity crunch”。

GitHubMicrosoft编码行业动态

推荐理由:微软因AI编码需求导致GitHub容量告急,转向竞争对手AWS租用算力,这信号很明确——AI开发工具已从软件功能战升级为超大规模基础设施竞赛,GitHub的可靠性危机可能加速开发者的平台迁移。
09:19
meng shao@shao__meng
66
Vercel Labs 推出 HarnessAgent:为 Coding Agent 提供生成式 UI

Vercel Labs 利用 AI SDK 7 实验 API 推出 HarnessAgent,结合 json-render 为 Claude Code / Codex / Pi 等 Coding Agent 提供生成式 UI。Agent 在 Vercel Sandbox 隔离 Linux 环境中执行写文件、跑测试等真实操作,输出受 Zod schema 约束的 JSONL UI 规格(仅限 Steps、FileChange、Terminal 等预定义组件),前端通过 useChat + useJsonRenderMessage 实时渲染。核心设计:Harness 抽象允许像换模型一样互换 Agent;UI 层与执行层完全解耦;Session 绑定 Sandbox,10 分钟空闲或“Start Over” 销毁。Agent 不得虚构结果,失败必须展示 error step、非零 exit code 或失败测试。

Chris Tate: Introducing Generative UI for Claude Code, Codex and Pi Charts, forms, 3D, anything Your agent renders real UI for users...

智能体GitHubMCP/工具产品更新
08:49
meng shao@shao__meng
66
@mattpocockuk 提出 AI 驱动开发七阶段及 /grill-with-docs 升级

@mattpocockuk 提出 AI 驱动开发七阶段:Grill(模糊→共享理解)、Research(缓存外部信息)、Prototype(可玩代码验证)、PRD(需求文档)、Issues(垂直切片)、Implement(Agent 执行)、Review(人工 QA)。/grill-with-docs 是 /grill-me 的升级版,专为有代码库场景设计,新增领域语言(CONTEXT.md)、ADR(docs/adr/)及会话四类动作。无代码库时仍用 /grill-me。作者认为 pre-PRD 阶段需更多结构,/grill-with-docs 将再次调整。

Matt Pocock: Here are my 7 phases of AI-powered development. I've been thinking that the pre-PRD phase needs more structure. You need...

智能体GitHub教程/实践编码
04:59
GitHub Blog
精选59
GitHub Copilot CLI 初学者指南:常用斜杠命令概览

GitHub Copilot CLI 为初学者提供了常用斜杠命令的概述,帮助用户通过命令控制终端中的 AI 智能体。

GitHub教程/实践编码

推荐理由:如果你是刚用上 Copilot CLI 的开发者,这篇官方指南把最常用的 slash 命令都讲清楚了,上手很快;老用户可以直接跳过。
04:36
宝玉@dotey
73
宝玉发布《图解Skill》配套Repo中的info-digest Skill

宝玉(@dotey)公开了《图解Skill》配套GitHub仓库中的info-digest Skill,用于日常整理AI资讯并生成推文初稿,默认调用Claude网页版+Opus 4.6。核心提示词技巧:1)站在读者角度写作;2)联网检索做实核查;3)交代背景信息;4)生成短而精炼的纯文本格式。该Skill为项目库JimLiu/Illustrated-Agent-Skills的一部分。同步有抽奖活动(转发/引用/评论抽10人,本周五中午12点,使用Grok抽奖)。

宝玉: 🎟️抽奖啦!为了回馈读者们对《图解 Skill -- AI 提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10 个人,北京时间本周五中午12点开奖。 规则很简单:转发、引用、评论这条推文就可以。 可以选择实体书(仅限内地地址)或者电子...

GitHub开源生态教程/实践
03:59
GitHub Blog
54
GitHub 发布新开源数据集,加速多语言 AI 研究与开发

GitHub 在 CC0-1.0 许可下发布了一个仓库级数据集,涵盖多语言开发者内容,包括 README、issue 和 pull request。该数据集旨在帮助研究者和开发者发现并利用跨语言的技术文档与社区讨论,以推动多语言 AI 的构建与优化。

GitHub开源/仓库数据/训练
00:13
elvis@omarsar0
73
DAIR AI 开源 /learn skill,用 Agent 学习任何主题

DAIR AI 创始人 Elvis Saravia 开源 /learn skill,允许用户通过 AI 智能体和 HTML artifacts 学习任意主题。该 skill 可安装后与任何 Agent 交互,生成视觉化、交互式的 artifact,帮助深入理解或生成知识检测(如测验)。支持 DAIR Academy pro 会员在 AI Builder 中使用。GitHub 链接及试用平台已开放。

智能体GitHub开源/仓库开源生态
6月15日
23:24
宝玉@dotey
39
宝玉(@dotey)的《图解 Skill -- AI 提效实战指南》在微信读书飙升版排名第15。为回馈读者,抽10人送实体书(限内地)或电子书,北京时间本周五12点开奖,转发、引用、评论即可参与。抽奖借助@Grok进行,将注意防范提示词注入。已购书读者可前往配套GitHub项目JimLiu/Illustrated-Agent-Skills,内含interview-analysis、interview-writing、info-digest等入门级实用Skills。

宝玉: 🎟️抽奖啦!为了回馈读者们对《图解 Skill -- AI 提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10 个人,北京时间本周五中午12点开奖。 规则很简单:转发、引用、评论这条推文就可以。 可以选择实体书(仅限内地地址)或者电子...

GitHub教程/实践
21:12
凡人小北@frxiaobei
62
AI Agent全自动协作:从发现Bug到修复Merge全程零人类编码

开发者@JeffreyCalm分享经历:他将GitHub链接交给Codex部署,发现Bug后Codex自动提Issue。官方仓库的Code Review Bot确认Bug并At Hotfix Bot,后者30分钟内提交修复PR,最后At真人开发者。真人仅回复“OK”即完成Merge。全程人类零编码,仅贡献一个决策确认,折射出Agent经济与A2A平台雏形。

Jeffrey.W: Github 本身在成为一个 A2A 平台。 我本周经历了一个特别魔幻的事情: 1. 我把一个 Github 链接丢给 Codex,让它帮我部署一下。 2. 我用了一段时间,发现似乎有个 Bug。我让 Codex 查了一下,它确认是个 Bu...

智能体GitHub开源生态现象/趋势
17:54
Peter Steinberger 🦞@steipete
43
每当你在我们的一个开源项目上创建issue时,@clawsweeper 会审核它,*如果*它符合VISION.md文件,就会接手并创建+自动审核一个PR。 例如:https://github.com/openclaw/gogcli/pull/816
智能体GitHub教程/实践编码
11:23
Berryxia.AI@berryxia
59
一个专门为产品经理准备的 Skill 包(pm-skills)在 GitHub 上 5 天内获得 13k Stars(约 1.3 万)。该项目覆盖产品经理日常工作范围,但发布者提醒用户警惕大而全的 Skill 包,建议根据实际需求进行微调后再使用。

向阳乔木: 一个专门给产品经理准备的Skill,五天竟有13k Stars。 从名字看,确实涵盖了产品经理日常工作范围。 警惕大而全的Skill产品包,最好体验根据需求微调。 安装地址见评论

GitHubMCP/工具开源/仓库
09:56
Orange AI@oran_ge
74
Oran Ge 推出橙线插画.skill 长文自动插图工具

Oran Ge 发布了一套名为“橙线插画.skill”的 AI 智能体技能,可自动将长文生成插图。他以 7.5 万字的文章《置身钉内》作为测试,由 Agent 为每个场景生成 2 套插图供挑选,最终制作了 20 张插图,且未做任何修改。该技能旨在帮助读者快速理解长文内容,下载地址已公开在 GitHub。

Orange AI: http://x.com/i/article/2066286219416469504

GitHub图像生成开源/仓库教程/实践
08:26
Orange AI@oran_ge
70
橙线插画.skill开源:用AI生成纽约客风配图

Oran Ge发布开源技能“橙线插画.skill”,基于Fable 5模型(已绝版)的纽约客风格插画迭代而来,支持Cola、Claude Code、Codex等Agent。该skill可生成文章配图及带插图的HTML幻灯片。作者同时分享了在钉钉工作期间的20个反思切片(如“好产品只有一个主发心”),配图由Agent为每个场景生成2套方案,最终免费开源发布在GitHub。

智能体GitHub图像生成开源/仓库
08:00
HuggingFace Daily Papers(社区热门论文)
54
基于梯度的 RLVR 稳定性分析与 WAPO

带可验证奖励的强化学习(RLVR)可提升语言模型推理能力,但 GRPO 式优化易出现不稳定性。通过 token 级梯度动态分析,发现更新受优势符号与当前策略下 token 分布共同影响。为此提出胜者优势策略优化(WAPO),一种仅对正优势补全进行更新的在线剪切策略梯度目标。在数学推理与多跳问答基准上,WAPO 提升了训练稳定性,并在多个模型族上达到或超越基线表现。完整代码已开源。

GitHub推理数据/训练论文/研究
07:55
karminski-牙医@karminski3
53
Qwen3.6-27B在Iterative-Contextual-Refinements框架下超越Anthropic Fable5

Iterative-Contextual-Refinements框架使Qwen3.6-27B在CGRE测试中获95.5分,超越Anthropic Fable5(Mythos)的94.1分。该框架通过BFS探索多种方案(如KMP、滑动窗口)、DFS结合性能工具迭代优化代码,以及路由统筹形成闭环,克服小模型易陷入局部最优的弱点。代价是token消耗增加25-40倍。框架与论文已开源。

智能体arXivGitHub开源生态
02:17
elvis@omarsar0
73
Elvis Saravia 发布 LLM Council 技能

Elvis Saravia 开源了 llm-council 技能,专为 Claude Code 等 AI 智能体设计,适用于深度研究任务。该技能默认集成 Fireworks AI 的 API,可轻松适配 OpenRouter。项目代码托管在 GitHub,地址为 dair-ai/dair-academy-plugins。

OpenRouter: Introducing the Fusion API, the smartest compound model in the market. Fusion achieves Fable-level intelligence at half ...

智能体GitHubMCP/工具教程/实践
6月14日
22:44
向阳乔木@vista8
精选82
乔木小说创作 Skill 开源发布

开源乔木小说创作 Skill,用户只需说“我想写一个小说”或指定风格,AI 自动生成剧情梗概、人物设定、钩子、经典桥段、人物欲望、冲突升级和结尾。与 AI 讨论确认后,可生成完整、低 AI 味的小说。安装命令:npx skills add joeseesun/qiaomu-novel-generator,Github 开源地址见评论区。

GitHub开源/仓库

推荐理由:乔木这个开源小说Skill把AI写作从‘给个灵感’拉到了‘完整创作流程’,里面把钩子、桥段、冲突结构化,做内容的可以直接套用,降低了普通人写小说的门槛。
09:51
Orange AI@oran_ge
73
Oran Ge推荐一个用pi+DeepSeek绘制架构图的skill。该skill无需生图模型,通过LLM将自然语言描述转为结构化JSON,再由Node.js渲染器用纯几何算法生成SVG,最终注入为自包含HTML。仓库:https://github.com/tt-a1i/archify。用户评价其审美优于大模型默认输出。

Geek: pi + DeepSeek 画的,才发现这个技能不需要生图模型,是通过 LLM 将自然语言描述转为结构化 JSON → Node.js 渲染器用纯几何算法生成 SVG → 注入自包含 HTML。 https://github.com/tt-...

GitHub开源/仓库开源生态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
42
SSync:面向视频目标中心学习的选择性协同学习方法

针对视频目标中心学习中密集对齐策略传播各模块弱点且计算代价二次增长的缺陷,提出 Selectice Synergistic Learning (SSync)。该方法避免穷举对齐,而是选择性蒸馏最可靠线索:编码器用于边界细化,解码器用于内部去噪。通过线性复杂度的伪标记实现,并引入传递式伪标记合并以消除重叠 slot 冗余。实验表明 SSync 显著提升分解质量,作为即插即用模块对 slot 配置具有强鲁棒性。代码已开源。

arXivGitHub开源/仓库数据/训练
6月13日
21:08
meng shao@shao__meng
65
邵猛更新 infocard-skills,优化多比例布局

邵猛(@shao__meng)更新开源项目 infocard-skills,提升不同比例下的布局合理性,避免空白或截断,保留瑞士国际主义风格。支持 16/9、4/3、1/1 等常见信息卡比例及封面比例,默认 4/3。用户输入内容和比例,AI Agent 使用该 Skill 生成 HTML 并截图输出 PNG。项目开源于 GitHub。

meng shao: 信息卡制作完整方法我做成了 Skill「infocard-skills」,开源在这里了: https://github.com/shaom/infocard-skills 支持 16/9、4/3、1/1、3/4、9/16 几种常见比例信息卡...

智能体GitHubMCP/工具开源/仓库
17:54
公众号:龙猫LongCat(美团)
54
WBench:面向交互式视频世界模型的首个系统性多轮评测基准

美团 LongCat 团队推出 WBench,首个面向交互式视频世界模型的系统性多轮评测基准。包含 289 个测试案例、1058 个交互轮次,覆盖导航、主体动作、事件编辑、视角切换四种交互方式,从视频质量、设定遵循度、交互遵循度、一致性、物理真实性五维度评测 20 个前沿模型(包括 Kling 3.0、HY-World 1.5、Genie 3 等)。核心发现:无全能模型,导航能力与画质无关;多轮交互后所有模型性能下降,导航平均分下降 33 点;开源模型 HY-World 1.5 导航能力突出;视角切换最难(平均分 30.7)。WBench 已开源。

arXivGitHub开源生态视频
09:14
Berryxia.AI@berryxia
73
开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具,通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI。此前有用户发现 macOS 的 GenerativeModels.plist 文件中存在 EnhancedSiriWaitlist 开关,关闭 SIP、挂载系统卷、修改键值并重启即可解锁 WWDC 新发布的 Siri AI 增强版。社区已整理出详细步骤,证明该 AI 能力早已内置,仅被等候名单屏蔽。

Berryxia.AI: 我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有...

GitHub开源/仓库端侧语音
‹ 上一页
12345…11
下一页 ›