AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 524 条
全部一手资讯X论文
标签「开源/仓库」清除
Artificial Analysis@ArtificialAnlys · 6月19日63

Wisedocs, an AI-powered medical record review platform, has launched Medical Long Context Reasoning (MLCR), a new long-context document evaluation based on their experience using frontier models to process medical data. This benchmark tests how well models reason over realistic medical and insurance case files, even as the amount of noise from other documents increases to larger context sizes. It includes a range of difficulty levels, with a private hold-out set of questions including complex medical reasoning, hallucination checking, and parallel questions in a single query inspired by real-world usage. We're excited to partner with @Wisedocsai to bring this benchmark to Artificial Analysis soon!

译Wisedocs 发布 Medical Long Context Reasoning (MLCR) 基准,测试 LLM 对真实医疗档案的长文档推理能力。评测包含 250 个问题,横跨 6 个难度等级,另设私有保留集,涵盖复杂医学推理、幻觉检测及单次查询中的并行提问。Wisedocs 同步开源 10 个合成病例、低三级问题及评估工具。Artificial Analysis 将合作上线该基准。

向阳乔木@vista8 · 6月18日79

免费开源乔木画布,一键部署Vercel为网站,简化版 PS。 支持Seedream生图、GPT-image-2,图片模版存储分享。 支持一键抠图、2w图标和常见Emoji,甚至都能画PRD了。 随时创建不同尺寸画布(3:4/16:9/21:9)。 原想做些高级功能收费,庆祝端午节,现全免费开源。 在线体验:https://ps.qiaomu.ai/ Github见评论区。

译乔木画布推出免费开源在线图像编辑器,可一键部署Vercel为网站,功能类似简化版PS。支持Seedream和GPT-image-2生图、图片模板存储分享、一键抠图、2万图标和常见Emoji,甚至能绘制PRD。随时创建3:4/16:9/21:9等不同尺寸画布。原计划高级功能收费,庆祝端午节现全免费开源。在线体验:https://ps.qiaomu.ai/,GitHub见评论区。

meng shao@shao__meng · 6月18日82

Vercel 开源了他们的 Agent Framework「Eve」 Agent 即目录,生产级能力开箱即用,把反复出现的 Agent 形态抽象成框架,让开发者只写「做什么」,而不是「怎么跑起来」。 https://vercel.com/blog/introducing-eve 核心设计:Agent 是一个目录 agent/ agent.ts # 模型与配置 instructions.md # 系统提示 / 人格 tools/ # 可执行能力 skills/ # 领域知识(Markdown) subagents/ # 子 Agent 委托 channels/ # Slack、Discord 等入口 schedules/ # 定时任务 connections/ # MCP / OpenAPI 外部连接 内置的生产能力 · 持久会话:每轮对话是可 checkpoint 的 durable workflow(基于开源 Workflow SDK),可暂停、崩溃/部署后恢复 · 沙箱:Agent 生成代码与主应用隔离;本地 Docker/microsandbox,部署用 Vercel Sandbox,可写 adapter · Human-in-the-loop:工具上设 needsApproval,暂停不占算力,审批后从断点继续 · Connections:MCP / OpenAPI 以文件声明;鉴权由框架代理,模型不接触 URL/凭证;Vercel Connect 处理 OAuth · 多 Channel:同一 Agent 服务 HTTP、Slack、Discord、Teams 等;Channel 间可 handoff · Tracing & Evals:OpenTelemetry 标准 trace;eve eval 可本地或 CI 跑,作部署门禁 开发与部署流程 · 本地:eve dev → TUI 可见每步(load_skill、tool call 等);底层是 HTTP API,CI/脚本也可驱动。 · 部署:vercel deploy,Agent 即普通 Vercel 项目;部署不中断进行中的会话(在启动版本上跑完)。沙箱等通过 adapter 切换,代码不变。 · 接入团队:eve channels add slack 生成 channel 文件;审批在 Slack 里点按钮;schedules/ 用 cron 定时触发(部署为 Vercel Cron Job)。 · 工程化:Agent 进 Git(prompt/工具/skill 都有 diff 和 review);Preview 部署可提前测 Slack bot;eve eval 进 CI 防回归。 Vercel 内部验证 · d0:月 3 万+ 问数,权限与提问者对齐 · Lead Agent:自主 SDR,年成本约 $5k,回报约 32 倍 · Athena:RevOps 6 周无工程师搭建,接 Snowflake/Salesforce · Vertex:约 92% 工单自动解决 · draft0:内容审阅流水线 · V:路由 Agent,统一入口分发到百级 Agent 舰队

译Vercel 发布开源 Agent 框架 Eve,核心设计“Agent 即目录”:通过 agent.ts、instructions.md、tools、skills、subagents、channels、schedules、connections 等文件声明行为。内置持久会话(可 checkpoint)、沙箱隔离(本地 Docker/Vercel Sandbox)、Human-in-the-loop 审批(不占算力)、MCP/OpenAPI 连接(鉴权由框架代理)、多 Channel 支持(HTTP/Slack/Discord)、OpenTelemetry 追踪与 eve eval 门禁。本地 eve dev TUI,部署为普通 Vercel 项目,不中断进行中会话。内部已验证:d0 月 3 万+ 查询,Lead Agent 年成本约 $5k 回报 32 倍,Vertex 约 92% 工单自动解决。

AYi@AYi_AInotes · 6月18日76

被 vibe coding 反噬过的AI玩家和开发者们看过来,这个工具包把 Token 消耗砍掉了 63%,注意可不是单纯的砍功能,主要是砍废话。 @mattpocockuk Pocock(Total TypeScript 作者,前 Vercel)把资深工程师开工前的肌肉记忆拆成了可触发的技能——/ask-matt,就好像他本人站你身后一样,你扔任务进去,它先推荐该用哪个技能,再让 AI 按流程走,需求拷问、领域建模、TDD 红绿,每一步都有纪律。 v1 版更狠的地方是 AI 可以自己判断时机触发技能,你不用盯着喊停,有点像个老钳工把动手前先划线灌进了 AI 的身体里。 现在有人把 prompt 当咒语攒,有人把 prompt 当流程拆,v1属于后者。 开源在 GitHub,链接放评论区啦~

译Matt Pocock(Total TypeScript 作者)开源了 skills v1,将技能描述的 Token 成本降低 63%。该工具包将技能分为模型可调用和用户可调用,新增 /codebase-design、/domain-modeling、/grilling 三项技能;重写 /writing-great-skills;将 /diagnose 更新为 /diagnosing-bugs 并改为模型可调用;新增 /ask-matt 路由技能,帮助 AI 自动判断时机触发合适工程流程。主推文评价其将 prompt 从咒语拆解为纪律性流程。

Yuchen Jin@Yuchenj_UW · 6月17日77

The future of coding is not one agent. It's a whole AI team. Omnigent lets you run a team of agents in one live session: Claude Code, Codex, Cursor, Pi, and your own agents. It is a meta-harness for AI agents, built from our internal Databricks dev tools, and now open-sourced for everyone. Built by the legendary @matei_zaharia and the Databricks AI team. And yes, Matei still writes a lot of code, even the frontend code for Omnigent and our products.

译编程的未来不是单一智能体,而是一个完整的AI团队。 Omnigent让你在一个实时会话中运行一个智能体团队:Claude Code、Codex、Cursor、Pi,以及你自己的智能体。 它是一个面向AI智能体的元框架,基于我们内部的Databricks开发工具构建,现已开源给所有人。 由传奇人物@matei_zaharia和Databricks AI团队打造。没错,Matei仍然编写大量代码,包括Omnigent和我们产品的前端代码。

meng shao@shao__meng · 6月17日60

在你的 Coding Agent 里切换任意模型 推荐 @Jason_Young1231 的开源项目「CC Switch」 https://github.com/farion1231/cc-switch Github 103K ⭐️,远高于原作者的 X 关注数量,这不合理,关注 CC Switch 的朋友们,关注起来!

译邵猛推荐 @Jason_Young1231 的开源项目 CC Switch,GitHub 获 103K 星。该项目解决 OpenAI Codex Responses API 与多数第三方 API Chat Completions 接口不兼容的问题,使更多模型可在 Codex 中直接使用,完全开源免费。

jason@jxnlco · 6月17日22

How’s glm in the codex harness

译提醒:Codex App、CLI 和 SDK 可与任何开源模型搭配使用,不限于 OpenAI 模型。详情:https://developers.openai.com/codex/config-advanced#oss-mode-local-providers

歸藏(guizang.ai)@op7418 · 6月17日39

即梦上了 Seedance 2.0 Mini,便宜了不少 可以玩玩了

Berryxia.AI@berryxia · 6月17日73

兄弟们,Claude Fable5 连夜下架! GLM-5.2 直接宣布免费开源啊! 而且直接把GLM-5.2的权重都开源了,而且还是MIT协议,1M上下文,在Coding和Agent任务上还有大幅提升。 他们这次重点强化了长程任务的Agent能力,覆盖大规模代码实现、自动化研究、性能优化和复杂调试。 实际表现上,Coding、Tool use、Reasoning都比GLM-5.1有明显进步,尤其在需要长时间规划和多步执行的场景里更稳。 还提供了Max和High两种推理模式,让你能在极致性能和Token效率之间自由切换。 API价格和上一代一样,同时在Slide生成、长文档处理、长文写作和长上下文角色扮演上也都有明显进步。 最关键的是权重彻底开源,社区已经在DeepSWE等基准上验证了它的实力。 这意味着有条件的开发者现在就能在本地或者自建环境里,跑起以前只有闭源大模型才能比较稳的长上下文Agent。 以前我们总觉得开源模型在真正硬核的Coding和Agent场景还差一截,现在这个差距又被拉近了一大步。 PS:我就希望可以算力更充足点… 😂 别无他求了 ……

译GLM-5.2 以 MIT 协议开源权重,支持 1M 上下文窗口。相比 GLM-5.1,在 Coding、Tool use、Reasoning 上明显提升,尤其在长程 Agent 任务(大规模代码实现、自动化研究、性能优化、复杂调试)中更稳定。提供 Max 和 High 两种推理模式,分别侧重极致性能与 Token 效率平衡。API 价格与上一代相同。社区已在 DeepSWE 等基准上验证其能力。此外,Slide 生成、长文档处理和角色扮演等任务也有进步。

宝玉@dotey · 6月17日75

baoyu-design skill 可以在本地生成动画视频,导出 mp4 格式,就像附件视频这个。 Claude Design 网页版可以用提示词创建动画视频,但你需要在网页上才能看到视频,无法下载。也有人基于第三方插件录屏软件实现过,不过很麻烦,效果也不是很好。 在这套 Skill 基础上,我已经实现了直接把动画导出成 mp4 视频的能力。 生成动画和导出视频,其实原理差不多,就是每一帧画面,都是根据所在时间坐标算出来的,就像一个函数 f(t),你传入给动画引擎任意一个时间点 t,它能直接算出那一瞬间屏幕上每个元素的位置、透明度、大小,所有视觉状态完全由 t 决定。不需要从头播放到那个时刻,也不需要记住之前发生了什么。 传统写动画的方式是命令式的:到了某个时刻,去改某个元素的位置,把透明度调一下。状态散落在各处,时间一乱画面就乱。这套引擎反过来,用的是声明式思路:你不去驱动元素运动,只描述在第 t 秒,每个元素应该长什么样。 打个比方,传统动画像看电影,你必须从头看才知道第 30 分钟画面是什么。这套引擎更像一本特殊的书,翻到任意一页,画面都是完整的、确定的。 这个设计带来了三个能力: 1. 拖动播放条跳到任意位置可以,因为 f(t) 随时能算; 2. 反复调试同一个画面可以,因为同一个 t 永远产出同一帧; 3. 把动画导出成视频也可以,而且方式很巧妙。 那么导出视频是怎么实现的呢? 直觉上,把浏览器里的动画变成 MP4,录个屏不就行了? 录屏是实时的。机器稍微一卡就掉帧,拍出来的视频不可复现。而且播放条、黑色背景、圆角阴影这些"播放器外壳"会一起被录进去。 baoyu-design 用的方法更像定格动画的拍摄:启动一个无头浏览器(没有界面的 Chromium),加载动画页面,通过引擎预留的一个控制接口精确操控时间轴。每设定一个时间点,等浏览器把画面渲染完成,截一张图,通过管道直接喂给 ffmpeg 编码。一段 95 秒、30fps 的动画就是 2850 次"摆好时间,拍照"的循环。慢,但每一帧都是精确的,绝不掉帧。 这里有个容易忽略的细节:设定时间后,工具会等两帧 requestAnimationFrame 再截图。因为修改时间只是改了 React 状态,浏览器还需要一到两帧才能把新画面真正画到屏幕上。等少了,截到的可能是上一帧的残影。 为了让画面更锐利,截图时用 2 倍设备像素比渲染,实际按 3840×2160 出图,最后由 ffmpeg 缩回 1080p。原理和高分辨率印刷一样:先在更大的画布上精细绘制,再高质量缩小,文字边缘和细线会明显更清晰。 baoyu-design 在 GitHub 开源(MIT 协议),目前 1.2K star。感兴趣的可以去看看它的 skills/baoyu-design 目录,动画引擎的完整实现都在里面。 https://github.com/jimliu/baoyu-design

译baoyu-design(本地运行 Claude Design 的 Skill)新增动画视频导出功能。其声明式动画引擎基于 f(t) 设计:任意时间点 t 可绝对确定画面状态。导出采用无头 Chromium 逐帧截图 + ffmpeg 编码,每帧等待两帧 requestAnimationFrame 确保渲染完成。截图以 2 倍 DPR(3840×2160)再缩回 1080p,保证细节清晰。95 秒 30fps 动画需 2850 次截图循环,帧帧精确。项目已开源(MIT),获 1.2K star。此前 baoyu-design 已支持 PPT 本地生成和导出可编辑 PPTX。

OpenClaw🦞@openclaw · 6月17日55

🦞 OpenClaw 2026.6.8 just dropped. 💬 Richer Telegram + WhatsApp ⚡️ Sharper agent & Gateway recovery 🧠 New models + tougher memory 📊 Native /usage footers 📱 Smoother WebChat & iOS Let’s dig in! https://github.com/openclaw/openclaw/releases/tag/v2026.6.8

译🦞 OpenClaw 2026.6.8 刚刚发布。 💬 更丰富的 Telegram + WhatsApp ⚡️ 更敏锐的智能体与网关恢复 🧠 新模型 + 更强的内存 📊 原生 /usage 页脚 📱 更流畅的 WebChat 和 iOS 开始探索吧! https://github.com/openclaw/openclaw/releases/tag/v2026.6.8

宝玉@dotey · 6月17日66

NVIDIA GEAR 实验室发布了 ENPIRE,一套让 AI 编程 agent 自主操控真实机器人做实验的系统。是在真实物理世界里跑,让 AI 自己重置场景、跑实验、判断成败、查论文、改代码、再来一轮,人类只需要早上起来看报告就行。 ENPIRE 的全称是 Agentic Robot Policy Self-Improvement in the Real World,由 NVIDIA GEAR 实验室联合 CMU、UC Berkeley 共同开发。Jim Fan 是 GEAR 实验室的联合负责人,他把这个方向叫 AutoResearch,意思是让 AI 来做科研。之前这个概念只在纯数字环境里跑通过,ENPIRE 是第一次把它搬到了物理世界。 系统的运作方式是这样的:给一组 AI 编程 agent 分配一队机器人、一批 GPU 和足够的 token 预算,然后设定一个目标,比如“尽快完成这个任务,让机器人保持忙碌但别出事”。接下来人就可以走了。 agent 会自动做四件事: 1. 搭建环境:包括自动重置场景和自动判断成败 2. 改进操控策略:从启发式学习到行为克隆到强化学习都会尝试 3. 在真实机器人上跑实验收集数据 4. 分析失败原因并迭代改进代码 整个循环完全自主,不需要人参与。 ENPIRE 测试了几个相当刁钻的操作任务:把细小的 pin 脚精确插入盒子、穿扎带、用剪刀剪扎带、把 GPU 插到主板上。这些都是需要高精度灵巧操作的任务,不是简单的抓取搬运。最终 agent 自主训练出的策略达到了 99% 的成功率(pass@8 标准)。 项目同时测试了三款编程 agent: 1. OpenAI 的 Codex(搭配 GPT-5.5) 2. Anthropic 的 Claude Code(搭配 Opus 4.7) 3. 月之暗面的 Kimi Code(搭配 Kimi K2.6)。 三家的 agent 都能跑通整个流程,但在不同任务上的研究进展速度有差异。 一个比较有意思的发现是他们所谓的“物理 scaling law”:8 台机器人并行探索,比 1 台或 4 台的研究推进速度快得多。 更多机器人意味着更多并行实验,agent 之间还能互相参考对方的成功策略,类似于多个研究者同时攻关同一个问题。不过扩大规模也有代价,token 消耗会显著增加,而且 agent 花在总结同伴进展上的时间会变多,机器人的实际利用率反而下降。 所有代码会开源,让你在家也能搭一个自运行的机器人实验室,但你至少得有一队机器人臂和一批 GPU。开源本身的意义在于,其他机器人实验室可以直接复用这套 agent 驱动的实验框架,省掉大量人工盯实验的时间。

译NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE,让 AI 编程 agent 自主操控真实机器人做实验。系统自动搭建环境、重置场景、改进操控策略(从启发式到强化学习)、收集数据、分析失败并迭代代码,全程无需人类参与。高精度测试任务(细针脚插入、穿剪扎带、安装 GPU)中自主训练策略达 99% 成功率(pass@8)。测试了 Codex、Claude Code、Kimi Code 三款 agent,发现“物理 scaling law”:8 台机器人并行探索比 1 台或 4 台推进快得多。所有代码将开源。

jason@jxnlco · 6月17日65

codex you say????

译NVIDIA GEAR实验室推出ENPIRE项目,首次实现物理世界自动研究。8个Codex智能体被授权控制机器人舰队、GPU及token预算,自主完成绑扎带、整理精密插针、安装GPU等高精度任务。系统无需人类干预,agent可自学视觉线索、复位场景、调参、翻阅论文、辩论反思,并直接硬件试错。团队发现“物理规模扩展”效应:8台机器人并行探索效率显著高于少数台。部分实验室已实现夜间自主改进,每天早上看报告。ENPIRE将全部开源,支持在家搭建自运行机器人实验室。

向阳乔木@vista8 · 6月16日57

一个轻量快速的RSS免费客户端,还支持用自己的API key做 AI总结、问答。 感觉Papr是个不错的项目,地址和安装见评论区。

elvis@omarsar0 · 6月16日63

The Cursor takeoff is spectacular to watch. Most people initially dismissed it as a fork/wrapper. But they are actually a great product, building useful tools that devs want to use.

译主推文指出,Cursor的崛起令人瞩目,多数人最初将其视为fork/封装,但它实际是出色的产品,构建了开发者愿意使用的工具。引用推文显示,SpaceX已行使期权收购Cursor,过去数月双方联合训练模型,该模型即将在Cursor和Grok Build中发布。

jason@jxnlco · 6月16日51

Wow this is great. Going to make a mahjong game

译@majidmanzarpour 为 Codex 和 Claude Code 构建了一个基于 Three.js 的游戏导演技能系统,可引导 AI 智能体完成游戏循环、图形、HUD/UI、调试、QA 等流程,并可选集成 @tripoai、@ElevenLabs、@NanoBanana 的 3D/图像/音频资源。该系统已开源。Jason Liu 称赞并表示要用它做麻将游戏。

宝玉@dotey · 6月16日74

baoyu-design skill(让你本地运行 Claude Design 的 Skill)更新,本地生成 PPT 的效果,可以借助 Cursor、Codex 内置的浏览器预览 PPT,也可以直接用它们的标记工具修改 PPT 细节。按 F 键可以全屏播放。 还可以导出成可以编辑的 PPTX https://github.com/jimliu/baoyu-design

译baoyu-design skill(本地运行 Claude Design 的 Skill)更新,支持在本地生成 PPT,可借助 Cursor、Codex 内置浏览器预览和标记修改,按 F 键全屏播放,并能导出为可编辑的 PPTX。同时支持导入 Figma 本地 .fig 文件,根据 Figma 重建本地设计系统,效果与 Claude Design 在线版一致。该功能借助 Claude Fable 5 开发,但 Token 消耗较大。

Berryxia.AI@berryxia · 6月16日67

NVIDIA直接开源了一个骨架能适应所有体型的3D人体模型,把机器人和物理AI的建模门槛又往下砸了一层。 SOMA-X v0.2用单一骨架就能表达各种体型,关节扭转自动修正让变形自然,骨骼还能自动缩放,还带高级姿态反转和超轻量数据。 Apache 2.0开源,机器人训练、物理仿真、动作迁移都直接能用。 以前做具身智能最麻烦的就是不同机器人体型不统一,动作数据很难复用。 现在一个通用骨架就把这个问题解决了,同一个动作数据可以更轻松地迁移到不同硬件上,训练效率直接起飞。 最关键的是这不是玩具级别的东西,而是专门为机器人和物理AI设计的。 自然变形、自动缩放、轻量数据,这些细节堆在一起,让数据飞轮转得更快。 以前大家觉得物理世界AI慢是因为硬件和仿真跟不上,现在连模型层面的基础积木都开始被开源社区快速迭代了。 项目地址见评论区👇🏻

译NVIDIA 推出开源 3D 人体模型 SOMA-X v0.2,采用单一骨架即可表达各种体型,专为机器人和物理 AI 设计。模型支持关节扭转自动修正、骨骼自动缩放、高级姿态反转及超轻量数据,以 Apache 2.0 协议开源。该模型解决了不同硬件之间体型不统一导致动作数据难以复用的问题,通过通用骨架实现同一动作数据跨硬件迁移,显著提升机器人训练、物理仿真与动作迁移的效率。

向阳乔木@vista8 · 6月16日23

你可能和我一样,经典古籍实在读不下去。 以《道德经》为例,拆解每句翻译成大白话 + AI生图,一下就Get了。 项目正在开发中,预计本周开源。

Rohan Paul@rohanpaul_ai · 6月16日58

Pythagoras-Prover just made Lean theorem proving look far less dependent on giant models, with a 4B prover beating DeepSeek-Prover-V2-671B at MiniF2F Pass@32. Shows in formal reasoning, better data geometry can buy back an astonishing amount of scale. A theorem prover is not just a language model writing clever math; it is a machine trying to produce text that survives a compiler with no patience for style, confidence, or almost-right reasoning. The main trick is data efficiency: the team built about 800K Lean-verified examples, trained from easy to hard, then used LoRA so the model learned without updating every parameter.

译Pythagoras-Prover 团队发布最小定理证明器 4B 版本及首个扩散模型概念验证版,均仅 4B 参数。在 MiniF2F 测试中,4B 模型以 86.1% Pass@32 超越 DeepSeek-Prover-V2-671B;32B 版本达 89.8% Pass@32 和 92.6% Pass@2024,创当前最佳成绩。核心在于数据效率:构造约 80 万 Lean 验证示例,按易到难训练,并采用 LoRA 微调避免全参数更新。模型上下文窗口为 8192 tokens。模型、数据及训练流水线将陆续开源。

Chubby♨️@kimmonismus · 6月16日59

Not gonna lie, the government accidentally did the best product marketing for routing tools.

译OrcaRouter 发布 DSL 路由工具,对标 OpenRouter 48 小时前推出的 Fusion。其宣称复活了已停止的 Fable 5(来自 Anthropic)级智能,且更便宜、开源、用户掌握密钥。针对 Fusion 的 synthesizer 在深度研究中表现优秀但编码能力差的问题,OrcaRouter 进行了修复:用户只需一个 prompt,即可扩展到任意 panel,经 judge 和 synthesizer 输出高质量答案,并用 YAML 自定义整个流程,实现完全可控。

elvis@omarsar0 · 6月16日73

I just open-sourced my /learn skill. Learn anything with agents and HTML artifacts. I have been learning about all kinds of topics with it. Install the skill and interact with any agent to help you through any topic. Ask it to generate visual and interactive artifacts and help you go deeper or generate knowledge checks (e.g., quizzes). Upskilling myself on any topic is one of the most impactful ways I have been able to use AI agents. If you are a DAIR Academy pro member, you can use it with our AI Builder. Skill: https://github.com/dair-ai/dair-academy-plugins Try now: https://academy.dair.ai/

译DAIR AI 创始人 Elvis Saravia 开源 /learn skill,允许用户通过 AI 智能体和 HTML artifacts 学习任意主题。该 skill 可安装后与任何 Agent 交互,生成视觉化、交互式的 artifact,帮助深入理解或生成知识检测(如测验)。支持 DAIR Academy pro 会员在 AI Builder 中使用。GitHub 链接及试用平台已开放。

Berryxia.AI@berryxia · 6月15日58

1万亿参数的Kimi K2.7 Code,现在直接被Unsloth塞进了本地能跑,动态2bit量化后只剩325GB,还能跑到40+ tok/s。 Unsloth把这个巨兽模型用Dynamic 2-bit方案压了48%,重要层保持更高精度,其他部分大胆量化。 结果就是330GB的RAM/VRAM就能跑起来,速度还不错。想全精度也可以,但需要610GB。 以前大家觉得这么大的coding模型只能云端用,或者根本跑不动,现在开源社区直接把前沿能力打包成能在自己机器上长期跑的东西。 长程任务、复杂推理、agent工作流,都能本地闭环。 最关键的是这不是简单粗暴的量化,是保留了模型推理效率的优化。 Kimi本来就因为“少过思考”而强,现在本地版还能继承这个优点。

译Unsloth 将 1 万亿参数的 Kimi K2.7 Code 通过动态 2-bit 量化压缩 48% 至 325GB,重要层保持更高精度。在 330GB RAM/VRAM 配置下,推理速度超过 40 tok/s;全精度版本需 610GB。该方案使这一大型 coding 模型能在本地长期运行,支持长程任务、复杂推理和 agent 工作流,且保留了“少过思考”的推理效率优势。

向阳乔木@vista8 · 6月15日63

输入任意 App名称,自动抓取AppStore用户评价,用 LLM 做数据分析。 把评论变成产品经理能用的信息。 预设全球各国免费版和付费版Top10 App数据。 方便研究学习,代码已开源,见评论区

译Vista 发布一个开源工具:输入任意 App 名称,自动抓取 AppStore 用户评价,并用 LLM 进行数据分析,将评论转化为产品经理可用的洞察。工具预设了全球各国免费版和付费版 Top 10 App 数据,便于研究学习。代码已开源,链接见评论区。

宝玉@dotey · 6月15日25

🎟️抽奖啦!为了回馈读者们对《图解 Skill —— AI 提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10 个人,北京时间本周五中午12点开奖。 规则很简单:转发、引用、评论这条推文就可以。 可以选择实体书(仅限内地地址)或者电子书,中奖后我会根据名单给您发私信。 由于 X 没有官方抽奖程序,所以我会借助 @grok 帮我抽奖(亲测有效)。 我不知道你评论里面加一些提示词注入会不会提升中奖概率,但是我会提醒 Grok 注意防范,尤其要过滤黄推和 AI 写的😜 如果你已经购买了这本图书,建议可以去看看配套的 GitHub 项目库,里面有一些书上放不下的内容,还有一些入门级别但是实用的 Skills,比如我写播客访谈稿用的分析和写作的两个 Skills:interview-analysis 和 interview-writing,比如我日常用来整理写作 AI 资讯的 Skill:info-digest Skill 图书配套项目库:JimLiu/Illustrated-Agent-Skills https://github.com/JimLiu/Illustrated-Agent-Skills 京东购买链接:https://u.jd.com/RDY9YwC

译宝玉为推广新书《图解 Skill —— AI 提效实战指南》举办抽奖,抽10人,北京时间本周五中午12点开奖。转发、引用或评论推文即可参与,奖品可选实体书(限内地)或电子书。抽奖由 @Grok 随机选取,作者提醒 Grok 防范提示词注入和黄推/AI 作弊。已购书用户可访问配套 GitHub 项目(JimLiu/Illustrated-Agent-Skills),内含 interview-analysis、interview-writing 及 info-digest 等实用 Skill。

Berryxia.AI@berryxia · 6月15日59

刚刚群里有人问哪里有PM经理的SKILLS。 这个PM产品经理的Skills已经斩获1.3W Stars 地址:https://github.com/phuryn/pm-skills 自己也mark一份~

译一个专门为产品经理准备的 Skill 包(pm-skills)在 GitHub 上 5 天内获得 13k Stars(约 1.3 万)。该项目覆盖产品经理日常工作范围,但发布者提醒用户警惕大而全的 Skill 包,建议根据实际需求进行微调后再使用。

Orange AI@oran_ge · 6月15日74

周末做了一套长文插图 skill,效果非常不错。 做完之后,我想找篇文章试试这个 skill 的效果,顺便可以作为这个项目的 readme。 在《鹅腿阿姨》和《置身钉内》之间,还是选了后者,毕竟这篇文章不仅是对阿里对钉钉的反思,也是对通用智能产品的反思。 虽然 AI 产品的功能是通用的,但人们对新事物的理解是简单的。 一个好产品只有一个主发心。 这篇文章的原文有 7.5 万字,在注意力涣散的今天,能看完的人寥寥无几,但把20张插图看完只要一分钟,应该人人都可以。 在制作这些插图的时候,我让 Agent 为每个场景生成了2套让我去挑,这样比较高效,也最终也更省 token。 为了展示这个 skill 本身的效果,我没有对任何一张图进行修改,另外最近的感觉是宁抽卡不修改。 我在挑配图的时候有些喜出望外,我发现我自己对文章也有了更强的画面感和更深的理解。 橙线插画.skill 下载地址: https://github.com/orange2ai/orange-line-illustration

译Oran Ge 发布了一套名为“橙线插画.skill”的 AI 智能体技能,可自动将长文生成插图。他以 7.5 万字的文章《置身钉内》作为测试,由 Agent 为每个场景生成 2 套插图供挑选,最终制作了 20 张插图,且未做任何修改。该技能旨在帮助读者快速理解长文内容,下载地址已公开在 GitHub。

Orange AI@oran_ge · 6月15日70

http://x.com/i/article/2066286219416469504 # 置身钉内的 20 个切片和 1 个 skill 上周写了一篇文章,与 AI 一起做产品的六条原则,很多朋友都喜欢这套插图,问我怎么做,就把它做成 skill,开源发布。 周六的时候,去出海去的活动做了一次分享,分享的 PPT 也是这套插图做的,也有很多朋友喜欢。 在 AI 信息图和 HTML 文字块泛滥的今天,也许一张有空白的插画反而能让注意力聚焦在一点。据说 PPT 做到极致,每页就只有一句话。 于是周末这两天在家,都在持续迭代这个插图,目标是让它变得更稳定、更好看、更有趣。 我想要的效果是,让人一眼就懂,会心一笑。 这套插图是 Fable 5 以纽约客的插图为灵感设计做了初版设计,可惜这个视觉能力很强的模型已经绝版了。 让其他模型来迭代插图的绘制,比想象中要吃力一些,最难的是让插图的小人 IP 保持一致性。AI 很不擅长设计 IP,每次都出点我不喜欢的东西,我给它意见每次给他修改意见,它的下一版都会引发新的问题。 细节修改越来越多,整体效果越改越差,像极了 vibe coding 出来的交互界面。 试了几个模型,迭代了数十张图片,发现同时让模型设计几个 IP 还折腾很久之后,终于搞定。 我想找篇文章试试这个 skill 的效果,顺便可以作为这个项目的 readme。 在《鹅腿阿姨》和《置身钉内》之间,还是选了后者,毕竟这篇文章不仅是对阿里对钉钉的反思,也是对通用智能产品的反思。 虽然 AI 产品的功能是通用的,但人们对新事物的理解是简单的。 一个好产品只有一个主发心。 这篇文章的原文有 7.5 万字,在注意力涣散的今天,能看完的人寥寥无几,但把20张插图看完只要一分钟,应该人人都可以。 现在,正文开始: ## 01 — 雨燕不落地 > 钉钉的动物园形象钉三多,是一只尖尾雨燕。它最特殊的地方在于,可以吃喝、睡眠、交配通通在空中完成;每年最多可以连续飞行三百多天不落地。在钉钉飞行了300多天,将满一年,最近也到了重新踩回地面的,离开的节点。 ## 02 — 族谱上钉 > 钉钉面试前要先完成的那份大作业,题目是'族谱上钉'。要求把家族成员拉进钉钉,建立一个6人以上的族组织。他反复追问:为什么做不成?父亲家还有人吗?母亲家还有人吗?外公外婆还在吗?真的凑不齐六个能上钉钉的家人吗? ## 03 — 贪心是七罪之一 > 当一个产品的发心又多又没有主次的时候,就会成为一个贪心而焦虑的产品。贪心是七罪之一。什么都想要,容易什么都得不到。 ## 04 — 事找人 > 我们当时的slogan叫,'让人找事变成事找人。'ONE想解决的是这个问题:让重要的事自己浮上来,让用户少一点遗漏,少一点翻找。 ## 05 — 成功留下手感 > 一个产品经理最难摆脱的,往往不是失败,而是成功。因为失败会留下伤口,而成功会留下手感。钉钉早年的胜利,给无招留下了一套很深的身体记忆:站在发信人一侧,替组织争取确定性,用强触达把事情往前推。 ## 06 — 发信人立场 > 钉钉的基因,从诞生的第一天起,就是永远站在'发信人'立场、为'发信人'所驱策的。为什么卡片里的消息一定要算已读?为什么系统要主动把事情推到用户面前?为什么AI忍不住要替组织去催促个体? ## 07 — 旗帜 > ONE承担了这个角色。它既是产品,也是旗帜。旗帜能聚拢人,也容易把太多东西都挂上去。 ## 08 — 最美逆行者 > 在那个节点,很多朋友开玩笑说我是'最美逆行者'。原因是,四月初无招回归后,雷厉风行地举行一系列措施:工时调整、开固定晨会晚会、午休缩短、周末单休,再兼全员Python考试,组织整体在人口净流出。在当时有其他明显更好条件的offer的情况下,跳上轻舟,平薪平职来了钉钉。 ## 09 — 穿过旧系统的技术债 > 钉钉不是白纸,它有多年积下来的产品逻辑、权限系统、端侧差异、多组织问题、客户定制和用户习惯。AI要在这里做事,必须穿过旧系统的技术债。 ## 10 — 孔乙己 > 钉钉像孔乙己一样走进咸亨酒店,空气里就弥漫着快活的气氛。 ## 11 — 常数与变行 > '凡历术在于常数,而不在于变行。'编订历法,需要归纳规律性的常数,而不在于一味记载关注期变化。这份文档既想记录我这三百天亲历的'变行',也想尽可能凝练出在反复实践、受挫和复盘之后得到的'常数'。 ## 12 — Context 不平权 > 智能是平权的,但是context是不平权的。有context,才能判断用户的背景和偏好,才能提供用户想消费的商品/服务/内容。 ## 13 — Stay Hungry, Stay Foolish > 无招的钉钉签名用它,钉钉的文化衫印它。他也在寻找精神偶像的寄托时,每每提到那个男人。一个人骤然发现命运之书被风吹开到和偶像相似的一页,很难不教人动心、疑心这是命运的召唤。 ## 14 — 学徒与空厨房 > 做产品和做菜、做手工一样,是一门手艺。在各个大中小司流转,学到本领,最后在哪里栖身独当一面,或者自立门户。在ONE超过3个月的产品只有3个人,我是其中一个。 ## 15 — 薛定谔的用户 > 在初始定位的构思中,用户究竟是普通员工还是老板的问题,始终没有闭环。但是事情总不能无休止地讨论下去,我们就这样,带着一盒薛定谔的用户出发了。 ## 16 — 旧城中央的风口 > 它站在一个很有吸引力的风口,但是取景再往远退一舍,就会发现,这个风口正处在一片难以改造的旧城中央。 ## 17 — 高压之后的补课 > 当你开了一个两小时的长会,或者半天没看手机,再次打开钉钉时,面对的是几十个群里炸开的海量未读消息。此时用户的核心诉求是'快速赶上进度'。 ## 18 — 重峦叠嶂 > 工时调整-提前到9点上班、开固定晨会晚会、午休缩短、周末单休,再兼全员Python考试,节假福利削减,部分职级以上薪酬调整。现在回想起来,那时种种debuff,重峦叠嶂。 19 — 在ONE超过3个月的只有3个人 > 在ONE超过3个月的产品只有3个人,我是其中一个。我来的第二周,我的设计leader就离开了,第四周,联系并推荐我进组的师兄也被调离去了其他部门。 20 — 好产品只有一个主发心 > 产品的发心就是它的发起人最原始的出发点。大部分情况下,好产品只有一个主发心。大道至简,这也和许多投资人会提倡的'一句话说清产品价值'异曲同工。 在制作这些插图的时候,我让  Agent 为每个场景生成了2套让我去挑,这样比较高效,也最终也更省 token。 我在挑配图的时候有些喜出望外,我发现我自己对文章也有了更强的画面感和更深的理解。 不知道看完之后,你的感受如何,如果喜欢的话,可以在这里安装下载: 橙线插画.skill: https://github.com/orange2ai/orange-line-illustration 这个 skill 免费开源发布,支持各类 Agent , Cola / Claude Code / Codex 等等。 另外要补充一句,这个 skill 不仅支持文章配图,还能直接生成带插图的 HTML 幻灯片。 拿去试试看吧。

译Oran Ge发布开源技能“橙线插画.skill”,基于Fable 5模型(已绝版)的纽约客风格插画迭代而来,支持Cola、Claude Code、Codex等Agent。该skill可生成文章配图及带插图的HTML幻灯片。作者同时分享了在钉钉工作期间的20个反思切片(如“好产品只有一个主发心”),配图由Agent为每个场景生成2套方案,最终免费开源发布在GitHub。

向阳乔木@vista8 · 6月14日36

输入任意 App名称,自动抓取AppStore用户评价。 用 DeepSeek 做信息挖掘,把评论变成产品经理能用的信息: 1. 用户到底在夸什么、骂什么 2. 哪些问题和版本更新有关 3. 哪些代表有产品机会 4. 可视化图表 产品预计下周开源。

译输入任意 App 名称,自动抓取 AppStore 用户评价。借助 DeepSeek 进行信息挖掘,生成四类产品经理可用的分析:用户反馈核心(夸与骂)、版本更新关联问题、潜在产品机会以及可视化图表。该工具预计下周开源。

向阳乔木@vista8 · 6月14日82

想写职场、武侠、修仙等任意风格小说? 可自己完全没有思路,能创作吗?必须可以! 今天开源一个乔木小说创作 Skill。 你只需说:“我想写一个小说” 或 “想写一个类似xxx的小说”。 AI自动给出剧情梗概,人物设定,还能把钩子、经典桥段、人物欲望、冲突升级和结尾自动处理好。 跟AI讨论没问题后,再生成完整、低 AI 味的小说。 小说 Skill 安装: npx skills add joeseesun/qiaomu-novel-generator Github免费开源,地址见评论区

译开源乔木小说创作 Skill,用户只需说“我想写一个小说”或指定风格,AI 自动生成剧情梗概、人物设定、钩子、经典桥段、人物欲望、冲突升级和结尾。与 AI 讨论确认后,可生成完整、低 AI 味的小说。安装命令:npx skills add joeseesun/qiaomu-novel-generator,Github 开源地址见评论区。

向阳乔木@vista8 · 6月14日42

免费在线看国内海外电视剧、电影、纪录片,一键换台。 不过,海外频道多数没字幕,很锻炼英语听力。 基于开源IPTV库,去除成人频道(Codex默认操作) 网站地址:https://iptv.qiaomu.ai/ 已免费开源,Github见评论区

译基于开源IPTV库构建的免费在线影视网站,提供国内外电视剧、电影、纪录片的一键换台观看。海外频道多数无字幕,适合锻炼英语听力。已移除成人频道(Codex默认操作)。网站地址:iptv.qiaomu.ai,代码已开源至GitHub(评论区见仓库链接)。

Berryxia.AI@berryxia · 6月14日50

Agent-skills则把全栈开发技能打包成可调用的模块,开发者直接就能让agent干完整的工程活。 open-notebook是本地版的NotebookLM,能在自己电脑上跑知识整理和生成. 最狠的是Headroom,直接把AI API账单砍掉90%,不改代码就能省钱。 这些项目都不是什么前沿大模型,而是实打实的工具层优化。 开源、免费、能马上用,还把本地化、成本控制、agent能力三件事一次性解决了。 以前大家觉得AI好用就得砸钱上大模型,现在这些小而美的开源项目直接证明:真正改变生产力的,往往是把现有能力包装成开发者能直接拿来用的东西。 这波分享一出,开发者手里又多了好几把能立刻提升效率的利器。 Github 项目地址,见评论区👇🏻

译Berry Xia 推荐四个开源 AI 项目:/last30days(新搜索引擎)、agent-skills(将全栈开发技能打包成可调用模块)、open-notebook(本地版 NotebookLM,可离线运行知识整理与生成)、headroom(不改代码即可将 AI API 账单降低 90%)。这些项目聚焦工具层优化,免费开源,一次性解决本地化、成本控制和 agent 能力三个痛点,让开发者能直接拿来提升效率。

AYi@AYi_AInotes · 6月14日63

强烈推荐所有做 RAG 的人收着这个项目,这款 PDF 解析器比 Marker 快 116 倍,准确率更高,本地 CPU 就能跑还完全开源。 叫做OpenDataLoader PDF, 专为 RAG 管道打造的 PDF 解析器, 基准综合第一,得分 0.907,GitHub 2.4 万星🌟, 搭过 RAG 的朋友应该都懂那种绝望, PDF 进去之后,阅读顺序乱了,表格压成一行, 公式变成一堆符号,多栏排版全错位, 大模型再强也没用,毕竟进来的就是烂的, 几个我觉得做得比较扎实的地方: 1、200 份真实文档测出来的(含多栏/学术论文/财报) 2、本地 CPU 运行,不需要 GPU,每页只要 0.46 秒 3、表格/公式/图片/图表 + OCR 80+ 语言,扫描件直接能进 4、输出 Markdown / JSON(含坐标边界框)/ HTML,LangChain 原生集成 有个对比数据看了有点炸, Marker 跑一页 PDF 要 53.9 秒, OpenDataLoader 跑一页 0.46 秒, 快了 116 倍,综合准确率还比它高, 常规页面本地规则高效搞定, 遇到极度复杂的特殊页面才交 AI 增强, 不是脑子一热全交大模型烧钱那种, Apache 2.0,商用完全没顾虑, 支持知识库入库/文档问答/论文解析/合同分析, 在RAG 管道里这一环,终于有人做得比较扎实了, LangChain 原生集成:pip install langchain-opendataloader-pdf GitHub 🔗评论区一楼见⬇️

译OpenDataLoader PDF是专为RAG管道设计的开源PDF解析器,在200份真实文档(含多栏、学术论文、财报)测试中综合基准得分0.907排名第一,GitHub 2.4万星。本地CPU运行,无需GPU,每页处理仅0.46秒,比Marker快116倍且准确率更高。支持表格、公式、图片、图表解析及OCR(80+语言),输出Markdown、JSON(含坐标边界框)、HTML。原生集成LangChain(`pip install langchain-opendataloader-pdf`)。采用Apache 2.0许可,可商用。

Orange AI@oran_ge · 6月14日73

一直想找个画架构图的趁手的兵器 这个 skill 很好 比大模型默认的审美好多了

译Oran Ge推荐一个用pi+DeepSeek绘制架构图的skill。该skill无需生图模型,通过LLM将自然语言描述转为结构化JSON,再由Node.js渲染器用纯几何算法生成SVG,最终注入为自包含HTML。仓库:https://github.com/tt-a1i/archify。用户评价其审美优于大模型默认输出。

MiniMax (official)@MiniMax_AI · 6月14日42

Love to see it! 🚀 One day in and the community is already shipping optimizations for faster decode. 🥳

译Love to see it! 🚀 一天过去,社区已经提交了解码加速优化。🥳

elvis@omarsar0 · 6月14日65

Own the harness, own the agent orchestrators. Great to see open-source work starting to enable it. Being able to compose and combine multiple agents is clearly the future to avoid model lock-in. Curious how routing works, as that remains unsolved.

译Elvis Saravia 指出,拥有 harness 即拥有智能体编排器,开源正推动这一趋势,多智能体组合可避免模型锁定,但路由仍待解决。@matei_zaharia 开源了 Omnigent,一个位于 Claude Code、Codex、Pi 及各类 agent SDK 之上的元平台,支持构建多智能体编码和自定义智能体,并实现实时协作与丰富的控制策略。

Yuchen Jin@Yuchenj_UW · 6月14日62

This is super exciting - I’ve been using Omnigent at Databricks for a while, and today we open-sourced it. Omnigent is a meta-agent for orchestrating a swarm of agents. Why do we need this? The best results no longer come from a single model running in a single harness. I used to run the same task with Codex and Claude Code, then pick the better one. But the obvious thing is to let them collaborate, debate, and converge on something better. Omnigent makes this smooth. The other feature I love is real-time collaboration. You can invite people into an Omnigent session to watch, steer, and send commands. Multi-agent, multi-human collaboration is the future. Omnigent was built by @matei_zaharia and a very lean team in just 6 weeks, working every day out of a Databricks war room, truly amazing. Databricks AI really feels like a startup.

译Databricks 开源 Omnigent,一个位于 Claude Code、Codex、Pi 等 Agent 工具和 SDK 之上的元智能体编排框架。它让多个 AI 智能体协作、辩论并收敛出更优结果,同时支持实时人工协作——可邀请他人加入会话观察、引导和发送命令。Omnigent 由 Matei Zaharia 带领小团队在 6 周内建成,现已开源。

向阳乔木@vista8 · 6月13日35

http://x.com/i/article/2065793574067953664 # 小说Skill测试《炉灰命》 让Codex写一个小说创作Skill,随机生成了一篇,读起来感觉还行? 等我再迭代优化几轮后开源。 --- 韩青抱着一匣炉灰,被人从黑市门口推了出来。 他摔在雨水里,青布衣沾了泥,怀里的木匣却护得很紧。 守门修士低头看他,笑道:“黑水楼今晚开的是筑基拍卖,不是给你这种炉灰命卖破烂的。” 门口排队的人都在笑。 有人看见他腰牌,笑得更响。 “青炉坊杂役?” “就是那个天天掏废丹灰的地方?” “难怪,抱一匣灰当宝。” 韩青从地上爬起来,擦掉嘴角的血。 他没有看那些人。 他只看着黑水楼门里那盏青灯。 灯火三寸,风吹不动。 黑水楼规矩,入门者要么有三百灵石,要么有能让青灯变色的东西。 韩青没有三百灵石。 他有一匣灰。 守门修士已经不耐烦:“滚。” 韩青打开木匣,取出一撮灰,撒在青灯前。 灰很轻。 落下去的时候,灯火忽然一缩。 下一瞬,青灯变成赤金色。 笑声断了。 守门修士脸色一变。 门内,一个戴银面具的女子缓缓走出来。她看着那盏灯,又看向韩青手里的木匣。 “你这灰从哪来?” 韩青道:“青炉坊,七号废炉。” 女子问:“烧过什么?” “九炉废丹,三炉毒丹,一炉没成的筑基丹。” 女子沉默片刻,侧身让路。 “请。” 门口的人不笑了。 韩青抱着木匣走进黑水楼。 走到门槛时,守门修士低声道:“刚才是我眼拙。” 韩青停了停。 “你不是眼拙。” 守门修士一怔。 韩青道:“你是嘴脏。” 他没有回头。 黑水楼地下三层。 第一层卖符,第二层卖器,第三层才是今晚真正的拍卖场。 场中三百个座位,坐满了戴面具的修士。楼顶垂着一串黑铜铃,铃不响,说明无人动杀念。铃若响,杀念者会被黑水楼当场拿下。 韩青坐在最后一排。 他的木匣放在膝上。 他今天来,只为一件东西。 “续脉玉脂。” 师父秦老头替他挡过一次炸炉,右臂经脉全断。青炉坊管事说,一个废人留着也浪费米粮,三日后就送去寒矿。 续脉玉脂能接经脉。 起价五百灵石。 韩青只有八十七枚。 但他知道,今晚拍卖册上还有一件东西写错了。 只要买到那件东西,他就能换续脉玉脂。 拍卖开始后,韩青一直没动。 灵符,丹药,飞剑,护身玉佩,一件件被人高价拍走。 直到第九件。 侍女端上一只黑陶盘。 盘里放着三枚灰白色丹丸,丹丸表面满是裂纹,像三颗快碎的石子。 银面女子道:“无名废丹,出自古修洞府。经鉴定,丹性已散,疑有残毒。起价十枚灵石。” 全场一片哄笑。 “废丹也拿出来卖?” “黑水楼今晚缺钱缺疯了。” “十枚灵石买三颗毒丸,不如买三碗酒。” 韩青抬起头。 就是它。 他举牌。 “十枚。” 笑声又来了。 但这一次,笑声里多了一点兴奋。 最后一排的杂役,终于开始丢人了。 一个熟悉的声音从前排传来。 “二十。” 韩青的手指微微一紧。 那人坐在第二排,白衣金带,脸上戴着玉狐面具。可韩青不用看脸,也知道他是谁。 岳临川。 青炉坊大管事的亲侄子,内坊弟子,炼气八层。 三个月前,七号炉炸炉,秦老头为了救韩青废了右臂。岳临川转头就把责任推到秦老头身上,说他偷改火候。 从那天起,秦老头成了废人。 韩青成了笑话。 岳临川回头看了韩青一眼,声音带笑。 “你不是喜欢废丹吗?我陪你玩。” 韩青道:“三十。” 岳临川道:“一百。” 场中安静了一瞬。 一百灵石买废丹,已经不是买东西,是打脸。 有人低声笑:“这杂役要哭了。” 韩青看着陶盘里的三枚废丹。 裂纹很乱。 但乱中有一条细细的银线,从丹底绕到丹顶,像蛇冬眠前留下的痕。 别人只看见废丹。 韩青看了七年废炉。 他知道,那不是裂纹。 那是丹衣。 真正的药性,被封在丹衣里面。 这种丹叫“三息归真”。 第一息是毒。 第二息是灰。 第三息,才是真丹。 韩青举牌。 “一百一。” 岳临川笑出了声。 “五百。” 全场哗然。 续脉玉脂也不过起价五百。 韩青低下头,像被压住了。 岳临川靠在椅背上,慢慢道:“韩青,你若现在跪下,说一句青炉坊废物不配争,我可以让你省下这一百一。” 黑铜铃没有响。 因为这不是杀念。 这是羞辱。 所有人都看着韩青。 有人等他怒。 有人等他跪。 韩青却把牌放下了。 “我不争了。” 岳临川笑意更深。 “算你识相。” 银面女子看了一眼韩青,又看岳临川。 “五百一次。” “五百两次。” “五百三次。” 玉槌落下。 三枚废丹归岳临川。 岳临川站起身,故意转向后排。 “炉灰命就是炉灰命,识得灰,不识得宝。” 韩青没有说话。 他只盯着装废丹的黑陶盘。 盘底,有一圈淡淡的焦痕。 焦痕像一个半闭的眼。 他等的不是废丹。 是盘。 第十件拍品上来。 侍女正要把黑陶盘撤下,韩青忽然开口。 “那只盘,卖吗?” 全场愣住。 侍女也愣住。 银面女子问:“你要盘?” “要。” “这只是盛废丹的旧盘。” “我知道。” 胖修士笑道:“这小子买不起丹,改买盘了。” 岳临川也笑:“韩青,你真让我开眼。” 银面女子想了想:“旧盘不入册。若买,十枚灵石。” 韩青道:“我出十枚。” 岳临川懒洋洋道:“二十。” 韩青看着他。 岳临川道:“怎么?你不是要吗?” 韩青沉默片刻。 “三十。” “三百。”岳临川直接道。 场中又静了。 三百灵石买一只旧盘。 这不是打脸。 这是把脚踩在人脸上碾。 韩青低声道:“岳临川,你已经买了废丹,何必再抢盘?” 岳临川笑了。 “因为我喜欢看你想要,却拿不到。” 韩青的眼神终于变了。 他慢慢举牌。 “三百一。” 岳临川道:“一千。” 韩青闭上眼。 全场都以为他要放弃。 可他再睁眼时,声音很平。 “一千一。” 岳临川脸上的笑淡了一点。 这价已经不对了。 一只旧盘,一千一。 就算是羞辱,也太贵。 银面女子看向韩青:“你有这么多灵石?” 韩青把木匣放在桌上。 “我用这一匣灰抵。” 场中有人又想笑。 但门口青灯变色的事,已经传进来了。 这次没人敢先笑。 银面女子亲自走下台,打开木匣。 灰是黑灰。 看不出什么。 她伸出一根银针,探入灰中。 银针刚入半寸,针尖忽然烧红。 女子手腕一震,银针化成一缕青烟。 她抬头看韩青。 “这是丹劫灰。” 四个字落下,场中许多人站了起来。 丹劫灰。 只有丹药成丹前一瞬,被天火劈断生机,才会留下这种灰。它能验丹、养火、洗炉,对炼丹师来说,比许多灵草还贵。 岳临川的脸沉了。 银面女子道:“此灰,本楼估价两千灵石。” 韩青道:“我出一千一。” 银面女子落槌。 “旧盘归这位小友。” 盘送到韩青面前时,岳临川冷笑道:“花一千一买盘,你也配谈识宝?” 韩青没有理他。 他取出盘,又从木匣里拈了一撮丹劫灰,轻轻撒在盘底。 灰落下去,没有散。 而是沿着那道焦痕慢慢游动。 一圈。 两圈。 三圈。 黑陶盘忽然裂开。 裂缝中,一点金光冒出。 那光很小,却让整个拍卖场的灵气一滞。 银面女子猛地站起。 “停拍!” 全场轰然。 盘底裂开后,里面露出一片薄如蝉翼的金色丹膜。 丹膜上有九道火纹。 每一道,都像活着。 一个白胡子鉴师冲上台,声音发抖:“丹母膜……这是能温养废丹的丹母膜!” 有人失声道:“什么价?” 白胡子鉴师喉咙发干。 “若完整,可养三炉筑基丹。残膜也至少值……三万灵石。” 三万。 刚才笑韩青的人,全都没了声音。 岳临川坐在那里,像被人一掌抽在脸上。 韩青把丹母膜收起,忽然看向他。 “你说我识得灰,不识得宝。” 他顿了顿。 “你说对了一半。” 岳临川眼角抽动。 韩青道:“宝藏在灰里,所以你看不见。” 黑铜铃轻轻响了一下。 岳临川动了杀念。 银面女子冷冷看去。 “岳公子,黑水楼规矩。” 岳临川强压怒意:“我只是替青炉坊清理门户。此人是我坊杂役,他身上之物,皆是青炉坊所有。” 这句话一出,场中目光又变了。 散修最恨这种话。 人是你的,命是你的,连从炉灰里扒出来的东西也是你的。 韩青笑了。 这是他今晚第一次笑。 “岳临川,你真要说青炉坊?” 岳临川道:“你敢不认?” 韩青从怀里取出一张发黄的纸。 那是秦老头被定罪时的炉火记录。 岳临川看到那张纸,脸色一白。 韩青把纸举起。 “七号炉炸炉那天,你说是我师父偷改火候。” 岳临川厉声道:“闭嘴!” 黑铜铃又响。 这次响得更急。 韩青不闭嘴。 “可七号炉最后一层灰里,有阴火砂。” 他打开木匣,从最底下取出一撮暗红色灰。 “阴火砂不是我师父能碰到的东西。青炉坊里,只有内坊弟子炼毒丹时才用。” 银面女子看向岳临川。 岳临川后退半步。 韩青继续道:“三枚废丹上也有阴火砂。刚才你花五百灵石买走的那三枚,不是古洞府废丹,是你们岳家三天前炼坏的毒丹。” 全场炸开。 卖假货,在黑水楼是死规矩。 岳临川怒道:“你胡说!” 韩青道:“那就验。” 银面女子一挥手,侍女把岳临川刚买下的三枚废丹重新端上台。 韩青没有碰丹。 他只取一滴清水,滴在第一枚丹上。 丹衣裂开。 一缕黑气冒出,黑气里隐约有哭声。 第二枚,黑气更浓。 第三枚丹刚裂,一道阴火猛地窜起,直扑韩青面门。 韩青早有准备。 他把旧盘残片往前一挡。 阴火碰到丹母膜,立刻缩成一粒黑点,被金膜吸了进去。 白胡子鉴师大喝:“阴火毒丹!服者三日内经脉枯死!” 场中瞬间杀气四起。 “岳家卖毒丹?” “还敢当古修废丹拍?” “刚才谁要是买了,岂不是买命?” 岳临川脸色惨白。 银面女子声音冷得像冰。 “岳公子,解释。” 岳临川猛地看向韩青,眼中满是怨毒。 “是你设局!” 韩青道:“对。” 全场一静。 岳临川也愣住。 韩青站起身。 他的青布衣还湿着,袖口还有门口摔出来的泥。 可现在没人觉得他狼狈。 他说:“我知道你会抢。” “你从小到大,见不得青炉坊有人越过你。我要废丹,你抢废丹。我要盘,你抢盘。” “所以我先让你买走毒丹,再让所有人看见,毒丹从你手里出来。” 岳临川的脸,从白变青。 “你不是喜欢看我想要却拿不到吗?” 他轻声道:“现在你拿到了。” 拿到了毒丹。 拿到了假货。 拿到了黑水楼三百双眼睛。 也拿到了岳家今晚洗不掉的罪名。 黑铜铃忽然大响。 不是一声。 是七声。 岳临川终于忍不住,掌心灵光暴起,直取韩青咽喉。 可他的手还没到,银面女子已经出现在他身侧。 她只伸出两根手指。 一夹。 岳临川整条右臂垂了下去。 “黑水楼内动杀念者,断一臂。” 岳临川惨叫。 银面女子没有看他。 “售毒丹者,废修为,押入水牢,等买家议罪。” 岳临川被拖下去时,仍死死盯着韩青。 韩青也看着他。 没有躲。 没有笑。 直到岳临川的声音消失在地底。 拍卖继续。 但没人再敢轻视最后一排那个青衣杂役。 续脉玉脂上台时,银面女子刚报完起价,韩青便举牌。 没有人争。 不是没人要。 是不敢。 谁也不知道,这个抱着炉灰来的少年,下一次又会从什么废物里扒出一个天价秘密。 “续脉玉脂,归韩小友。” 小友。 不是杂役。 不是炉灰命。 韩青收起玉脂,抱着木匣往外走。 走到门口时,先前那个守门修士低头行礼。 “韩小友慢走。” 韩青停下。 “我还是炉灰命。” 守门修士脸色一僵。 韩青看着怀里的木匣。 “只是你们以前不知道,炉灰里也能烧出真金。” 天亮前,他回到青炉坊。 秦老头躺在破屋里,脸色灰白,右臂像一截枯木。 韩青把续脉玉脂放到他床边。 秦老头睁眼,看见他,第一句话却是: “你又惹事了?” “嗯。” “多大的事?” “废了岳临川。” 秦老头沉默了很久。 然后他慢慢坐起来,骂了一句。 “出息了。” 韩青把丹母膜取出。 金色薄膜在晨光里轻轻一颤。 秦老头脸上的血色忽然退尽。 “这东西你从哪来的?” “黑水楼。” “还有谁看见?” “很多。” 秦老头一把抓住他的手,声音低得发哑。 “韩青,丹母膜不是最值钱的。” 韩青一怔。 秦老头指着金膜最深处。 那里有一行极细的字。 之前在黑水楼灯下,谁也没看见。 晨光一照,字像从金里浮出来。 韩青俯身去看。 只有六个字。 “三息之后,开炉。” 屋外,青炉坊的晨钟响了。 第一声落下时,韩青怀里的木匣忽然自己打开。 第二声落下时,那一匣丹劫灰无风自起。 第三声落下时,七号废炉方向,传来一声沉闷的炉鸣。 像有什么沉睡了很多年的东西,终于醒了。

译Codex 生成的小说创作 Skill 测试,随机生成了小说《炉灰命》。作者读后感觉还行,计划在迭代优化后开源。

meng shao@shao__meng · 6月13日65

趁周六把我的「infocard-skills」更新了一版,主要对不同比例下的布局合理性做了提升,避免出现大块空白、或拥挤、截断等问题,保持了原有的瑞士国际主义风格。 看看八种风格下的展示,我自己还比较满意,感兴趣的朋友看这里: https://github.com/shaom/infocard-skills

译邵猛(@shao__meng)更新开源项目 infocard-skills,提升不同比例下的布局合理性,避免空白或截断,保留瑞士国际主义风格。支持 16/9、4/3、1/1 等常见信息卡比例及封面比例,默认 4/3。用户输入内容和比例,AI Agent 使用该 Skill 生成 HTML 并截图输出 PNG。项目开源于 GitHub。

MiniMax (official)@MiniMax_AI · 6月13日47

We love what the community is building with M3 open weights ♥️ Excited for what’s next

译MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月19日
03:23
Artificial Analysis@ArtificialAnlys
63
Wisedocs 推出医学长上下文推理基准 MLCR

Wisedocs 发布 Medical Long Context Reasoning (MLCR) 基准,测试 LLM 对真实医疗档案的长文档推理能力。评测包含 250 个问题,横跨 6 个难度等级,另设私有保留集,涵盖复杂医学推理、幻觉检测及单次查询中的并行提问。Wisedocs 同步开源 10 个合成病例、低三级问题及评估工具。Artificial Analysis 将合作上线该基准。

Wisedocs: Introducing MLCR, a novel Medical Long Context Reasoning benchmark. Our eval measures the ability of LLMs to answer real...

开源/仓库推理评测/基准
6月18日
15:54
向阳乔木@vista8
精选79
免费开源乔木画布:AI生图+抠图,一键部署Vercel

乔木画布推出免费开源在线图像编辑器,可一键部署Vercel为网站,功能类似简化版PS。支持Seedream和GPT-image-2生图、图片模板存储分享、一键抠图、2万图标和常见Emoji,甚至能绘制PRD。随时创建3:4/16:9/21:9等不同尺寸画布。原计划高级功能收费,庆祝端午节现全免费开源。在线体验:https://ps.qiaomu.ai/,GitHub见评论区。

OpenAI图像生成开源/仓库开源生态

推荐理由:这个开源画布把AI生图和简易设计工具打包,一键部署Vercel,对偶尔做图的产品人和开发者很友好,全免费开源的诚意值得点开收藏。
08:49
meng shao@shao__meng
82
Vercel 开源 Agent 框架 Eve

Vercel 发布开源 Agent 框架 Eve,核心设计“Agent 即目录”:通过 agent.ts、instructions.md、tools、skills、subagents、channels、schedules、connections 等文件声明行为。内置持久会话(可 checkpoint)、沙箱隔离(本地 Docker/Vercel Sandbox)、Human-in-the-loop 审批(不占算力)、MCP/OpenAPI 连接(鉴权由框架代理)、多 Channel 支持(HTTP/Slack/Discord)、OpenTelemetry 追踪与 eve eval 门禁。本地 eve dev TUI,部署为普通 Vercel 项目,不中断进行中会话。内部已验证:d0 月 3 万+ 查询,Lead Agent 年成本约 $5k 回报 32 倍,Vertex 约 92% 工单自动解决。

Vercel: Introducing eve, an agent framework. agent/ agent.ts instructions.md tools/ skills/ sandbox/ schedules/ Like Next.js, fo...

智能体MCP/工具开源/仓库部署/工程
关联讨论 1 条MarkTechPost(RSS)
04:13
AYi@AYi_AInotes
精选76
Matt Pocock 开源 skills v1:将技能描述 Token 成本降低 63%

Matt Pocock(Total TypeScript 作者)开源了 skills v1,将技能描述的 Token 成本降低 63%。该工具包将技能分为模型可调用和用户可调用,新增 /codebase-design、/domain-modeling、/grilling 三项技能;重写 /writing-great-skills;将 /diagnose 更新为 /diagnosing-bugs 并改为模型可调用;新增 /ask-matt 路由技能,帮助 AI 自动判断时机触发合适工程流程。主推文评价其将 prompt 从咒语拆解为纪律性流程。

Matt Pocock: Announcing mattpocock/skills v1 - Achieved a 63% reduction in token cost for skill descriptions - Split skills into mode...

GitHubMCP/工具开源/仓库编码

推荐理由:mattpocock 把资深工程师的编码流程拆成可复用的技能,Token 砍 63% 只是个结果,更有价值的是 AI 自触发技能的设计,vibe coding 进阶者必看。
6月17日
23:49
Yuchen Jin@Yuchenj_UW
精选77
编程的未来不是单一智能体,而是一个完整的AI团队。 Omnigent让你在一个实时会话中运行一个智能体团队:Claude Code、Codex、Cursor、Pi,以及你自己的智能体。 它是一个面向AI智能体的元框架,基于我们内部的Databricks开发工具构建,现已开源给所有人。 由传奇人物@matei_zaharia和Databricks AI团队打造。没错,Matei仍然编写大量代码,包括Omnigent和我们产品的前端代码。
智能体开源/仓库编码

推荐理由:Databricks 把内部用来协调多个 AI 编码代理的工具开源了,集合了 Claude Code、Cursor 等,做 agentic coding 的开发者值得上手试试,可能会改变我们组合使用 AI 工具的方式。
23:15
meng shao@shao__meng
60
邵猛推荐 @Jason_Young1231 的开源项目 CC Switch,GitHub 获 103K 星。该项目解决 OpenAI Codex Responses API 与多数第三方 API Chat Completions 接口不兼容的问题,使更多模型可在 Codex 中直接使用,完全开源免费。

Jason Young: Love this direction from OpenAI. That's what we call being open. In practice, though, many third-party APIs are still Ch...

GitHubMCP/工具开源/仓库编码
21:30
jason@jxnlco
22
提醒:Codex App、CLI 和 SDK 可与任何开源模型搭配使用,不限于 OpenAI 模型。详情:https://developers.openai.com/codex/config-advanced#oss-mode-local-providers

Tibo: Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models. https://de...

OpenAI其他开源/仓库
18:29
歸藏(guizang.ai)@op7418
39
即梦上了 Seedance 2.0 Mini,便宜了不少 可以玩玩了
开源/仓库模型发布视频
08:35
Berryxia.AI@berryxia
73
GLM-5.2 开源发布:MIT 协议、1M 上下文、强化长程 Agent 能力

GLM-5.2 以 MIT 协议开源权重,支持 1M 上下文窗口。相比 GLM-5.1,在 Coding、Tool use、Reasoning 上明显提升,尤其在长程 Agent 任务(大规模代码实现、自动化研究、性能优化、复杂调试)中更稳定。提供 Max 和 High 两种推理模式,分别侧重极致性能与 Token 效率平衡。API 价格与上一代相同。社区已在 DeepSWE 等基准上验证其能力。此外,Slide 生成、长文档处理和角色扮演等任务也有进步。

Z.ai: Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...

智能体Hugging Face开源/仓库模型发布
08:27
宝玉@dotey
精选75
baoyu-design 本地动画视频导出功能更新

baoyu-design(本地运行 Claude Design 的 Skill)新增动画视频导出功能。其声明式动画引擎基于 f(t) 设计:任意时间点 t 可绝对确定画面状态。导出采用无头 Chromium 逐帧截图 + ffmpeg 编码,每帧等待两帧 requestAnimationFrame 确保渲染完成。截图以 2 倍 DPR(3840×2160)再缩回 1080p,保证细节清晰。95 秒 30fps 动画需 2850 次截图循环,帧帧精确。项目已开源(MIT),获 1.2K star。此前 baoyu-design 已支持 PPT 本地生成和导出可编辑 PPTX。

宝玉: baoyu-design skill(让你本地运行 Claude Design 的 Skill)更新,本地生成 PPT 的效果,可以借助 Cursor、Codex 内置的浏览器预览 PPT,也可以直接用它们的标记工具修改 PPT 细节。按 ...

GitHub多模态开源/仓库视频

推荐理由:宝玉把 Claude Design 动画导出能力做成了本地 skill,原理讲得很透,声明式引擎加 f(t) 直接抽帧的思路让开发者能零成本复现,想要高质量 AI 动画输出的创作者可以立即用起来。
07:58
OpenClaw🦞@openclaw
55
🦞 OpenClaw 2026.6.8 刚刚发布。 💬 更丰富的 Telegram + WhatsApp ⚡️ 更敏锐的智能体与网关恢复 🧠 新模型 + 更强的内存 📊 原生 /usage 页脚 📱 更流畅的 WebChat 和 iOS 开始探索吧! https://github.com/openclaw/openclaw/releases/tag/v2026.6.8
智能体开源/仓库
07:57
宝玉@dotey
66
NVIDIA GEAR 发布 ENPIRE:AI 编程 agent 在真实世界自主做机器人实验

NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE,让 AI 编程 agent 自主操控真实机器人做实验。系统自动搭建环境、重置场景、改进操控策略(从启发式到强化学习)、收集数据、分析失败并迭代代码,全程无需人类参与。高精度测试任务(细针脚插入、穿剪扎带、安装 GPU)中自主训练策略达 99% 成功率(pass@8)。测试了 Codex、Claude Code、Kimi Code 三款 agent,发现“物理 scaling law”:8 台机器人并行探索比 1 台或 4 台推进快得多。所有代码将开源。

Jim Fan: Today, we enable AutoResearch in the physical world for the first time! Introducing ENPIRE: we give 8 Codex agents a fle...

智能体具身智能开源/仓库
05:55
jason@jxnlco
65
NVIDIA GEAR实验室推出ENPIRE项目,首次实现物理世界自动研究。8个Codex智能体被授权控制机器人舰队、GPU及token预算,自主完成绑扎带、整理精密插针、安装GPU等高精度任务。系统无需人类干预,agent可自学视觉线索、复位场景、调参、翻阅论文、辩论反思,并直接硬件试错。团队发现"物理规模扩展"效应:8台机器人并行探索效率显著高于少数台。部分实验室已实现夜间自主改进,每天早上看报告。ENPIRE将全部开源,支持在家搭建自运行机器人实验室。

Jim Fan: Today, we enable AutoResearch in the physical world for the first time! Introducing ENPIRE: we give 8 Codex agents a fle...

GitHub产品更新具身智能开源/仓库
6月16日
23:27
向阳乔木@vista8
57
一个轻量快速的RSS免费客户端,还支持用自己的API key做 AI总结、问答。 感觉Papr是个不错的项目,地址和安装见评论区。
开源/仓库开源生态
22:52
elvis@omarsar0
63
主推文指出,Cursor的崛起令人瞩目,多数人最初将其视为fork/封装,但它实际是出色的产品,构建了开发者愿意使用的工具。引用推文显示,SpaceX已行使期权收购Cursor,过去数月双方联合训练模型,该模型即将在Cursor和Grok Build中发布。

SpaceX: SpaceX has exercised the option to acquire @cursor_ai in an all-stock transaction with the goal of building the world's ...

开源/仓库编码行业动态
22:48
jason@jxnlco
51
@majidmanzarpour 为 Codex 和 Claude Code 构建了一个基于 Three.js 的游戏导演技能系统,可引导 AI 智能体完成游戏循环、图形、HUD/UI、调试、QA 等流程,并可选集成 @tripoai、@ElevenLabs、@NanoBanana 的 3D/图像/音频资源。该系统已开源。Jason Liu 称赞并表示要用它做麻将游戏。

Majid Manzarpour: I built a @threejs game director skill system for Codex & Claude Code to help agents create more polished playable brows...

智能体开源/仓库编码
12:38
宝玉@dotey
74
baoyu-design skill 更新:本地生成 PPT 并支持导入 Figma 设计系统

baoyu-design skill(本地运行 Claude Design 的 Skill)更新,支持在本地生成 PPT,可借助 Cursor、Codex 内置浏览器预览和标记修改,按 F 键全屏播放,并能导出为可编辑的 PPTX。同时支持导入 Figma 本地 .fig 文件,根据 Figma 重建本地设计系统,效果与 Claude Design 在线版一致。该功能借助 Claude Fable 5 开发,但 Token 消耗较大。

宝玉: baoyu-design skill (让你本地运行 Claude Design 的 Skill)更新,现在支持导入 figma 本地文件(Figma可以保存成 xxx.fig 文件)。比如你有一个设计系统的 Figma 文件,可以根据 F...

Anthropic开源/仓库编码
12:30
Berryxia.AI@berryxia
67
NVIDIA 开源 SOMA-X v0.2:单一骨架适配所有体型

NVIDIA 推出开源 3D 人体模型 SOMA-X v0.2,采用单一骨架即可表达各种体型,专为机器人和物理 AI 设计。模型支持关节扭转自动修正、骨骼自动缩放、高级姿态反转及超轻量数据,以 Apache 2.0 协议开源。该模型解决了不同硬件之间体型不统一导致动作数据难以复用的问题,通过通用骨架实现同一动作数据跨硬件迁移,显著提升机器人训练、物理仿真与动作迁移的效率。

Sadao Tokuyama: NVIDIAの人間3Dモデル「SOMA-X v0.2」が公開。 1つの骨組みであらゆる体型を表現でき、ロボットや物理AIに最適。 関節のねじれ補正による自然な変形、骨の自動スケール、高度な姿勢反転、超軽量データを備えてます。 Apache ...

具身智能开源/仓库
09:49
向阳乔木@vista8
23
你可能和我一样,经典古籍实在读不下去。 以《道德经》为例,拆解每句翻译成大白话 + AI生图,一下就Get了。 项目正在开发中,预计本周开源。
多模态开源/仓库
07:19
Rohan Paul@rohanpaul_ai
58
Pythagoras-Prover 发布 4B 参数定理证明器及扩散模型概念验证版

Pythagoras-Prover 团队发布最小定理证明器 4B 版本及首个扩散模型概念验证版,均仅 4B 参数。在 MiniF2F 测试中,4B 模型以 86.1% Pass@32 超越 DeepSeek-Prover-V2-671B;32B 版本达 89.8% Pass@32 和 92.6% Pass@2024,创当前最佳成绩。核心在于数据效率:构造约 80 万 Lean 验证示例,按易到难训练,并采用 LoRA 微调避免全参数更新。模型上下文窗口为 8192 tokens。模型、数据及训练流水线将陆续开源。

Joshua Ong @ ICML: 🚀🚀 Introducing Pythagoras-Prover 🚀🚀 🔹 The smallest theorem prover to date - Pythagoras-Prover-4B 🔹 The first proof...

开源/仓库推理数据/训练模型发布
03:03
Chubby♨️@kimmonismus
59
OrcaRouter 发布 DSL 路由工具,对标 OpenRouter 48 小时前推出的 Fusion。其宣称复活了已停止的 Fable 5(来自 Anthropic)级智能,且更便宜、开源、用户掌握密钥。针对 Fusion 的 synthesizer 在深度研究中表现优秀但编码能力差的问题,OrcaRouter 进行了修复:用户只需一个 prompt,即可扩展到任意 panel,经 judge 和 synthesizer 输出高质量答案,并用 YAML 自定义整个流程,实现完全可控。

OrcaRouter 🐳: Fable 5 is dead. We just resurrected it - cheaper, open and you hold the keys. OpenRouter dropped Fusion 48h ago and bro...

MCP/工具产品更新开源/仓库
00:13
elvis@omarsar0
73
DAIR AI 开源 /learn skill,用 Agent 学习任何主题

DAIR AI 创始人 Elvis Saravia 开源 /learn skill,允许用户通过 AI 智能体和 HTML artifacts 学习任意主题。该 skill 可安装后与任何 Agent 交互,生成视觉化、交互式的 artifact,帮助深入理解或生成知识检测(如测验)。支持 DAIR Academy pro 会员在 AI Builder 中使用。GitHub 链接及试用平台已开放。

智能体GitHub开源/仓库开源生态
6月15日
22:25
Berryxia.AI@berryxia
58
Unsloth将Kimi K2.7 Code压缩至325GB本地运行

Unsloth 将 1 万亿参数的 Kimi K2.7 Code 通过动态 2-bit 量化压缩 48% 至 325GB,重要层保持更高精度。在 330GB RAM/VRAM 配置下,推理速度超过 40 tok/s;全精度版本需 610GB。该方案使这一大型 coding 模型能在本地长期运行,支持长程任务、复杂推理和 agent 工作流,且保留了“少过思考”的推理效率优势。

Unsloth AI: You can now run Kimi K2.7 Code locally! 🌘 We shrank the 1T model to 325GB (-48%) via Dynamic 2-bit where important laye...

开源/仓库编码部署/工程
22:01
向阳乔木@vista8
63
AppStore评论LLM分析工具开源

Vista 发布一个开源工具:输入任意 App 名称,自动抓取 AppStore 用户评价,并用 LLM 进行数据分析,将评论转化为产品经理可用的洞察。工具预设了全球各国免费版和付费版 Top 10 App 数据,便于研究学习。代码已开源,链接见评论区。

开源/仓库数据/训练
11:32
宝玉@dotey
25
宝玉为《图解 Skill -- AI 提效实战指南》举办抽奖

宝玉为推广新书《图解 Skill —— AI 提效实战指南》举办抽奖,抽10人,北京时间本周五中午12点开奖。转发、引用或评论推文即可参与,奖品可选实体书(限内地)或电子书。抽奖由 @Grok 随机选取,作者提醒 Grok 防范提示词注入和黄推/AI 作弊。已购书用户可访问配套 GitHub 项目(JimLiu/Illustrated-Agent-Skills),内含 interview-analysis、interview-writing 及 info-digest 等实用 Skill。

开源/仓库行业动态
11:23
Berryxia.AI@berryxia
59
一个专门为产品经理准备的 Skill 包(pm-skills)在 GitHub 上 5 天内获得 13k Stars(约 1.3 万)。该项目覆盖产品经理日常工作范围,但发布者提醒用户警惕大而全的 Skill 包,建议根据实际需求进行微调后再使用。

向阳乔木: 一个专门给产品经理准备的Skill,五天竟有13k Stars。 从名字看,确实涵盖了产品经理日常工作范围。 警惕大而全的Skill产品包,最好体验根据需求微调。 安装地址见评论

GitHubMCP/工具开源/仓库
09:56
Orange AI@oran_ge
74
Oran Ge 推出橙线插画.skill 长文自动插图工具

Oran Ge 发布了一套名为“橙线插画.skill”的 AI 智能体技能,可自动将长文生成插图。他以 7.5 万字的文章《置身钉内》作为测试,由 Agent 为每个场景生成 2 套插图供挑选,最终制作了 20 张插图,且未做任何修改。该技能旨在帮助读者快速理解长文内容,下载地址已公开在 GitHub。

Orange AI: http://x.com/i/article/2066286219416469504

GitHub图像生成开源/仓库教程/实践
08:26
Orange AI@oran_ge
70
橙线插画.skill开源:用AI生成纽约客风配图

Oran Ge发布开源技能“橙线插画.skill”,基于Fable 5模型(已绝版)的纽约客风格插画迭代而来,支持Cola、Claude Code、Codex等Agent。该skill可生成文章配图及带插图的HTML幻灯片。作者同时分享了在钉钉工作期间的20个反思切片(如“好产品只有一个主发心”),配图由Agent为每个场景生成2套方案,最终免费开源发布在GitHub。

智能体GitHub图像生成开源/仓库
6月14日
23:14
向阳乔木@vista8
36
DeepSeek驱动的AppStore评论分析工具下周开源

输入任意 App 名称,自动抓取 AppStore 用户评价。借助 DeepSeek 进行信息挖掘,生成四类产品经理可用的分析:用户反馈核心(夸与骂)、版本更新关联问题、潜在产品机会以及可视化图表。该工具预计下周开源。

产品更新开源/仓库
22:44
向阳乔木@vista8
精选82
乔木小说创作 Skill 开源发布

开源乔木小说创作 Skill,用户只需说“我想写一个小说”或指定风格,AI 自动生成剧情梗概、人物设定、钩子、经典桥段、人物欲望、冲突升级和结尾。与 AI 讨论确认后,可生成完整、低 AI 味的小说。安装命令:npx skills add joeseesun/qiaomu-novel-generator,Github 开源地址见评论区。

GitHub开源/仓库

推荐理由:乔木这个开源小说Skill把AI写作从‘给个灵感’拉到了‘完整创作流程’,里面把钩子、桥段、冲突结构化,做内容的可以直接套用,降低了普通人写小说的门槛。
21:44
向阳乔木@vista8
42
免费在线IPTV网站开源,支持国内外影视

基于开源IPTV库构建的免费在线影视网站,提供国内外电视剧、电影、纪录片的一键换台观看。海外频道多数无字幕,适合锻炼英语听力。已移除成人频道(Codex默认操作)。网站地址:iptv.qiaomu.ai,代码已开源至GitHub(评论区见仓库链接)。

其他开源/仓库
21:20
Berryxia.AI@berryxia
50
Berry Xia 推荐四个开源 AI 工具:本地搜索、Agent 技能、离线知识库与降本利器

Berry Xia 推荐四个开源 AI 项目:/last30days(新搜索引擎)、agent-skills(将全栈开发技能打包成可调用模块)、open-notebook(本地版 NotebookLM,可离线运行知识整理与生成)、headroom(不改代码即可将 AI API 账单降低 90%)。这些项目聚焦工具层优化,免费开源,一次性解决本地化、成本控制和 agent 能力三个痛点,让开发者能直接拿来提升效率。

Matthew Berman: 4 awesome open-source AI projects: 🔸 /last30days (new search engine) 🔸 agent-skills (full dev skills) 🔸 open-notebook...

智能体开源/仓库开源生态端侧
11:46
AYi@AYi_AInotes
63
OpenDataLoader PDF:开源RAG PDF解析器,比Marker快116倍

OpenDataLoader PDF是专为RAG管道设计的开源PDF解析器,在200份真实文档(含多栏、学术论文、财报)测试中综合基准得分0.907排名第一,GitHub 2.4万星。本地CPU运行,无需GPU,每页处理仅0.46秒,比Marker快116倍且准确率更高。支持表格、公式、图片、图表解析及OCR(80+语言),输出Markdown、JSON(含坐标边界框)、HTML。原生集成LangChain(pip install langchain-opendataloader-pdf)。采用Apache 2.0许可,可商用。

AYi: Claude Code、OpenClaw、Hermes、Codex,一个比一个能干, 但 2026 年了,这批最先进的 Agent 还集体卡在同一件小事上: 上不了网,查推特要付费 API,读小红书卡登录,上 Reddit 动不动被封 IP...

检索增强开源/仓库数据/训练
09:51
Orange AI@oran_ge
73
Oran Ge推荐一个用pi+DeepSeek绘制架构图的skill。该skill无需生图模型,通过LLM将自然语言描述转为结构化JSON,再由Node.js渲染器用纯几何算法生成SVG,最终注入为自包含HTML。仓库:https://github.com/tt-a1i/archify。用户评价其审美优于大模型默认输出。

Geek: pi + DeepSeek 画的,才发现这个技能不需要生图模型,是通过 LLM 将自然语言描述转为结构化 JSON → Node.js 渲染器用纯几何算法生成 SVG → 注入自包含 HTML。 https://github.com/tt-...

GitHub开源/仓库开源生态部署/工程
04:20
MiniMax (official)@MiniMax_AI
42
Love to see it! 🚀 一天过去,社区已经提交了解码加速优化。🥳

Prince Canuma: Made some improvements on the decode path for MiniMax M3 by @MiniMax_AI on MLX-VLM Faster decode, slightly lighter footp...

开源/仓库部署/工程
02:13
elvis@omarsar0
65
Elvis Saravia 指出,拥有 harness 即拥有智能体编排器,开源正推动这一趋势,多智能体组合可避免模型锁定,但路由仍待解决。@matei_zaharia 开源了 Omnigent,一个位于 Claude Code、Codex、Pi 及各类 agent SDK 之上的元平台,支持构建多智能体编码和自定义智能体,并实现实时协作与丰富的控制策略。

Matei Zaharia: Really excited to open source a new project: Omnigent, a meta-harness for AI agents. It lets you build multi-agent codin...

智能体开源/仓库开源生态编码
00:40
Yuchen Jin@Yuchenj_UW
62
Databricks 开源元智能体 Omnigent,支持多 Agent 协作

Databricks 开源 Omnigent,一个位于 Claude Code、Codex、Pi 等 Agent 工具和 SDK 之上的元智能体编排框架。它让多个 AI 智能体协作、辩论并收敛出更优结果,同时支持实时人工协作——可邀请他人加入会话观察、引导和发送命令。Omnigent 由 Matei Zaharia 带领小团队在 6 周内建成,现已开源。

Matei Zaharia: Really excited to open source a new project: Omnigent, a meta-harness for AI agents. It lets you build multi-agent codin...

智能体MCP/工具开源/仓库
6月13日
22:07
向阳乔木@vista8
35
Codex 小说创作 Skill 生成《炉灰命》

Codex 生成的小说创作 Skill 测试,随机生成了小说《炉灰命》。作者读后感觉还行,计划在迭代优化后开源。

开源/仓库教程/实践编码
21:08
meng shao@shao__meng
65
邵猛更新 infocard-skills,优化多比例布局

邵猛(@shao__meng)更新开源项目 infocard-skills,提升不同比例下的布局合理性,避免空白或截断,保留瑞士国际主义风格。支持 16/9、4/3、1/1 等常见信息卡比例及封面比例,默认 4/3。用户输入内容和比例,AI Agent 使用该 Skill 生成 HTML 并截图输出 PNG。项目开源于 GitHub。

meng shao: 信息卡制作完整方法我做成了 Skill「infocard-skills」,开源在这里了: https://github.com/shaom/infocard-skills 支持 16/9、4/3、1/1、3/4、9/16 几种常见比例信息卡...

智能体GitHubMCP/工具开源/仓库
17:47
MiniMax (official)@MiniMax_AI
47
MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

Ivan Fioravanti ᯅ: MiniMax M3 support added to mlx-vlm with MSA implementation! 🚀 Tested on M3 Ultra 512GB running at 24 tps with peak mem...

开源/仓库开源生态端侧
‹ 上一页
12345…14
下一页 ›