全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「开源生态」清除

6月22日周一

08:00HuggingFace Daily Papers（社区热门论文）52ReasoningLens：大型推理模型层级可视化与诊断审计框架

07:37Hacker News 热门（buzzing.cc 中文翻译）62Apertus：面向主权人工智能的开放式基础模型发布

01:37Yuchen Jin43GLM-5.2 迎来 DeepSeek R1 时刻

01:36Rohan Paul44Linus：原始 Vibe Coder，零成本无限上下文

01:34elvis56GLM-5.2登顶开源模型排行榜

6月21日周日

22:05Nathan Lambert26GLM 5.2 迎来编码实用时刻

20:05AYi31GLM 5.2被赞国产Fable 5，或接棒DeepSeek

19:04IT之家（RSS）63刘强东：京东所有AI技术向海外开放，反对技术壁垒

17:26Chubby♨️67GLM-5.2 编码能力震惊 Vercel CEO

09:03IT之家（RSS）58独立开发者徐子文用AI自制《GTA6》项目GT-Caliber

06:03MarkTechPost（RSS）66Nous Research 为 Hermes Agent 新增 Blank Slate 模式：默认仅开启三项工具，其余全部禁用

03:03AYi68Greg 的 AI 高价值技能清单：本地部署、内容策展与全链路 Builder-Distributor

02:03AYi55GLM-5.2 与 Fable 5 测评：五十分之一价格实现九成效果，开源模型跨过"够好且便宜"线

01:31Yuchen Jin42GLM-5.2势头猛，开源LLM或胜闭源

00:28Nathan Lambert45Nathan Lambert为RLHF书建后训练学习社区

00:05Emad32开源寓言级模型可运行于基础MacBook

6月20日周六

21:50OpenBMB50面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群

20:24meng shao75精选开源教程《Deep Agents 实战》发布

15:59IT之家（RSS）46广东：将依托省开源鸿蒙适配中心，推进多行业示范应用和规模化适配

15:01AYi75精选微软双向转售GPT与DeepSeek成全球最大AI中间商

12:28Yuchen Jin30GLM-5.2 表现接近 Opus 4.8/GPT-5.5

09:24meng shao47GLM 5.2开源获海外好评，智谱股价飙升

08:56向阳乔木21Vista 计划开发 PPT 生成 Skill

06:24MarkTechPost（RSS）68VibeThinker-3B：基于Qwen2.5-Coder-3B的3B密集推理模型，开源MIT

06:22Eric29模型训练退潮，模型选择崛起

05:40Chubby♨️45多家AI公司性能差距缩小，整体向上移动

04:26OpenRouter：Announcements（RSS）68精选OpenRouter vs LiteLLM：如何选择 LLM 网关

02:01AYi67OpenAI 推出 Codex for Open Source 计划：免费提供半年 ChatGPT Pro

6月19日周五

22:23Nathan Lambert32开源AI禁令有损美国价值观

21:59Nathan Lambert：Interconnects（RSS）56精选禁止开源AI将是一个错误

21:22Hacker News 热门（buzzing.cc 中文翻译）66Datasette 发布插件 datasette-apps：在 Datasette 中托管自定义 HTML 应用

20:52SemiAnalysis65黄仁勋威胁新云：不买全套就削减芯片配额

18:50MiniMax (official)36MiniMax M3登顶B.AI最受欢迎模型

17:50Hacker News 热门（buzzing.cc 中文翻译）47"令牌压缩"的错觉：我为何对RTK持怀疑态度

16:43歸藏(guizang.ai)22国内开源Fable 5模型或无需等到27年

16:12宝玉74baoyu-design skill 更新：支持 AI 生图配图与导出 PPTX/MP4

13:19AYi79精选阿里开源向量数据库Zvec，UCSD黄碧薇教授提出因果AI第四代范式

11:16IT之家（RSS）40蔡崇信：阿里全面投入 AI，开源的主要推动力量来自中国企业

10:56MarkTechPost（RSS）75精选Salesforce CodeGen教程：生成、验证并重排序Python函数（含单元测试与安全检查）

10:47HuggingFace Daily Papers（社区热门论文）49FreeStyle：基于社区LoRA挖掘的风格-内容双参考生成框架

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月22日

08:00

HuggingFace Daily Papers（社区热门论文）

52

ReasoningLens：大型推理模型层级可视化与诊断审计框架

ReasoningLens是一个开源框架，用于对大型推理模型的超长思维链进行层级可视化与诊断审计。它通过三方面解决信息埋没问题：将推理轨迹组织成交互式层级，分离高级策略与低级执行；利用智能体审计器自动检测错误并进行工具增强验证；综合系统推理画像以揭示模型特定盲点。该框架将无结构文本转化为可操作的洞察，为解释、调试和优化推理AI提供基础。

开源生态推理论文/研究

07:37

Hacker News 热门（buzzing.cc 中文翻译）

62

Apertus：面向主权人工智能的开放式基础模型发布

瑞士AI倡议（EPFL、苏黎世联邦理工学院、CSCS合作）推出完全开放的基础模型Apertus，公开训练数据、代码、权重、方法和对齐原则。模型符合欧盟AI法案要求，支持1000+种语言，提供8B和70B参数版本。同时发布Apertus Mini，含16个小模型用于演示知识蒸馏与量化技术。技术报告已被ACL 2026接收。针对提契诺州微调的版本已用于内部AI翻译。瑞士电信为战略合作伙伴。

开源生态模型发布

01:37

Yuchen Jin@Yuchenj_UW

43

看我的时间线，感觉 GLM-5.2 正迎来它的 DeepSeek R1 时刻。我从未想过一个开源模型能这么快跻身编程模型前三。

大佬观点开源生态编码

01:36

Rohan Paul@rohanpaul_ai

44

一条推文调侃 Linus 是原始的 vibe coder：他只需在邮件列表上发一条愤怒邮件描述需求，全球数千工程师就免费实现。零 token 消耗、零 API 成本，拥有无限上下文（30 多年内核知识）。对比 OpenAI 和 Anthropic 试图用 AI 复制 Linus 从 1991 年起靠人类贡献者做的事，但 Linus 的"agents"不产生模型幻觉且完全免费。

Chayenne Zhao: linus was the original vibe coder before it was cool. dude just posts an angry email on the mailing list describing what...

大佬观点开源生态

01:34

elvis@omarsar0

56

GLM-5.2 的表现令人印象深刻。确实是前沿的开放权重模型。那么，我们很快能看到 Gemini 模型跻身前三吗？

Datacurve: GLM 5.2 is now on DeepSWE as the top open-source model on our leaderboard. With a pass@1 score of 44% at max effort, GLM...

开源生态编码评测/基准

6月21日

22:05

Nathan Lambert@natolambert

26

开放式权重模型，通过 GLM 5.2，在 Gemini 之前迎来了它们在编码测试中的"非常实用"时刻。自 Opus 4.5 发布以来约 200 天。

Google 大佬观点开源生态编码

20:05

AYi@AYi_AInotes

31

感觉GLM 5.2太强了，有点国产Fable 5的感觉了，会不会是下一个DeepSeek时刻，然后接棒DeepSeek成为中国大模型的新一代大哥和门店担当

DeepSeek 开源生态现象/趋势

19:04

IT之家（RSS）

63

刘强东：京东所有AI技术向海外开放，反对技术壁垒

6月21日，在2026年APEC工商领导人中国论坛上，京东创始人刘强东宣布，京东所有AI技术即日起向包括亚太地区在内的海外合作伙伴开放。他表示不希望任何企业或国家制造技术壁垒，认为技术壁垒本质上是剥削。他还呼吁企业、研究机构和政府尽早就AI和机器人时代开展国际化合作。刘强东透露，京东近期提出“涅槃计划”，计划将70万快递员等蓝领工人送往学校进行技术培训，以应对AI冲击。

开源生态行业动态

17:26

Chubby♨️@kimmonismus

67

就连 Vercel CEO 都对 GLM-5.2 在编码上的出色表现感到印象深刻/震惊。开源，开放权重。

Guillermo Rauch: Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.

开源生态模型发布编码

09:03

IT之家（RSS）

58

独立开发者徐子文用AI自制《GTA6》项目GT-Caliber

25岁创业者徐子文（Ziwen Xu）启动自制《GTA6》项目GT-Caliber，使用Anthropic旗下Claude Max 20x大模型，配合多款AI智能体循环运行，实时收集社区需求并自动生成代码。开发首周先后从Godot引擎迁移至虚幻引擎，最终选定Unity。九天进展包括路人NPC自主行走、道路交通、武器系统及仿Instagram游戏手机，第七日生成洛杉矶风格居民区。项目开源托管于GitHub，无发行商支持。R星官方已公布《GTA6》预购6月25日开启，11月19日登陆PS5、Xbox Series X|S。

智能体开源生态现象/趋势

06:03

MarkTechPost（RSS）

66

Nous Research 为 Hermes Agent 新增 Blank Slate 模式：默认仅开启三项工具，其余全部禁用

Nous Research 为其开源 AI 智能体框架 Hermes Agent 新增 Blank Slate 设置模式。该模式默认仅开启 provider & model、File Operations 和 Terminal 三项，Web、浏览器、代码执行、视觉、记忆、委托、cron、技能、插件及 MCP 等全部禁用。配置被写入 platform_toolsets.cli 和 agent.disabled_toolsets 并固化到磁盘，即使执行 hermes update 也不会静默启用未选工具。用户可在极简基线后选择完全禁用或逐项启用。该模式适用于安全敏感部署、可复现团队设置和教学审计场景。本地运行要求模型至少 64K 上下文窗口。

智能体产品更新开源生态

03:03

AYi@AYi_AInotes

68

Greg 的 AI 高价值技能清单：本地部署、内容策展与全链路 Builder-Distributor

Greg 列出当下最有价值的六项技能：搭建管理 agent 并运行本地 AI 模型、懂渠道的营销、全能机器人、短内容策展、能出产品又能分发的 builder-distributor、线下社区建设。主推文指出 AI 抹平单一工具门槛，纯写提示词或代码贬值，真正拉开差距的是打通 builder 与 distributor 全链路。具体解读：本地部署保留应急控制权；内容策展是稀缺筛选力；管理 agent 需监控重试。建议三件事：迁核心工作流到本地并搭观测面板；精准分发产品给 20 个潜在用户；线下聊天获真实反馈。

GREG ISENBERG: The most valuable skill sets on the planet right now: 1. people who can set up agents properly, manage them, and run loc...

智能体大佬观点开源生态

02:03

AYi@AYi_AInotes

55

GLM-5.2 与 Fable 5 测评：五十分之一价格实现九成效果，开源模型跨过"够好且便宜"线

同一任务、同一 prompt、同一参考图下，GLM-5.2（价格 <$0.10）效果接近 Fable 5（约 $5）的九成，价格仅为后者五十分之一。作为最强开源模型，GLM-5.2 体积从 1.5TB 压缩 84% 至 238GB，可在 256GB Mac 本地运行，保留 82% 能力。当开源模型跨过“够好且便宜到随便用”的线，设计探索第一步的默认选项可能从 Fable 转向 GLM-5.2。

AYi: 把 1.5TB 的模型剁掉 84% 的体积,塞进本地跑,还剩 82% 的功力, 这就是GLM-5.2,最强开源模型, 现在缩骨到了 238GB,256GB 的 Mac 或者同档 RAM/VRAM 的机器就能带起来了技术博客:http://...

图像生成开源生态现象/趋势

01:31

Yuchen Jin@Yuchenj_UW

42

Fable 仍未回归（遗憾）。与此同时，GLM-5.2 变得非常出色。如果 Fable 或 GPT-5.6 因安全风险无法发布，而 Kimi K3 或 GLM-5.3 率先推出，那么开源大语言模型或许有机会击败公开的闭源模型。

大佬观点开源生态

00:28

Nathan Lambert@natolambert

45

我很少宣传的一件事是，我为我的 RLHF 书籍创建了一个 Discord 社区，该书几周后即将印刷出版。旨在为想要学习后训练的下一代人提供一个学习和交流的社区。

开源生态数据/训练行业动态

00:05

Emad@EMostaque

32

将有一个开源寓言级模型，可在基础MacBook mini / Air或同等设备上运行。我认为人们还没有意识到这一点。

大佬观点开源生态端侧

6月20日

21:50

OpenBMB@OpenBMB

50

面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群

面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行，通过vLLM连续批处理提供服务，每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明，1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。

Joey: Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...

智能体开源生态教程/实践部署/工程

20:24

meng shao@shao__meng

精选75

开源教程《Deep Agents 实战》发布

LangChain 官方认证大使 @zhanghaili0610 推出开源教程《Deep Agents 实战》，基于 LangChain / LangGraph 生态，讲解如何用 Deep Agents Harness 框架构建真实 Agent 应用。核心是“三层架构”：Runtime（LangGraph）、Framework（LangChain）、Harness（Deep Agents）。技术内核为上下文工程，通过虚拟文件系统实现按需读取、中间结果落盘、大文件局部读取。教程共 8 章 + 2 准备篇，覆盖虚拟文件系统（六大工具）、任务规划、子 Agent 委派（异步并行）及 Skills 复用（可在 Claude Code、Cursor 等 30+ 工具中通用）。

Harry Zhang: A gift to the Chinese developer community for anyone building agents on @LangChain: After 2 books on the ecosystem, I op...

智能体开源生态教程/实践

推荐理由：海里的这份 Deep Agents 教程把 LangChain 生态下的 Agent 开发梳理成了清晰的三层架构，虚拟文件系统、子 Agent、Skills 这些实战点讲得透，正在做协作型 Agent 的开发者终于有个成体系的免费入门路径了。

15:59

IT之家（RSS）

46

广东：将依托省开源鸿蒙适配中心，推进多行业示范应用和规模化适配

广东省人民政府6月19日印发《广东省推进服务业扩能提质实施方案》，在软件和信息技术服务业方面，将加快开源生态建设，依托省开源鸿蒙适配中心，在制造业、能源、交通、海洋、泛家居等领域推进多行业示范应用和规模化适配。今年5月28日，开源鸿蒙开发者大会2026上，该适配中心技术指导委员会（TSC）正式授牌成立，由19名专家组成，涵盖科研院所、龙头企业、高校、行业协会四大领域。

开源生态政策/监管

15:01

AYi@AYi_AInotes

精选75

微软双向转售GPT与DeepSeek成全球最大AI中间商

彭博社报道，微软已成为全球最大AI模型中转站，既将ChatGPT卖给中国企业，也反向将DeepSeek模型卖给西方客户。报道称微软正在测试DeepSeek-R1和DeepSeek-V4，计划向西方客户提供这些中国模型。这一模式构建起跨中美AI模型的双向贸易网络。

DeepSeek Microsoft 开源生态行业动态

推荐理由：微软做起了跨中美模型的双向经销商，这事比表面看起来意义大——它可能绕过限制，把最先进的模型分发到原本接触不到的市场，全球 AI 供应链要改写了。

12:28

Yuchen Jin@Yuchenj_UW

30

使用 GLM-5.2 一天后，我惊讶于它经常感觉接近 Opus 4.8/GPT-5.5 的水平。我将它与 Opus 4.8 进行了并排比较，有时我甚至更喜欢 GLM-5.2 的结果。开源大语言模型令人印象深刻，尤其是考虑到它们训练的 GPU 数量少得多。

开源生态推理评测/基准

09:24

meng shao@shao__meng

47

GLM 5.2开源获海外好评，智谱股价飙升

GLM 5.2 开源发布后，国外 AI 博主纷纷称赞。作者认为模型够强是关键，用户会主动付费。同时智谱港股股价飙升，已甩开 MiniMax、追上小米。在作者看来，现阶段模型团队远未到精细化运营阶段，更重要的是资方和股民。

大佬观点开源生态行业动态

08:56

向阳乔木@vista8

21

Vista 计划开发 PPT 生成 Skill

Vista 计划开发 PPT 生成 Skill，核心：同时输出可编辑 PPTX、PDF、HTML；基于 GPT 5.5 Pro 方法论；按环境在 Codex 生图或 SVG 渐变背景；集成 echart、lucide icon、Google Font；内置抓取 X 帖子、长文、论文 PDF 素材。预计下周开源。

开源/仓库开源生态

06:24

MarkTechPost（RSS）

68

VibeThinker-3B：基于Qwen2.5-Coder-3B的3B密集推理模型，开源MIT

新浪微博研究人员发布VibeThinker-3B，一个仅3B参数的密集推理模型，基于Qwen2.5-Coder-3B，采用谱到信号后训练流水线（SFT、强化学习与自蒸馏），MIT开源。在AIME26上得分94.3，比肩DeepSeek V3.2（671B）和Kimi K2.5（1T）；LiveCodeBench v6达80.2 Pass@1；2026年4月至5月LeetCode周赛与双周赛首次提交通过率96.1%。搭载CLR测试时缩放后AIME26升至97.1。BF16权重约6GB，单GPU可运行，推荐使用vLLM 0.10.1或SGLang ≥0.4.9.post6推理。

开源生态推理模型发布

06:22

Eric@ericmitchellai

29

过时：模型训练流行：模型选择

开源生态数据/训练现象/趋势

05:40

Chubby♨️@kimmonismus

45

另一个指数级增长，来自 Artificial Analysis。几乎是整个领域都在同时向上移动。 OpenAI、Anthropic、Google、xAI、Meta、DeepSeek、Alibaba、Mistral、Kimi 等公司现在*相互之间的聚集程度*比两年前更紧密了。鸣谢 @ArtificialAnlys

开源生态现象/趋势

04:26

OpenRouter：Announcements（RSS）

精选68

OpenRouter vs LiteLLM：如何选择 LLM 网关

OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关，无需管理基础设施，收取 5.5% 平台费（前 100 万次请求免费），支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理（Docker/PostgreSQL/Redis），数据不离开内网，免费开源，但需承担基础设施成本（生产部署约数百美元/月）。当模型月支出超过约 $3,600（基础设施 $200/月）或 $9,100（基础设施 $500/月）时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由；OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。

开源生态评测/基准部署/工程

推荐理由：OpenRouter 这份官方对比很坦诚，把成本、延迟、合规的权衡掰开了讲，自建 LiteLLM 和托管谁更划算的算术也给清楚了，做 LLM 网关选型的直接看这篇就够了。

02:01

AYi@AYi_AInotes

67

OpenAI 推出 Codex for Open Source 计划：免费提供半年 ChatGPT Pro

OpenAI 正式推出 Codex for Open Source 计划，为开源项目维护者免费提供 6 个月 ChatGPT Pro（含完整 Codex 权限）及专项 API 额度，总价值 1200 美元。无硬性 Star 门槛，个位数 Star 的小项目也可申请。申请需说明具体维护工作、项目真实影响力及资源使用计划。审核采用 AI 加人工滚动处理，通过率较高，整个过程零成本，约十分钟即可完成。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI 开源生态教程/实践

6月19日

22:23

Nathan Lambert@natolambert

32

禁止任何形式的开源AI将是错误。与@kevinsxu共同发布的一则面向公众的公告，阐述为何开源维护美国价值观。管理前沿风险是困难的，但通过削弱开放前沿来减少透明度、创新和教育将更糟。

Kevin S. Xu: http://x.com/i/article/2067652729913114624

大佬观点安全/对齐开源生态

21:59

Nathan Lambert：Interconnects（RSS）

精选56

禁止开源AI将是一个错误

近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制，可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值，在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中，开源（尤其开放权重）是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全，更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反，美国初创公司正依赖包括中国在内的开源模型提升效率。

大佬观点开源生态政策/监管

推荐理由：在华盛顿弥漫监管 AI 空气的当下，这篇文章是对‘禁止开源 AI’冲动的清晰反驳。它系统梳理了开源在教育、创新和竞争中不可替代的价值，尤其适合对政策走向摇摆不定的人阅读。

21:22

Hacker News 热门（buzzing.cc 中文翻译）

66

Datasette 发布插件 datasette-apps：在 Datasette 中托管自定义 HTML 应用

Datasette 发布新插件 datasette-apps，允许托管自包含 HTML+JavaScript 应用。应用在严格沙箱中运行（sandbox 属性和 CSP 头），无法访问 cookies、localStorage 或外部 HTTP 请求，防止数据泄露。应用可用 JavaScript 对 Datasette 数据执行只读 SQL 查询，若配置存储查询还可写入。应用与父窗口通过 postMessage 或 MessageChannel 通信。灵感来自 Claude Artifacts，为 HTML 前端提供 Datasette 后端。试用需 GitHub 登录 agent.datasette.io 演示实例。

产品更新开源生态部署/工程

20:52

SemiAnalysis@SemiAnalysis_

65

Bessemer 合伙人 Adam Fisher 称，一些新云公司担心若未购买英伟达全套硬件，可能被"关进 Jensen 监狱"--即失去芯片配额。黄仁勋似乎在暗示，若不买全套就会削减配额。主推文称正在出售，有意者私信询价。

Jukan: "Some neo-clouds worry that they can't stray from buying Nvidia's full stack of hardware for fear of being put in "Jense...

开源生态行业动态

18:50

MiniMax (official)@MiniMax_AI

36

MiniMax M3 已成为 B.AI 上最受欢迎的模型，目前免费使用。感谢 @BAI_AGI 团队让 M3 从第一天起就可用。

B.AI: 👑 @MiniMax_AI's MiniMax M3 is now the #1 most popular model on http://B.AI. From topping the open source rankings to le...

开源生态行业动态

17:50

Hacker News 热门（buzzing.cc 中文翻译）

47

"令牌压缩"的错觉：我为何对RTK持怀疑态度

RTK获得60k GitHub星标，宣称能“削减60–90%模型token用量，支付1/10的价格”，但实际API账单并未同比例下降——它仅裁剪Bash原始输出，忽略文件读取、仓库上下文、系统提示词和模型内部推理token。公开issues指出终端输出会被静默截断或丢失，且AI智能体无法感知压缩，导致关键信息缺失。RTK从未公布任务成功率（如SWE-bench类基准），其节省量更像营销指标。从架构看，rtk引入脆弱的外部依赖，解析git、cargo、npm、grep等CLI工具的stdout/stderr格式，一旦工具更新格式便可能静默失败。本质上这是CLI原生可实现的feature，而非独立产品，将其放入生产agent关键路径存在高风险。

大佬观点开源生态编码

16:43

歸藏(guizang.ai)@op7418

22

唐老师与马斯克就国内开源版本的Fable 5级别模型何时出现展开对话。马斯克认为需要较长周期，而唐老师回复"won't take that long"，暗示时间可能早于预期。主推文据此判断，国内开源Fable 5级别模型不必等到2027年。

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态

16:12

宝玉@dotey

74

baoyu-design skill 更新，支持在制作 PPT、动画视频或网站时调用 AI 生图技能配图，可配合 Codex 或 Claude Code 使用。生成 PPT 时自动在合适位置插入配图，并可导出为 PPTX 格式，支持二次编辑。此外，该 skill 可在本地生成动画视频并导出 mp4，采用声明式动画引擎 f（t），通过无头浏览器逐帧截图经 ffmpeg 合成，确保每帧精确无掉帧。项目已在 GitHub 开源（MIT），获 1.2K star。

宝玉: baoyu-design skill 可以在本地生成动画视频,导出 mp4 格式,就像附件视频这个。 Claude Design 网页版可以用提示词创建动画视频,但你需要在网页上才能看到视频,无法下载。也有人基于第三方插件录屏软件实现过,不...

GitHub 图像生成开源生态教程/实践

13:19

AYi@AYi_AInotes

精选79

阿里开源向量数据库Zvec，UCSD黄碧薇教授提出因果AI第四代范式

阿里开源内部向量数据库Zvec，pip install zvec免费使用，对标Pinecone每月70美元能力。支持十亿向量毫秒级检索，无需单独起服务，全平台兼容；v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授（causal-learn作者）提出AI四代范式：相关性小模型→因果小模型→相关性大模型（LLM）→因果大模型，认为当前正站在第四代门口。其创立的Aether AI完成首轮融资，致力于从视频中自动抽取物理规律，探索下一代因果AI范式。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

检索增强产品更新开源生态搜索

推荐理由：阿里把内部跑了多年的向量数据库开源了，pip一行直接跑，十亿级毫秒检索还不占额外服务，做RAG和搜索的不用再每月给Pinecone交钱，虽然刚起步，但免费生产级轮子值得一试。

11:16

IT之家（RSS）

40

蔡崇信：阿里全面投入 AI，开源的主要推动力量来自中国企业

蔡崇信昨日在 VivaTech 2026 上表示，AI 的总潜在市场规模达 50 万亿美元，对标人类生产力，阿里巴巴正全面投入 AI。其全栈 AI 优势包括：中国高效低成本的能源供给，提前布局的云计算和芯片，全球最受欢迎的开源模型千问（Qwen），以及覆盖电商、即时零售等丰富应用场景。他同时指出，当前全球 AI 开源的主要推动力量来自中国企业，阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。

大佬观点开源生态现象/趋势

10:56

MarkTechPost（RSS）

精选75

Salesforce CodeGen教程：生成、验证并重排序Python函数（含单元测试与安全检查）

本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型（支持350M、2B、codegen2-1B、codegen25-7b等版本），通过自然语言提示生成Python函数，随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构化代码生成流水线的能力，不仅完成代码补全，还能评估、筛选和组织生成结果。

Hugging Face 开源生态教程/实践编码

推荐理由：这篇教程把CodeGen从单纯补全变成一个带安全检查、单元测试和候选重排序的工程化代码生成管道，读完能直接套用到日常写代码里，对想落地的开发者非常友好。

10:47

HuggingFace Daily Papers（社区热门论文）

49

FreeStyle：基于社区LoRA挖掘的风格-内容双参考生成框架

风格-内容双参考生成旨在合成图像，保留内容参考的结构语义并采用风格参考的样式。FreeStyle提出基于社区LoRA挖掘的可扩展双参考生成框架，将LoRA作为风格与内容的组合锚点，通过生成-过滤流程构建大规模三元组数据。针对内容泄漏，采用两阶段课程学习：注意力级增强约束抑制风格参考泄漏，频率感知RoPE调制策略应对双参考阶段的位置对应泄漏。引入覆盖风格参考与双参考生成的基准，包含风格不变内容对齐分数（CAS）和基于VLM的拒绝分数。实验表明模型在风格对齐、内容保留和泄漏抑制间取得强平衡。

Hugging Face 图像生成开源生态论文/研究

1…5 678 9…36