AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
6月22日周一
08:00HuggingFace Daily Papers(社区热门论文)52ReasoningLens:大型推理模型层级可视化与诊断审计框架
07:37Hacker News 热门(buzzing.cc 中文翻译)62Apertus:面向主权人工智能的开放式基础模型发布
01:37Yuchen Jin43GLM-5.2 迎来 DeepSeek R1 时刻
01:36Rohan Paul44Linus:原始 Vibe Coder,零成本无限上下文
01:34elvis56GLM-5.2登顶开源模型排行榜
6月21日周日
22:05Nathan Lambert26GLM 5.2 迎来编码实用时刻
20:05AYi31GLM 5.2被赞国产Fable 5,或接棒DeepSeek
19:04IT之家(RSS)63刘强东:京东所有AI技术向海外开放,反对技术壁垒
17:26Chubby♨️67GLM-5.2 编码能力震惊 Vercel CEO
09:03IT之家(RSS)58独立开发者徐子文用AI自制《GTA6》项目GT-Caliber
06:03MarkTechPost(RSS)66Nous Research 为 Hermes Agent 新增 Blank Slate 模式:默认仅开启三项工具,其余全部禁用
03:03AYi68Greg 的 AI 高价值技能清单:本地部署、内容策展与全链路 Builder-Distributor
02:03AYi55GLM-5.2 与 Fable 5 测评:五十分之一价格实现九成效果,开源模型跨过"够好且便宜"线
01:31Yuchen Jin42GLM-5.2势头猛,开源LLM或胜闭源
00:28Nathan Lambert45Nathan Lambert为RLHF书建后训练学习社区
00:05Emad32开源寓言级模型可运行于基础MacBook
6月20日周六
21:50OpenBMB50面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群
20:24meng shao75精选开源教程《Deep Agents 实战》发布
15:59IT之家(RSS)46广东:将依托省开源鸿蒙适配中心,推进多行业示范应用和规模化适配
15:01AYi75精选微软双向转售GPT与DeepSeek成全球最大AI中间商
12:28Yuchen Jin30GLM-5.2 表现接近 Opus 4.8/GPT-5.5
09:24meng shao47GLM 5.2开源获海外好评,智谱股价飙升
08:56向阳乔木21Vista 计划开发 PPT 生成 Skill
06:24MarkTechPost(RSS)68VibeThinker-3B:基于Qwen2.5-Coder-3B的3B密集推理模型,开源MIT
06:22Eric29模型训练退潮,模型选择崛起
05:40Chubby♨️45多家AI公司性能差距缩小,整体向上移动
04:26OpenRouter:Announcements(RSS)68精选OpenRouter vs LiteLLM:如何选择 LLM 网关
02:01AYi67OpenAI 推出 Codex for Open Source 计划:免费提供半年 ChatGPT Pro
6月19日周五
22:23Nathan Lambert32开源AI禁令有损美国价值观
21:59Nathan Lambert:Interconnects(RSS)56精选禁止开源AI将是一个错误
21:22Hacker News 热门(buzzing.cc 中文翻译)66Datasette 发布插件 datasette-apps:在 Datasette 中托管自定义 HTML 应用
20:52SemiAnalysis65黄仁勋威胁新云:不买全套就削减芯片配额
18:50MiniMax (official)36MiniMax M3登顶B.AI最受欢迎模型
17:50Hacker News 热门(buzzing.cc 中文翻译)47"令牌压缩"的错觉:我为何对RTK持怀疑态度
16:43歸藏(guizang.ai)22国内开源Fable 5模型或无需等到27年
16:12宝玉74baoyu-design skill 更新:支持 AI 生图配图与导出 PPTX/MP4
13:19AYi79精选阿里开源向量数据库Zvec,UCSD黄碧薇教授提出因果AI第四代范式
11:16IT之家(RSS)40蔡崇信:阿里全面投入 AI,开源的主要推动力量来自中国企业
10:56MarkTechPost(RSS)75精选Salesforce CodeGen教程:生成、验证并重排序Python函数(含单元测试与安全检查)
10:47HuggingFace Daily Papers(社区热门论文)49FreeStyle:基于社区LoRA挖掘的风格-内容双参考生成框架
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月22日
08:00
HuggingFace Daily Papers(社区热门论文)
52
ReasoningLens:大型推理模型层级可视化与诊断审计框架

ReasoningLens是一个开源框架,用于对大型推理模型的超长思维链进行层级可视化与诊断审计。它通过三方面解决信息埋没问题:将推理轨迹组织成交互式层级,分离高级策略与低级执行;利用智能体审计器自动检测错误并进行工具增强验证;综合系统推理画像以揭示模型特定盲点。该框架将无结构文本转化为可操作的洞察,为解释、调试和优化推理AI提供基础。

开源生态推理论文/研究
07:37
Hacker News 热门(buzzing.cc 中文翻译)
62
Apertus:面向主权人工智能的开放式基础模型发布

瑞士AI倡议(EPFL、苏黎世联邦理工学院、CSCS合作)推出完全开放的基础模型Apertus,公开训练数据、代码、权重、方法和对齐原则。模型符合欧盟AI法案要求,支持1000+种语言,提供8B和70B参数版本。同时发布Apertus Mini,含16个小模型用于演示知识蒸馏与量化技术。技术报告已被ACL 2026接收。针对提契诺州微调的版本已用于内部AI翻译。瑞士电信为战略合作伙伴。

开源生态模型发布
01:37
Yuchen Jin@Yuchenj_UW
43
看我的时间线,感觉 GLM-5.2 正迎来它的 DeepSeek R1 时刻。 我从未想过一个开源模型能这么快跻身编程模型前三。
大佬观点开源生态编码
01:36
Rohan Paul@rohanpaul_ai
44
一条推文调侃 Linus 是原始的 vibe coder:他只需在邮件列表上发一条愤怒邮件描述需求,全球数千工程师就免费实现。零 token 消耗、零 API 成本,拥有无限上下文(30 多年内核知识)。对比 OpenAI 和 Anthropic 试图用 AI 复制 Linus 从 1991 年起靠人类贡献者做的事,但 Linus 的"agents"不产生模型幻觉且完全免费。

Chayenne Zhao: linus was the original vibe coder before it was cool. dude just posts an angry email on the mailing list describing what...

大佬观点开源生态
01:34
elvis@omarsar0
56
GLM-5.2 的表现令人印象深刻。 确实是前沿的开放权重模型。 那么,我们很快能看到 Gemini 模型跻身前三吗?

Datacurve: GLM 5.2 is now on DeepSWE as the top open-source model on our leaderboard. With a pass@1 score of 44% at max effort, GLM...

开源生态编码评测/基准
6月21日
22:05
Nathan Lambert@natolambert
26
开放式权重模型,通过 GLM 5.2,在 Gemini 之前迎来了它们在编码测试中的"非常实用"时刻。自 Opus 4.5 发布以来约 200 天。
Google大佬观点开源生态编码
20:05
AYi@AYi_AInotes
31
感觉GLM 5.2太强了,有点国产Fable 5的感觉了, 会不会是下一个DeepSeek时刻, 然后接棒DeepSeek成为中国大模型的新一代大哥和门店担当
DeepSeek开源生态现象/趋势
19:04
IT之家(RSS)
63
刘强东:京东所有AI技术向海外开放,反对技术壁垒

6月21日,在2026年APEC工商领导人中国论坛上,京东创始人刘强东宣布,京东所有AI技术即日起向包括亚太地区在内的海外合作伙伴开放。他表示不希望任何企业或国家制造技术壁垒,认为技术壁垒本质上是剥削。他还呼吁企业、研究机构和政府尽早就AI和机器人时代开展国际化合作。刘强东透露,京东近期提出“涅槃计划”,计划将70万快递员等蓝领工人送往学校进行技术培训,以应对AI冲击。

开源生态行业动态
17:26
Chubby♨️@kimmonismus
67
就连 Vercel CEO 都对 GLM-5.2 在编码上的出色表现感到印象深刻/震惊。 开源,开放权重。

Guillermo Rauch: Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.

开源生态模型发布编码
09:03
IT之家(RSS)
58
独立开发者徐子文用AI自制《GTA6》项目GT-Caliber

25岁创业者徐子文(Ziwen Xu)启动自制《GTA6》项目GT-Caliber,使用Anthropic旗下Claude Max 20x大模型,配合多款AI智能体循环运行,实时收集社区需求并自动生成代码。开发首周先后从Godot引擎迁移至虚幻引擎,最终选定Unity。九天进展包括路人NPC自主行走、道路交通、武器系统及仿Instagram游戏手机,第七日生成洛杉矶风格居民区。项目开源托管于GitHub,无发行商支持。R星官方已公布《GTA6》预购6月25日开启,11月19日登陆PS5、Xbox Series X|S。

智能体开源生态现象/趋势
06:03
MarkTechPost(RSS)
66
Nous Research 为 Hermes Agent 新增 Blank Slate 模式:默认仅开启三项工具,其余全部禁用

Nous Research 为其开源 AI 智能体框架 Hermes Agent 新增 Blank Slate 设置模式。该模式默认仅开启 provider & model、File Operations 和 Terminal 三项,Web、浏览器、代码执行、视觉、记忆、委托、cron、技能、插件及 MCP 等全部禁用。配置被写入 platform_toolsets.cli 和 agent.disabled_toolsets 并固化到磁盘,即使执行 hermes update 也不会静默启用未选工具。用户可在极简基线后选择完全禁用或逐项启用。该模式适用于安全敏感部署、可复现团队设置和教学审计场景。本地运行要求模型至少 64K 上下文窗口。

智能体产品更新开源生态
03:03
AYi@AYi_AInotes
68
Greg 的 AI 高价值技能清单:本地部署、内容策展与全链路 Builder-Distributor

Greg 列出当下最有价值的六项技能:搭建管理 agent 并运行本地 AI 模型、懂渠道的营销、全能机器人、短内容策展、能出产品又能分发的 builder-distributor、线下社区建设。主推文指出 AI 抹平单一工具门槛,纯写提示词或代码贬值,真正拉开差距的是打通 builder 与 distributor 全链路。具体解读:本地部署保留应急控制权;内容策展是稀缺筛选力;管理 agent 需监控重试。建议三件事:迁核心工作流到本地并搭观测面板;精准分发产品给 20 个潜在用户;线下聊天获真实反馈。

GREG ISENBERG: The most valuable skill sets on the planet right now: 1. people who can set up agents properly, manage them, and run loc...

智能体大佬观点开源生态
02:03
AYi@AYi_AInotes
55
GLM-5.2 与 Fable 5 测评:五十分之一价格实现九成效果,开源模型跨过"够好且便宜"线

同一任务、同一 prompt、同一参考图下,GLM-5.2(价格 <$0.10)效果接近 Fable 5(约 $5)的九成,价格仅为后者五十分之一。作为最强开源模型,GLM-5.2 体积从 1.5TB 压缩 84% 至 238GB,可在 256GB Mac 本地运行,保留 82% 能力。当开源模型跨过“够好且便宜到随便用”的线,设计探索第一步的默认选项可能从 Fable 转向 GLM-5.2。

AYi: 把 1.5TB 的模型剁掉 84% 的体积,塞进本地跑,还剩 82% 的功力, 这就是GLM-5.2,最强开源模型, 现在缩骨到了 238GB,256GB 的 Mac 或者同档 RAM/VRAM 的机器就能带起来了 技术博客:http://...

图像生成开源生态现象/趋势
01:31
Yuchen Jin@Yuchenj_UW
42
Fable 仍未回归(遗憾)。与此同时,GLM-5.2 变得非常出色。 如果 Fable 或 GPT-5.6 因安全风险无法发布,而 Kimi K3 或 GLM-5.3 率先推出,那么开源大语言模型或许有机会击败公开的闭源模型。
大佬观点开源生态
00:28
Nathan Lambert@natolambert
45
我很少宣传的一件事是,我为我的 RLHF 书籍创建了一个 Discord 社区,该书几周后即将印刷出版。 旨在为想要学习后训练的下一代人提供一个学习和交流的社区。
开源生态数据/训练行业动态
00:05
Emad@EMostaque
32
将有一个开源寓言级模型,可在基础MacBook mini / Air或同等设备上运行。 我认为人们还没有意识到这一点。
大佬观点开源生态端侧
6月20日
21:50
OpenBMB@OpenBMB
50
面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群

面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行,通过vLLM连续批处理提供服务,每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明,1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。

Joey: Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...

智能体开源生态教程/实践部署/工程
20:24
meng shao@shao__meng
精选75
开源教程《Deep Agents 实战》发布

LangChain 官方认证大使 @zhanghaili0610 推出开源教程《Deep Agents 实战》,基于 LangChain / LangGraph 生态,讲解如何用 Deep Agents Harness 框架构建真实 Agent 应用。核心是“三层架构”:Runtime(LangGraph)、Framework(LangChain)、Harness(Deep Agents)。技术内核为上下文工程,通过虚拟文件系统实现按需读取、中间结果落盘、大文件局部读取。教程共 8 章 + 2 准备篇,覆盖虚拟文件系统(六大工具)、任务规划、子 Agent 委派(异步并行)及 Skills 复用(可在 Claude Code、Cursor 等 30+ 工具中通用)。

Harry Zhang: A gift to the Chinese developer community for anyone building agents on @LangChain: After 2 books on the ecosystem, I op...

智能体开源生态教程/实践

推荐理由:海里的这份 Deep Agents 教程把 LangChain 生态下的 Agent 开发梳理成了清晰的三层架构,虚拟文件系统、子 Agent、Skills 这些实战点讲得透,正在做协作型 Agent 的开发者终于有个成体系的免费入门路径了。
15:59
IT之家(RSS)
46
广东:将依托省开源鸿蒙适配中心,推进多行业示范应用和规模化适配

广东省人民政府6月19日印发《广东省推进服务业扩能提质实施方案》,在软件和信息技术服务业方面,将加快开源生态建设,依托省开源鸿蒙适配中心,在制造业、能源、交通、海洋、泛家居等领域推进多行业示范应用和规模化适配。今年5月28日,开源鸿蒙开发者大会2026上,该适配中心技术指导委员会(TSC)正式授牌成立,由19名专家组成,涵盖科研院所、龙头企业、高校、行业协会四大领域。

开源生态政策/监管
15:01
AYi@AYi_AInotes
精选75
微软双向转售GPT与DeepSeek成全球最大AI中间商

彭博社报道,微软已成为全球最大AI模型中转站,既将ChatGPT卖给中国企业,也反向将DeepSeek模型卖给西方客户。报道称微软正在测试DeepSeek-R1和DeepSeek-V4,计划向西方客户提供这些中国模型。这一模式构建起跨中美AI模型的双向贸易网络。

DeepSeekMicrosoft开源生态行业动态

推荐理由:微软做起了跨中美模型的双向经销商,这事比表面看起来意义大——它可能绕过限制,把最先进的模型分发到原本接触不到的市场,全球 AI 供应链要改写了。
12:28
Yuchen Jin@Yuchenj_UW
30
使用 GLM-5.2 一天后,我惊讶于它经常感觉接近 Opus 4.8/GPT-5.5 的水平。 我将它与 Opus 4.8 进行了并排比较,有时我甚至更喜欢 GLM-5.2 的结果。 开源大语言模型令人印象深刻,尤其是考虑到它们训练的 GPU 数量少得多。
开源生态推理评测/基准
09:24
meng shao@shao__meng
47
GLM 5.2开源获海外好评,智谱股价飙升

GLM 5.2 开源发布后,国外 AI 博主纷纷称赞。作者认为模型够强是关键,用户会主动付费。同时智谱港股股价飙升,已甩开 MiniMax、追上小米。在作者看来,现阶段模型团队远未到精细化运营阶段,更重要的是资方和股民。

大佬观点开源生态行业动态
08:56
向阳乔木@vista8
21
Vista 计划开发 PPT 生成 Skill

Vista 计划开发 PPT 生成 Skill,核心:同时输出可编辑 PPTX、PDF、HTML;基于 GPT 5.5 Pro 方法论;按环境在 Codex 生图或 SVG 渐变背景;集成 echart、lucide icon、Google Font;内置抓取 X 帖子、长文、论文 PDF 素材。预计下周开源。

开源/仓库开源生态
06:24
MarkTechPost(RSS)
68
VibeThinker-3B:基于Qwen2.5-Coder-3B的3B密集推理模型,开源MIT

新浪微博研究人员发布VibeThinker-3B,一个仅3B参数的密集推理模型,基于Qwen2.5-Coder-3B,采用谱到信号后训练流水线(SFT、强化学习与自蒸馏),MIT开源。在AIME26上得分94.3,比肩DeepSeek V3.2(671B)和Kimi K2.5(1T);LiveCodeBench v6达80.2 Pass@1;2026年4月至5月LeetCode周赛与双周赛首次提交通过率96.1%。搭载CLR测试时缩放后AIME26升至97.1。BF16权重约6GB,单GPU可运行,推荐使用vLLM 0.10.1或SGLang ≥0.4.9.post6推理。

开源生态推理模型发布
06:22
Eric@ericmitchellai
29
过时:模型训练 流行:模型选择
开源生态数据/训练现象/趋势
05:40
Chubby♨️@kimmonismus
45
另一个指数级增长,来自 Artificial Analysis。 几乎是整个领域都在同时向上移动。 OpenAI、Anthropic、Google、xAI、Meta、DeepSeek、Alibaba、Mistral、Kimi 等公司现在*相互之间的聚集程度*比两年前更紧密了。鸣谢 @ArtificialAnlys
开源生态现象/趋势
04:26
OpenRouter:Announcements(RSS)
精选68
OpenRouter vs LiteLLM:如何选择 LLM 网关

OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关,无需管理基础设施,收取 5.5% 平台费(前 100 万次请求免费),支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理(Docker/PostgreSQL/Redis),数据不离开内网,免费开源,但需承担基础设施成本(生产部署约数百美元/月)。当模型月支出超过约 $3,600(基础设施 $200/月)或 $9,100(基础设施 $500/月)时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由;OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。

开源生态评测/基准部署/工程

推荐理由:OpenRouter 这份官方对比很坦诚,把成本、延迟、合规的权衡掰开了讲,自建 LiteLLM 和托管谁更划算的算术也给清楚了,做 LLM 网关选型的直接看这篇就够了。
02:01
AYi@AYi_AInotes
67
OpenAI 推出 Codex for Open Source 计划:免费提供半年 ChatGPT Pro

OpenAI 正式推出 Codex for Open Source 计划,为开源项目维护者免费提供 6 个月 ChatGPT Pro(含完整 Codex 权限)及专项 API 额度,总价值 1200 美元。无硬性 Star 门槛,个位数 Star 的小项目也可申请。申请需说明具体维护工作、项目真实影响力及资源使用计划。审核采用 AI 加人工滚动处理,通过率较高,整个过程零成本,约十分钟即可完成。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI开源生态教程/实践
6月19日
22:23
Nathan Lambert@natolambert
32
禁止任何形式的开源AI将是错误。与@kevinsxu共同发布的一则面向公众的公告,阐述为何开源维护美国价值观。 管理前沿风险是困难的,但通过削弱开放前沿来减少透明度、创新和教育将更糟。

Kevin S. Xu: http://x.com/i/article/2067652729913114624

大佬观点安全/对齐开源生态
21:59
Nathan Lambert:Interconnects(RSS)
精选56
禁止开源AI将是一个错误

近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制,可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值,在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中,开源(尤其开放权重)是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全,更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反,美国初创公司正依赖包括中国在内的开源模型提升效率。

大佬观点开源生态政策/监管

推荐理由:在华盛顿弥漫监管 AI 空气的当下,这篇文章是对‘禁止开源 AI’冲动的清晰反驳。它系统梳理了开源在教育、创新和竞争中不可替代的价值,尤其适合对政策走向摇摆不定的人阅读。
21:22
Hacker News 热门(buzzing.cc 中文翻译)
66
Datasette 发布插件 datasette-apps:在 Datasette 中托管自定义 HTML 应用

Datasette 发布新插件 datasette-apps,允许托管自包含 HTML+JavaScript 应用。应用在严格沙箱中运行(sandbox 属性和 CSP 头),无法访问 cookies、localStorage 或外部 HTTP 请求,防止数据泄露。应用可用 JavaScript 对 Datasette 数据执行只读 SQL 查询,若配置存储查询还可写入。应用与父窗口通过 postMessage 或 MessageChannel 通信。灵感来自 Claude Artifacts,为 HTML 前端提供 Datasette 后端。试用需 GitHub 登录 agent.datasette.io 演示实例。

产品更新开源生态部署/工程
20:52
SemiAnalysis@SemiAnalysis_
65
Bessemer 合伙人 Adam Fisher 称,一些新云公司担心若未购买英伟达全套硬件,可能被"关进 Jensen 监狱"--即失去芯片配额。黄仁勋似乎在暗示,若不买全套就会削减配额。主推文称正在出售,有意者私信询价。

Jukan: "Some neo-clouds worry that they can't stray from buying Nvidia's full stack of hardware for fear of being put in "Jense...

开源生态行业动态
18:50
MiniMax (official)@MiniMax_AI
36
MiniMax M3 已成为 B.AI 上最受欢迎的模型,目前免费使用。 感谢 @BAI_AGI 团队让 M3 从第一天起就可用。

B.AI: 👑 @MiniMax_AI's MiniMax M3 is now the #1 most popular model on http://B.AI. From topping the open source rankings to le...

开源生态行业动态
17:50
Hacker News 热门(buzzing.cc 中文翻译)
47
"令牌压缩"的错觉:我为何对RTK持怀疑态度

RTK获得60k GitHub星标,宣称能“削减60–90%模型token用量,支付1/10的价格”,但实际API账单并未同比例下降——它仅裁剪Bash原始输出,忽略文件读取、仓库上下文、系统提示词和模型内部推理token。公开issues指出终端输出会被静默截断或丢失,且AI智能体无法感知压缩,导致关键信息缺失。RTK从未公布任务成功率(如SWE-bench类基准),其节省量更像营销指标。从架构看,rtk引入脆弱的外部依赖,解析git、cargo、npm、grep等CLI工具的stdout/stderr格式,一旦工具更新格式便可能静默失败。本质上这是CLI原生可实现的feature,而非独立产品,将其放入生产agent关键路径存在高风险。

大佬观点开源生态编码
16:43
歸藏(guizang.ai)@op7418
22
唐老师与马斯克就国内开源版本的Fable 5级别模型何时出现展开对话。马斯克认为需要较长周期,而唐老师回复"won't take that long",暗示时间可能早于预期。主推文据此判断,国内开源Fable 5级别模型不必等到2027年。

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态
16:12
宝玉@dotey
74
baoyu-design skill 更新,支持在制作 PPT、动画视频或网站时调用 AI 生图技能配图,可配合 Codex 或 Claude Code 使用。生成 PPT 时自动在合适位置插入配图,并可导出为 PPTX 格式,支持二次编辑。此外,该 skill 可在本地生成动画视频并导出 mp4,采用声明式动画引擎 f(t),通过无头浏览器逐帧截图经 ffmpeg 合成,确保每帧精确无掉帧。项目已在 GitHub 开源(MIT),获 1.2K star。

宝玉: baoyu-design skill 可以在本地生成动画视频,导出 mp4 格式,就像附件视频这个。 Claude Design 网页版可以用提示词创建动画视频,但你需要在网页上才能看到视频,无法下载。也有人基于第三方插件录屏软件实现过,不...

GitHub图像生成开源生态教程/实践
13:19
AYi@AYi_AInotes
精选79
阿里开源向量数据库Zvec,UCSD黄碧薇教授提出因果AI第四代范式

阿里开源内部向量数据库Zvec,pip install zvec免费使用,对标Pinecone每月70美元能力。支持十亿向量毫秒级检索,无需单独起服务,全平台兼容;v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授(causal-learn作者)提出AI四代范式:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型,认为当前正站在第四代门口。其创立的Aether AI完成首轮融资,致力于从视频中自动抽取物理规律,探索下一代因果AI范式。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

检索增强产品更新开源生态搜索

推荐理由:阿里把内部跑了多年的向量数据库开源了,pip一行直接跑,十亿级毫秒检索还不占额外服务,做RAG和搜索的不用再每月给Pinecone交钱,虽然刚起步,但免费生产级轮子值得一试。
11:16
IT之家(RSS)
40
蔡崇信:阿里全面投入 AI,开源的主要推动力量来自中国企业

蔡崇信昨日在 VivaTech 2026 上表示,AI 的总潜在市场规模达 50 万亿美元,对标人类生产力,阿里巴巴正全面投入 AI。其全栈 AI 优势包括:中国高效低成本的能源供给,提前布局的云计算和芯片,全球最受欢迎的开源模型千问(Qwen),以及覆盖电商、即时零售等丰富应用场景。他同时指出,当前全球 AI 开源的主要推动力量来自中国企业,阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。

大佬观点开源生态现象/趋势
10:56
MarkTechPost(RSS)
精选75
Salesforce CodeGen教程:生成、验证并重排序Python函数(含单元测试与安全检查)

本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型(支持350M、2B、codegen2-1B、codegen25-7b等版本),通过自然语言提示生成Python函数,随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构化代码生成流水线的能力,不仅完成代码补全,还能评估、筛选和组织生成结果。

Hugging Face开源生态教程/实践编码

推荐理由:这篇教程把CodeGen从单纯补全变成一个带安全检查、单元测试和候选重排序的工程化代码生成管道,读完能直接套用到日常写代码里,对想落地的开发者非常友好。
10:47
HuggingFace Daily Papers(社区热门论文)
49
FreeStyle:基于社区LoRA挖掘的风格-内容双参考生成框架

风格-内容双参考生成旨在合成图像,保留内容参考的结构语义并采用风格参考的样式。FreeStyle提出基于社区LoRA挖掘的可扩展双参考生成框架,将LoRA作为风格与内容的组合锚点,通过生成-过滤流程构建大规模三元组数据。针对内容泄漏,采用两阶段课程学习:注意力级增强约束抑制风格参考泄漏,频率感知RoPE调制策略应对双参考阶段的位置对应泄漏。引入覆盖风格参考与双参考生成的基准,包含风格不变内容对齐分数(CAS)和基于VLM的拒绝分数。实验表明模型在风格对齐、内容保留和泄漏抑制间取得强平衡。

Hugging Face图像生成开源生态论文/研究
‹ 上一页
1…56789…36
下一页 ›