AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
6月1日周一
19:48AYi50说个暴论:信息差是普通人最后的红利。
19:17MiniMax (official)62MiniMax M3 SVG生成能力惊艳,闭源优势减弱
18:47MiniMax (official)64MiniMax M3与GPT 5.5差距仅2.1%
18:42Berryxia.AI71KwaiKeye开源多模态大模型Keye VL 2.0-30B-A3B
15:48Emad54NVIDIA借Nemotron与Cosmos推动AI普惠化
14:04IT之家(RSS)80让机器人看懂世界:英伟达推出全球首款全开源全模态物理 AI 大模型 Cosmos 3
13:36🚨 AI News | TestingCatalog80MiniMax发布开源模型M3
13:31Runway69NVIDIA联合AI实验室开源物理AI世界模型
13:24Runway:News(网页)55精选介绍Cosmos Coalition
13:04IT之家(RSS)74英伟达开源5500亿参数Nemotron 3 Ultra模型
09:25swyx66PewDiePie发布个人AI生产力套件,成为DIY新标杆
08:28Hacker News 热门(buzzing.cc 中文翻译)48人工智能时代原型制作的速度
08:28Hacker News 热门(buzzing.cc 中文翻译)58奥德修斯--自主托管的 AI 工作区
08:00HuggingFace Daily Papers(社区热门论文)75Cosmos 3:面向物理AI的全模态世界模型
04:55Artificial Analysis74HiDream发布O1-Image系列文生图模型
5月31日周日
21:20Peter Steinberger 🦞61OpenClaw理念:模块化与精简高效
16:44Hacker News 热门(buzzing.cc 中文翻译)59Rsync 3.4.3 包含数百个由 Claude 提交的代码
08:44向阳乔木73GEO公开课首期举办,全套资料开放获取
05:43Nathan Lambert50开源与闭源模型之争:智能边际价值
5月30日周六
23:34AYi75精选免费领取6个月ChatGPT Pro及AI工具思考
23:14Ethan Mollick61开源模型真实能力与评测表现存差距
15:21IT之家(RSS)46Linux 应用商店 Flathub 将禁止新提交应用使用 AI 生成代码,维护者直言"我受够了"
13:11向阳乔木72X平台互动下降原因分析:翻译功能与算法更新
12:18SemiAnalysis76精选xAI放弃JAX GPU转向自研训练框架
08:40Hacker News 热门(buzzing.cc 中文翻译)62神秘的大语言模型 Hy3 以巨大优势领跑 OpenRouter 模型排行榜
08:08Nathan Lambert56开放科学是AI研究的重要共识与实践基础
08:06OpenRouter72精选ComfyUI现已支持OpenRouter模型直接调用
04:46Chubby♨️56开源模型与闭源前沿差距仅四个月
04:46Chubby♨️65NVIDIA 将四个开放模型系列迁移至 OpenMDW 框架
04:08Epoch AI65开放权重模型与前沿差距达四个月
02:10Hacker News 热门(buzzing.cc 中文翻译)62巴黎Mistral AI Now峰会纪要
00:34Berryxia.AI69PaddleOCR-VL 1.6 发布,文档解析SOTA提升
00:15AK62Qwen-VLA:统一视觉语言动作建模
00:15AK58HuggingFace 推理 API 已提供 81k 模型
00:15AK69minWM:实时交互视频世界模型开源框架
5月29日周五
22:30HuggingFace Daily Papers(社区热门论文)69Xetrieval: 机制性地解释密集检索
22:19Peter Steinberger 🦞57多个开源项目全面禁止AI代码贡献
17:21IT之家(RSS)74精选小米开源可控视频音效生成模型 ControlFoley,让声音"按你想要的来"
17:13Alibaba Cloud41阿里云与Appnovation探讨Qwen企业应用策略
14:21IT之家(RSS)63美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型:自称是千问和 DeepSeek,Anthropic 再陷"双标"争议
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月1日
19:48
AYi@AYi_AInotes
50
说个暴论:信息差是普通人最后的红利。

推文指出,在AI时代,真正的贫富差距已转变为信息差。信息玩家能通过各种渠道节省开支或获取免费资源,例如以五折价购得几乎全新的商品、利用学生身份免费使用一年Cursor、作为开源项目维护者领取半年ChatGPT Pro,或为初创公司获取数万美元云额度。推文引用的具体福利显示,任何公开开源项目的维护者,均可申请免费获得价值$1200的6个月ChatGPT Pro。这些高杠杆的免费通道不会主动出现,因此推文建议养成在消费前先审视自身是否为“冤种”的习惯,以抓住信息差带来的红利。

AYi: 免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...

OpenAI开源生态教程/实践
19:17
MiniMax (official)@MiniMax_AI
62
我可以整天看SVG测试!快用M3多发点给我 👀

WorldofAI: Minimax M3 is excellent at SVG generation, reaching close to Gemini 3.5 Flash levels and beating Opus 4.7 on SVG-Bench. ...

图像生成开源生态评测/基准
18:47
MiniMax (official)@MiniMax_AI
64
确实如此 😎 #M3

Arif: MiniMax M3 scores 90.3% GPT 5.5 Scores 92.4% Just a 2.1% gap now at @convex. Incredible to see the open-source models cl...

开源生态推理模型发布
18:42
Berryxia.AI@berryxia
71
KwaiKeye开源多模态大模型Keye VL 2.0-30B-A3B

KwaiKeye开源了多模态大模型Keye VL 2.0-30B-A3B,采用Apache 2.0许可。该模型总参数为30B,但仅激活3B参数。其核心亮点是通过DeepSeek稀疏注意力技术实现了256K的上下文长度。该模型的视频理解能力表现出一个反直觉的特性:喂入的帧数越多,其准确率反而持续上升。在基准测试中,其表现已与Qwen3 VL、Gemini 3 Flash等模型相当。

Adina Yakup: Keye VL 2.0-30B-A3B 🔥 New multimodal model from @KwaiKeye ✨ 30B/3B active - Apache 2.0 ✨ 256K context via DeepSeek Spar...

多模态开源生态推理模型发布
15:48
Emad@EMostaque
54
借助Nemotron与Cosmos,NVIDIA将把所有人的互补能力商品化。
大佬观点开源生态
14:04
IT之家(RSS)
80
让机器人看懂世界:英伟达推出全球首款全开源全模态物理 AI 大模型 Cosmos 3

英伟达推出全球首款全开源全模态物理AI大模型Cosmos 3。该模型基于混合Transformer架构,可在单一系统中融合文本、图像、视频、音效及动作内容的理解与生成,将物理AI的训练与评估周期从数月缩短至数日。Cosmos 3在Artificial Analysis、Physics-IQ等多个评测基准上排名第一,提供Super和Nano版本用于机器人与自动驾驶的训练与实时推理,Edge版本即将推出。

具身智能多模态开源生态模型发布
关联讨论 8 条X:Kim (@kimmonismus)Hugging Face:Blog(RSS)X:卡兹克 (@Khazix0918)X:Satya Nadella (@satyanadella)X:Perplexity (@perplexity_ai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)LMSYS:Blog(Chatbot Arena 团队)
13:36
🚨 AI News | TestingCatalog@testingcatalog
80
MiniMax发布开源模型M3

MiniMax发布了新开源权重模型M3,现已通过API和MiniMax Agent提供服务。该模型在SWE-Bench Pro上得分59.0%,在Terminal Bench 2.1上得分66.0%,并支持高达1M的上下文窗口。同时,MiniMax Agent更新了持久记忆与进化技能等能力。此外,MiniMax Code也已发布,模型权重与技术报告将在约10天后公开。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

多模态开源生态模型发布编码
关联讨论 11 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
13:31
Runway@runwayml
69
介绍Cosmos联盟 一项与NVIDIA及领先AI实验室合作的新全球倡议,旨在构建并开源用于物理AI的前沿世界模型。Runway作为创始成员加入,与NVIDIA及一系列领先AI实验室共同工作,通过一个共同的开放生态系统来构建、共享并加速世界模型的研究与开发。
具身智能开源生态行业动态
13:24
Runway:News(网页)
精选55
介绍Cosmos Coalition

Runway宣布作为创始成员加入Cosmos Coalition,该联盟与NVIDIA及多家领先AI实验室合作,旨在构建并开源面向物理AI的前沿世界模型。首个项目将由Runway与NVIDIA共同开发一个基础模型,以推动下一代开放世界模型的研究与发展。

开源生态行业动态

推荐理由:Runway 和 NVIDIA 等联手成立 Cosmos Coalition,要开源世界模型,这份声明是视频生成和物理 AI 走向基础设施化的信号,但眼下没有可用的模型或代码,更像一份生态宣言。
13:04
IT之家(RSS)
74
英伟达开源5500亿参数Nemotron 3 Ultra模型

英伟达发布面向AI智能体的开源模型Nemotron 3 Ultra,其为5500亿参数的混合专家模型。相较于同级别开源模型,该模型推理速度最高提升5倍,使用成本最高降低30%。模型已适配Hermes Agent、LangChain Deep Agents等主流框架,并已助力CrowdStrike、Palantir等企业构建智能体系统。该模型预计于6月4日通过Hugging Face、ModelScope等平台以NVIDIA NIM微服务形式提供。

智能体开源生态模型发布
关联讨论 8 条X:Kim (@kimmonismus)Hugging Face:Blog(RSS)X:卡兹克 (@Khazix0918)X:Satya Nadella (@satyanadella)X:Perplexity (@perplexity_ai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)LMSYS:Blog(Chatbot Arena 团队)
09:25
swyx@swyx
66
PewDiePie发布个人AI生产力套件,成为DIY新标杆

2025年2月,soumithchintala关于个人、本地、私有AI智能体的愿景曾遭质疑。而至2026年6月,知名玩家PewDiePie已基于opencode封装发布了一款vibecoded的个人AI生产力套件,功能涵盖邮件、文档和日历。该产品在Hacker News上迅速获得超过1百万次浏览和超过10k星标。推文指出,这一成果为知识工作智能体初创公司设立了新的DIY基准。

智能体开源生态现象/趋势
08:28
Hacker News 热门(buzzing.cc 中文翻译)
48
人工智能时代原型制作的速度

在人工智能时代,产品原型设计的速度正迎来显著变化。文章探讨了AI工具如何影响原型制作的流程与效率,讨论了从概念到实现的加速可能性。

开源生态现象/趋势编码
08:28
Hacker News 热门(buzzing.cc 中文翻译)
58
奥德修斯--自主托管的 AI 工作区

奥德修斯是一个自主托管的 AI 工作区项目,其源代码已在 GitHub 上公开。

GitHub开源/仓库开源生态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
75
Cosmos 3:面向物理AI的全模态世界模型

NVIDIA 发布 Cosmos 3 全模态世界模型家族,基于统一混合 Transformer 架构,联合处理与生成语言、图像、视频、音频和动作序列。该模型将视觉-语言模型、视频生成器、世界模拟器及世界-动作模型整合为单一框架,在多项理解与生成任务上达到新 SOTA。技术报告撰写时,后训练版本被 Artificial Analysis 评为最佳开源文生图与图生视频模型,被 RoboArena 评为最佳策略模型。代码、模型权重、合成数据集及评测基准已开源(Linux Foundation OpenMDW-1.1 许可)。

具身智能多模态开源生态论文/研究
关联讨论 8 条X:Kim (@kimmonismus)Hugging Face:Blog(RSS)X:卡兹克 (@Khazix0918)X:Satya Nadella (@satyanadella)X:Perplexity (@perplexity_ai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)LMSYS:Blog(Chatbot Arena 团队)
04:55
Artificial Analysis@ArtificialAnlys
74
HiDream发布O1-Image系列文生图模型

HiDream发布O1-Image系列文生图模型,包含8B参数的HiDream-O1-Image、其蒸馏版本HiDream-O1-Image-Dev,以及基于Dev微调并集成提示增强管线的HiDream-O1-Image-Dev-2604。在Artificial Analysis Text to Image Arena榜单上,Dev-2604版本在所有开源权重模型中排名第一,生成质量接近Seedream 4.0和FLUX.2 [max]等闭源模型。在图像编辑任务中,HiDream-O1-Image是排名第二高的开源模型,仅次于腾讯的HunyuanImage 3.0 Instruct。所有模型的权重及完整推理管线均以MIT许可证开源。HiDream-O1-Image与HiDream-O1-Image-Dev也通过Fal等第三方API提供,价格分别为$10/1k images和$5/1k images。

Hugging Face图像生成开源生态模型发布
5月31日
21:20
Peter Steinberger 🦞@steipete
61
OpenClaw的理念始终是它应该属于你。 它是模块化且精简的,只添加你需要的功能。更少的技能,更少的工具 = 你的智能体可以更高效地工作。

EdgeDimi: @theo Seeing different paths ioenclaw started as a heavy package and became lean now hermes becomes the heabty trash pac...

智能体大佬观点开源生态
16:44
Hacker News 热门(buzzing.cc 中文翻译)
59
Rsync 3.4.3 包含数百个由 Claude 提交的代码

版本控制系统 Rsync 的 3.4.3 版本代码库中,包含数百个由 AI 模型 Claude 完成的代码提交。

开源生态现象/趋势编码
08:44
向阳乔木@vista8
73
GEO公开课首期举办,全套资料开放获取

首期GEO公开课于上周末直播,由姚老师主讲,吸引了飞书和视频号数千人在线参与。课后已将直播PPT、免费开源的GEOflow系统及全部提示词等干货资源在评论区开放分享。

开源/仓库开源生态搜索
05:43
Nathan Lambert@natolambert
50
关于开源还是闭源模型会胜出的争论,归结于边际智能提升是否带来不成比例的价值。 相信这一点的人,与认为开源模型"足够好"的阵营相对而立。 闭源模型将保持略微更智能。开源模型将更便宜。
大佬观点开源生态
5月30日
23:34
AYi@AYi_AInotes
精选75
免费领取6个月ChatGPT Pro及AI工具思考

OpenAI为开源项目维护者提供福利,可免费领取6个月ChatGPT Pro(价值$1200),申请无硬性Star数要求,有项目链接即可。同时,文章引用讨论了AI工具的分类:一类是“agent型”(如Claude Code、Codex),可自主运行;另一类是“实习生型”(如Cursor),需人工决策,有助于使用者以术入道、培养判断力,但受限于需人在场。作者推荐了网易的UU远程工具,称其免费两年,支持4K 144帧无延迟连接Mac并可使用原生终端,解决了“实习生型”工具的地点限制问题。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

OpenAI其他开源生态

推荐理由:OpenAI 给开源维护者送 6 个月 Pro,没 Star 要求,有项目链接就行,我觉得这是今年最实在的开发者福利,手慢无。
23:14
Ethan Mollick@emollick
61
Epoch AI 使用其综合指标 Epoch Capabilities Index 测量发现,开源模型与闭源模型的能力差距平均约为三个月。但主推文作者对此表示怀疑,认为开源大语言模型的实际表现(尤其是在分布外任务上)比评测分数所显示的更为脆弱,真实的体感差距可能远不止三四个月。

Epoch AI: We measure the gap using the Epoch Capabilities Index, our aggregate measure of model capability. Compared to our last a...

大佬观点开源生态评测/基准
15:21
IT之家(RSS)
46
Linux 应用商店 Flathub 将禁止新提交应用使用 AI 生成代码,维护者直言"我受够了"
开源生态编码行业动态
13:11
向阳乔木@vista8
72
近期X平台用户互动下降,主要受两大因素影响。一是全球自动翻译功能于2026年4月7日上线,打破了语言壁垒,使得同主题内容(如地缘政治)的潜在竞争者数量从约5000个英语账户剧增至约5万个全语言账户,大幅降低了单个帖子的能见度。二是推荐算法根本性转变:粉丝权重降低,每条帖子需基于预测互动独立赢得受众。新算法采用两阶段机制:先通过语义匹配从全平台筛选出约1500个候选帖,再通过一个Grok模型基于15项预测互动指标(如点赞、回复、停留时间等)进行排序。其中,负面互动(如标记不感兴趣、屏蔽)会被负向加权,直接影响展示优先级。

Arnaud Bertrand: So I spent some time studying the new Twitter/X algorithm today since the latest version was published about a week ago ...

开源生态现象/趋势
12:18
SemiAnalysis@SemiAnalysis_
精选76
突发新闻:JAX NVIDIA GPU & XLA:GPU最大客户刚刚宣布已放弃JAX GPU,宁愿用Grok Build"氛围编程"一个C训练框架。据报道xAI的JAX堆栈MFU低于10%。NVIDIA JAX团队过去两年全部主力996专注于支持xAI却失败了,我想他们现在可以休息并兑现期权了。
xAI开源生态行业动态

推荐理由:xAI 这个 GPU 最大客户突然甩了 JAX,要自研 C 训练框架,理由是 JAX 利用率太低。如果连万亿参数集群都搞不定,JAX 的底层缺陷可能比想象的大,做大规模训练的团队得认真评估了。
08:40
Hacker News 热门(buzzing.cc 中文翻译)
62
神秘的大语言模型 Hy3 以巨大优势领跑 OpenRouter 模型排行榜

根据2026年5月29日发布的一则消息,一个名为 Hy3 的神秘大语言模型(LLM)在 OpenRouter 模型排行榜上取得了显著领先优势,位居榜首。OpenRouter 是一个 AI 模型聚合平台,其排行榜反映了不同模型的综合表现。该信息最初发布于 minimaxir.com,并获得了科技社区 HN 的关注。然而,关于该模型的具体技术细节、开发者信息以及性能评分,原文并未提供更多说明。

DeepSeek开源生态现象/趋势部署/工程
08:08
Nathan Lambert@natolambert
56
推文强调开放科学在AI讨论和研究中的基础性作用,以Tulu 3项目创建RLVR(基于强化学习的验证与推理)为例,说明公开研究方法能为领域设定标准并减少未来冗余。同时指出一个关键现象:AI前沿实验室的创新常被学术界独立重现,但外部人员无法接触这些内部工作,唯一的参考来源就是公开分享的研究。因此,开放科学对推动整个领域进步至关重要。

Rishabh Agarwal: Someone once told me: "You should be the last one to reinvent something" -- not sure how useful this is, but this is a c...

大佬观点开源生态现象/趋势
08:06
OpenRouter@OpenRouter
精选72
现在你可以直接在ComfyUI工作流中使用你的OpenRouter模型了! 【引用 @ComfyUI】:ComfyUI刚刚添加了@OpenRouter支持。 你不再局限于单一的大语言模型,现在可以直接在Comfy中访问20多个模型。 更多灵活性,更少摩擦,同样的工作流。 工作流链接在下方👇

ComfyUI: ComfyUI just added @OpenRouter support. Instead of being locked into a single LLM, you can now access 20+ models directl...

产品更新多模态开源生态

推荐理由:ComfyUI 首次直接集成 LLM 路由服务,等于给图像管线加了个「外挂大脑」,做自动化工作流的人可以直接在节点里调用 20+ 模型,省掉一堆 API tinker 环节。
04:46
Chubby♨️@kimmonismus
56
根据 EpochAI 的研究,开源权重模型落后于前沿闭源模型四个月。 四个月。这非常短暂。同时也令人印象深刻。

Epoch AI: We took another look at the capability gap between open-weight and proprietary models. Since the start of the year, open...

开源生态评测/基准
04:46
Chubby♨️@kimmonismus
65
NVIDIA 将四个开放模型系列迁移至 OpenMDW 框架

NVIDIA 宣布将其四个开放模型系列(Cosmos、Isaac GR00T、Ising、Nemotron)迁移至 Linux 基金会的 OpenMDW-1.1 框架下。此举旨在解决当前开放模型因许可杂乱和附加限制导致的法律审查负担。OpenMDW 框架为模型权重、代码、文档和数据提供了统一的宽松许可证,使得开发者和企业从多次审查简化为一次。这符合 NVIDIA 以算力为核心的业务逻辑,能够促进更多人部署和微调其开放模型。

NVIDIA AI: We're adopting the Linux Foundation's OpenMDW framework across our open model families. This helps make open model licen...

开源生态行业动态
04:08
Epoch AI@EpochAIResearch
65
我们再次审视了开放权重模型与专有模型之间的能力差距。自今年年初以来,开放权重模型落后于最先进水平四个月。
开源生态现象/趋势
02:10
Hacker News 热门(buzzing.cc 中文翻译)
62
巴黎Mistral AI Now峰会纪要

Mistral AI 在巴黎举办了 AI Now 峰会。会议讨论了开放模型、本地部署以及 AI 智能体工具等议题,展现了 Mistral 致力于成为欧洲全方位人工智能合作伙伴的战略方向。

智能体开源生态行业动态
00:34
Berryxia.AI@berryxia
69
PaddleOCR-VL 1.6 发布,文档解析SOTA提升

飞桨发布了PaddleOCR-VL 1.6版本。该版本在OmniDocBench评测基准上取得了96.33%的新SOTA成绩,在该榜单及Real5-OmniDocBench上均排名第一。在表格、经典文本和稀有字符识别能力上均有显著提升,并增强了印章检测与图表理解能力。该版本与1.5版本架构完全兼容,实现了零迁移成本,方便直接部署使用,旨在为大语言模型和检索增强生成等系统提供更高质量的输入数据。

PaddlePaddle: 🚀PaddleOCR-VL 1.6 Officially Released! We are thrilled to announce the official release of PaddleOCR-VL 1.6 - this vers...

多模态开源生态模型发布
00:15
AK@_akhaliq
62
Qwen-VLA 跨任务、环境与机器人具身的统一视觉语言动作建模
具身智能多模态开源生态论文/研究
00:15
AK@_akhaliq
58
81k 模型可通过 HuggingFace 推理 API 使用
Hugging Face产品更新开源生态部署/工程
00:15
AK@_akhaliq
69
minWM 一个用于实时交互视频世界模型的全栈开源框架
开源/仓库开源生态视频
5月29日
22:30
HuggingFace Daily Papers(社区热门论文)
69
Xetrieval: 机制性地解释密集检索

Xetrieval是一种用于解释密集检索行为的嵌入级别的机制性框架。它首先引入轻量级推理内化器,通过单次前向传播在嵌入空间近似链式推理,以增强句子嵌入的推理信息。随后,框架将这些推理增强的嵌入分解为稀疏的、人类可解释的特征,并为每个特征赋予自然语言描述。通过聚合多个文档侧视图的稀疏特征重叠,Xetrieval能够为单个检索决策提供特征级别的解释。实验表明,该方法在不同检索器和基准上能发现连贯的可解释特征,并支持任务级的特征引导。

开源生态搜索论文/研究
22:19
Peter Steinberger 🦞@steipete
57
多个知名开源项目正在全面禁止AI/大语言模型相关的代码贡献。QEMU的政策是拒绝任何被认为包含或源自AI生成内容的贡献;NetBSD将AI生成的代码推定为污点代码,不得提交;Zig对AI实施完全禁令,明确禁止使用大语言模型生成内容、翻译、查找bug,甚至禁止讨论使用聊天机器人/大语言模型服务;OBS Studio则要求代码必须由人类编写。

The Lunduke Journal: While the Linux Kernel is quickly becoming "Vibe Coded", many other Open Source projects are outright banning all AI / L...

大佬观点开源生态编码
17:21
IT之家(RSS)
精选74
小米开源可控视频音效生成模型 ControlFoley,让声音"按你想要的来"

小米大模型应用团队发布开源可控视频音效生成模型 ControlFoley,旨在解决创作中的可控性难题。该模型统一支持文本引导视频配音、文本控制视频配音和参考音频控制视频配音三类任务。ControlFoley 在 VGGSound-Test 等多个 benchmark 上取得开源 SOTA 表现,其代码、模型权重和在线 Demo 均已开放。

多模态开源生态模型发布语音

推荐理由:小米开源的 ControlFoley 把视频音效生成从“看画面配声音”推进到“按意图来”,开源 SOTA 且直接提供 Skill,做视频创作的可以上手试试。
17:13
Alibaba Cloud@alibaba_cloud
41
加入阿里云和Appnovation的战略简报,了解通义千问(Qwen)如何帮助企业重新思考AI性能与成本的平衡。了解全球领先企业为何选择Qwen,以及您的团队需要了解哪些信息以保持竞争力。 📅 6月9日星期二 | 太平洋时间上午11:00 / 东部时间下午2:00 | 55分钟 | 线上 立即注册:https://lnkd.in/gHEyw6EQ
开源生态行业动态
14:21
IT之家(RSS)
63
美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型:自称是千问和 DeepSeek,Anthropic 再陷"双标"争议
Anthropic开源生态行业动态
‹ 上一页
1…1617181920…37
下一页 ›