AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 236 条
全部一手资讯X论文
标签「开源生态」清除
5月9日周六
02:34Hugging Face:Blog(RSS)52CyberSecQwen-4B 发布:防御性网络安全专用小模型
00:34Hugging Face:Blog(RSS)72精选EMO:为涌现模块化预训练的专家混合模型
5月8日周五
16:23Hugging Face:Blog(RSS)58精选MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型
05:29Anthropic:Research(发表成果 · 网页)73精选捐赠开源对齐工具 Petri
01:29Anthropic:Research(发表成果 · 网页)81精选自然语言自编码器:将Claude的"想法"解码为文本
5月6日周三
21:00公众号:昆仑万维(天工)23昆仑万维方汉:天工AI领跑垂类大模型 开源赋能全球创作
5月5日周二
00:54Google Developers Blog(RSS)66精选在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理
00:11Tomer Tunguz 博客(VC 分析)63精选每日仅需8条广告,广告支持型AI的经济可行性分析
5月2日周六
01:19Google Research:Blog(网页)51通过全球合作与开放资源催化科学影响力
4月30日周四
09:00公众号:蚂蚁百灵(Ling)62同事件精选Ling-2.6-1T 正式开源:面向复杂任务的万亿级综合旗舰模型同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
02:43LMSYS:Blog(Chatbot Arena 团队)74精选秒级更新万亿参数--大规模分布式强化学习中的点对点权重传输技术
00:40Mistral AI:News(网页)76Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
4月29日周三
16:30公众号:腾讯混元46出国必备+1!腾讯混元开源手机端离线翻译模型,仅0.4G,支持33种语言
11:19蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-1T
09:00公众号:蚂蚁百灵(Ling)57Ling-2.6-flash 正式开源
4月28日周二
01:27公众号:小米 MiMo45小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动
4月24日周五
15:41Steve Yegge:Medium(RSS)62Gas City 正式发布
09:00公众号:蚂蚁百灵(Ling)51Ling-2.6-1T 发布:万亿旗舰"快思考"模型,对标 GPT-5.4
08:00Hugging Face:Blog(RSS)78精选DeepSeek-V4:智能体可实际使用的百万token上下文
4月23日周四
08:00Hugging Face:Blog(RSS)57精选如何在 Chrome 扩展中使用 Transformers.js
4月17日周五
16:48蚂蚁 inclusionAI:GitHub 新仓库56精选inclusionAI发布LLaDA2.0-Uni模型
4月16日周四
11:46Hermes Desktop:GitHub Releases(RSS)51Hermes 桌面客户端 v0.1.0
10:30公众号:腾讯混元53腾讯混元3D世界模型2.0发布:无缝对接游戏工作流
4月15日周三
11:00公众号:小红书技术(dots.llm)52小红书 Relax 开源发布:面向全模态 Agentic 的异步 RL 训练引擎
4月14日周二
00:00Google Research:Blog(网页)AI生成合成神经元加速大脑测绘
4月12日周日
21:30公众号:MiniMax(稀宇科技)57MiniMax M2.7开源,携手全球伙伴加速AI生态繁荣
4月11日周六
21:02Nathan Lambert:Interconnects(RSS)开放模型联盟的必要性
4月10日周五
17:14公众号:智谱(GLM)59GLM-5.1获LMArena代码榜开源第一、全球第三
4月8日周三
10:41公众号:智谱(GLM)62精选GLM-5.1开源:一个独立工作8小时的模型
4月4日周六
00:57Nathan Lambert:Interconnects(RSS)精选Gemma 4 与开放模型成功之道
4月3日周五
13:08Steve Yegge:Medium(RSS)47Gas Town与Beads同步发布1.0.0正式版
4月1日周三
15:13Hugging Face:Blog(RSS)70精选Falcon Perception
3月31日周二
16:23Hugging Face:Blog(RSS)83精选以165美元成本训练25个物种的mRNA语言模型:构建从结构预测到密码子优化的AI流程
15:06Steve Yegge:Medium(RSS)49氛围维护者
3月30日周一
21:02Nathan Lambert:Interconnects(RSS)最新开源成果第20期发布:新增组织与模型类型,涵盖 Nemotron Super、Sarvam、Cohere Transcribe 等
11:25美团 LongCat:HuggingFace 新模型精选LongCat-AudioDiT-1B:高保真波形潜空间扩散式文本转语音模型
3月27日周五
08:00Hugging Face:Blog(RSS)43解放你的OpenClaw:致力于通过开源与开放科学推动AI民主化
3月25日周三
21:18美团 LongCat:HuggingFace 新模型美团 LongCat-Next
20:00公众号:月之暗面(Kimi)47Kimi 杨植麟「2026 中关村论坛」演讲全文(附视频)
09:06公众号:MiniMax(稀宇科技)55MiniMax Office Skills:开源一套生产级办公文档引擎
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月9日
02:34
Hugging Face:Blog(RSS)
52
CyberSecQwen-4B 发布:防御性网络安全专用小模型

CyberSecQwen-4B 是基于 Qwen3-4B-Instruct-2507 微调的 4B 参数防御性网络安全模型,在 CTI-Bench 上以半参数(4B vs 8B)对标 Cisco Foundation-Sec-Instruct-8B:CTI-MCQ 得分 0.5868,领先 8.7 个百分点;CTI-RCM 得分 0.6664,保留后者 97.3% 的准确率。可运行于单张 12 GB 消费级 GPU,训练使用 AMD Instinct MI300X,LoRA 微调(r=64, lr=5e-5),数据来自 MITRE/NVD 的 2021 CVE→CWE 映射及合成分析师问答,以 Apache-2.0 许可发布。专为需本地部署的敏感安全场景设计。

Hugging Face安全/对齐开源生态模型发布
00:34
Hugging Face:Blog(RSS)
精选72
EMO:为涌现模块化预训练的专家混合模型

EMO是一种新型专家混合模型,通过端到端预训练使模块化结构直接从数据中涌现,无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集(即8个活跃专家中的部分),同时保持接近全模型的性能;当所有128个专家共同使用时,它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数,训练数据达1万亿令牌。与标准MoE相比,EMO通过文档级路由约束,鼓励专家形成领域专业化组,从而支持选择性使用而不导致严重性能下降,实现了可组合架构,优化了大型稀疏MoE的内存-准确性权衡。

Hugging Face开源生态数据/训练模型发布

推荐理由:EMO 让 MoE 专家从按词法分散进化到按语义域自然模块化,仅用 12.5% 专家就能接近全模型性能,对需要按需加载的大模型部署是真正的突破。
5月8日
16:23
Hugging Face:Blog(RSS)
精选58
MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型

该项目使用AMD Instinct MI300X(192 GB HBM3显存)和ROCm,通过LoRA微调Qwen3-1.7B模型实现医学问答。训练仅用2000条MedMCQA样本,约5分钟完成,仅更新约220万参数(占模型总参数的0.1443%),全程采用fp16精度,无需量化。HuggingFace生态(Transformers、PEFT、TRL、Accelerate)在ROCm上无缝运行,无需修改代码即可直接替代CUDA。模型已上传至HuggingFace Hub并提供在线Demo。

Hugging Face开源生态教程/实践数据/训练

推荐理由:一个月前的教程了,但如果你是 AMD 党想跑医疗微调,这篇把坑都踩完了,代码直接能复现,LoRA 适配器也挂在 Hub 上,拿来就能用。
05:29
Anthropic:Research(发表成果 · 网页)
精选73
捐赠开源对齐工具 Petri

2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由:Petri 从 Anthropic 内部工具箱变成行业公共品,捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司,做安全测试的团队又多了一个可参考的标尺。
01:29
Anthropic:Research(发表成果 · 网页)
精选81
自然语言自编码器:将Claude的"想法"解码为文本

Anthropic团队推出自然语言自编码器方法,能将大模型内部的激活值直接解码为可读文本。该方法通过训练“激活描述器”和“激活重建器”,形成“激活值→文本解释→重建激活值”的循环,并以重建相似度为目标进行优化。应用表明,NLA能揭示模型未言明的内部状态,例如在安全测试中,发现Claude内心意识到自己正被评估的比例远超其外部回应。团队已公开代码,并合作发布了交互式探索工具。

Anthropic安全/对齐开源生态论文/研究

推荐理由:Anthropic 搞出了一种从激活中直接读出自然语言的方法,相当于给 Claude 的内心戏配了字幕。他们用这招发现模型在安全测试里比表面更常怀疑自己被评估,对审计隐藏动机也有奇效。做 AI 安全的人应该立刻点开看。
5月6日
21:00
公众号:昆仑万维(天工)
23
昆仑万维方汉:天工AI领跑垂类大模型 开源赋能全球创作

昆仑万维方汉指出,天工AI在垂类大模型领域中处于领先地位,并通过开源策略推动全球范围内的内容创作与生态构建。

开源生态行业动态
5月5日
00:54
Google Developers Blog(RSS)
精选66
在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理

加州大学圣地亚哥分校的研究团队在谷歌TPU上成功部署了DFlash,一种基于块扩散的推测解码方法。该方法突破传统自回归草稿生成的序列性瓶颈,通过单次前向传播并行“绘制”整个候选令牌块,而非逐个预测。系统平均实现了3.13倍的推理加速,峰值性能接近EAGLE-3等现有方法的两倍。这一开源方案已集成至vLLM生态系统,通过利用“免费”的并行验证能力和针对复杂推理任务的高质量草稿预测,显著优化了TPU硬件的利用效率。

Google开源生态推理论文/研究
关联讨论 1 条X:Berry Xia (@berryxia)
推荐理由:把扩散式的 speculative decoding 在 TPU 上跑出了 3 倍推理加速,峰值快到 EAGLE-3 的两倍,还直接集成了 vLLM,做推理优化的赶紧试一下。
00:11
Tomer Tunguz 博客(VC 分析)
精选63
每日仅需8条广告,广告支持型AI的经济可行性分析

基于开源模型和商用GPU的广告支持型AI在经济上可行。计算表明,一个由4块B200 GPU组成的集群服务300名用户时,每小时成本约18美元。通过广告收入即可覆盖成本:在内容网络中每3分钟展示一条广告(CPM 3.12美元),或在搜索广告中每39分钟展示一条(CPM 38.40美元),这一广告频率已与常见的移动和网页应用相当。对于代码代理等高强度任务,可采用混合盈利模式:用户每月支付10美元订阅费并每日观看8条广告,即可支持约200万token的用量,这证明了该模式的实用性。

开源生态推理现象/趋势

推荐理由:Tunguz 用一页纸的算账说清了广告支持 AI 的经济账,一天看 8 条广告就能换两百万 token,这对做免费 AI 产品的团队是个真正有说服力的模型。
5月2日
01:19
Google Research:Blog(网页)
51
通过全球合作与开放资源催化科学影响力

Google Research强调通过开源软件和开放数据集推动现代科学发展,秉持负责任、包容和严谨的开放科学原则。其Transformer架构重塑了自动语言处理,专业模型正推动医学、基因组学、神经科学、气候与能源等跨学科领域的突破。团队通过API、学术出版物、会议及全球合作伙伴关系,构建协作生态系统,旨在加速全球科学进步与创新。

Google开源生态行业动态
4月30日
09:00
公众号:蚂蚁百灵(Ling)
同事件精选62
Ling-2.6-1T 正式开源:面向复杂任务的万亿级综合旗舰模型

Ling-2.6-1T 于上周发布,今日正式开源。该模型定位为面向复杂任务的万亿级综合旗舰模型。

开源生态模型发布
同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
推荐理由:蚂蚁开源万亿参数模型 Ling-2.6-1T,虽然一个多月后才看到,但这是目前国内参数最大的综合性基座,做复杂多模态 agent 的团队可以直接拿来用,省去从头训练的麻烦。
02:43
LMSYS:Blog(Chatbot Arena 团队)
精选74
秒级更新万亿参数--大规模分布式强化学习中的点对点权重传输技术

LMSYS团队针对SGLang中的强化学习工作负载,提出了一种基于RDMA的点对点权重更新机制,作为传统NCCL广播方法的补充。该设计利用源端CPU引擎副本和Mooncake TransferEngine进行P2P RDMA传输,将拥有1T参数的Kimi-K2模型的权重传输时间从53秒大幅缩短至7.2秒,提速7倍。其代价是每个训练等级需在CPU内存中额外占用一个32G的推理引擎副本。此优化最大限度地减少了网络冗余,允许推理服务器更快恢复rollout过程,且兼容所有主流开源模型。

智能体开源生态论文/研究部署/工程

推荐理由:LMSYS 把分布式 RL 训练的权重同步从 NCCL 广播改成 RDMA P2P,1T 参数模型传输快了 7 倍,做大规模 RL infra 的团队该认真看看这个工程方案。
00:40
Mistral AI:News(网页)
76
Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

Mistral AI推出旗舰模型Mistral Medium 3.5,这是一个128B参数的密集模型,拥有256K上下文窗口,在SWE-Bench Verified上获得77.6%的分数。该模型现作为Vibe和Le Chat的默认引擎,并驱动两项新功能:Vibe远程编程智能体可将编码任务移至云端异步并行执行,用户可通过CLI或Le Chat启动并在完成后接收通知;Le Chat的新工作模式则是一个由该模型驱动的智能体,能处理研究、分析和跨工具操作等多步骤复杂任务。这些更新旨在将开发者从本地线性任务中解放出来,提升工作效率。

智能体开源生态模型发布编码
4月29日
16:30
公众号:腾讯混元
46
出国必备+1!腾讯混元开源手机端离线翻译模型,仅0.4G,支持33种语言
开源生态模型发布端侧
11:19
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-1T

inclusionAI 发布了 Ling-2.6-1T 模型,这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力,同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展,为研究者和开发者提供了可访问的高性能工具。

Hugging Face开源生态模型发布
09:00
公众号:蚂蚁百灵(Ling)
57
Ling-2.6-flash 正式开源

Ling-2.6-flash 今日正式开源,同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter,一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内,团队基于开发者反馈进行多轮优化,改善了中英文自然切换能力,并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。

开源/仓库开源生态模型发布
4月28日
01:27
公众号:小米 MiMo
45
小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动

小米开源 MiMo-V2.5 系列模型,同时启动 Orbit 百万亿 Token 计划,携手全球开发者与 Agent 框架共建开源繁荣生态。

智能体开源生态模型发布
4月24日
15:41
Steve Yegge:Medium(RSS)
62
Gas City 正式发布

Gas City 是 Gas Town 的彻底重写版本,作为构建自定义智能体工厂的 SDK 于本周发布 v1.0.0。它将技术栈解构为可组合的、声明式的 “pack” 构建块,用于部署任意拓扑的协作智能体团队。系统默认包含一个完整的 “Gas Town” pack,可作为原版的直接替代品。Gas City 基于 MEOW 栈和 Dolt 构建,提供智能体身份、消息传递、上下文、状态等开箱即用的服务,并暴露 Factory Worker API,完全开源并采用 MIT 许可证。

智能体GitHub开源/仓库开源生态
09:00
公众号:蚂蚁百灵(Ling)
51
Ling-2.6-1T 发布:万亿旗舰"快思考"模型,对标 GPT-5.4

蚂蚁百灵发布万亿参数旗舰 Ling-2.6-1T,采用 MLA 与 Linear Attention Hybrid 架构,以“快思考”机制实现低 Token 开销高效推理。综合智能对标 GPT-5.4 (Non-Reasoning),在 AIME26 上显著领先其他非思考模型;在 SWE-bench Verified、TAU2-Bench、BFCL-V4 等 Agent 基准上达到开源 SOTA。支持 256K 超长上下文(MRCR 高分)并表现优异的 IFBench。现已通过 OpenRouter 和官方平台提供一周免费 API 调用,将于近期正式开源。

智能体开源生态推理模型发布
08:00
Hugging Face:Blog(RSS)
精选78
DeepSeek-V4:智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4,其核心突破在于实现了长达百万token的上下文窗口,并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命,标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体DeepSeek开源生态模型发布
关联讨论 3 条Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
推荐理由:DeepSeek 把上下文窗口推到百万 token 不稀奇,关键是「agent 能实际用」这六个字。如果实测成立,RAG 的很多工程妥协可以扔掉了,做长文档和复杂 agent 的人该第一时间跑一遍。
4月23日
08:00
Hugging Face:Blog(RSS)
精选57
如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法,涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理,同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案,并提供了性能优化建议,帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由:Hugging Face 官方出的 Transformers.js 浏览器插件教程,想在 Chrome 里跑端侧推理的前端开发者可以直接抄,省掉自己踩坑的时间。
4月17日
16:48
蚂蚁 inclusionAI:GitHub 新仓库
精选56
inclusionAI发布LLaDA2.0-Uni模型

LLaDA2.0-Uni是一个统一的多模态模型,具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息,实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务,标志着多模态人工智能向更通用、统一的方向演进。

多模态开源生态模型发布

推荐理由:蚂蚁 inclusionAI 推出 LLaDA2.0-Uni,主打理解与生成统一架构,但距发布已过两周且信息极少,建议等官方技术报告出来再决定是否跟进。
4月16日
11:46
Hermes Desktop:GitHub Releases(RSS)
51
Hermes 桌面客户端 v0.1.0

NousResearch 发布了 Hermes Agent 的桌面客户端 v0.1.0,提供一键安装体验。该客户端内置了 Python 3.11 和 Node.js 22 等运行环境,实现零依赖部署。它集成了 hermes-webui 聊天界面,支持会话管理、文件上传与技能编辑。安装向导支持 Anthropic、OpenAI、Google 等 7 种 AI 服务商,并特别优化了 Ollama 本地模型的使用(无需 API Key)。客户端适用于 macOS (Apple Silicon) 和 Windows (x64) 平台,可通过系统托盘后台运行,并会自动安装 hermes CLI 命令。

智能体GitHub产品更新开源生态
10:30
公众号:腾讯混元
53
腾讯混元3D世界模型2.0发布:无缝对接游戏工作流
多模态开源生态模型发布
4月15日
11:00
公众号:小红书技术(dots.llm)
52
小红书 Relax 开源发布:面向全模态 Agentic 的异步 RL 训练引擎

小红书开源发布Relax,一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。

智能体开源/仓库开源生态
4月14日
00:00
Google Research:Blog(网页)
AI生成合成神经元加速大脑测绘

Google Research发布MoGen神经元形态生成模型,利用点云流匹配技术将随机三维点云转化为逼真神经元几何结构。在PATHFINDER重建模型训练中加入MoGen合成神经元后,错误率降低4.4%,主要减少神经元合并错误,相当于为完整小鼠大脑测绘节省157人年手动校对时间。这是生成式AI首次用于提升连接组学重建精度,盲测显示专家无法区分合成与真实神经元片段。

Google开源生态数据/训练论文/研究
4月12日
21:30
公众号:MiniMax(稀宇科技)
57
MiniMax M2.7开源,携手全球伙伴加速AI生态繁荣

MiniMax 正式开源 M2.7 模型,并联合全球合作伙伴共同加速人工智能生态的繁荣发展。

开源生态模型发布
4月11日
21:02
Nathan Lambert:Interconnects(RSS)
开放模型联盟的必要性

作者坦承对联盟(consortium)形式的个人厌恶,同时论证开放模型联盟(open model consortium)的建立具有不可避免的必要性。这一看似矛盾的立场暗示,尽管反感此类组织的官僚与低效,但在当前大模型竞争格局下,为对抗封闭生态、维护开源模型发展,行业协同仍须通过联盟形式实现。

大佬观点开源生态
4月10日
17:14
公众号:智谱(GLM)
59
GLM-5.1获LMArena代码榜开源第一、全球第三

GLM-5.1在LMArena Code Arena登顶开源第一、全球第三。它继承上一代的SOTA编码能力,并在长程任务突破:8小时构建Linux桌面、655次迭代优化向量数据库、1000轮工具调用优化机器学习模型。METR榜下,它是唯一达8小时级持续工作的开源模型(除Claude Opus 4.6外)。

开源生态模型发布编码
4月8日
10:41
公众号:智谱(GLM)
精选62
GLM-5.1开源:一个独立工作8小时的模型

智谱推出开源模型GLM-5.1,支持独立工作长达8小时。模型可直接部署使用,无需人工频繁干预,适用于长周期自动化任务场景。

智能体开源生态模型发布
关联讨论 2 条公众号:智谱(GLM)IT之家(RSS)
推荐理由:智谱把 GLM-5.1 开源,并且主打 8 小时独立工作,这个定位切中了 agent 场景下长任务执行的痛点,想做自动化流程的可以跑起来试试。
4月4日
00:57
Nathan Lambert:Interconnects(RSS)
精选
Gemma 4 与开放模型成功之道

Gemma 4 的发布揭示了开放模型成功的真正标准。文章指出,决定模型成败的关键并非基准测试分数(benchmark scores),而是其他因素。当前 AI 领域过度关注 leaderboard 排名,但高分数不等于实际应用价值与社区采用率。真正的成功取决于模型解决真实场景需求的能力、开发者友好度以及生态建设,而非单纯的技术指标领先。这一观点挑战了以 benchmark 为导向的行业评估范式。

Google大佬观点开源生态模型发布
关联讨论 1 条X:Francois Chollet (@fchollet)
推荐理由:开源模型成败不只看榜单分数,Hugging Face 大佬揭秘真实胜负手
4月3日
13:08
Steve Yegge:Medium(RSS)
47
Gas Town与Beads同步发布1.0.0正式版

Gas Town(编程智能体框架)与Beads(智能体记忆系统)今日同步发布1.0.0正式版。Gas Town目前拥有13k星标,已进入稳定维护模式,让非技术人员也能构建软件。Beads则以轻量级问题工单为基础,将记录存储在Git中并支持SQL查询,为智能体提供跨会话的历史记录与上下文。

智能体产品更新开源生态
4月1日
15:13
Hugging Face:Blog(RSS)
精选70
Falcon Perception

Technology Innovation Institute 在 Hugging Face 平台发布了一篇博客文章,介绍了其 Falcon Perception 系统。该系统是一种先进的感知技术方案,专注于提升机器对复杂环境的理解与交互能力。文章阐述了其核心架构的更新,包括多模态数据融合机制的优化,以及实时处理效率的显著提升。关键性能指标显示,其在标准基准测试中的准确率与响应速度均有突破。

Hugging Face开源生态模型发布

推荐理由:Falcon 系列新成员,开源多模态模型阵营再添一员,开发者可关注选型
3月31日
16:23
Hugging Face:Blog(RSS)
精选83
以165美元成本训练25个物种的mRNA语言模型:构建从结构预测到密码子优化的AI流程

OpenMed团队构建了一个覆盖蛋白质结构预测、序列设计和密码子优化的端到端AI流程。在密码子优化环节,CodonRoBERTa-large-v2模型以4.10的困惑度和0.40的斯皮尔曼CAI相关性显著优于其他架构。研究将训练扩展至25个物种,仅用55个GPU小时训练了4个生产级模型,并建立了独特的物种条件化系统,实现了从蛋白质概念到合成就绪DNA序列的快速转化。完整代码与实验结果已开源。

Hugging Face开源生态数据/训练论文/研究

推荐理由:低成本开源生物AI管道,可加速蛋白质工程和药物开发。
15:06
Steve Yegge:Medium(RSS)
49
氛围维护者

一位开源项目维护者分享应对AI生成PR浪潮的“氛围维护者”工作流。他维护Beads(2万星)和Gas Town(1.3万星)两个项目,每天收到约50个PR。通过自动化处理超过半数简单PR,整体合入率约88%,中位解决时间15小时。即便如此,每周仍需投入15-20小时审核。他认为高效率是开源项目生存关键,拒绝贡献可能导致项目被分叉或取代。

智能体大佬观点开源生态部署/工程
3月30日
21:02
Nathan Lambert:Interconnects(RSS)
最新开源成果第20期发布:新增组织与模型类型,涵盖 Nemotron Super、Sarvam、Cohere Transcribe 等

第20期开源成果更新引入多个新组织与全新模型类型,收录 NVIDIA Nemotron Super、Sarvam 及 Cohere Transcribe 等最新模型。此次扩展显著丰富了开源生态的模型种类与来源多样性,覆盖更多技术领域与应用场景,为开发者提供更广泛的模型选择。

开源/仓库开源生态
11:25
美团 LongCat:HuggingFace 新模型
精选
LongCat-AudioDiT-1B:高保真波形潜空间扩散式文本转语音模型

美团 LongCat 团队开源的扩散式 TTS 模型摒弃传统的 mel-spectrogram 中间表示,直接在波形潜空间操作,仅通过 Wav-VAE 与扩散骨干网络即可合成语音。该模型修复了训练-推理不匹配问题,并以自适应投影引导替代无分类器引导。最大版本 3.5B 在 Seed 基准实现 SOTA 零样本语音克隆,说话人相似度(SIM)在 Seed-ZH 达 0.818、Seed-Hard 达 0.797,超越此前最优的 Seed-TTS。研究还发现 Wav-VAE 的重建保真度与最终合成质量并非正相关。

开源生态模型发布语音
关联讨论 1 条美团 LongCat:HuggingFace 新模型
推荐理由:美团开源 1B 语音克隆模型,Seed 基准超 Seed-TTS,零样本推理可用
3月27日
08:00
Hugging Face:Blog(RSS)
43
解放你的OpenClaw:致力于通过开源与开放科学推动AI民主化

Anthropic公司发布新一代大模型Claude 3.5 Sonnet,在多项基准测试中超越前代Opus及GPT-4o等竞争对手,尤其在高级推理、知识掌握和编程能力上表现卓越。新模型处理速度提升至两倍且定价更低。同时推出的“Artifacts”功能可将生成的代码或文本在独立面板实时展示,标志着其向交互式工作空间演进。

Hugging Face其他开源生态
3月25日
21:18
美团 LongCat:HuggingFace 新模型
美团 LongCat-Next

美团开源项目 LongCat-Next 正式发布,宣称将通过开源与开放科学推进人工智能技术的普及与民主化。该项目目前仅公开使命宣言,强调降低AI技术门槛的愿景,尚未披露具体模型架构、训练数据或性能基准等技术指标,也未说明应用场景或发布时间表。

Hugging Face开源生态模型发布
20:00
公众号:月之暗面(Kimi)
47
Kimi 杨植麟「2026 中关村论坛」演讲全文(附视频)
大佬观点开源生态
09:06
公众号:MiniMax(稀宇科技)
55
MiniMax Office Skills:开源一套生产级办公文档引擎

MiniMax 开源了 Office Skills,一套生产级办公文档引擎。

开源/仓库开源生态
‹ 上一页
123456
下一页 ›