AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
4月29日周三
22:13meng shao56商汤 SenseNova-U1 架构创新:统一语言视觉表征
22:10TestingCatalog News 🗞54SenseTime开源多模态图像生成模型SenseNova-U1,基于NEO-Unify架构
21:49Xiaomi MiMo60精选小米MiMo-V2.5-Pro在最新Arena排行榜中实现多项突破
21:45向阳乔木71精选OpenAI开源Symphony:为每个任务分配AI代理的项目管理系统
21:34IT之家(RSS)62AI 编程热潮推动 GitHub 爆发增长,平台频发故障后启动底层基础设施重构
18:38Nathan Lambert36阿里通义千问发布新模型引热议
17:41The Decoder:AI News(RSS)55通过 Nemotron 3 Nano Omni,Nvidia 揭示了现代多模态模型的真实构成
17:16SenseTime56SenseNova U1原生多模态模型开源
17:11向阳乔木43提示词优化大师Skill:针对不同AI场景的Prompt工具
16:49Alibaba Cloud58阿里入选TIME最具影响力AI公司,Qwen成全球最受欢迎开源模型
16:30公众号:腾讯混元46出国必备+1!腾讯混元开源手机端离线翻译模型,仅0.4G,支持33种语言
16:08Rohan Paul59AI编程代理激增致GitHub基础设施承压,早期用户因服务中断迁出项目
15:35阿绎 AYi66蚂蚁Ling-2.6-1T模型以高效能低成本引领AI生产落地竞争
14:40Ant Ling58高效服务大语言模型需工程智慧与品味
12:38ginobefun41个人知识库GBrain数据激增,关联链接成核心
11:37歸藏(guizang.ai)46重度用户因服务不稳定而离开 GitHub,揭示 AI 时代 Git 服务新机遇
11:19蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-1T
10:46SiliconFlow63精选SiliconFlow成第三方模型日用量榜首
10:37Chubby♨️40欧洲AI公司Mistral即将发布新模型
10:35阿绎 AYi47Warp开源引爆AI原生协作新范式
09:41meng shao60Warp终端开源并推出AI协作平台
09:33IT之家(RSS)60蚂蚁集团百灵大模型开源 Ling-2.6-flash,提供 BF16、FP8、INT4 等版本
09:00公众号:蚂蚁百灵(Ling)57Ling-2.6-flash 正式开源
08:38Berryxia.AI65🚀 OpenBMB 重磅发布!MiniCPM-o 4.5 技术报告来了!
08:10宝玉62微软开源VibeVoice-ASR语音识别模型,支持长音频与说话人分离
08:00HuggingFace Daily Papers(社区热门论文)66基于RoundPipe在消费级多GPU上实现高效训练
07:41小互53智能终端工具Warp 宣布开源
07:38Berryxia.AI67Poolside AI开源Laguna XS.2模型,专为智能编码设计
07:38Berryxia.AI60NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni
05:37Chubby♨️46本地化AI浏览器引领隐私与开源新方向
05:37Rohan Paul59Sigma推出开源私有AI浏览器,本地模型驱动智能体直接操作网页
04:39TestingCatalog News 🗞55私有AI代理现可本地运行于Sigma浏览器
02:07Chubby♨️54NVIDIA发布Nemotron 3 Nano Omni,专为智能体感知层设计
01:38Ant Ling57感谢Hugging Face开源平台,Ling-2.6-flash以超高token效率登场
01:30OpenRouter33欢迎KenTheRogers加入团队并发布技术指南
01:09Hacker News 热门(buzzing.cc 中文翻译)56Anthropic 加入 Blender 开发基金,成为企业赞助商
01:08AK44SenseNova U1模型于Hugging Face发布
00:53Ant Ling59vLLM团队为Ling-2.6-flash模型提供首发支持,彰显开源协同高效
00:10凡人小北20雷军营销妙招,为小米产品带货
4月28日周二
20:36Chubby♨️59微软开源4B参数图像转3D模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月29日
22:13
meng shao@shao__meng
56
商汤 SenseNova-U1 架构创新:统一语言视觉表征

商汤开源的 SenseNova-U1 模型在架构上实现关键突破。传统多模态模型多采用“语言模型 + 视觉编码器 + VAE”的拼接方式,视觉信息需先翻译再输入 LLM。U1 基于 NEO-Unify 架构,直接移除翻译层,使语言和视觉在同一表征空间中运行。因此,模型能在单次推理中同步完成图像理解、推理和生成等任务,而非分步处理,提升了多模态交互的效率和连贯性。

多模态大佬观点开源生态
22:10
TestingCatalog News 🗞@testingcatalog
54
SenseTime开源了基于NEO-Unify架构的多模态图像生成模型SenseNova-U1。该架构完全摒弃了传统视觉编码器和VAE,原生地将理解、推理和生成统一为一个系统。该系列模型(8B和A3B参数)在开源模型中效率领先,以紧凑尺寸提供商业级性能与出色成本效益。其特色功能包括原生生成图文交织内容,适用于制作指南等实用场景;并擅长高密度信息渲染,能生成知识插图、海报、PPT和漫画等丰富结构的布局。模型已在Hugging Face和GitHub等平台开源。

SenseTime: SenseNova U1 Lite Series is now open source! Built on the NEO-unify architecture, it natively unifies multimodal underst...

图像生成多模态开源生态模型发布
21:49
Xiaomi MiMo@XiaomiMiMo
精选60
小米MiMo-V2.5-Pro在最新Arena排行榜中实现多项突破

小米MiMo-V2.5-Pro模型在最新Arena排行榜中表现卓越。在Text Arena(Expert)榜单中,它位列全球第六,同时是开源模型与中文模型的双料第一,其所属实验室全球排名第三。该模型在Text Arena(Overall)总榜中排名开源全球第二,在Code Arena(WebDev)前端开发榜单中位列开源全球第三。此外,它在Text Arena的四个关键子类别(Hard Prompts、英文Hard Prompts、指令遵循与长查询)中均获得开源全球第一。这些成绩均基于真实用户偏好与社区盲投评估,体现了模型在复杂任务上的强大综合能力。

开源生态推理模型发布

推荐理由:小米MiMo-V2.5-Pro冲到Arena开源第一,虽然排名更新晚了几天,但这是国产模型在硬核评测里最好的成绩,做选型的现在该认真看看小米。
21:45
向阳乔木@vista8
精选71
OpenAI开源Symphony:为每个任务分配AI代理的项目管理系统

OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具(如Linear)的任务看板作为控制中枢,为每个任务自动分配并运行一个独立的AI代理(基于Codex),直至完成。人类仅在“人工审查”节点介入,实现了从微观管理到任务级分配的转变。系统允许大粒度任务,代理能自主拆解依赖、创建新任务,并保证持续运行。初步数据显示,该方法能显著提升开发效率。

智能体GitHubOpenAI开源生态

推荐理由:Symphony 把 AI 代理管理从盯着终端变成了管理看板,对每个任务自动分配代理,这个思路会让所有用 AI 编程的团队重新思考工作流程,做工程落地的建议都看看。
21:34
IT之家(RSS)
62
AI 编程热潮推动 GitHub 爆发增长,平台频发故障后启动底层基础设施重构

AI 编程热潮推动 GitHub 用户规模爆发式增长,平台频发故障后启动底层基础设施重构。2025年10月,GitHub 计划扩容至原有承载能力的10倍,但预计未来业务规模将达当前30倍。增长压力导致稳定性问题,如4月23日故障影响658个代码仓库和2092个合并请求。GitHub 正优先保障服务可用性,迁移算力至微软 Azure,物理隔离 Git 等核心服务,并推进多云架构以提升抗故障能力。

GitHub开源生态行业动态部署/工程
18:38
Nathan Lambert@natolambert
36
Let's goooooooooo 我们准备好水豚模式了,感谢 @Alibaba_Qwen,继续推出新模型吧
大佬观点开源生态
17:41
The Decoder:AI News(RSS)
55
通过 Nemotron 3 Nano Omni,Nvidia 揭示了现代多模态模型的真实构成

Nvidia 发布了开源多模态模型 Nemotron 3 Nano Omni,该模型能够处理文本、图像、视频和音频。其引人关注之处不仅在于性能表现,更在于其训练数据的构成。模型的部分训练数据来源于 Qwen、GPT-OSS、Kimi 和 DeepSeek OCR 等多个知名项目,这揭示了构建现代多模态模型所需数据集的多样性与复杂性。

多模态开源生态模型发布
17:16
SenseTime@SenseTime_AI
56
感谢 @liuziwei7 与我们共同创造 #多模态智能 的未来!

Ziwei Liu: 🔥Native Unified Multimodal Model Open Sourced🔥 🚀SenseNova U1🚀 is the first native multimodal model that unifies mult...

Hugging Face多模态开源生态模型发布
17:11
向阳乔木@vista8
43
提示词优化大师Skill:针对不同AI场景的Prompt工具

一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。

开源/仓库开源生态编码
16:49
Alibaba Cloud@alibaba_cloud
58
阿里入选TIME最具影响力AI公司,Qwen成全球最受欢迎开源模型

阿里巴巴被《TIME》评为2026年十大最具影响力AI公司之一,入选其首届“行业领袖”榜单。公司凭借构建根植于开源领导力的全栈AI生态系统获得认可。阿里巴巴已成长为全球开源AI的重要力量,其Qwen模型系列不仅在中国驱动创新,也支持了Airbnb、Pinterest等国际公司。《TIME》认可Qwen为全球最受欢迎的开源模型家族,这体现了阿里巴巴“开放加速共同进步”的理念。

开源生态行业动态
16:30
公众号:腾讯混元
46
出国必备+1!腾讯混元开源手机端离线翻译模型,仅0.4G,支持33种语言
开源生态模型发布端侧
16:08
Rohan Paul@rohanpaul_ai
59
AI编程代理激增致GitHub基础设施承压,早期用户因服务中断迁出项目

AI编程代理的普及正使GitHub基础设施面临极限压力。这些工具不仅生成更多代码,更导致提交、拉取请求、搜索和CI任务等仓库事件数量激增,彻底改变了平台原本为人类节奏设计的工作负载形态。开发者现可在短时间内推送大量AI辅助的迭代,每次迭代都会触发CI、索引、存储和审查系统,使瓶颈从编写代码转向消化代码。这种过载已影响日常维护,导致评审阻塞、合并卡顿和自动化失败。作为例证,GitHub早期用户Mitchell Hashimoto因其项目Ghostty反复遭遇服务中断,最终决定将项目迁出他使用了18年的GitHub,这标志着一个时代的转变。

Mitchell Hashimoto: Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...

智能体GitHub开源生态现象/趋势
15:35
阿绎 AYi@AYi_AInotes
66
蚂蚁Ling-2.6-1T模型以高效能低成本引领AI生产落地竞争

蚂蚁集团推出的Ling-2.6-1T模型在免费测试期表现突出,处理复杂任务速度可比竞品快6倍,并具备主动思辨能力。其核心优势在于极高的token效率,能将成本降至可比模型的四分之一,同时综合智能接近GPT-5.4非推理水平,实现了高智能与低生产成本的结合。该模型在SWE-bench、AIME26等生产相关评测中领先,擅长代码、Agent编排等实际应用。蚂蚁依托支付宝场景与海量数据,通过开放API策略推动行业竞争重点从刷榜转向生产落地。

阿绎 AYi: 说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...

大佬观点开源生态推理评测/基准
14:40
Ant Ling@AntLingAGI
58
服务好LLM是一项具有挑战性的任务,它需要工程智慧和良好的品味。感谢@Modular团队高水平的工程师们让这次合作成为现实。生态系统必胜!🤠👏

Modular: Ling-2.6-flash from @AntLingAGI is now open source, with day zero support on Modular Cloud! Fast MoE for agent workflows...

智能体开源生态模型发布
12:38
ginobefun@hongming731
41
个人知识管理工具GBrain的数据量在短时间内快速增长,页面数从14,000激增至74,114。其核心价值在于117,855个关联链接,将人物、会议、公司、邮件等元素相互连接,使之成为一个基于联想运作的Memex系统,而非简单的文件柜。这种关联网络使用户能在短时间内追溯复杂的信息脉络,体现了万尼瓦尔·布什提出的"人类思维通过联想运作"的理念。该工具正被用于书籍研究,并将开源共享。

Garry Tan: How big is my personal Karpathy knowledge wiki stored in GBrain now? 74,114 pages. 117,855 edges. 281,700 timeline entri...

大佬观点开源生态
11:37
歸藏(guizang.ai)@op7418
46
重度用户因服务不稳定而离开 GitHub,揭示 AI 时代 Git 服务新机遇

Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务,仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户,他指出 GitHub 频繁的故障已严重影响开发,特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为,在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施,但微软难以维持其可靠性。这揭示了一个市场机会:若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务,将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。

Mitchell Hashimoto: Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...

GitHub开源生态现象/趋势部署/工程
11:19
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-1T

inclusionAI 发布了 Ling-2.6-1T 模型,这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力,同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展,为研究者和开发者提供了可访问的高性能工具。

Hugging Face开源生态模型发布
10:46
SiliconFlow@SiliconFlowAI
精选63
👀 🚀 🙌 【引用 @SiliconFlowAI】:开发者们正在用他们的 token 投票 🔥 SiliconFlow 现已成为日 token 使用量排名第一的第三方模型提供商 在 @OpenRouter 上, • 每日约 280B token • 每月约 1.9T token • 33 个前沿模型:DeepSeek V4 系列、GLM 5.1、Kimi K2.6 等 衷心感谢每一位与我们共同构建的开发者 更多精彩即将到来🚀

SiliconFlow: Builders are voting with their tokens 🔥 SiliconFlow is now the #1 third-party model provider by daily token usage On @O...

开源生态行业动态部署/工程

推荐理由:如果你在选模型API,这个数据比任何benchmark都有说服力。每天280B token的真金白银投票,国产模型厂商里硅基流动已经跑出来了。
10:37
Chubby♨️@kimmonismus
40
Mistral Medium 即将到来。唯一相关的欧洲AI公司将发布另一个模型。
开源生态模型发布
10:35
阿绎 AYi@AYi_AInotes
47
Warp开源引爆AI原生协作新范式

Warp宣布开源后,其GitHub仓库在一天内获得超过3万星标,热度极高。此举被视为开创了“AI原生的开源协作范式”,其核心在于引入AI代理(如Oz代理)自动执行编码、测试、代码审查和技术文档生成等任务。这预示着未来开发者的角色将转向提出创意、把控质量和决策方向。此举与Cal.com因AI风险而闭源的做法形成鲜明对比,Warp通过AI技术将开源协作的优势极大化。用户现可在线实时观察数百个AI代理协同处理代码、修复漏洞的进程,这可能是未来十年软件开发模式的一次重要预演。

Warp: Warp is now open-source.

智能体开源/仓库开源生态
09:41
meng shao@shao__meng
60
Warp终端开源并推出AI协作平台

Warp 开源啦 ?! @warpdotdev 👍🏻 Warp cline 正式宣布开源,AGPL License: https://github.com/warpdotdev/warp 和开源发布同步的是一套以 Agent 为中心的协作方式:用云端编排平台 Oz 让 Agent 承担大部分编码、规划、测试等重活,人类侧重方向、审阅与验证。 OpenAI 是新开源仓库的创始赞助方,Oz 工作流里用的是 GPT-5.5 模型。 [引用 @zachlloydtweets]:http://x.com/i/article/2049151514380267520

Zach Lloyd: http://x.com/i/article/2049151514380267520

智能体OpenAI产品更新开源生态
09:33
IT之家(RSS)
60
蚂蚁集团百灵大模型开源 Ling-2.6-flash,提供 BF16、FP8、INT4 等版本

蚂蚁集团百灵大模型宣布开源Ling-2.6-flash,提供BF16、FP8、INT4等多个版本供开发者灵活选用。该模型总参数量104B,激活参数7.4B,是一款Instruct模型。官方基于开发者反馈优化了中英文切换及主流编程框架适配效果。其核心优势包括:采用混合线性架构,在4卡H20上推理速度最快达340 tokens/s;通过Token效率优化,在评测中消耗的tokens仅为同类模型的约1/10;针对Agent场景增强了工具调用与任务执行能力,在多项评测中达到先进水平。模型已在Hugging Face和ModelScope平台开源。

智能体开源生态模型发布
09:00
公众号:蚂蚁百灵(Ling)
57
Ling-2.6-flash 正式开源

Ling-2.6-flash 今日正式开源,同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter,一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内,团队基于开发者反馈进行多轮优化,改善了中英文自然切换能力,并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。

开源/仓库开源生态模型发布
08:38
Berryxia.AI@berryxia
65
OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型,实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流,无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash,并专为边缘AI设计,支持完全离线运行,提供Windows/macOS一键安装(仅需12G显存),保障100%数据隐私,同时开源权重并提供免费社区API。

OpenBMB: 🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...

GitHub多模态开源生态模型发布
08:10
宝玉@dotey
62
微软开源VibeVoice-ASR语音识别模型,支持长音频与说话人分离

微软开源的VibeVoice-ASR是一个9B参数语音转文字模型,采用MIT协议。其核心优势在于单次可处理长达60分钟的连续音频,并直接输出带说话人、时间戳的结构化文本,原生支持50多种语言及中英混说。实测在128GB内存的MacBook Pro上,其4-bit量化版转录一小时音频约需9分钟,但预填充阶段内存峰值达61.5GB,要求设备内存至少64GB。模型存在单次60分钟时长限制,且对录音环境变化敏感,但为播客、会议等长音频转录提供了简化流程。

Simon Willison: Microsoft's MIT licensed VibeVoice speech-to-text model (think Whisper with speaker diarization) is really good - my not...

Microsoft开源生态教程/实践语音
08:00
HuggingFace Daily Papers(社区热门论文)
66
基于RoundPipe在消费级多GPU上实现高效训练

针对消费级GPU服务器内存有限和PCIe互联慢的问题,研究团队提出了RoundPipe流水线调度方案。该方法通过将GPU视为无状态工作节点,以轮询方式动态分配计算阶段,打破了权重绑定限制,实现了接近零气泡的流水线。系统集成了优先级感知传输调度、细粒度事件同步协议与自动分层划分算法。在8块RTX 4090的服务器上测试表明,其对1.7B至32B模型的微调速度比现有最优基线快1.48至2.16倍,并能单机完成Qwen3-235B模型(31K序列长度)的LoRA微调。该工具已作为开源Python库发布。

开源生态论文/研究
07:41
小互@xiaohu
53
智能终端工具Warp 宣布开源

智能终端工具Warp宣布开源,并引入由云端AI(Oz)驱动的协作开发模式,该AI可负责代码编写、测试等任务,开发者主要进行审核。OpenAI成为首位赞助商,其GPT模型驱动开源仓库的智能体工作流。产品改进包括支持Kimi、MiniMax、通义千问等多款开源AI模型,具备自动选择最优模型功能;提供高度可定制的界面,支持从纯终端到完整AI开发环境;新增配置文件,便于跨设备迁移和程序化控制。

智能体OpenAI产品更新开源生态
07:38
Berryxia.AI@berryxia
67
由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构,专为Agentic Coding和长时序任务设计,可在单张GPU上运行,并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness,标志着其在智能编码代理赛道成为新的竞争者。

poolside: Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...

智能体开源生态模型发布编码
07:38
Berryxia.AI@berryxia
60
NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni

NVIDIA 重磅发布!🚀 Nemotron 3 Nano Omni 多模态开源模型来了! 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型(语言+视觉+语音+视频+音频一体化) 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源(权重 + 数据 + 配方),领跑多项榜单 可通过 NVIDIA NIM API 免费试用!完美驱动多代理工作流。

NVIDIA AI: Meet Nemotron 3 Nano Omni 👋 Our latest addition to the Nemotron family is the highest efficiency, open multimodal model...

智能体多模态开源生态模型发布
05:37
Chubby♨️@kimmonismus
46
作者推崇将AI智能体完全本地化运行的浏览器模式,认为这是浏览器AI应有的发展方向。这种模式的核心在于隐私保护与开源,所有数据处理均在用户设备本地完成,无需依赖云端,确保数据不外泄。当前,已有如Sigma Browser等产品实现了这一理念,支持在浏览器内直接运行Qwen、Gemma、Nemotron等开源模型。作者对此表示高度赞赏,并表达了强烈的合作意愿。

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体产品更新开源生态端侧
05:37
Rohan Paul@rohanpaul_ai
59
Sigma推出开源私有AI浏览器,本地模型驱动智能体直接操作网页

Sigma发布了一款开源私有AI浏览器,其核心是将本地大语言模型(如Qwen、Gemma、Nemotron)与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体,能直接读取页面内容、理解用户意图,并执行点击、输入、总结等自动化操作,从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险,所有计算均在用户本地设备完成,确保了隐私安全和响应速度。

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体产品更新开源生态端侧
04:39
TestingCatalog News 🗞@testingcatalog
55
现在你可以在Sigma浏览器内直接运行由本地模型驱动的私有OpenClaw智能体。 > 可选Gemma 4、Qwen、3.5或Nemotron 3模型。所有浏览器数据均保留在本地设备。 > 私有AI智能体可管理标签页、跳转页面,功能丰富!

Sigma Browser: Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...

智能体产品更新开源生态端侧
02:07
Chubby♨️@kimmonismus
54
NVIDIA发布Nemotron 3 Nano Omni,专为智能体感知层设计

NVIDIA推出Nemotron 3 Nano Omni模型,其定位并非通用聊天机器人,而是作为智能体系统中的轻量级感知模块。该模型采用30B-3B混合专家架构,在处理视觉、音频和文本多模态输入时,吞吐量可比同类开源全模态模型提升高达9倍。它旨在充当多智能体栈中的“眼睛和耳朵”,负责感知屏幕、文档和音频等信息,并将结构化上下文传递给如Nemotron Super(执行)和Ultra(规划)等推理层,从而优化大规模、高频率调用的智能体工作流。模型完全开源,现已登陆Hugging Face。

智能体开源生态模型发布
01:38
Ant Ling@AntLingAGI
57
推文感谢Hugging Face为开源模型的持续发展提供了重要平台。文中强调,token效率是构建实用、可持续协作系统的关键。AntLingAGI最新发布的Ling-2.6-flash模型已加入这场效率竞争,该模型采用MIT许可,具备104B/7.4B激活参数,并创新性地结合了1:7 MLA与Lightning Linear混合注意力机制。其性能表现突出:推理速度高达340 tok/s,并且仅需约1500万tokens即可完成完整的Artificial Analysis评测套件。这一效率显著高于通常需要5000万至1亿tokens的前沿模型,展现出其作为高效协作伙伴的潜力。

Adina Yakup: Token efficiency has become a major battleground, Ling-2.6-flash released by @AntLingAGI just enters the race 🔥 ✨ 104B/...

开源生态推理模型发布
01:30
OpenRouter@OpenRouter
33
欢迎 @KenTheRogers 加入团队!期待看到他带来一些技术指南、cookbooks 等。他是我们第一篇 X 文章的作者👇

Kenny Rogers: Today is my first day as a DevRel Lead at @OpenRouter 🙌 I've been a fan and user of OpenRouter for a while now, ridicul...

开源生态行业动态
01:09
Hacker News 热门(buzzing.cc 中文翻译)
56
Anthropic 加入 Blender 开发基金,成为企业赞助商

Anthropic宣布以企业赞助商身份加入Blender开发基金。该基金旨在支持开源3D创作套件Blender的持续开发。作为企业级赞助商,Anthropic将提供资金支持,助力Blender在3D建模、动画和渲染等核心功能的研发。此举标志着AI公司与开源图形软件社区的重要合作,将进一步推动创意工具的发展。相关新闻在Hacker News上获得了111个社区积分。

Anthropic开源生态行业动态
01:08
AK@_akhaliq
44
SenseNova U1 已在 Hugging Face 发布 https://huggingface.co/collections/sensenova/sensenova-u1
Hugging Face开源生态模型发布
00:53
Ant Ling@AntLingAGI
59
vLLM项目团队宣布对Ling-2.6-flash模型提供Day-0首发支持,体现了开源生态系统构建者之间的高效协同。Ling-2.6-flash是一个专为需要快速响应和强大执行力的现实世界智能体设计的即时指令MoE模型。其核心特点包括:1040亿总参数与74亿激活参数的高度稀疏混合专家架构,结合了1:7 MLA与Lightning Linear注意力机制,支持262K上下文长度,并具备原生工具调用能力,可无缝接入Claude Code、Kilo Code、Qwen Code、Hermes、OpenClaw等主流框架。

vLLM: 🎉 Day-0 vLLM support for Ling-2.6-flash from @AntLingAGI! Ling-2.6-flash is an instant (instruct) MoE model built for r...

智能体开源生态模型发布
00:10
凡人小北@frxiaobei
20
雷老板是懂营销的, 本着拿人 token,替人带货的原则, 替 Xiaomi MiMo 喊个话。
开源生态行业动态
4月28日
20:36
Chubby♨️@kimmonismus
59
Microsoft 推出 "TRELLIS.2":一个开源的、40亿参数的图像转3D模型,可生成高达15363的PBR纹理资产。 基于原生3D VAES,具有16倍空间压缩能力,提供高效、可扩展、高保真的资产生成。 说实话,相当酷!
Microsoft多模态开源生态模型发布
‹ 上一页
1…2728293031…36
下一页 ›