AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源/仓库」清除
3月31日周二
08:00Hugging Face:Blog(RSS)58TRL v1.0:与领域同步发展的后训练库
3月30日周一
21:02Nathan Lambert:Interconnects(RSS)最新开源成果第20期发布:新增组织与模型类型,涵盖 Nemotron Super、Sarvam、Cohere Transcribe 等
3月26日周四
11:55Hacker News:AI 热帖Show HN: 基于 TypeScript 的稳健 LLM 网页数据提取工具
10:40karminski-牙医太棒了 👍
3月25日周三
09:06公众号:MiniMax(稀宇科技)55MiniMax Office Skills:开源一套生产级办公文档引擎
00:00LMSYS:Blog(Chatbot Arena 团队)Elastic EP:实现DeepSeek MoE部署的部分故障容忍
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang亮相NVIDIA GTC 2026:三天五场活动展示开源AI基础设施实力
3月24日周二
12:14DeedySiri 修了 13 年还是烂,我自己做了一个:完全本地运行,无需联网
10:01Hugging Face:Blog(RSS)78精选全新语音智能体评估框架EVA发布
3月23日周一
00:00Berkeley RDI:Blog(AI 安全与评测)OpenSage:自编程智能体生成引擎
3月22日周日
10:56公众号:MiniMax(稀宇科技)48Skills精选开源,MaxClaw支持多龙虾部署!
3月19日周四
01:18Hao AI Lab哇!Vera Rubin 的演示看起来很棒,但实时编辑实际上已经可以在单张 B200 上实现了!
3月17日周二
00:00LMSYS:Blog(Chatbot Arena 团队)Miles RL框架正式支持ROCm:基于AMD Instinct GPU的大规模后训练
3月16日周一
23:00公众号:月之暗面(Kimi)60精选推荐:10万人亲测好用的原版OpenClaw安装器
3月14日周六
03:19Hao AI Lab(1/N) 内容创作者被困在昂贵且缓慢的视频生成 API 中太久了。我们再也受不了了。😅😭
01:58Hacker News:AI 热帖精选Show HN: Context Gateway - 自动压缩 AI Agent 上下文再送入 LLM
3月9日周一
08:00Hugging Face:Blog(RSS)71精选LeRobot v0.5.0: 扩展每一个维度
3月7日周六
02:00Google Blog:AI(RSS)开源 AI 模型 SpeciesNet 如何助力野生动物保护
00:14蚂蚁 inclusionAI:HuggingFace 新模型46inclusionAI/AReaL-tau2-merge-sft-235B 发布
3月5日周四
13:56蚂蚁 inclusionAI:HuggingFace 新模型45inclusionAI/ZwZ-4B-GGUF
13:56蚂蚁 inclusionAI:HuggingFace 新模型37inclusionAI发布ZwZ-2B-GGUF模型
10:55蚂蚁 inclusionAI:HuggingFace 新模型31inclusionAI/AReaL-tau2-telecom-user-sft-30B
10:08蚂蚁 inclusionAI:HuggingFace 新模型32inclusionAI/AReaL-tau2-telecom-sft-30B
00:53蚂蚁 inclusionAI:HuggingFace 新模型35inclusionAI/AReaL-tau2-retail-sft-30B 发布
00:30蚂蚁 inclusionAI:HuggingFace 新模型35inclusionAI/AReaL-tau2-airline-sft-30B 发布
3月4日周三
16:25蚂蚁 inclusionAI:HuggingFace 新模型37inclusionAI/ZwZ-2B
09:00公众号:阶跃星辰(Step)49阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源
3月2日周一
17:58公众号:小红书技术(dots.llm)55FireRed-OCR 开源发布:端到端方案新SOTA!小红书提出低成本文档识别训练范式
3月1日周日
17:56蚂蚁 inclusionAI:HuggingFace 新模型46inclusionAI/AReaL-SEA-235B-A22B
2月27日周五
21:02公众号:月之暗面(Kimi)32Kimi API:用90%缓存命中率,把价格打到25%
04:15Saining Xie精选世界建模绝非像素渲染:Project Solaris发布多智能体视频世界模型
2月20日周五
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang 在 NVIDIA GB300 NVL72 上实现 25 倍推理性能突破
2月19日周四
00:00LMSYS:Blog(Chatbot Arena 团队)GB300 NVL72部署DeepSeek R1优化方案:长上下文推理性能突破
2月16日周一
09:52公众号:蚂蚁百灵(Ling)52Ling-2.5-1T 开源发布:深度思考模型拉升智能上限,即时模型平衡效率与覆盖
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang-Diffusion:面向生产级视频生成的高级优化
2月12日周四
18:22公众号:小红书技术(dots.llm)50小红书发布 FireRed-Image-Edit:图像编辑新 SOTA
16:52蚂蚁 inclusionAI:HuggingFace 新模型39inclusionAI/ZwZ-8B
08:00Hugging Face:Blog(RSS)83精选实践中的OpenEnv:在真实环境中评估工具使用智能体
2月11日周三
18:55蚂蚁 inclusionAI:GitHub 新仓库61精选inclusionAI 发布高性能量化推理 GEMM 内核库 Humming
18:52蚂蚁 inclusionAI:GitHub 新仓库65精选inclusionAI发布新一代即时大模型Ling-2.5-1T
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
3月31日
08:00
Hugging Face:Blog(RSS)
58
TRL v1.0:与领域同步发展的后训练库

Hugging Face 正式发布 TRL v1.0,这是一个专为大语言模型后训练设计的开源库。该版本整合了 SFT、RLHF 等多种高效微调技术,提供从监督微调到人类反馈强化学习的完整工具链。新库支持与 Transformers、PEFT 等主流框架无缝集成,显著简化了模型对齐流程。此次更新旨在降低大语言模型微调门槛,推动AI技术民主化,使开发者能够更便捷地提升模型在对话、安全等方面的性能表现。

Hugging Face开源/仓库数据/训练
3月30日
21:02
Nathan Lambert:Interconnects(RSS)
最新开源成果第20期发布:新增组织与模型类型,涵盖 Nemotron Super、Sarvam、Cohere Transcribe 等

第20期开源成果更新引入多个新组织与全新模型类型,收录 NVIDIA Nemotron Super、Sarvam 及 Cohere Transcribe 等最新模型。此次扩展显著丰富了开源生态的模型种类与来源多样性,覆盖更多技术领域与应用场景,为开发者提供更广泛的模型选择。

开源/仓库开源生态
3月26日
11:55
Hacker News:AI 热帖
Show HN: 基于 TypeScript 的稳健 LLM 网页数据提取工具

Lightfeed Extractor 发布基于 TypeScript 的 LLM 网页数据提取库,支持通过自然语言提示和 Zod schema 从 HTML、Markdown 或纯文本中提取结构化数据。核心功能包括 HTML 转 Markdown 预处理、JSON 模式输出、失败 JSON 自动修复及 token 追踪。可与 Playwright 集成加载动态页面,或配合 browser-agent 实现自然语言导航后提取,适用于电商竞品监控等生产级场景。

智能体GitHub开源/仓库数据/训练
10:40
karminski-牙医@karminski3
太棒了 👍

yan5xu: 😅嗯,bb-browser,badboy browser,坏孩子浏览器来了,真的很丧良心,但真的很好用。 现在你可以用 bb-browser site 的方式直接拉到任何网站的信息,目前支持 Reddit、Twitter、GitHub、H...

智能体MCP/工具开源/仓库
3月25日
09:06
公众号:MiniMax(稀宇科技)
55
MiniMax Office Skills:开源一套生产级办公文档引擎

MiniMax 开源了 Office Skills,一套生产级办公文档引擎。

开源/仓库开源生态
00:00
LMSYS:Blog(Chatbot Arena 团队)
Elastic EP:实现DeepSeek MoE部署的部分故障容忍

Mooncake团队与Volcano Engine在SGLang框架中推出Elastic EP功能,解决大规模DeepSeek MoE模型"宽"专家并行部署的可靠性瓶颈。该技术通过解耦专家与GPU的刚性绑定并维护冗余副本,可在32 GPU集群中容忍最多16个rank故障,将服务恢复时间从2-3分钟缩短至10秒以内,降幅达90%。基准测试显示,该方案在实现极端韧性的同时,吞吐量、TTFT和TPOT等关键指标与标准DeepEP持平,实现零静态性能损耗。

DeepSeek开源/仓库部署/工程
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang亮相NVIDIA GTC 2026:三天五场活动展示开源AI基础设施实力

SGLang亮相Jensen Huang主题演讲AI生态图谱,三天内密集举办五场活动。团队与RadixArk合办200人技术聚会,在LinkedIn总部举办搜索与推荐LLM系统研讨,并参与700人规模的Novita行业论坛。官方培训实验室发布Miles RL框架,解决生产环境训练-推理不匹配难题;LinkedIn工程师分享预填充优化方案,在H100上实现2–3倍吞吐量提升并回馈上游。

开源/仓库数据/训练部署/工程
3月24日
12:14
Deedy@deedydas
吐槽 Siri 长期体验糟糕,作者花一个周末自研纯本地语音助手,无需联网即可控制 Mac、设置提醒、获取实时数据和回答问题,认为这是软件的未来方向。
智能体开源/仓库端侧
10:01
Hugging Face:Blog(RSS)
精选78
全新语音智能体评估框架EVA发布

ServiceNow AI团队在Hugging Face上发布了语音智能体评估框架EVA。该框架通过标准化测试集与多模态指标,系统评估语音助手在对话理解、任务完成及交互自然度等方面的性能,旨在量化衡量智能体在复杂真实场景下的表现,助力研究人员客观比较不同模型,推动技术优化。

智能体Hugging Face开源/仓库语音

推荐理由:提供语音代理评估标准,帮助开发者优化模型性能和测试效率。
3月23日
00:00
Berkeley RDI:Blog(AI 安全与评测)
OpenSage:自编程智能体生成引擎

OpenSage是新一代Agent开发工具包,推动智能体开发从人工设计转向AI自主编程范式。该系统支持LLM自动构建智能体拓扑、动态编写管理工具(具备沙箱隔离与异步执行),以及维护分层图结构记忆系统。与现有方案需人工设计不同,OpenSage实现了拓扑、工具和记忆的全面AI自动化生成,并内置软件工程与安全工具套件。

智能体DeepMind开源/仓库编码
3月22日
10:56
公众号:MiniMax(稀宇科技)
48
Skills精选开源,MaxClaw支持多龙虾部署!

本周MiniMax Skills社区上线,精选上百种覆盖开发、学习、办公及内容创作的Skill,包括基于M2.7模型创建的PPT制作、PDF编辑等Skill已开源,用户可在MaxClaw或MiniMax Agent中一键添加。MaxClaw新增支持同时部署多个Claw,可自定义命名与设定,支持工作流拆分和多角色协作。通过MiniMax Agent桌面端部署本地OpenClaw时,预置多款安全诊断Skill以降低高危操作风险,并能自主诊断修复。MaxClaw沙箱升级,新环境支持root权限,用户可自由安装依赖库与浏览器,OpenClaw框架也可自行升级。

MCP/工具产品更新开源/仓库
3月19日
01:18
Hao AI Lab@haoailab
哇!Vera Rubin 的演示看起来很棒,但实时编辑实际上已经可以在单张 B200 上实现了!

Runway: A breakthrough in real-time video generation. As a research preview developed with @NVIDIA and shared at @NVIDIAGTC this...

开源/仓库视频部署/工程
3月17日
00:00
LMSYS:Blog(Chatbot Arena 团队)
Miles RL框架正式支持ROCm:基于AMD Instinct GPU的大规模后训练

开源RL框架Miles正式支持ROCm,可在AMD Instinct MI300/350 GPU上原生运行大规模语言模型后训练。该框架采用解耦架构分离rollout生成与模型优化,针对RL工作负载中占比70-90%的推理场景优化。在单节点8卡MI300X上训练Qwen3-30B-A3B的实测显示,rollout吞吐达1.1k-1.3k tok/GPU/s,AIME准确率从66.5%提升至72.9%。现提供预构建容器,支持GRPO、Megatron-LM和FSDP后端。

开源/仓库数据/训练部署/工程
3月16日
23:00
公众号:月之暗面(Kimi)
精选60
推荐:10万人亲测好用的原版OpenClaw安装器

Kimi支持的个人开发者开源项目OneClaw下载量突破10万,提供一键安装包,1分钟即可在本地部署原版OpenClaw,无需命令行或环境配置。功能包括纯净卸载、自由切换模型、远程控制,支持连接飞书、企微、钉钉、QQ、Kimi Claw;内置2万+技能的技能商店,可无损迁移记忆和Skills。Kimi提供包月方案和API按需购买。使用地址:oneclaw.cn。

MCP/工具开源/仓库编码

推荐理由:如果你曾被 OpenClaw 的部署门槛劝退,OneClaw 可以让你两分钟跑起来,适合在备用机尝尝鲜,但别在生产环境乱搞。
3月14日
03:19
Hao AI Lab@haoailab
(1/N) 内容创作者被困在昂贵且缓慢的视频生成 API 中太久了。我们再也受不了了。😅😭
开源/仓库视频部署/工程
01:58
Hacker News:AI 热帖
精选
Show HN: Context Gateway - 自动压缩 AI Agent 上下文再送入 LLM

YC 孵化的 Compresr 发布 Context Gateway,在 AI Agent 与 LLM 间自动压缩过长对话历史。后台预计算实现即时压缩,支持 Claude Code、Cursor 等,默认 75% 上下文阈值触发。curl 一键安装,TUI 向导配置。

智能体开源/仓库部署/工程

推荐理由:YC背书的Agent上下文压缩工具,自动优化长对话,支持Claude Code等主流Agent
3月9日
08:00
Hugging Face:Blog(RSS)
精选71
LeRobot v0.5.0: 扩展每一个维度

Hugging Face 发布了 LeRobot v0.5.0 版本。该版本在数据集、模型、任务和社区四个维度上进行了全面扩展。具体包括:引入了新的现实世界和模拟数据集,推出了支持多任务学习的模型,并扩展了任务范围至移动操作和双臂协调。社区方面,提供了更易用的库、演示应用和教学资源。此次更新的核心目标是降低机器人技术的应用门槛,推动其民主化发展。

Hugging Face具身智能开源/仓库

推荐理由:开源机器人AI框架大版本更新,降低具身智能研发门槛,值得关注落地进展
3月7日
02:00
Google Blog:AI(RSS)
开源 AI 模型 SpeciesNet 如何助力野生动物保护

SpeciesNet 是开源 AI 模型,旨在帮助全球各地的人们保护和保存野生动物。该模型为野生动物保护提供技术支持,助力生物多样性保护事业。

Google开源/仓库开源生态
00:14
蚂蚁 inclusionAI:HuggingFace 新模型
46
inclusionAI/AReaL-tau2-merge-sft-235B 发布

inclusionAI 团队发布了 AReaL-tau2-merge-sft-235B 模型。该模型参数量达2350亿,采用合并与监督微调技术构建。其目标是推动人工智能技术发展并通过开源开放模式实现AI民主化,致力于让先进AI技术更广泛可及。

开源/仓库推理模型发布
3月5日
13:56
蚂蚁 inclusionAI:HuggingFace 新模型
45
inclusionAI/ZwZ-4B-GGUF

inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念,旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式,这是一种高效且通用的模型文件格式,便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛,促进更广泛的研究与应用开发。

开源/仓库模型发布端侧
13:56
蚂蚁 inclusionAI:HuggingFace 新模型
37
inclusionAI发布ZwZ-2B-GGUF模型

inclusionAI推出开源模型ZwZ-2B-GGUF,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛,促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径,强调技术普及与包容性发展。

开源/仓库模型发布端侧
10:55
蚂蚁 inclusionAI:HuggingFace 新模型
31
inclusionAI/AReaL-tau2-telecom-user-sft-30B

inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及,使其更易于获取和应用。

开源/仓库模型发布端侧
10:08
蚂蚁 inclusionAI:HuggingFace 新模型
32
inclusionAI/AReaL-tau2-telecom-sft-30B

inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型,这是一个拥有300亿参数、专门针对电信领域进行监督微调(SFT)的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化,以提升在该垂直领域的专业性能和应用效果。

开源/仓库模型发布端侧
00:53
蚂蚁 inclusionAI:HuggingFace 新模型
35
inclusionAI/AReaL-tau2-retail-sft-30B 发布

inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型,参数量达 300 亿,采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及,旨在降低技术使用门槛,促进AI在零售领域的专业化应用与创新。

开源/仓库模型发布端侧
00:30
蚂蚁 inclusionAI:HuggingFace 新模型
35
inclusionAI/AReaL-tau2-airline-sft-30B 发布

inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化,其具体训练数据与性能指标尚未在本次公告中详细披露。

开源/仓库模型发布部署/工程
3月4日
16:25
蚂蚁 inclusionAI:HuggingFace 新模型
37
inclusionAI/ZwZ-2B

inclusionAI 发布了 ZwZ-2B 模型,这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K,并在多项基准测试中性能显著提升,特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。

开源/仓库模型发布端侧
09:00
公众号:阶跃星辰(Step)
49
阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源

阶跃星辰将 Step 3.5 Flash 的预训练、中训练和训练框架全部开源,支持开发者进行更深度模型定制,以打造专属 AI 智能体。

开源/仓库开源生态数据/训练
3月2日
17:58
公众号:小红书技术(dots.llm)
55
FireRed-OCR 开源发布:端到端方案新SOTA!小红书提出低成本文档识别训练范式

FireRed-OCR 开源发布,为端到端方案新SOTA,小红书提出低成本文档识别训练范式,无缝兼容Qwen系列加速方案,是开箱即用的工业级OCR结构化专家。

多模态开源/仓库
3月1日
17:56
蚂蚁 inclusionAI:HuggingFace 新模型
46
inclusionAI/AReaL-SEA-235B-A22B

inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛,促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数,体现了其在处理复杂任务方面的潜力,同时强调开放协作对加速AI创新与社会普惠的关键作用。

开源/仓库推理模型发布
2月27日
21:02
公众号:月之暗面(Kimi)
32
Kimi API:用90%缓存命中率,把价格打到25%

Kimi K2.5 多模态模型的 API 输入成本,在 90% 缓存命中率下,实际价格为 1.03 元/M tokens,仅为标准定价 4 元/M tokens 的 2.5 折。Kimi API 缓存命中率通常在 85%-95% 之间波动,核心支撑是与清华大学合作研发的 Mooncake 推理架构,该架构获存储顶会 FAST 2025 最佳论文,并已开源。

开源/仓库推理教程/实践部署/工程
04:15
Saining Xie@sainingxie
精选
世界建模绝非像素渲染:Project Solaris发布多智能体视频世界模型

Project Solaris提出世界建模的本质在于全局共享状态而非局部像素渲染,推出基于Minecraft的多人在线视频世界模型。该系统突破单智能体视角局限,支持任意数量智能体随时介入交互,实现持久化世界状态演化。核心包含三大组件:Solaris Engine多人数据收集系统、基于DiT架构的Solaris Model(采用新型内存高效自强制设计,训练于1260万帧协调游戏数据)、以及使用VLM评判的Solaris Eval评估体系。这一范式转变为构建神经MMORPG服务器奠定基础。

Oscar Michel: 📢Current world models aren't really modeling the world; they're modeling one agent's view of it. Partial observations ≠...

智能体具身智能开源/仓库视频

推荐理由:从单视角到共享全局状态,开源多智能体世界模型或改变AI训练范式
2月20日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang 在 NVIDIA GB300 NVL72 上实现 25 倍推理性能突破

SGLang 与 NVIDIA 合作,在最新 GB300 NVL72 服务器上实现相比 H200 最高 25 倍的推理性能提升。基于 Blackwell Ultra GPU 的架构升级包括 1.5 倍 FP4 算力和 2 倍 Softmax 吞吐量,结合 NVFP4 GEMM 低精度计算、计算通信重叠及与 NVIDIA Dynamo 的集成优化,DeepSeek R1 等 MoE 模型在 InferenceXv2 基准测试中达成突破性表现。同时,GB200 NVL72 平台性能在 4 个月内提升 8 倍,显著降低大模型部署的延迟与成本。

开源/仓库推理部署/工程
2月19日
00:00
LMSYS:Blog(Chatbot Arena 团队)
GB300 NVL72部署DeepSeek R1优化方案:长上下文推理性能突破

NVIDIA与SGLang团队发布DeepSeek R1-NVFP4在GB300 NVL72上的优化部署方案,针对128K/8K长上下文推理实现显著性能提升。通过PD分离、分块流水线并行、宽专家并行及多Token预测(MTP)等技术,系统在GB300上达226 TPS/GPU峰值吞吐量,较GB200提升1.53倍;相同延迟下性能领先1.4–1.6倍。MTP可再提升每用户TPS达1.87倍,128K预填充首Token延迟降至8.6秒。

DeepSeek开源/仓库推理部署/工程
2月16日
09:52
公众号:蚂蚁百灵(Ling)
52
Ling-2.5-1T 开源发布:深度思考模型拉升智能上限,即时模型平衡效率与覆盖

蚂蚁百灵发布并开源 Ling-2.5-1T,包含深度思考模型(thinking model)与即时模型(instant model)两类。深度思考模型旨在拉高智能上限,即时模型则在效率与效果之间取得平衡,拓宽智能覆盖范围。该版本在模型架构、token 效率、偏好对齐等维度实现全面升级。

开源/仓库推理模型发布
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang-Diffusion:面向生产级视频生成的高级优化

SGLang-Diffusion发布六项生产级优化,包括Token级序列分片替代帧级方案,消除14.3%的padding开销并将通信量降至0.875倍;并行折叠技术解耦文本编码器与DiT的并行策略;并行VAE实现分布式编解码,消除高分辨率视频内存瓶颈。同时修复Cache-DiT多请求稳定性问题,优化视频保存I/O性能,并针对WanVideo融合LayerNorm内核。这些改进显著提升了视频生成框架的可扩展性、效率与稳定性。

开源/仓库视频部署/工程
2月12日
18:22
公众号:小红书技术(dots.llm)
50
小红书发布 FireRed-Image-Edit:图像编辑新 SOTA

小红书基础模型 FireRed-Image-Edit 在 GitHub 上正式亮相,该模型专注于图像编辑任务,并达到新的最佳性能(新 SOTA)。

GitHub图像生成开源/仓库模型发布
16:52
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/ZwZ-8B

inclusionAI发布了ZwZ-8B模型,这是一个拥有80亿参数的开源人工智能模型。该模型旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及。此举是inclusionAI推进AI民主化进程的一部分,致力于让更广泛的社区能够访问和利用先进的AI技术。

开源/仓库模型发布端侧
08:00
Hugging Face:Blog(RSS)
精选83
实践中的OpenEnv:在真实环境中评估工具使用智能体

Meta与Hugging Face联合推出开源评估框架OpenEnv,旨在标准化智能体与真实系统的交互。Turing公司贡献了生产级“Calendar Gym”环境,用于在权限控制、时间推理等现实约束下研究工具使用智能体。该框架采用类似Gymnasium的API,通过标准接口连接真实工具,将评估重点从受控演示转向真实世界可靠性。日历系统因涉及多用户、多步骤工作流等复杂性,成为评估智能体实际能力的强大测试平台。

智能体Hugging FaceMCP/工具Meta

推荐理由:提供生产级基准测试,帮助开发者评估和改进 AI 代理在复杂环境中的表现。
2月11日
18:55
蚂蚁 inclusionAI:GitHub 新仓库
精选61
inclusionAI 发布高性能量化推理 GEMM 内核库 Humming

inclusionAI 开源了 Humming,这是一个专为量化推理设计的高性能、轻量级即时编译 GEMM 内核库。它支持在 FP16、BF16、FP8 等多种激活数据类型下进行 8 比特以下任意权重类型的推理,兼容多种量化策略与缩放类型,并同时支持稠密 GEMM 和混合专家 GEMM 运算。该库兼容 SM75+ 及以上的所有 NVIDIA GPU,在多种计算场景下能提供业界领先的吞吐量和效率。其依赖极简,仅需 PyTorch 和 NVCC,软件包大小仅约 100 KB,便于超轻量化部署。

开源/仓库推理部署/工程

推荐理由:蚂蚁 inclusionAI 开源了一个 100KB 级的量化 GEMM 库,支持从 INT1 到 FP8 全家桶,SM75+ 全覆盖,做推理部署的工程师值得花半小时跑一下 benchmark,看看能不能替换掉现有的 Marlin 方案。
18:52
蚂蚁 inclusionAI:GitHub 新仓库
精选65
inclusionAI发布新一代即时大模型Ling-2.5-1T

inclusionAI推出新一代旗舰即时模型Ling-2.5-1T,其总参数量达1T,活跃参数为63B,预训练语料扩展至29T tokens。该模型采用混合线性注意力架构,支持1M tokens上下文长度,并通过结合“正确性”与“过程冗余”的复合奖励机制,在相近的token效率下,其推理能力显著超越前代,接近前沿思维模型水平。经双向RL反馈和智能体验证等对齐策略优化,模型在创意写作和指令遵循任务上表现提升。它已兼容主流智能体平台,并在通用工具调用基准BFCL-V4上取得领先的开源性能。

开源/仓库推理模型发布部署/工程

推荐理由:蚂蚁把 1T 参数的即时模型开源了,63B 活跃参数加 1M 上下文,主打效率而非堆算力,对国内做开源推理模型的团队来说是个值得对标的基线。
‹ 上一页
1…202122232425
下一页 ›