全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 471 条

全部一手资讯 X 论文

标签「开源/仓库」清除

4月15日周三

14:41Hacker News 热门（buzzing.cc 中文翻译）Gas Town：从小丑秀到 v1.0

11:00公众号：小红书技术（dots.llm）52小红书 Relax 开源发布：面向全模态 Agentic 的异步 RL 训练引擎

09:27Hacker News 热门（buzzing.cc 中文翻译）Show HN： LangAlpha--如果Claude Code是为华尔街打造的会怎样？

4月13日周一

23:50Hacker News 热门（buzzing.cc 中文翻译）他们看到了你的照片

21:54Hacker News 热门（buzzing.cc 中文翻译）Show HN：我用了3周时间，借助Claude和Codex开发了一款社交媒体管理工具

12:32Hacker News 热门（buzzing.cc 中文翻译）Show HN： Claudraband - 面向高级用户的 Claude 代码

4月12日周日

21:55Hacker News 热门（buzzing.cc 中文翻译）尽管使用频率不高，Pro Max 5x 的流量配额仍在 1.5 小时内用尽

4月11日周六

09:41Hacker News 热门（buzzing.cc 中文翻译）在为 Linux 内核做贡献时使用 AI 辅助

4月10日周五

00:00LMSYS：Blog（Chatbot Arena 团队）HiSparse：分层内存系统加速稀疏注意力

4月9日周四

17:30公众号：通义实验室（千问）56VimRAG：图文视频全模态知识库开源框架

4月8日周三

14:06蚂蚁 inclusionAI：HuggingFace 新模型34inclusionAI/TC-AE

4月7日周二

17:26蚂蚁 inclusionAI：GitHub 新仓库54inclusionAI/TC-AE

4月6日周一

08:00HuggingFace Daily Papers（社区热门论文）SuperLocalMemory V3.3："活脑"--生物启发式遗忘与认知量化的Zero-LLM智能体记忆系统

4月2日周四

15:05蚂蚁 inclusionAI：GitHub 新仓库40inclusionAI/cuLA：基于CuTe DSL与CUTLASS C++的线性注意力变体CUDA内核

3月31日周二

17:34公众号：通义实验室（千问）36CoPaw 1.0 发布：定制小模型、安全机制与多智能体全面进化

08:00Hugging Face：Blog（RSS）58TRL v1.0：与领域同步发展的后训练库

3月30日周一

21:02Nathan Lambert：Interconnects（RSS）最新开源成果第20期发布：新增组织与模型类型，涵盖 Nemotron Super、Sarvam、Cohere Transcribe 等

3月26日周四

11:55Hacker News：AI 热帖Show HN：基于 TypeScript 的稳健 LLM 网页数据提取工具

3月25日周三

09:06公众号：MiniMax（稀宇科技）55MiniMax Office Skills：开源一套生产级办公文档引擎

00:00LMSYS：Blog（Chatbot Arena 团队）Elastic EP：实现DeepSeek MoE部署的部分故障容忍

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang亮相NVIDIA GTC 2026：三天五场活动展示开源AI基础设施实力

3月24日周二

10:01Hugging Face：Blog（RSS）78精选全新语音智能体评估框架EVA发布

3月23日周一

00:00Berkeley RDI：Blog（AI 安全与评测）OpenSage：自编程智能体生成引擎

3月22日周日

10:56公众号：MiniMax（稀宇科技）48Skills精选开源，MaxClaw支持多龙虾部署！

3月17日周二

00:00LMSYS：Blog（Chatbot Arena 团队）Miles RL框架正式支持ROCm：基于AMD Instinct GPU的大规模后训练

3月16日周一

23:00公众号：月之暗面（Kimi）60精选推荐：10万人亲测好用的原版OpenClaw安装器

3月14日周六

01:58Hacker News：AI 热帖精选Show HN： Context Gateway - 自动压缩 AI Agent 上下文再送入 LLM

3月9日周一

08:00Hugging Face：Blog（RSS）71精选LeRobot v0.5.0：扩展每一个维度

3月7日周六

02:00Google Blog：AI（RSS）开源 AI 模型 SpeciesNet 如何助力野生动物保护

00:14蚂蚁 inclusionAI：HuggingFace 新模型46inclusionAI/AReaL-tau2-merge-sft-235B 发布

3月5日周四

13:56蚂蚁 inclusionAI：HuggingFace 新模型45inclusionAI/ZwZ-4B-GGUF

13:56蚂蚁 inclusionAI：HuggingFace 新模型37inclusionAI发布ZwZ-2B-GGUF模型

10:55蚂蚁 inclusionAI：HuggingFace 新模型31inclusionAI/AReaL-tau2-telecom-user-sft-30B

10:08蚂蚁 inclusionAI：HuggingFace 新模型32inclusionAI/AReaL-tau2-telecom-sft-30B

00:53蚂蚁 inclusionAI：HuggingFace 新模型35inclusionAI/AReaL-tau2-retail-sft-30B 发布

00:30蚂蚁 inclusionAI：HuggingFace 新模型35inclusionAI/AReaL-tau2-airline-sft-30B 发布

3月4日周三

16:25蚂蚁 inclusionAI：HuggingFace 新模型37inclusionAI/ZwZ-2B

09:00公众号：阶跃星辰（Step）49阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源

3月2日周一

17:58公众号：小红书技术（dots.llm）55FireRed-OCR 开源发布：端到端方案新SOTA！小红书提出低成本文档识别训练范式

3月1日周日

17:56蚂蚁 inclusionAI：HuggingFace 新模型46inclusionAI/AReaL-SEA-235B-A22B

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

4月15日

14:41

Hacker News 热门（buzzing.cc 中文翻译）

Gas Town：从小丑秀到 v1.0

Steve Yegge 宣布 Gas Town 项目正式发布 v1.0 版本，标志着该软件从早期被戏称为"小丑秀"的混乱开发阶段进入稳定正式版。文章回顾了项目迭代过程中的关键转折与改进，该发布在 Hacker News 获得 101 点关注热度。

开源/仓库编码

11:00

公众号：小红书技术（dots.llm）

52

小红书 Relax 开源发布：面向全模态 Agentic 的异步 RL 训练引擎

小红书开源发布Relax，一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。

智能体开源/仓库开源生态

09:27

Hacker News 热门（buzzing.cc 中文翻译）

Show HN： LangAlpha--如果Claude Code是为华尔街打造的会怎样？

LangAlpha是一款专为华尔街金融场景打造的AI编程助手，定位为面向交易与金融分析优化的Claude Code替代品。该项目已开源并托管于GitHub仓库ginlix-ai/langalpha，在Hacker News发布当日获得102个赞。工具针对金融行业复杂的数据处理、量化分析和交易执行需求进行了专门适配，旨在为金融从业者提供更精准的代码生成与数据分析能力。

智能体开源/仓库编码

4月13日

23:50

Hacker News 热门（buzzing.cc 中文翻译）

他们看到了你的照片

"They See Your Photos"（theyseeyourphotos.com）项目揭示用户上传照片可能面临的隐私泄露风险，通过直观演示展示图像元数据及内容如何被第三方获取与分析。该网站在 Hacker News 平台获得 104 点热度关注，以可视化方式警示公众关于数字影像在未经授权情况下被访问与识别的安全隐患。

多模态开源/仓库

21:54

Hacker News 热门（buzzing.cc 中文翻译）

Show HN：我用了3周时间，借助Claude和Codex开发了一款社交媒体管理工具

开发者仅用3周时间，借助Claude和Codex开发了一款社交媒体管理工具，并在GitHub开源。该项目在Hacker News发布后立即获得102个点赞，展示了AI辅助编程在快速构建产品原型方面的高效性。项目代码已托管于brightbeanxyz/brightbean-studio仓库，为开发者提供了可参考的AI协作开发实践案例。

智能体 Anthropic OpenAI 开源/仓库

12:32

Hacker News 热门（buzzing.cc 中文翻译）

Show HN： Claudraband - 面向高级用户的 Claude 代码

Claudraband 是专为高级用户设计的 Claude Code 增强工具，针对专业开发者优化，已开源至 GitHub。

智能体 Anthropic 开源/仓库编码

4月12日

21:55

Hacker News 热门（buzzing.cc 中文翻译）

尽管使用频率不高，Pro Max 5x 的流量配额仍在 1.5 小时内用尽

Claude Code Pro Max 5x 用户反馈，在 moderate usage（中等使用强度）下，流量配额仅 1.5 小时即耗尽。该问题已提交至 GitHub issue，引发对配额限制合理性的质疑。

智能体 Anthropic 开源/仓库编码

4月11日

09:41

Hacker News 热门（buzzing.cc 中文翻译）

在为 Linux 内核做贡献时使用 AI 辅助

Linux 内核官方文档新增 coding-assistants.rst，明确贡献者使用 AI 辅助工具时的披露义务与代码审查标准，要求声明 AI 生成内容并确保符合内核编码规范，为开源大型项目整合 LLM 提供首个官方指引框架。

GitHub 开源/仓库编码

4月10日

00:00

LMSYS：Blog（Chatbot Arena 团队）

HiSparse：分层内存系统加速稀疏注意力

LMSYS Org推出HiSparse分层内存系统，针对稀疏注意力仍受限于GPU内存容量的问题，将非活跃KV缓存卸载至主机内存，仅在GPU HBM保留热缓冲区，并通过专用CUDA内核高效管理数据交换（采用LRU策略与页表更新）。该系统在256并发请求下实现超3倍吞吐量提升，GLM-5.1-FP8模型长上下文场景性能提升达5倍，支持DeepSeek-V3.2等采用DeepSeek Sparse Attention架构的模型。

开源/仓库推理部署/工程

4月9日

17:30

公众号：通义实验室（千问）

56

VimRAG：图文视频全模态知识库开源框架

VimRAG 是一个开源框架，通过模态统一记忆技术，支持图文视频全模态知识库，告别分模态处理，实现一体化管理。

检索增强多模态开源/仓库

4月8日

14:06

蚂蚁 inclusionAI：HuggingFace 新模型

34

inclusionAI/TC-AE

inclusionAI团队发布了TC-AE项目，旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛，促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架，强调协作与知识共享。此举预期将加速AI工具在多元领域的应用，并推动技术发展的透明性与包容性。

开源/仓库模型发布

4月7日

17:26

蚂蚁 inclusionAI：GitHub 新仓库

54

inclusionAI/TC-AE

研究团队发布了TC-AE，一种用于深度压缩自动编码器的新方法，旨在突破现有模型的令牌容量限制。该方法通过创新的架构设计，显著提升了模型在压缩表示中保留信息的能力，实现了更高的压缩效率与重建质量。具体指标显示，TC-AE在多个基准测试中，相较于传统深度压缩自动编码器，将有效令牌容量提升了约30%，同时保持了较低的计算开销。这项工作为高密度数据压缩与表示学习提供了新的技术路径。

开源/仓库数据/训练论文/研究部署/工程

4月6日

08:00

HuggingFace Daily Papers（社区热门论文）

SuperLocalMemory V3.3："活脑"--生物启发式遗忘与认知量化的Zero-LLM智能体记忆系统

SuperLocalMemory V3.3（"活脑"）作为本地优先的Zero-LLM智能体记忆系统发布，实现完整认知记忆分类。核心创新包括：Fisher-Rao量化感知距离（FRQAD）以100%精度识别高保真嵌入；艾宾浩斯自适应遗忘曲线实现6.7倍区分力；7通道认知检索（语义、关键词、实体图、时间、扩散激活、巩固、Hopfield联想）在LoCoMo基准零LLM模式下达70.4%，多跳任务提升23.8个百分点。支持长时内隐记忆参数化与自动认知管道，纯CPU运行，月下载超5000次。

智能体 arXiv Hugging Face 开源/仓库

4月2日

15:05

蚂蚁 inclusionAI：GitHub 新仓库

40

inclusionAI/cuLA：基于CuTe DSL与CUTLASS C++的线性注意力变体CUDA内核

inclusionAI发布了cuLA项目，这是一套为线性注意力变体编写的CUDA内核。该内核完全采用NVIDIA的CuTe DSL和CUTLASS C++库进行开发，旨在高效实现Transformer模型中的线性注意力机制。此举专注于底层计算优化，通过利用先进的CUDA编程抽象和高效模板库，有望提升大语言模型在推理和训练过程中的计算性能与效率。

开源/仓库数据/训练部署/工程

3月31日

17:34

公众号：通义实验室（千问）

36

CoPaw 1.0 发布：定制小模型、安全机制与多智能体全面进化

产品更新开源/仓库端侧

08:00

Hugging Face：Blog（RSS）

58

TRL v1.0：与领域同步发展的后训练库

Hugging Face 正式发布 TRL v1.0，这是一个专为大语言模型后训练设计的开源库。该版本整合了 SFT、RLHF 等多种高效微调技术，提供从监督微调到人类反馈强化学习的完整工具链。新库支持与 Transformers、PEFT 等主流框架无缝集成，显著简化了模型对齐流程。此次更新旨在降低大语言模型微调门槛，推动AI技术民主化，使开发者能够更便捷地提升模型在对话、安全等方面的性能表现。

Hugging Face 开源/仓库数据/训练

3月30日

21:02

Nathan Lambert：Interconnects（RSS）

最新开源成果第20期发布：新增组织与模型类型，涵盖 Nemotron Super、Sarvam、Cohere Transcribe 等

第20期开源成果更新引入多个新组织与全新模型类型，收录 NVIDIA Nemotron Super、Sarvam 及 Cohere Transcribe 等最新模型。此次扩展显著丰富了开源生态的模型种类与来源多样性，覆盖更多技术领域与应用场景，为开发者提供更广泛的模型选择。

开源/仓库开源生态

3月26日

11:55

Hacker News：AI 热帖

Show HN：基于 TypeScript 的稳健 LLM 网页数据提取工具

Lightfeed Extractor 发布基于 TypeScript 的 LLM 网页数据提取库，支持通过自然语言提示和 Zod schema 从 HTML、Markdown 或纯文本中提取结构化数据。核心功能包括 HTML 转 Markdown 预处理、JSON 模式输出、失败 JSON 自动修复及 token 追踪。可与 Playwright 集成加载动态页面，或配合 browser-agent 实现自然语言导航后提取，适用于电商竞品监控等生产级场景。

智能体 GitHub 开源/仓库数据/训练

3月25日

09:06

公众号：MiniMax（稀宇科技）

55

MiniMax Office Skills：开源一套生产级办公文档引擎

MiniMax 开源了 Office Skills，一套生产级办公文档引擎。

开源/仓库开源生态

00:00

LMSYS：Blog（Chatbot Arena 团队）

Elastic EP：实现DeepSeek MoE部署的部分故障容忍

Mooncake团队与Volcano Engine在SGLang框架中推出Elastic EP功能，解决大规模DeepSeek MoE模型"宽"专家并行部署的可靠性瓶颈。该技术通过解耦专家与GPU的刚性绑定并维护冗余副本，可在32 GPU集群中容忍最多16个rank故障，将服务恢复时间从2-3分钟缩短至10秒以内，降幅达90%。基准测试显示，该方案在实现极端韧性的同时，吞吐量、TTFT和TPOT等关键指标与标准DeepEP持平，实现零静态性能损耗。

DeepSeek 开源/仓库部署/工程

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang亮相NVIDIA GTC 2026：三天五场活动展示开源AI基础设施实力

SGLang亮相Jensen Huang主题演讲AI生态图谱，三天内密集举办五场活动。团队与RadixArk合办200人技术聚会，在LinkedIn总部举办搜索与推荐LLM系统研讨，并参与700人规模的Novita行业论坛。官方培训实验室发布Miles RL框架，解决生产环境训练-推理不匹配难题；LinkedIn工程师分享预填充优化方案，在H100上实现2–3倍吞吐量提升并回馈上游。

开源/仓库数据/训练部署/工程

3月24日

10:01

Hugging Face：Blog（RSS）

精选78

全新语音智能体评估框架EVA发布

ServiceNow AI团队在Hugging Face上发布了语音智能体评估框架EVA。该框架通过标准化测试集与多模态指标，系统评估语音助手在对话理解、任务完成及交互自然度等方面的性能，旨在量化衡量智能体在复杂真实场景下的表现，助力研究人员客观比较不同模型，推动技术优化。

智能体 Hugging Face 开源/仓库语音

推荐理由：提供语音代理评估标准，帮助开发者优化模型性能和测试效率。

3月23日

00:00

Berkeley RDI：Blog（AI 安全与评测）

OpenSage：自编程智能体生成引擎

OpenSage是新一代Agent开发工具包，推动智能体开发从人工设计转向AI自主编程范式。该系统支持LLM自动构建智能体拓扑、动态编写管理工具（具备沙箱隔离与异步执行），以及维护分层图结构记忆系统。与现有方案需人工设计不同，OpenSage实现了拓扑、工具和记忆的全面AI自动化生成，并内置软件工程与安全工具套件。

智能体 DeepMind 开源/仓库编码

3月22日

10:56

公众号：MiniMax（稀宇科技）

48

Skills精选开源，MaxClaw支持多龙虾部署！

本周MiniMax Skills社区上线，精选上百种覆盖开发、学习、办公及内容创作的Skill，包括基于M2.7模型创建的PPT制作、PDF编辑等Skill已开源，用户可在MaxClaw或MiniMax Agent中一键添加。MaxClaw新增支持同时部署多个Claw，可自定义命名与设定，支持工作流拆分和多角色协作。通过MiniMax Agent桌面端部署本地OpenClaw时，预置多款安全诊断Skill以降低高危操作风险，并能自主诊断修复。MaxClaw沙箱升级，新环境支持root权限，用户可自由安装依赖库与浏览器，OpenClaw框架也可自行升级。

MCP/工具产品更新开源/仓库

3月17日

00:00

LMSYS：Blog（Chatbot Arena 团队）

Miles RL框架正式支持ROCm：基于AMD Instinct GPU的大规模后训练

开源RL框架Miles正式支持ROCm，可在AMD Instinct MI300/350 GPU上原生运行大规模语言模型后训练。该框架采用解耦架构分离rollout生成与模型优化，针对RL工作负载中占比70-90%的推理场景优化。在单节点8卡MI300X上训练Qwen3-30B-A3B的实测显示，rollout吞吐达1.1k-1.3k tok/GPU/s，AIME准确率从66.5%提升至72.9%。现提供预构建容器，支持GRPO、Megatron-LM和FSDP后端。

开源/仓库数据/训练部署/工程

3月16日

23:00

公众号：月之暗面（Kimi）

精选60

推荐：10万人亲测好用的原版OpenClaw安装器

Kimi支持的个人开发者开源项目OneClaw下载量突破10万，提供一键安装包，1分钟即可在本地部署原版OpenClaw，无需命令行或环境配置。功能包括纯净卸载、自由切换模型、远程控制，支持连接飞书、企微、钉钉、QQ、Kimi Claw；内置2万+技能的技能商店，可无损迁移记忆和Skills。Kimi提供包月方案和API按需购买。使用地址：oneclaw.cn。

MCP/工具开源/仓库编码

推荐理由：如果你曾被 OpenClaw 的部署门槛劝退，OneClaw 可以让你两分钟跑起来，适合在备用机尝尝鲜，但别在生产环境乱搞。

3月14日

01:58

Hacker News：AI 热帖

精选

Show HN： Context Gateway - 自动压缩 AI Agent 上下文再送入 LLM

YC 孵化的 Compresr 发布 Context Gateway，在 AI Agent 与 LLM 间自动压缩过长对话历史。后台预计算实现即时压缩，支持 Claude Code、Cursor 等，默认 75% 上下文阈值触发。curl 一键安装，TUI 向导配置。

智能体开源/仓库部署/工程

推荐理由：YC背书的Agent上下文压缩工具，自动优化长对话，支持Claude Code等主流Agent

3月9日

08:00

Hugging Face：Blog（RSS）

精选71

LeRobot v0.5.0：扩展每一个维度

Hugging Face 发布了 LeRobot v0.5.0 版本。该版本在数据集、模型、任务和社区四个维度上进行了全面扩展。具体包括：引入了新的现实世界和模拟数据集，推出了支持多任务学习的模型，并扩展了任务范围至移动操作和双臂协调。社区方面，提供了更易用的库、演示应用和教学资源。此次更新的核心目标是降低机器人技术的应用门槛，推动其民主化发展。

Hugging Face 具身智能开源/仓库

推荐理由：开源机器人AI框架大版本更新，降低具身智能研发门槛，值得关注落地进展

3月7日

02:00

Google Blog：AI（RSS）

开源 AI 模型 SpeciesNet 如何助力野生动物保护

SpeciesNet 是开源 AI 模型，旨在帮助全球各地的人们保护和保存野生动物。该模型为野生动物保护提供技术支持，助力生物多样性保护事业。

Google 开源/仓库开源生态

00:14

蚂蚁 inclusionAI：HuggingFace 新模型

46

inclusionAI/AReaL-tau2-merge-sft-235B 发布

inclusionAI 团队发布了 AReaL-tau2-merge-sft-235B 模型。该模型参数量达2350亿，采用合并与监督微调技术构建。其目标是推动人工智能技术发展并通过开源开放模式实现AI民主化，致力于让先进AI技术更广泛可及。

开源/仓库推理模型发布

3月5日

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

45

inclusionAI/ZwZ-4B-GGUF

inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念，旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式，这是一种高效且通用的模型文件格式，便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛，促进更广泛的研究与应用开发。

开源/仓库模型发布端侧

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

37

inclusionAI发布ZwZ-2B-GGUF模型

inclusionAI推出开源模型ZwZ-2B-GGUF，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛，促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径，强调技术普及与包容性发展。

开源/仓库模型发布端侧

10:55

蚂蚁 inclusionAI：HuggingFace 新模型

31

inclusionAI/AReaL-tau2-telecom-user-sft-30B

inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及，使其更易于获取和应用。

开源/仓库模型发布端侧

10:08

蚂蚁 inclusionAI：HuggingFace 新模型

32

inclusionAI/AReaL-tau2-telecom-sft-30B

inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型，这是一个拥有300亿参数、专门针对电信领域进行监督微调（SFT）的大型语言模型。该模型基于开源与开放科学理念构建，旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化，以提升在该垂直领域的专业性能和应用效果。

开源/仓库模型发布端侧

00:53

蚂蚁 inclusionAI：HuggingFace 新模型

35

inclusionAI/AReaL-tau2-retail-sft-30B 发布

inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型，参数量达 300 亿，采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及，旨在降低技术使用门槛，促进AI在零售领域的专业化应用与创新。

开源/仓库模型发布端侧

00:30

蚂蚁 inclusionAI：HuggingFace 新模型

35

inclusionAI/AReaL-tau2-airline-sft-30B 发布

inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化，其具体训练数据与性能指标尚未在本次公告中详细披露。

开源/仓库模型发布部署/工程

3月4日

16:25

蚂蚁 inclusionAI：HuggingFace 新模型

37

inclusionAI/ZwZ-2B

inclusionAI 发布了 ZwZ-2B 模型，这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K，并在多项基准测试中性能显著提升，特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。

开源/仓库模型发布端侧

09:00

公众号：阶跃星辰（Step）

49

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源

阶跃星辰将 Step 3.5 Flash 的预训练、中训练和训练框架全部开源，支持开发者进行更深度模型定制，以打造专属 AI 智能体。

开源/仓库开源生态数据/训练

3月2日

17:58

公众号：小红书技术（dots.llm）

55

FireRed-OCR 开源发布：端到端方案新SOTA！小红书提出低成本文档识别训练范式

FireRed-OCR 开源发布，为端到端方案新SOTA，小红书提出低成本文档识别训练范式，无缝兼容Qwen系列加速方案，是开箱即用的工业级OCR结构化专家。

多模态开源/仓库

3月1日

17:56

蚂蚁 inclusionAI：HuggingFace 新模型

46

inclusionAI/AReaL-SEA-235B-A22B

inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛，促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数，体现了其在处理复杂任务方面的潜力，同时强调开放协作对加速AI创新与社会普惠的关键作用。

开源/仓库推理模型发布

1…7 8910 11 12