5月1日

08:44

elvis@omarsar0

测试者使用 DeepSeek-V4-Pro 在 Pi 编码智能体上构建了一个 LLM 知识库，对其开箱即用的表现感到震撼。这是首个在推理能力上媲美 Claude 和 Codex 的开源权重模型，且成本效益高，支持 100 万上下文长度。该模型无需复杂配置即可在基础框架中直接运行，擅长智能体编码和知识密集型推理任务，能跨公司文档、论坛、论文和代码库进行多步骤研究、代码生成与上下文推理。其高效运行得益于 Fireworks 的市场最快推理速度及混合注意力设计，将 KV 缓存降至 10%，推理计算量减少近 4 倍，实现了快速且低成本的实践部署。

智能体 DeepSeek 开源生态推理

08:00

HuggingFace Daily Papers（社区热门论文）

LASE：用于印度语系跨文字身份保护的语言对抗性说话人编码

研究提出LASE（语言对抗性说话人编码器），以解决多语言语音克隆中因发音文字不同导致的说话人身份漂移问题。现有编码器如WavLM和ECAPA-TDNN在跨文字切换时性能下降。LASE在冻结的WavLM-base-plus模型上增加小型投影头，结合监督对比损失和梯度反转的跨语言分类对抗损失进行训练，使编码消除语言信息的同时保留说话人特征。实验表明，在1118个跨文字语音对上，LASE将身份漂移降至接近零，并扩大与基线的差距2.4-2.7倍。在合成多说话人日记任务中，LASE仅用约百分之一训练数据即达到与ECAPA-TDNN相当的说话人召回率。研究同时发布了模型检查点、语料库和评估代码。

Hugging Face 开源生态论文/研究语音

07:16

Mistral AI@MistralAI

Mistral AI 入选 TIME100 2026 年 AI 领域前十最具影响力公司

Mistral AI 被列入 TIME100 2026 年最具影响力公司名单，并在人工智能类别中排名前十。公司强调其客户能够根据自己的条件在自有基础设施上运行前沿模型，这体现了自主性和数据控制优势。Mistral AI 感谢客户的信任和全球团队成员的贡献，同时祝贺所有今年被认可的企业。

开源生态行业动态

06:16

OpenClaw🦞@openclaw

事实证明，最安全的龙虾是每个人都能检查的那一只。我们撰文探讨了咨询洪流、真正的修复方案、ClawHub、混沌代理，以及那些公开帮助强化OpenClaw的公司。🦞 https://openclaw.ai/blog/openclaw-security-in-public/

安全/对齐开源生态

06:15

Nathan Lambert@natolambert

蒸馏在很大程度上是行业标准，并非仅是中国实验室针对 OpenAI/Anthropic 的做法。许多美国公司也会蒸馏中国的（开源）模型。

MTS: LIVE TRIAL UPDATE: OpenAI's counsel asked Musk whether xAI has ever "distilled" technology from OpenAI. Musk: "Generally...

DeepSeek 大佬观点开源生态

06:12

Simon Willison 博客

Zig 语言创始人 Andrew Kelley 谈如何识别 AI 生成的代码

Zig 语言创始人 Andrew Kelley 反驳了“无法识别谁在使用 LLM”的常见误解。他指出，尽管可能未捕获所有由 AI 辅助的拉取请求，但人类错误与 LLM 的幻觉存在本质区别，使得后者易于识别。他进一步比喻道，习惯于使用 AI 代理编程的人带有一种“数字气味”，就像吸烟者进入房间时，不吸烟者能立刻察觉一样。Kelley 澄清自己并非反对使用 LLM，但明确禁止在 Zig 项目中使用 AI 辅助生成的代码。

大佬观点开源生态编码

04:12

Chubby♨️@kimmonismus

本地LLM游戏开发对决：Gemma 4 31B 在效率与逻辑上胜过 Qwen 3.6 27B

在@atomic_chat_hq平台的本地LLM游戏开发竞赛中，Gemma 4 31B与Qwen 3.6 27B于MacBook Pro M5 Max上对决。尽管Qwen生成速度更快（32 tokens/秒）且回答更具创意，但Gemma仅用3分51秒和6209个token，输出了更简短、清晰、逻辑性强的答案。在具体的吃豆人游戏逻辑实现上，Gemma在点击反应、与墙壁/幽灵的交互及粒子效果处理方面表现更优。作者强调此为单次测试，Qwen或可通过调整设置提升表现，并邀请社区验证。

开源生态推理评测/基准

03:14

Artificial Analysis@ArtificialAnlys

蚂蚁集团开源Ling 2.6 1T模型，性价比与智能取得平衡

蚂蚁集团InclusionAI实验室发布开源非推理模型Ling 2.6 1T。该模型拥有1万亿参数，在Artificial Analysis Intelligence Index上得分为34分，较前代Ling-1T提升15分，智能水平接近DeepSeek V3.2等同类模型。其在科学推理与知识任务上表现扎实，GPQA得分达75%。模型运行效率较高，执行该指数仅需约1600万输出tokens，成本效益突出，通过官方API运行全套指数成本约95美元。但其事实可靠性较弱，在AA-Omniscience基准上得分为-51分，主要因幻觉率高达92%。模型权重已在Hugging Face公开。

开源生态评测/基准

03:12

Simon Willison 博客

我们需要用于分享海量氛围编码应用的RSS

Matt Webb提出，随着氛围编码加速应用开发，应用变得更个人化、场景化和高频次，发布工具或微应用更像写博客而非建网站。他期望有一个RSS订阅源，能聚合各类工具和应用页面，每个条目都带“安装”按钮。受此启发，作者使用Claude为自己的工具页面添加了Atom订阅源和图标，该页面内容来自其个人工具站点。这一实践指向了在应用开发轻量化、个人化的趋势下，通过订阅机制高效分享和发现微应用的新可能，其核心在于如何定义“安装”的目的地与实现方式。

大佬观点开源生态部署/工程

02:14

Hacker News 热门（buzzing.cc 中文翻译）

在 PyTorch Lightning AI 训练库中发现以"沙伊-胡鲁德"为主题的恶意软件

安全平台 semgrep.dev 报告，在流行的 PyTorch Lightning AI 训练库中发现了名为“沙伊-胡鲁德”的恶意软件。该恶意代码通过库的依赖项进行植入，可能在使用受影响版本进行人工智能训练的项目中执行恶意操作。此事件在 Hacker News 上引发广泛讨论，获得了 111 点热度，突显了开源软件供应链的潜在安全风险。建议开发者立即检查并更新项目依赖，以防范此类供应链攻击。

安全/对齐开源生态数据/训练

02:10

阿绎 AYi@AYi_AInotes

Anthropic被曝检测用户代码提交历史以打压第三方工具，引发社区强烈抗议

Anthropic被曝通过其官方Claude Code工具检测用户Git提交历史，若发现包含“openclaw”字符串，便将该用户识别为第三方工具使用者，并触发“out of extra usage”错误，导致服务被拒或强制额外收费。开发者实验证实此为人为设置的字符串匹配规则。此举被视为Anthropic为将用户锁定在自家生态、打压更灵活的第三方竞品而采取的粗暴手段，与其此前塑造的开放、不监控形象相悖，引发了开发者社区的强烈不满和抗议。

阿绎 AYi: 卧槽,Anthropic这次真把开发者当傻子。知名开发者Theo做了个实验:建了个空Git仓库,只commit一行JSON {"schema": "openclaw.inbound_meta.v1"}, 调用官方Claude Code就直...

Anthropic MCP/工具大佬观点开源生态

00:13

Artificial Analysis@ArtificialAnlys

阿里发布Qwen3.6系列开源模型，27B版本成150B参数以下最强开源模型

阿里巴巴开源了Qwen3.6系列两款模型：27B密集模型和35B A3B混合专家模型。其中，Qwen3.6 27B在Artificial Analysis智能指数上得分46，成为150B参数以下最智能的开源模型，领先于Gemma 4 31B等。但其运行完整测试消耗的输出token约为后者的3.7倍，成本高出约21倍。两款模型均采用Apache 2.0许可，支持262K上下文，具备多模态能力。值得注意的是，其幻觉率较前代大幅下降，但准确率基本持平。更大的Plus和Max Preview版本未开源。

多模态开源生态推理评测/基准

00:10

Berryxia.AI@berryxia

Stripe Sessions 推动 Agent 经济迈向新高度

Stripe在年度大会上宣布一系列战略更新，以迎接AI Agent主导交易的新经济时代。CEO指出，经济正经历“平台重构”，未来多数交易将由Agent完成，这使得“开发者优先”战略至关重要。核心发布包括Link AI钱包，允许Agent使用安全令牌代用户购物，并新增Pix、UPI及稳定币支持。同时，Machine Payments协议增加了微支付和循环支付功能。此外，Checkout Studio、Adaptive Pricing订阅版、新款终端硬件T600以及Treasury的多币种扩展等产品，共同标志着Stripe正从支付基础设施向Agent时代的经济层全面演进。

Patrick Collison: We just announced a large raft of improvements at @Stripe Sessions. My meta reflections: • It feels that the entire econ...

智能体产品更新开源生态

4月30日

23:10

Berryxia.AI@berryxia

🚀 Qwen 重磅开源 Qwen-Scope！

Qwen开源了Qwen-Scope，这是一个为Qwen模型家族设计的稀疏自编码器完整套件，旨在将SAE特征转化为实用工具。该套件提供四大核心功能：在推理方面，可直接操纵模型内部特征以控制输出，无需依赖提示工程；在数据方面，能用极少样本对目标数据进行分类和合成，增强模型的长尾能力；在训练方面，能精准追溯代码切换和重复生成等问题的根源并进行修复；在评估方面，可通过分析特征激活模式来智能筛选基准测试，减少冗余。Qwen希望社区能利用此工具深入探索模型内部机制并开发更多应用。

Qwen: Today we're releasing Qwen-Scope 🔭, an open suite of sparse autoencoders for the Qwen model family. It turns SAE featur...

Hugging Face 开源/仓库开源生态

22:43

Qwen@Alibaba_Qwen

精选73

Qwen-Scope开源套件发布：稀疏自编码器助力模型内部特征操控

Qwen团队推出开源稀疏自编码器套件Qwen-Scope，将SAE特征转化为实用工具。该套件支持四大应用方向：无需提示工程即可通过直接操控内部特征引导模型输出；用极少样本对目标数据进行分类与合成，提升长尾能力；追踪代码切换和重复生成问题的根源并进行修复；通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制，并开发出超越现有研究范围的应用。相关资源已开放。

Hugging Face 开源/仓库开源生态数据/训练

推荐理由：可解释性工具从学术走向工程，Qwen-Scope 把内部特征操控、数据合成、问题溯源打包成套装，做模型调试和长尾优化的团队值得立刻上手试试。

22:13

向阳乔木@vista8

DeepSeek开源视觉语言模型DeepSeek-VL，聚焦真实场景应用

DeepSeek团队开源视觉语言模型DeepSeek-VL，包含1.3B和7B两个版本，旨在缩小开源模型与GPT-4V在真实场景中的差距。模型从数据、架构、训练三方面优化：数据构建上，采用从真实用户需求倒推的分类体系，并包含70%纯文本以保持语言能力；架构上创新采用SigLIP与SAM-B的混合视觉编码器，分别处理语义与细节特征；训练采用三阶段策略及模态平衡技术，缓解多模态训练对语言能力的侵蚀。

DeepSeek 多模态开源生态现象/趋势

22:11

Baidu Inc.@Baidu_Inc

人人皆可构建：MeDo平台推动开发方式根本性转变

SBTI迷因测试的流行，揭示了低门槛参与的趋势正驱动AI应用开发工具的演进。Miaoda及其国际版MeDo是一个生成式AI驱动的无代码对话式应用开发平台，用户仅需通过自然语言描述，即可在几分钟内获得功能完整、可部署的应用，无需编写代码。平台背后由10多个专用AI代理协作，覆盖从需求分析到部署的全流程。传统上全球仅0.4%的人口是专业程序员，而该平台已助力创建超50万个商业应用，其中81%的创建者是非程序员，服务超1000万用户。这标志着开发方式从编写代码转向描述意图的根本性变革。

智能体产品更新开源生态

20:42

The Decoder：AI News（RSS）

Tencent 发布 440 MB AI 模型，可在手机上离线翻译 33 种语言

腾讯发布了一款紧凑型开源 AI 翻译模型，其大小仅为 440 MB。该模型支持 33 种语言的互译，并能在智能手机上完全离线运行。腾讯声称，其性能超越了谷歌翻译。这一轻量化设计使得高质量的神经机器翻译无需依赖网络连接即可在移动设备上实现。

开源生态模型发布端侧

20:42

Hacker News 热门（buzzing.cc 中文翻译）

Granite 4.1：IBM 的 8 位模型与 32 位 MoE 相媲美

IBM开源了Granite 4.1系列模型，其80亿参数版本在性能上可与320亿参数的混合专家模型相媲美。这一突破表明，通过优化架构与训练方法，较小规模的模型也能达到更大模型的效能水平，为高效部署提供了新选择。该模型家族已开源，在开发者社区中获得关注，相关讨论在Hacker News上获得了超过100点热度。

开源生态模型发布

16:09

IT之家（RSS）

每季度亏 40 亿美元，Meta 元宇宙业务深陷长期亏损泥潭

Meta最新季度财报显示，其负责元宇宙业务的现实实验室部门单季度亏损高达40亿美元。自2021年以来，该部门在21个季度内累计亏损已达835亿美元，平均每季度亏损约40亿美元。与此同时，Meta正将战略重心转向人工智能，预计2026年资本支出将高达1250亿至1450亿美元，远超此前预期。尽管公司第一季度净利润达268亿美元，同比增长61%，但市场对其巨额投入和未来支出规划感到担忧，财报发布后盘后股价下跌超5%。

Meta 开源生态行业动态

15:09

Hacker News 热门（buzzing.cc 中文翻译）

Zig 项目坚持反人工智能贡献政策的理由

Zig编程语言项目坚持其严格的反人工智能贡献政策，明确拒绝接受任何由AI生成或辅助编写的代码提交。项目维护者认为，AI生成的代码存在版权与许可证不清晰、代码质量难以保障、以及可能引入安全漏洞等风险。此举旨在确保代码库的纯粹性、可维护性以及法律上的明确性，强调人类贡献者的理解和责任至关重要。该政策在开发者社区引发广泛讨论，获得了超过100个Hacker News点赞支持。

大佬观点开源生态

12:39

Nathan Lambert@natolambert

推文指出，当前AI访问权正被企业和政府双重控制：企业通过高价订阅实现软性垄断，而政府则以安全为由限制Mythos等系统的使用范围，且未给出清晰解释。这种控制将导致权力急剧集中，可能催生反乌托邦社会。作者认为，推动开源模型能力紧追闭源模型，是减少政治博弈和权力集中的关键途径。

Andrew Curran: The White House is against a proposal from Anthropic to more than double the number of groups with access to Mythos, cit...

Anthropic 安全/对齐开源生态行业动态

09:40

ginobefun@hongming731

AGI 2030年临近，创业者需战略布局与技术攻坚

Demis Hassabis预测AGI将在2030年左右到来，科技创业者必须提前将其纳入长远战略规划。当前底层架构需攻克持续学习与长期推理两大难题，智能体被视为通向AGI的必经之路，但受限于持续学习能力难以适应复杂环境。模型生态上，大小模型协同运作成为趋势，蒸馏技术使轻量级模型以低成本达到高性能，端侧模型降低成本并保障隐私，未来与云端超大模型协同构建理解物理世界的基础设施。

智能体 DeepMind 大佬观点开源生态

09:34

Simon Willison 博客

llm 0.32a0 发布

Simon Willison 发布了其命令行工具 LLM 的 0.32a0 版本。此次更新为 alpha 预发布版本，主要变更与详细说明可通过 GitHub 的发布页面及作者博客上的注解式发布说明获取。该版本标志着 LLM 工具在功能或兼容性上的进一步迭代，通常涉及对大型语言模型（如 GPT、Claude、LLaMA 等）进行访问或操作的改进。

产品更新开源生态部署/工程

09:34

Simon Willison 博客

Zig项目严格反AI贡献政策的核心理由

Zig项目实施了最严格的反LLM政策，全面禁止在问题、拉取请求和评论中使用AI生成内容。尽管其生态中的重要项目Bun（已被Anthropic收购）重度依赖AI辅助，并通过对Zig的分支实现了4倍的编译性能提升，但由于该禁令，这些改进不会向上游合并。Zig软件基金会社区副总裁解释，此政策的核心逻辑是“贡献者扑克”——项目更重视培养可信赖的长期贡献者，而非单次代码贡献。审查PR被视为对“人”的投资，而LLM生成的“完美”PR无法帮助社区积累这样的贡献者，因此被禁止。

Anthropic 大佬观点开源生态编码

09:34

IT之家（RSS）

万亿级综合旗舰模型：蚂蚁集团百灵大模型开源 Ling-2.6-1T

蚂蚁集团正式开源百灵大模型万亿级综合旗舰模型 Ling-2.6-1T。该模型不单纯追求参数规模，而是通过MLA与Linear Attention混合架构等创新，系统性优化智效比与复杂任务执行能力。其核心是在更低Token开销下实现强综合智能，减少对冗长思考链的依赖，并在AIME26、SWE-bench Verified等多个执行类基准测试中达到开源SOTA水平。模型具备完整的工程落地能力，并与主流Agent框架兼容，旨在成为可部署于真实业务系统的底座。为方便体验，其在OpenRouter平台的免费API调用服务将延期一周。

开源生态推理模型发布编码

09:00

公众号：蚂蚁百灵（Ling）

同事件精选62

Ling-2.6-1T 正式开源：面向复杂任务的万亿级综合旗舰模型

Ling-2.6-1T 于上周发布，今日正式开源。该模型定位为面向复杂任务的万亿级综合旗舰模型。

开源生态模型发布

同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

推荐理由：蚂蚁开源万亿参数模型 Ling-2.6-1T，虽然一个多月后才看到，但这是目前国内参数最大的综合性基座，做复杂多模态 agent 的团队可以直接拿来用，省去从头训练的麻烦。

08:00

HuggingFace Daily Papers（社区热门论文）

重复优于多样：面向高效德语建模的高质量数据过滤策略

针对德语等高资源非英语语言，本研究构建分层过滤器处理5亿份网络文档，对比了单次训练大规模低过滤数据与多轮重复训练高质量核心数据的效果。实验表明，重复训练高质量数据在多种模型规模和训练量级下均稳定优于追求多样性的单次训练，即使重复7轮后性能差距依然显著。这证明通过质量过滤实现语义集中，比单纯扩大数据量更能高效推进语言建模。基于此发布的德语模型Boldt，在训练量仅为同类模型1/10至1/360的情况下取得了领先性能，相关清洗后的评估基准已公开。

arXiv 开源生态数据/训练论文/研究

07:34

IT之家（RSS）

IT早报 0430：微信朋友圈灰度改版；追觅回应造车质疑；小米自研芯片玄戒 O3 曝光；DeepSeek 灰度"识图模式"

微信朋友圈正进行灰度改版，将文字描述移至配图上方，并新增“时间轴相册”入口。追觅正式回应造车质疑，宣布其高端新能源品牌“星空计划”首款概念车零百加速0.9秒，采用“华为模式”合作造车，量产车计划于2027年上市。小米下一代自研芯片“玄戒O3”信息曝光，主频突破4GHz。DeepSeek大模型正灰度测试具备多模态识别能力的“识图模式”。此外，比亚迪方程豹钛7 EV闪充版上市，福特改装版Mustang创下全美400米加速最快电车纪录。

多模态开源生态行业动态

04:39

Chubby♨️@kimmonismus

说真的，这是最能引起共鸣的感觉了。开源，本地化 = &lt；3

其他开源生态

04:12

SemiAnalysis@SemiAnalysis_

德黑兰，2026年4月29日--在@deepseek_ai DeepSeek v4 Pro发布不到一周后，@vllm_project和@inferact的破解团队在GB200（Dynamo+vLLM）上取得了显著改进。这主要得益于vLLM 0.20.0版本的发布，该版本为DEP部署启用了MegaMoE内核！出色的工作--我们期待在未来几天重点介绍更多改进。

DeepSeek 产品更新开源生态推理

03:42

swyx 🇸🇬@swyx

IMO DeepSeek v4 展现了十足的自信与能力，它没有进行基准刷分，没有关注某些无意义的最终运行成本，甚至没有投入推理最优的计算资源。只是亮相，展示了SOTA的长上下文效率技术（CSA、HCA、mHC，以pro版本8%的成本实现flash，而pro版本成本仅为opus的14%），发布了全球最佳的开源基础模型，然后潇洒离场。后续训练请自行处理。留给智能体实验室去收拾残局吧。喝彩。

DeepSeek 大佬观点开源生态

02:43

LMSYS：Blog（Chatbot Arena 团队）

精选74

秒级更新万亿参数--大规模分布式强化学习中的点对点权重传输技术

LMSYS团队针对SGLang中的强化学习工作负载，提出了一种基于RDMA的点对点权重更新机制，作为传统NCCL广播方法的补充。该设计利用源端CPU引擎副本和Mooncake TransferEngine进行P2P RDMA传输，将拥有1T参数的Kimi-K2模型的权重传输时间从53秒大幅缩短至7.2秒，提速7倍。其代价是每个训练等级需在CPU内存中额外占用一个32G的推理引擎副本。此优化最大限度地减少了网络冗余，允许推理服务器更快恢复rollout过程，且兼容所有主流开源模型。

智能体开源生态论文/研究部署/工程

推荐理由：LMSYS 把分布式 RL 训练的权重同步从 NCCL 广播改成 RDMA P2P，1T 参数模型传输快了 7 倍，做大规模 RL infra 的团队该认真看看这个工程方案。

02:09

Chubby♨️@kimmonismus

Mistral Medium 3.5：定位胜于基准测试

Mistral Medium 3.5是MistralAI的新旗舰模型，以公共预览版发布。它整合指令遵循、推理和编码能力，采用128B密集参数和256k上下文窗口，支持可配置推理努力。模型定位比基准测试更关键，比较对象包括Kimi、Qwen、GLM和Claude Sonnet，而非GPT或Gemini。随着Aleph Alpha被Cohere收购，Mistral成为唯一非美国、非中国的尖端实验室，以开源权重和修改的MIT许可证发布。模型在推理效率与一致性间权衡，Collie分数达95.8领先，目标不是原始推理，而是成为生产中可靠遵循指令的模型，体现欧洲企业定位。它是Mistral Vibe和Le Chat的新默认模型。

Mistral Vibe: Mistral Medium 3.5, a new flagship model in public preview by @MistralAI that merges instruction-following, reasoning, a...

大佬观点开源生态

01:42

Ant Ling@AntLingAGI

精选61

AntLingAGI 开源了 Ling-2.6-1T 模型，这是一个面向现实世界智能体工作流程的新旗舰模型。作为 1T 参数规模模型的先驱，团队强调了硬件、软件与 LLM 协同设计的重要性。vLLM 项目从发布首日（Day-0）起即提供支持，体现了顶尖工程生态系统的协作。这种合作旨在实现最佳的优化效果与用户体验，共同推动技术进步。

vLLM: Congrats to @AntLingAGI on the open release of Ling-2.6-1T! 🎉 A new flagship for real-world agentic workflows - Day-0 v...

智能体开源生态模型发布

推荐理由：vLLM 对 1T 模型的 Day-0 适配，说明开源推理栈对大尺寸模型的跟进速度越来越快，做私有化部署的可以直接参考官配 recipe 跑起来。

00:40

Mistral AI：News（网页）

Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

Mistral AI推出旗舰模型Mistral Medium 3.5，这是一个128B参数的密集模型，拥有256K上下文窗口，在SWE-Bench Verified上获得77.6%的分数。该模型现作为Vibe和Le Chat的默认引擎，并驱动两项新功能：Vibe远程编程智能体可将编码任务移至云端异步并行执行，用户可通过CLI或Le Chat启动并在完成后接收通知；Le Chat的新工作模式则是一个由该模型驱动的智能体，能处理研究、分析和跨工具操作等多步骤复杂任务。这些更新旨在将开发者从本地线性任务中解放出来，提升工作效率。

智能体开源生态模型发布编码

4月29日

23:40

TestingCatalog News 🗞@testingcatalog

MISTRAL 🚨： Mistral AI 发布了 Mistral Medium 3.5，这是一个拥有 256k 上下文窗口和可配置推理算力的 128B 密集开放权重模型。 Mistral Medium 3.5 现已在 Mistral Vibe 和 Le Chat 上可用。

Mistral Vibe: Introducing remote agents in Vibe and Mistral Medium 3.5. You can now launch remote agents in the cloud, including from ...

开源生态推理模型发布

23:10

Artificial Analysis@ArtificialAnlys

IBM发布三款高效非推理模型Granite 4.1，采用Apache 2.0开源许可

IBM发布了三款采用Apache 2.0许可的Granite 4.1开源模型（30B、8B、3B）。其核心特点是极高的令牌效率，例如8B模型运行智能指数仅需4M输出令牌，远低于同类模型。在开放性指数上，三款模型均获得61分，领先多数同行。但高效率也带来了智能指数的相对折衷，其得分低于Qwen3.5、Gemma 4等竞品。不过，与上一代Granite 4.0系列相比，新模型的智能表现仍有提升。该系列模型拥有128K令牌的上下文窗口，主要面向企业和边缘部署，可通过WandB、Replicate和Hugging Face获取。

Hugging Face 开源生态模型发布

22:42

Ant Ling@AntLingAGI

此前在OpenRouter上备受喜爱的快速模型"elephant-alpha"现已永久保留并正式开源，命名为Ling-2.6-flash。该模型由novita_labs驱动，旨在提供稳健且高性价比的性能。它专为现实世界智能体工作流打造，拥有1040亿总参数和74亿活跃参数，并提供多种精度版本以适应不同部署需求。其核心优势包括高达每秒215个令牌的生成速度、仅需1500万令牌即可完成完整智能评估的高效令牌利用率，以及在编码、文档处理和轻量级智能体任务中的强大执行能力。同时，模型在中文切换和主流编码框架兼容性方面体验更佳。为庆祝发布，现提供20%的折扣。

Ant Ling: Ling-2.6-flash is now officially open-sourced! A fast, token-efficient Instruct model built for real-world agent workflo...

智能体开源生态模型发布

22:17

Tencent Hy@TencentHunyuan

精选67

腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型，440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型，其参数量为18亿，经量化后仅440MB，可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向，包括藏语、蒙古语等少数语言。在标准测试中，其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特，模型内存占用从FP16格式的3.3GB大幅降低，比之前的1.67比特方法体积缩小25%、速度提升约10%，且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一，并部署于腾讯多个产品中。

Hugging Face 开源生态模型发布端侧

推荐理由：440MB的模型能在手机上跑33种语言翻译，还宣称比谷歌翻译强，这个量化技术让离线翻译不再是‘能看不能用’，出差党可以试试看。