商汤开源的 SenseNova-U1 模型在架构上实现关键突破。传统多模态模型多采用“语言模型 + 视觉编码器 + VAE”的拼接方式,视觉信息需先翻译再输入 LLM。U1 基于 NEO-Unify 架构,直接移除翻译层,使语言和视觉在同一表征空间中运行。因此,模型能在单次推理中同步完成图像理解、推理和生成等任务,而非分步处理,提升了多模态交互的效率和连贯性。
商汤开源的 SenseNova-U1 模型在架构上实现关键突破。传统多模态模型多采用“语言模型 + 视觉编码器 + VAE”的拼接方式,视觉信息需先翻译再输入 LLM。U1 基于 NEO-Unify 架构,直接移除翻译层,使语言和视觉在同一表征空间中运行。因此,模型能在单次推理中同步完成图像理解、推理和生成等任务,而非分步处理,提升了多模态交互的效率和连贯性。
SenseNova U1 Lite Series is now open source! Built on the NEO-unify architecture, it natively unifies multimodal underst...
小米MiMo-V2.5-Pro模型在最新Arena排行榜中表现卓越。在Text Arena(Expert)榜单中,它位列全球第六,同时是开源模型与中文模型的双料第一,其所属实验室全球排名第三。该模型在Text Arena(Overall)总榜中排名开源全球第二,在Code Arena(WebDev)前端开发榜单中位列开源全球第三。此外,它在Text Arena的四个关键子类别(Hard Prompts、英文Hard Prompts、指令遵循与长查询)中均获得开源全球第一。这些成绩均基于真实用户偏好与社区盲投评估,体现了模型在复杂任务上的强大综合能力。
OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具(如Linear)的任务看板作为控制中枢,为每个任务自动分配并运行一个独立的AI代理(基于Codex),直至完成。人类仅在“人工审查”节点介入,实现了从微观管理到任务级分配的转变。系统允许大粒度任务,代理能自主拆解依赖、创建新任务,并保证持续运行。初步数据显示,该方法能显著提升开发效率。
AI 编程热潮推动 GitHub 用户规模爆发式增长,平台频发故障后启动底层基础设施重构。2025年10月,GitHub 计划扩容至原有承载能力的10倍,但预计未来业务规模将达当前30倍。增长压力导致稳定性问题,如4月23日故障影响658个代码仓库和2092个合并请求。GitHub 正优先保障服务可用性,迁移算力至微软 Azure,物理隔离 Git 等核心服务,并推进多云架构以提升抗故障能力。
Nvidia 发布了开源多模态模型 Nemotron 3 Nano Omni,该模型能够处理文本、图像、视频和音频。其引人关注之处不仅在于性能表现,更在于其训练数据的构成。模型的部分训练数据来源于 Qwen、GPT-OSS、Kimi 和 DeepSeek OCR 等多个知名项目,这揭示了构建现代多模态模型所需数据集的多样性与复杂性。
🔥Native Unified Multimodal Model Open Sourced🔥 🚀SenseNova U1🚀 is the first native multimodal model that unifies mult...
一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。
阿里巴巴被《TIME》评为2026年十大最具影响力AI公司之一,入选其首届“行业领袖”榜单。公司凭借构建根植于开源领导力的全栈AI生态系统获得认可。阿里巴巴已成长为全球开源AI的重要力量,其Qwen模型系列不仅在中国驱动创新,也支持了Airbnb、Pinterest等国际公司。《TIME》认可Qwen为全球最受欢迎的开源模型家族,这体现了阿里巴巴“开放加速共同进步”的理念。
AI编程代理的普及正使GitHub基础设施面临极限压力。这些工具不仅生成更多代码,更导致提交、拉取请求、搜索和CI任务等仓库事件数量激增,彻底改变了平台原本为人类节奏设计的工作负载形态。开发者现可在短时间内推送大量AI辅助的迭代,每次迭代都会触发CI、索引、存储和审查系统,使瓶颈从编写代码转向消化代码。这种过载已影响日常维护,导致评审阻塞、合并卡顿和自动化失败。作为例证,GitHub早期用户Mitchell Hashimoto因其项目Ghostty反复遭遇服务中断,最终决定将项目迁出他使用了18年的GitHub,这标志着一个时代的转变。
Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...
蚂蚁集团推出的Ling-2.6-1T模型在免费测试期表现突出,处理复杂任务速度可比竞品快6倍,并具备主动思辨能力。其核心优势在于极高的token效率,能将成本降至可比模型的四分之一,同时综合智能接近GPT-5.4非推理水平,实现了高智能与低生产成本的结合。该模型在SWE-bench、AIME26等生产相关评测中领先,擅长代码、Agent编排等实际应用。蚂蚁依托支付宝场景与海量数据,通过开放API策略推动行业竞争重点从刷榜转向生产落地。
说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...
Ling-2.6-flash from @AntLingAGI is now open source, with day zero support on Modular Cloud! Fast MoE for agent workflows...
How big is my personal Karpathy knowledge wiki stored in GBrain now? 74,114 pages. 117,855 edges. 281,700 timeline entri...
Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务,仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户,他指出 GitHub 频繁的故障已严重影响开发,特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为,在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施,但微软难以维持其可靠性。这揭示了一个市场机会:若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务,将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。
Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...
inclusionAI 发布了 Ling-2.6-1T 模型,这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力,同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展,为研究者和开发者提供了可访问的高性能工具。
Builders are voting with their tokens 🔥 SiliconFlow is now the #1 third-party model provider by daily token usage On @O...
Warp宣布开源后,其GitHub仓库在一天内获得超过3万星标,热度极高。此举被视为开创了“AI原生的开源协作范式”,其核心在于引入AI代理(如Oz代理)自动执行编码、测试、代码审查和技术文档生成等任务。这预示着未来开发者的角色将转向提出创意、把控质量和决策方向。此举与Cal.com因AI风险而闭源的做法形成鲜明对比,Warp通过AI技术将开源协作的优势极大化。用户现可在线实时观察数百个AI代理协同处理代码、修复漏洞的进程,这可能是未来十年软件开发模式的一次重要预演。
Warp is now open-source.
Warp 开源啦 ?! @warpdotdev 👍🏻 Warp cline 正式宣布开源,AGPL License: https://github.com/warpdotdev/warp 和开源发布同步的是一套以 Agent 为中心的协作方式:用云端编排平台 Oz 让 Agent 承担大部分编码、规划、测试等重活,人类侧重方向、审阅与验证。 OpenAI 是新开源仓库的创始赞助方,Oz 工作流里用的是 GPT-5.5 模型。 [引用 @zachlloydtweets]:http://x.com/i/article/2049151514380267520
http://x.com/i/article/2049151514380267520
蚂蚁集团百灵大模型宣布开源Ling-2.6-flash,提供BF16、FP8、INT4等多个版本供开发者灵活选用。该模型总参数量104B,激活参数7.4B,是一款Instruct模型。官方基于开发者反馈优化了中英文切换及主流编程框架适配效果。其核心优势包括:采用混合线性架构,在4卡H20上推理速度最快达340 tokens/s;通过Token效率优化,在评测中消耗的tokens仅为同类模型的约1/10;针对Agent场景增强了工具调用与任务执行能力,在多项评测中达到先进水平。模型已在Hugging Face和ModelScope平台开源。
Ling-2.6-flash 今日正式开源,同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter,一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内,团队基于开发者反馈进行多轮优化,改善了中英文自然切换能力,并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。
🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...
微软开源的VibeVoice-ASR是一个9B参数语音转文字模型,采用MIT协议。其核心优势在于单次可处理长达60分钟的连续音频,并直接输出带说话人、时间戳的结构化文本,原生支持50多种语言及中英混说。实测在128GB内存的MacBook Pro上,其4-bit量化版转录一小时音频约需9分钟,但预填充阶段内存峰值达61.5GB,要求设备内存至少64GB。模型存在单次60分钟时长限制,且对录音环境变化敏感,但为播客、会议等长音频转录提供了简化流程。
Microsoft's MIT licensed VibeVoice speech-to-text model (think Whisper with speaker diarization) is really good - my not...
针对消费级GPU服务器内存有限和PCIe互联慢的问题,研究团队提出了RoundPipe流水线调度方案。该方法通过将GPU视为无状态工作节点,以轮询方式动态分配计算阶段,打破了权重绑定限制,实现了接近零气泡的流水线。系统集成了优先级感知传输调度、细粒度事件同步协议与自动分层划分算法。在8块RTX 4090的服务器上测试表明,其对1.7B至32B模型的微调速度比现有最优基线快1.48至2.16倍,并能单机完成Qwen3-235B模型(31K序列长度)的LoRA微调。该工具已作为开源Python库发布。
智能终端工具Warp宣布开源,并引入由云端AI(Oz)驱动的协作开发模式,该AI可负责代码编写、测试等任务,开发者主要进行审核。OpenAI成为首位赞助商,其GPT模型驱动开源仓库的智能体工作流。产品改进包括支持Kimi、MiniMax、通义千问等多款开源AI模型,具备自动选择最优模型功能;提供高度可定制的界面,支持从纯终端到完整AI开发环境;新增配置文件,便于跨设备迁移和程序化控制。
Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...
NVIDIA 重磅发布!🚀 Nemotron 3 Nano Omni 多模态开源模型来了! 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型(语言+视觉+语音+视频+音频一体化) 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源(权重 + 数据 + 配方),领跑多项榜单 可通过 NVIDIA NIM API 免费试用!完美驱动多代理工作流。
Meet Nemotron 3 Nano Omni 👋 Our latest addition to the Nemotron family is the highest efficiency, open multimodal model...
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Sigma发布了一款开源私有AI浏览器,其核心是将本地大语言模型(如Qwen、Gemma、Nemotron)与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体,能直接读取页面内容、理解用户意图,并执行点击、输入、总结等自动化操作,从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险,所有计算均在用户本地设备完成,确保了隐私安全和响应速度。
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
NVIDIA推出Nemotron 3 Nano Omni模型,其定位并非通用聊天机器人,而是作为智能体系统中的轻量级感知模块。该模型采用30B-3B混合专家架构,在处理视觉、音频和文本多模态输入时,吞吐量可比同类开源全模态模型提升高达9倍。它旨在充当多智能体栈中的“眼睛和耳朵”,负责感知屏幕、文档和音频等信息,并将结构化上下文传递给如Nemotron Super(执行)和Ultra(规划)等推理层,从而优化大规模、高频率调用的智能体工作流。模型完全开源,现已登陆Hugging Face。
Token efficiency has become a major battleground, Ling-2.6-flash released by @AntLingAGI just enters the race 🔥 ✨ 104B/...
Today is my first day as a DevRel Lead at @OpenRouter 🙌 I've been a fan and user of OpenRouter for a while now, ridicul...
Anthropic宣布以企业赞助商身份加入Blender开发基金。该基金旨在支持开源3D创作套件Blender的持续开发。作为企业级赞助商,Anthropic将提供资金支持,助力Blender在3D建模、动画和渲染等核心功能的研发。此举标志着AI公司与开源图形软件社区的重要合作,将进一步推动创意工具的发展。相关新闻在Hacker News上获得了111个社区积分。
🎉 Day-0 vLLM support for Ling-2.6-flash from @AntLingAGI! Ling-2.6-flash is an instant (instruct) MoE model built for r...