商汤发布开源可商用的多模态大模型SenseNova-U1,采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版,适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度,并即将推出办公场景应用功能。
商汤发布开源可商用的多模态大模型SenseNova-U1,采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版,适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度,并即将推出办公场景应用功能。
小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...
阿里云作为战略合作伙伴,支持了TNG Digital FINHACK 2026活动。该活动汇聚了300多名马来西亚创新者,利用人工智能应对从欺诈预防到金融普惠等现实金融科技挑战。阿里云提供了云基础设施、AI工具(包括排名第一的开源模型Qwen和下一代AI驱动编码平台Qoder)以及现场解决方案架构师支持,旨在帮助未来人才构建可扩展的、面向真实世界的解决方案。活动致力于共同加速马来西亚金融科技的未来,使其更具包容性、安全性和智能化。
Python 包管理工具 pip 发布 26.1 版本,引入两项关键功能。一是新增 pip lock 命令,可生成记录所有依赖精确版本的锁文件(如 pylock.toml)。二是提供 --uploaded-prior-to PXD 选项以实现依赖冷却期,可强制安装指定天数前发布的旧版本包,例如使用 P4D 安装至少 4 天前的 LLM 版本 0.30,有助于提升供应链安全。该版本已停止对 Python 3.9 的支持。
InferenceX已将DeepSeek V4 Pro集成至vLLM项目,在B200、B300、H200和GB200等硬件上的性能测试显示,B300的推理速度比H200快达8倍。团队正在基于vLLM 0.20版本进行基准测试,该版本引入了全新的DeepGEMM MegaMoE技术,将专家并行调度、组合、通用矩阵乘法及SwiGLU激活函数融合为单一巨型内核,预计将带来更优性能。文中感谢了来自NVIDIA AI、社区贡献者及相关团队的开发人员对开源项目的投入与努力。
香蕉派本月发布了BPI-SM10微型计算机,搭载进迭时空K3 RISC-V处理器,号称是全球首个符合RVA23标准的RISC-V AI CPU平台。该处理器采用8核设计,主频2.4 GHz,集成的AI加速器可提供最高60 TOPS的算力,并板载支持最高32GB LPDDR5-6400内存。整机功耗预计在18-35瓦之间,可支撑300亿参数的AI模型并以每秒10个Token的速度运行。载板尺寸为103 x 90.5 x 35毫米,提供了PCIe 4.0、USB 3.2、DisplayPort 1.2、千兆以太网及MIPI-CSI等丰富接口。
针对开源大语言模型在模拟真实对话的工具使用场景中,因规模较小、上下文有限导致的错误累积问题,研究团队提出故障感知元智能体框架FAMA。该框架首先分析基线智能体的故障轨迹以识别常见错误,随后在决策前启动最小规模的专用智能体,向工具使用智能体注入针对性上下文以应对这些故障。实验表明,FAMA使多种开源LLM在评估中的性能较基线提升最高达27%,证明通过专用智能体针对性处理常见故障,能有效提升多轮次工具使用智能体的可靠性。
Praxy Voice提出一种无需商业训练数据、不重新训练声学解码器,即可将非印度语系基础TTS模型提升至商业级印度语输出质量的方法。其结合三项技术:BUPS统一音素空间将七种印度文字罗马化;仅在文本标记预测器上训练LoRA适配器;以及通过同语言参考音频与特定采样配置实现语音提示恢复。在泰卢固语、泰米尔语和印地语的评估中,该系统在音韵指标上达到或略微超越商业基线。针对语码混合场景,额外引入IndicF5分支,显著降低了混合语句的错误率。项目已开源相关资源。
GitHub服务目前出现故障,用户访问受到影响。故障状态可通过其官方状态页面(www.githubstatus.com)实时查看。该事件在技术社区Hacker News上引发关注,相关讨论帖获得了137个社区积分。故障发生时间记录为2026年4月27日17:42(UTC时间)。
小米推出MiMo Orbit计划,旨在超越单纯开源模型权重,构建开放的AI生态系统。该计划包含两大核心举措:一是向全球AI开发者提供100万亿(100T)令牌的免费资源资助,申请者有机会获得最高1.6B积分的月度计划,申请窗口为2026年4月27日至5月27日;二是启动Agent生态系统项目,为全球Agent框架提供免费的集成接入和无摩擦的用户入驻支持,以促进下一代AI应用的发展。
小米正式开源MiMo-V2.5系列模型,采用MIT许可,支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型:MiMo-V2.5-Pro专为复杂智能体和编码任务设计,在GDPVal-AA和ClawEval基准测试中位列开源模型第一;MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调,模型的价值不仅在于排名,更在于其解决实际问题的能力,并已公开模型权重与技术博客。
小米开源 MiMo-V2.5 系列模型,同时启动 Orbit 百万亿 Token 计划,携手全球开发者与 Agent 框架共建开源繁荣生态。
一款名为OSS Agent的开源智能体在谷歌Gemini-3-flash-preview模型上运行,成功登顶终端操作基准测试TerminalBench榜首。该智能体由开发者独立构建,其GitHub仓库地址已公开。这一成果在技术社区Hacker News上获得了113个点赞,引发了广泛关注。
法国人工智能公司Mistral以“非美国”身份为核心战略,在全球AI竞争中脱颖而出,成功构建了一个价值140亿美元的帝国。公司凭借欧洲背景和市场定位,专注于数据隐私和监管合规优势,与美国科技巨头形成差异化竞争,从而吸引投资并实现快速增长,成为AI领域的重要力量。这一案例凸显了身份差异化在科技行业中的关键作用。
构建自进化AI代理必须依赖可靠的评估体系,否则将浪费资源。@FutureAGI_ 开源其平台,整合了领先的评估工具与方法,为开发者提供完整基础设施。该平台涵盖幻觉、毒性、偏见等多维度可修改评估器,集成六种提示优化算法,支持多轮模拟测试与实时安全防护,并提供多语言追踪及兼容OpenAI的网关。其开源特性旨在建立可信任的评估基础,推动自进化AI代理领域发展。
Reading @deepseek_ai 's v4 paper.... absolute hats off. Every problem has a mathematical solution, nothing is left to ch...
OpenAI开源了15亿参数的PII脱敏模型Privacy Filter,采用混合专家设计,每次仅激活约5000万参数,可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息,在基准测试中F1分数达97.43%。该模型作为本地预过滤层,帮助用户在文本发送至云端AI前脱敏数据,但高敏感场景仍需结合人工审核。
小米宣布未来三年在AI领域的投入将超过600亿元。其基座大模型MiMo开始收费后用户留存率超过35%,即将开源的MiMo-V2.5模型在AA智能与Agent指数上位列全球开源大模型并列第一,并几乎适配国内所有芯片。小米首代机器人VLA大模型团队仅用6个月完成开发,并判断机器人的“GPT3时刻”将在未来1-2年到来。在企业效率方面,小米预计通过全面拥抱Agent技术,整体效率将提升500%。此外,小米的智能助理Miclaw未来将与小爱同学全面融合,并贯通人车家全生态设备。
Browser Use团队发布Browser Use Box(bux),一个可部署在自有设备(如VPS、树莓派)的24/7在线个人代理盒子。它通过将Claude Code Agent部署于本地,并将浏览器外移至Browser Use Cloud,解决了传统智能体会话不持久、本地浏览器环境脆弱(受2FA/CAPTCHA等限制)以及无法随时随地调用的问题。用户可通过Telegram或Web终端远程触发,Agent通过CDP-over-WSS协议驱动云端真实Chromium执行自动化任务(如预订航班、回复消息)。该项目已开源。
Introducing: Browser Use Box (bux). Your 24/7 personal agent box, powered by Browser Harness. ♞ We got tired of agents t...
小米正式发布了其开源视觉语言动作大模型Xiaomi-Robotics-0的真机后训练全流程。通过仅20小时的任务数据训练,该模型成功掌握了将耳机精准收纳进耳机盒的高难度动作,并能连续丝滑完成多个耳机的收纳。此任务要求模型具备亚毫米级的空间感知精度,以应对耳机与槽位间极小的公差,同时能快速修正动作偏差,克服耳机盒表面最低Ra0.03μm粗糙度带来的位移挑战。该模型此前已在HuggingFace全球VLA模型下载榜位列第六。
软件功能已非核心壁垒,稀缺资源转向分发能力、组织模式与协作机制。Snapchat创始人指出,新社交产品需依赖资本或平台规模破局;Replit将未来押注于Builders与Sales两类角色,瞄准十亿开发者市场;GitHub Next强调,AI大幅缩短产品实现周期后,团队目标对齐与协作效率已成为关键瓶颈。
Nemotron 3 Nano Omni是该系列最新模型,首次原生支持音频、文本、图像和视频输入。通过架构、训练数据及方法的改进,其在所有模态上的准确性均超越前代Nemotron Nano V2 VL,尤其在真实文档理解、长音视频理解和智能体计算机使用方面表现领先。该模型基于高效的Nemotron 3 Nano 30B-A3B骨干网络,并融入创新的多模态令牌缩减技术,实现了比同类规模模型更低的推理延迟和更高的吞吐量。为促进后续研发,团队发布了BF16、FP8和FP4格式的模型检查点,以及部分训练数据和代码库。
针对现有可控扩散方法因架构孤立、流程不兼容导致的碎片化问题,研究团队提出统一开源插件框架Diffusion Templates。该框架通过模板模型、模板缓存和模板管道三大核心组件,实现基础模型推理与可控能力注入的解耦。其系统级接口设计支持KV-Cache、LoRA等多种异构能力载体。基于此构建的模型库覆盖了结构控制、图像编辑、超分辨率等十类任务,展现了框架在模块化、可组合性及跨模型可扩展性方面的统一能力。所有代码、模型与数据集将开源。
研究提出“用数据编程”新范式,通过将结构化知识作为训练与评估的共同基础,将数据工程生命周期精确映射至软件开发流程:训练数据即源代码,模型训练即编译,基准测试即单元测试。模型失败可被分解为概念缺失或推理链断裂,并能追溯到具体数据缺陷,通过针对性修补实现改进。该方法在十六个学科中得到验证,修复周期能带来模型性能和架构的持续提升,且不损害通用能力。研究同时开源了结构化知识库、基准测试套件和训练语料库。
推文以开放麦分享为引,尖锐指出GitHub在AI浪潮中正演变为类似“小红书”的社区。核心论证围绕“星标”功能异化展开:其一,Star从实用价值认可退化为对项目叙事的情感共鸣;其二,项目README从技术文档转变为营销导向的落地页;其三,Star数量出现可购买现象,市场价约20元人民币可购100个。这一观察揭示了开源平台在热度驱动下,其核心评价体系与内容生态正在发生显著偏移。
Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。
作者回应外界对其开发的“悟空skills”是否抄袭“女娲skills”的质疑,澄清其项目是在“女娲skills”启发下,根据自身需求进行独立迭代和完善的产物,并预告即将开源以供公众自行比较差异。背景信息显示,“女娲.skill”已取得显著关注,并被多家主流公司的Agent产品采用。
女娲.skill半个多月,14k+ stars了。并且已经分别被腾讯、Kimi、智谱的Agent产品直接植入作为默认skill使用。 如果你还不知道这是什么的话,这张图可以帮你建立起一个基本的认知。
砺算科技7G100显卡已通过微软WHQL认证,成为国内首家、全球第四家获得该认证的GPU公司。WHQL认证是微软针对硬件与Windows系统兼容性和稳定性的严格测试标准。7G100系列GPU采用TrueGPU架构,基于6nm制程工艺,从计算核心到整体架构均为砺算科技自主研发,不依赖外部技术授权,显著提升了应对外部技术限制风险的能力。
4月26日,国家超算互联网上线DeepSeek-V4限时免费对话服务。用户登录官网即可体验其百万Token超长上下文实时对话能力。此举标志着百万上下文从高端选配变为基础标配,进入普惠时代。该能力可一次性处理如《三体》三部曲总字数的文本,支持全文分析与深度推理。通过国家级算力基础设施与顶级大模型的融合,此举大幅降低了大规模AI应用的门槛与成本,推动AI技术更广泛地赋能千行百业。
🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 Dee...
SAN FRANCISCO, April 24, 2026 - InferenceX has added Day 0 DeepSeek v4 support for @sgl_project's amazing Blackwell B300...
中国科学技术大学在合肥发布“灵境造物”智能科研工具,面向全球科研人员、机构及企业开放。该系统基于昇腾、鲲鹏、华为云等全栈国产化软硬件生态构建,整合了科学大模型、科研机器人、自动计算与实验等能力,形成操作系统级入口。它依托千余台科研机器人和万余台智能工作站,深度整合千余个科研技能,旨在实现自主科研与物质创制,以破解传统科研成本高、周期长、转化难等痛点。此举标志着人工智能驱动的科学研究正向工程化、平台化与开放共享迈进。
阿里巴巴新发布的开源模型 Qwen3.6-27B 在多项编程基准测试中超越了其前代模型。该模型仅拥有 270 亿参数,而其前代模型的参数量是其 15 倍。这一结果表明,模型在代码能力上实现了显著的效率提升,以更小的规模取得了更优的性能。