AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
4月28日周二
18:36Berryxia.AI56商汤开源多模态大模型SenseNova-U1,推动本地化部署
17:35歸藏(guizang.ai)65小米开源MiMo模型并推出百万亿Token激励计划
17:15Alibaba Cloud28阿里云战略支持TNG Digital FINHACK 2026,携手马来西亚创新者共筑金融科技未来
14:07SiliconFlow43SiliconFlow成第三方模型日调用量榜首
13:33Simon Willison 博客60pip 26.1 新特性:锁文件与依赖冷却期
10:49SemiAnalysis57DeepSeek V4 Pro在vLLM性能测试中展现8倍加速
10:19IT之家(RSS)32香蕉派推出 BPI-SM10 开发板:进迭时空 K3 RISC-V 处理器,AI 算力 60 TOPS
08:00HuggingFace Daily Papers(社区热门论文)54FAMA:面向交互式工具使用环境的开源大语言模型故障感知元智能体框架
08:00HuggingFace Daily Papers(社区热门论文)57Praxy Voice:零商业数据成本,通过语音提示恢复与BUPS实现商业级印度语TTS
03:29François Chollet60Keras Kinetic发布新版Alpha 0.0.2
03:04Hacker News 热门(buzzing.cc 中文翻译)53GitHub 目前出现故障
01:59Google AI Developers52Gemma 4单GPU高并发处理复杂任务演示
01:50Xiaomi MiMo53小米MiMo Orbit计划:开放100T令牌并支持AI应用生态
01:48Xiaomi MiMo71精选小米开源MiMo-V2.5双模型,支持百万上下文与商用
01:27公众号:小米 MiMo45小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动
4月27日周一
23:26Hacker News 热门(buzzing.cc 中文翻译)64Show HN: 我开发的 OSS Agent 在 Gemini-3-flash-preview 上夺得 TerminalBench 榜首
22:58小互29阿里推出HappyHorse 字节幽默回应
22:26Hacker News 热门(buzzing.cc 中文翻译)50法国的Mistral公司凭借"非美国"这一身份,打造了价值140亿美元的人工智能帝国
21:58elvis59开源评估平台FutureAGI助力构建可信自进化AI代理
20:27向阳乔木33模型翻译失误引热议,GOAT直译山羊欠妥
17:20Kimi.ai50Kimi登顶周榜致谢开发者
14:19IT之家(RSS)52OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线
13:18IT之家(RSS)67未来三年小米 AI 投入超 600 亿元:MiMo-V2.5 将开源,几乎适配国内所有芯片
11:00meng shao67Browser Use 团队推出「Browser Use Box (bux)」:个人专属的24/7在线浏览器智能体盒子
09:18IT之家(RSS)66机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程
08:19ginobefun49软件功能壁垒消失,未来竞争聚焦分发、组织与协作
08:00HuggingFace Daily Papers(社区热门论文)64Nemotron 3 Nano Omni:高效开放的多模态智能模型
08:00HuggingFace Daily Papers(社区热门论文)63Diffusion Templates:可控扩散的统一插件框架
08:00HuggingFace Daily Papers(社区热门论文)61用数据编程:基于原始语料库的自改进大语言模型的测试驱动数据工程
06:29Orange AI48GitHub星标文化异化,沦为AI界"小红书"
4月26日周日
23:52Hacker News 热门(buzzing.cc 中文翻译)42Eden AI--OpenRouter的欧洲替代方案
23:19Berryxia.AI36开源"悟空skills"回应质疑,强调与"女娲skills"的差异化迭代
15:20IT之家(RSS)43国内首家、全球第四家,砺算科技 7G100 显卡通过微软 WHQL 认证
12:20IT之家(RSS)49国家超算互联网推出 DeepSeek-V4 限时免费对话服务
05:51SemiAnalysis36DeepSeekv4获InferenceX GB200首日支持
03:51swyx 🇸🇬70精选DeepSeek-V4预览版正式发布,开启百万上下文高性价比时代
02:50Deedy52Pangram扩展成社交媒体灌文克星
01:01SemiAnalysis50紧急救援:GB300集群宕机之际,CoreWeave助力DeepSeek-V4基准测试
4月25日周六
23:26IT之家(RSS)36我国科学家发布"灵境造物"智能科研工具,面向全球科研主体开放
20:47The Decoder:AI News(RSS)47Qwen3.6-27B 在多数编程基准测试中击败了规模大得多的前代模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月28日
18:36
Berryxia.AI@berryxia
56
商汤开源多模态大模型SenseNova-U1,推动本地化部署

商汤发布开源可商用的多模态大模型SenseNova-U1,采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版,适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度,并即将推出办公场景应用功能。

图像生成多模态开源生态模型发布
17:35
歸藏(guizang.ai)@op7418
65
小米宣布将其MiMo-V2.5系列模型全部开源,采用宽松的MIT协议,允许自由商用、二次训练与微调。同时,公司推出了Orbit 100T Token计划,旨在激励开发者和构建者。该计划包含两部分:面向AI builder的"百万亿Token创造者激励计划",成功申请者最高可获得价值659元的16亿Credits;以及面向Agent框架团队的"Agent生态共建计划",将为框架提供MiMo token限免支持,让终端用户免费体验模型。

歸藏(guizang.ai): 小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...

产品更新开源生态编码
17:15
Alibaba Cloud@alibaba_cloud
28
阿里云战略支持TNG Digital FINHACK 2026,携手马来西亚创新者共筑金融科技未来

阿里云作为战略合作伙伴,支持了TNG Digital FINHACK 2026活动。该活动汇聚了300多名马来西亚创新者,利用人工智能应对从欺诈预防到金融普惠等现实金融科技挑战。阿里云提供了云基础设施、AI工具(包括排名第一的开源模型Qwen和下一代AI驱动编码平台Qoder)以及现场解决方案架构师支持,旨在帮助未来人才构建可扩展的、面向真实世界的解决方案。活动致力于共同加速马来西亚金融科技的未来,使其更具包容性、安全性和智能化。

开源生态行业动态
14:07
SiliconFlow@SiliconFlowAI
43
开发者们正在用他们的代币投票 🔥 SiliconFlow 现已成为日使用代币量排名第一的第三方模型提供商 在 @OpenRouter 上, • 每日约 2800 亿代币 • 每月约 1.9 万亿代币 • 33 个前沿模型:DeepSeek V4 系列、GLM 5.1、Kimi K2.6 等 衷心感谢每一位与我们共同构建的开发者 更多精彩即将到来 🚀
开源生态行业动态部署/工程
13:33
Simon Willison 博客
60
pip 26.1 新特性:锁文件与依赖冷却期

Python 包管理工具 pip 发布 26.1 版本,引入两项关键功能。一是新增 pip lock 命令,可生成记录所有依赖精确版本的锁文件(如 pylock.toml)。二是提供 --uploaded-prior-to PXD 选项以实现依赖冷却期,可强制安装指定天数前发布的旧版本包,例如使用 P4D 安装至少 4 天前的 LLM 版本 0.30,有助于提升供应链安全。该版本已停止对 Python 3.9 的支持。

开源生态教程/实践部署/工程
10:49
SemiAnalysis@SemiAnalysis_
57
DeepSeek V4 Pro在vLLM性能测试中展现8倍加速

InferenceX已将DeepSeek V4 Pro集成至vLLM项目,在B200、B300、H200和GB200等硬件上的性能测试显示,B300的推理速度比H200快达8倍。团队正在基于vLLM 0.20版本进行基准测试,该版本引入了全新的DeepGEMM MegaMoE技术,将专家并行调度、组合、通用矩阵乘法及SwiGLU激活函数融合为单一巨型内核,预计将带来更优性能。文中感谢了来自NVIDIA AI、社区贡献者及相关团队的开发人员对开源项目的投入与努力。

产品更新开源生态部署/工程
10:19
IT之家(RSS)
32
香蕉派推出 BPI-SM10 开发板:进迭时空 K3 RISC-V 处理器,AI 算力 60 TOPS

香蕉派本月发布了BPI-SM10微型计算机,搭载进迭时空K3 RISC-V处理器,号称是全球首个符合RVA23标准的RISC-V AI CPU平台。该处理器采用8核设计,主频2.4 GHz,集成的AI加速器可提供最高60 TOPS的算力,并板载支持最高32GB LPDDR5-6400内存。整机功耗预计在18-35瓦之间,可支撑300亿参数的AI模型并以每秒10个Token的速度运行。载板尺寸为103 x 90.5 x 35毫米,提供了PCIe 4.0、USB 3.2、DisplayPort 1.2、千兆以太网及MIPI-CSI等丰富接口。

产品更新开源生态端侧
08:00
HuggingFace Daily Papers(社区热门论文)
54
FAMA:面向交互式工具使用环境的开源大语言模型故障感知元智能体框架

针对开源大语言模型在模拟真实对话的工具使用场景中,因规模较小、上下文有限导致的错误累积问题,研究团队提出故障感知元智能体框架FAMA。该框架首先分析基线智能体的故障轨迹以识别常见错误,随后在决策前启动最小规模的专用智能体,向工具使用智能体注入针对性上下文以应对这些故障。实验表明,FAMA使多种开源LLM在评估中的性能较基线提升最高达27%,证明通过专用智能体针对性处理常见故障,能有效提升多轮次工具使用智能体的可靠性。

智能体开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
57
Praxy Voice:零商业数据成本,通过语音提示恢复与BUPS实现商业级印度语TTS

Praxy Voice提出一种无需商业训练数据、不重新训练声学解码器,即可将非印度语系基础TTS模型提升至商业级印度语输出质量的方法。其结合三项技术:BUPS统一音素空间将七种印度文字罗马化;仅在文本标记预测器上训练LoRA适配器;以及通过同语言参考音频与特定采样配置实现语音提示恢复。在泰卢固语、泰米尔语和印地语的评估中,该系统在音韵指标上达到或略微超越商业基线。针对语码混合场景,额外引入IndicF5分支,显著降低了混合语句的错误率。项目已开源相关资源。

开源生态论文/研究语音
03:29
François Chollet@fchollet
60
Keras Kinetic 发布了新的 alpha 版本:v0.0.2!包括新的文档网站:http://kinetic.readthedocs.io Kinetic 是我最喜欢的 Keras 团队新发布:一个超级简单的类 Modal API,用于在 TPU 上运行训练任务。
产品更新开源生态部署/工程
03:04
Hacker News 热门(buzzing.cc 中文翻译)
53
GitHub 目前出现故障

GitHub服务目前出现故障,用户访问受到影响。故障状态可通过其官方状态页面(www.githubstatus.com)实时查看。该事件在技术社区Hacker News上引发关注,相关讨论帖获得了137个社区积分。故障发生时间记录为2026年4月27日17:42(UTC时间)。

GitHub开源生态行业动态
01:59
Google AI Developers@googleaidevs
52
深入了解 @GoogleGemma 4 如何优化以在单个 GPU 上处理高并发复杂任务(例如生成 SVG)。 ✓ 10 多个会话被发送到 26B A4B 模型 ✓ 系统路由、加速并处理这些工作负载--没有瓶颈 ✓ 实时仪表板可视化跟踪负载均衡,显示活动槽位、上下文大小和令牌生成速度 观看演示视频以了解实际运行情况 ⬇️
Google产品更新开源生态部署/工程
01:50
Xiaomi MiMo@XiaomiMiMo
53
小米MiMo Orbit计划:开放100T令牌并支持AI应用生态

小米推出MiMo Orbit计划,旨在超越单纯开源模型权重,构建开放的AI生态系统。该计划包含两大核心举措:一是向全球AI开发者提供100万亿(100T)令牌的免费资源资助,申请者有机会获得最高1.6B积分的月度计划,申请窗口为2026年4月27日至5月27日;二是启动Agent生态系统项目,为全球Agent框架提供免费的集成接入和无摩擦的用户入驻支持,以促进下一代AI应用的发展。

智能体开源生态行业动态
01:48
Xiaomi MiMo@XiaomiMiMo
精选71
小米开源MiMo-V2.5双模型,支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型,采用MIT许可,支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型:MiMo-V2.5-Pro专为复杂智能体和编码任务设计,在GDPVal-AA和ClawEval基准测试中位列开源模型第一;MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调,模型的价值不仅在于排名,更在于其解决实际问题的能力,并已公开模型权重与技术博客。

智能体开源生态模型发布编码

推荐理由:小米把 MiMo-V2.5 直接 MIT 开源且支持商用,1M 上下文 + Agent 能力在开源阵营里确实能打,做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。
01:27
公众号:小米 MiMo
45
小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动

小米开源 MiMo-V2.5 系列模型,同时启动 Orbit 百万亿 Token 计划,携手全球开发者与 Agent 框架共建开源繁荣生态。

智能体开源生态模型发布
4月27日
23:26
Hacker News 热门(buzzing.cc 中文翻译)
64
Show HN: 我开发的 OSS Agent 在 Gemini-3-flash-preview 上夺得 TerminalBench 榜首

一款名为OSS Agent的开源智能体在谷歌Gemini-3-flash-preview模型上运行,成功登顶终端操作基准测试TerminalBench榜首。该智能体由开发者独立构建,其GitHub仓库地址已公开。这一成果在技术社区Hacker News上获得了113个点赞,引发了广泛关注。

智能体产品更新开源生态评测/基准
22:58
小互@xiaohu
29
阿里的 HappyHorse 上线了 字节的回应🤣
开源生态行业动态
22:26
Hacker News 热门(buzzing.cc 中文翻译)
50
法国的Mistral公司凭借"非美国"这一身份,打造了价值140亿美元的人工智能帝国

法国人工智能公司Mistral以“非美国”身份为核心战略,在全球AI竞争中脱颖而出,成功构建了一个价值140亿美元的帝国。公司凭借欧洲背景和市场定位,专注于数据隐私和监管合规优势,与美国科技巨头形成差异化竞争,从而吸引投资并实现快速增长,成为AI领域的重要力量。这一案例凸显了身份差异化在科技行业中的关键作用。

开源生态现象/趋势行业动态
21:58
elvis@omarsar0
59
开源评估平台FutureAGI助力构建可信自进化AI代理

构建自进化AI代理必须依赖可靠的评估体系,否则将浪费资源。@FutureAGI_ 开源其平台,整合了领先的评估工具与方法,为开发者提供完整基础设施。该平台涵盖幻觉、毒性、偏见等多维度可修改评估器,集成六种提示优化算法,支持多轮模拟测试与实时安全防护,并提供多语言追踪及兼容OpenAI的网关。其开源特性旨在建立可信任的评估基础,推动自进化AI代理领域发展。

智能体产品更新开源生态评测/基准
20:27
向阳乔木@vista8
33
DeepSeek 牛逼! 不过得吐槽下Grok的翻译,这个语境下的GOAT翻译成山羊… 不翻译就好啊 这应该是没用大模型翻译能力吧,再弱的模型都不应该犯这样的错误。

Arthur Zucker: Reading @deepseek_ai 's v4 paper.... absolute hats off. Every problem has a mathematical solution, nothing is left to ch...

DeepSeek大佬观点开源生态
17:20
Kimi.ai@Kimi_Moonshot
50
Kimi K2.6 现已登上 OpenRouter 每周 LLM 排行榜首位 🏆 衷心感谢每一位使用 Kimi 进行开发的开发者。我们将继续埋头苦干,持续交付。
开源生态模型发布评测/基准
14:19
IT之家(RSS)
52
OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线

OpenAI开源了15亿参数的PII脱敏模型Privacy Filter,采用混合专家设计,每次仅激活约5000万参数,可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息,在基准测试中F1分数达97.43%。该模型作为本地预过滤层,帮助用户在文本发送至云端AI前脱敏数据,但高敏感场景仍需结合人工审核。

OpenAI开源生态模型发布部署/工程
13:18
IT之家(RSS)
67
未来三年小米 AI 投入超 600 亿元:MiMo-V2.5 将开源,几乎适配国内所有芯片

小米宣布未来三年在AI领域的投入将超过600亿元。其基座大模型MiMo开始收费后用户留存率超过35%,即将开源的MiMo-V2.5模型在AA智能与Agent指数上位列全球开源大模型并列第一,并几乎适配国内所有芯片。小米首代机器人VLA大模型团队仅用6个月完成开发,并判断机器人的“GPT3时刻”将在未来1-2年到来。在企业效率方面,小米预计通过全面拥抱Agent技术,整体效率将提升500%。此外,小米的智能助理Miclaw未来将与小爱同学全面融合,并贯通人车家全生态设备。

智能体开源生态模型发布
11:00
meng shao@shao__meng
67
Browser Use 团队推出「Browser Use Box (bux)」:个人专属的24/7在线浏览器智能体盒子

Browser Use团队发布Browser Use Box(bux),一个可部署在自有设备(如VPS、树莓派)的24/7在线个人代理盒子。它通过将Claude Code Agent部署于本地,并将浏览器外移至Browser Use Cloud,解决了传统智能体会话不持久、本地浏览器环境脆弱(受2FA/CAPTCHA等限制)以及无法随时随地调用的问题。用户可通过Telegram或Web终端远程触发,Agent通过CDP-over-WSS协议驱动云端真实Chromium执行自动化任务(如预订航班、回复消息)。该项目已开源。

Larsen Cundric: Introducing: Browser Use Box (bux). Your 24/7 personal agent box, powered by Browser Harness. ♞ We got tired of agents t...

智能体产品更新开源生态
09:18
IT之家(RSS)
66
机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程

小米正式发布了其开源视觉语言动作大模型Xiaomi-Robotics-0的真机后训练全流程。通过仅20小时的任务数据训练,该模型成功掌握了将耳机精准收纳进耳机盒的高难度动作,并能连续丝滑完成多个耳机的收纳。此任务要求模型具备亚毫米级的空间感知精度,以应对耳机与槽位间极小的公差,同时能快速修正动作偏差,克服耳机盒表面最低Ra0.03μm粗糙度带来的位移挑战。该模型此前已在HuggingFace全球VLA模型下载榜位列第六。

具身智能开源生态教程/实践
08:19
ginobefun@hongming731
49
软件功能壁垒消失,未来竞争聚焦分发、组织与协作

软件功能已非核心壁垒,稀缺资源转向分发能力、组织模式与协作机制。Snapchat创始人指出,新社交产品需依赖资本或平台规模破局;Replit将未来押注于Builders与Sales两类角色,瞄准十亿开发者市场;GitHub Next强调,AI大幅缩短产品实现周期后,团队目标对齐与协作效率已成为关键瓶颈。

GitHub开源生态现象/趋势
08:00
HuggingFace Daily Papers(社区热门论文)
64
Nemotron 3 Nano Omni:高效开放的多模态智能模型

Nemotron 3 Nano Omni是该系列最新模型,首次原生支持音频、文本、图像和视频输入。通过架构、训练数据及方法的改进,其在所有模态上的准确性均超越前代Nemotron Nano V2 VL,尤其在真实文档理解、长音视频理解和智能体计算机使用方面表现领先。该模型基于高效的Nemotron 3 Nano 30B-A3B骨干网络,并融入创新的多模态令牌缩减技术,实现了比同类规模模型更低的推理延迟和更高的吞吐量。为促进后续研发,团队发布了BF16、FP8和FP4格式的模型检查点,以及部分训练数据和代码库。

多模态开源生态模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
63
Diffusion Templates:可控扩散的统一插件框架

针对现有可控扩散方法因架构孤立、流程不兼容导致的碎片化问题,研究团队提出统一开源插件框架Diffusion Templates。该框架通过模板模型、模板缓存和模板管道三大核心组件,实现基础模型推理与可控能力注入的解耦。其系统级接口设计支持KV-Cache、LoRA等多种异构能力载体。基于此构建的模型库覆盖了结构控制、图像编辑、超分辨率等十类任务,展现了框架在模块化、可组合性及跨模型可扩展性方面的统一能力。所有代码、模型与数据集将开源。

图像生成开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
用数据编程:基于原始语料库的自改进大语言模型的测试驱动数据工程

研究提出“用数据编程”新范式,通过将结构化知识作为训练与评估的共同基础,将数据工程生命周期精确映射至软件开发流程:训练数据即源代码,模型训练即编译,基准测试即单元测试。模型失败可被分解为概念缺失或推理链断裂,并能追溯到具体数据缺陷,通过针对性修补实现改进。该方法在十六个学科中得到验证,修复周期能带来模型性能和架构的持续提升,且不损害通用能力。研究同时开源了结构化知识库、基准测试套件和训练语料库。

开源生态数据/训练论文/研究
06:29
Orange AI@oran_ge
48
GitHub星标文化异化,沦为AI界"小红书"

推文以开放麦分享为引,尖锐指出GitHub在AI浪潮中正演变为类似“小红书”的社区。核心论证围绕“星标”功能异化展开:其一,Star从实用价值认可退化为对项目叙事的情感共鸣;其二,项目README从技术文档转变为营销导向的落地页;其三,Star数量出现可购买现象,市场价约20元人民币可购100个。这一观察揭示了开源平台在热度驱动下,其核心评价体系与内容生态正在发生显著偏移。

GitHub开源生态现象/趋势
4月26日
23:52
Hacker News 热门(buzzing.cc 中文翻译)
42
Eden AI--OpenRouter的欧洲替代方案

Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。

产品更新开源生态部署/工程
23:19
Berryxia.AI@berryxia
36
开源"悟空skills"回应质疑,强调与"女娲skills"的差异化迭代

作者回应外界对其开发的“悟空skills”是否抄袭“女娲skills”的质疑,澄清其项目是在“女娲skills”启发下,根据自身需求进行独立迭代和完善的产物,并预告即将开源以供公众自行比较差异。背景信息显示,“女娲.skill”已取得显著关注,并被多家主流公司的Agent产品采用。

花叔: 女娲.skill半个多月,14k+ stars了。并且已经分别被腾讯、Kimi、智谱的Agent产品直接植入作为默认skill使用。 如果你还不知道这是什么的话,这张图可以帮你建立起一个基本的认知。

智能体MCP/工具其他开源生态
15:20
IT之家(RSS)
43
国内首家、全球第四家,砺算科技 7G100 显卡通过微软 WHQL 认证

砺算科技7G100显卡已通过微软WHQL认证,成为国内首家、全球第四家获得该认证的GPU公司。WHQL认证是微软针对硬件与Windows系统兼容性和稳定性的严格测试标准。7G100系列GPU采用TrueGPU架构,基于6nm制程工艺,从计算核心到整体架构均为砺算科技自主研发,不依赖外部技术授权,显著提升了应对外部技术限制风险的能力。

开源生态端侧行业动态
12:20
IT之家(RSS)
49
国家超算互联网推出 DeepSeek-V4 限时免费对话服务

4月26日,国家超算互联网上线DeepSeek-V4限时免费对话服务。用户登录官网即可体验其百万Token超长上下文实时对话能力。此举标志着百万上下文从高端选配变为基础标配,进入普惠时代。该能力可一次性处理如《三体》三部曲总字数的文本,支持全文分析与深度推理。通过国家级算力基础设施与顶级大模型的融合,此举大幅降低了大规模AI应用的门槛与成本,推动AI技术更广泛地赋能千行百业。

DeepSeek产品更新开源生态
05:51
SemiAnalysis@SemiAnalysis_
36
DAVIS, 2026年4月25日 - InferenceX 已为 @vllm_project 添加了 DeepSeekv4,以支持 GB200 分解的 day 0 支持!感谢 @flowpow123 @rogerw0108 @NVIDIAAIDev @inferact 的快速支持和工程工作!
开源生态行业动态部署/工程
03:51
swyx 🇸🇬@swyx
精选70
DeepSeek团队正式推出并开源了DeepSeek-V4预览版模型,标志着高性价比的百万上下文长度时代到来。该系列包含两个模型:DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数,性能媲美顶级闭源模型;DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数,主打快速、高效与经济。模型现已在官方平台通过专家模式和即时模式开放试用,API也已同步更新。完整的技术报告和模型权重已在Hugging Face平台发布,供社区研究和应用。

DeepSeek: 🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 Dee...

DeepSeek开源生态模型发布

推荐理由:DeepSeek-V4 把 MoE 推到 1.6T 总参、49B 活跃,百万上下文 + 开源权重,这是开源阵营第一次在旗舰级闭源模型面前不落下风,做长上下文应用的团队该认真测一下了。
02:50
Deedy@deedydas
52
新的Pangram扩展程序绝对是X、LinkedIn和Reddit上所有灌水帖的克星。 消除灌水的颠覆性方法。
产品更新开源生态
01:01
SemiAnalysis@SemiAnalysis_
50
在DeepSeek发布的关键时刻,原GB300集群意外宕机。云服务商CoreWeave在计算资源危机中紧急调配,找到了两套备用的GB300开发机架,使团队得以顺利运行DeepSeek-V4进行InferenceX基准测试。据引用推文,InferenceX已实现对DeepSeek-V4的Day 0支持,并利用Blackwell B300获得了相比Hopper架构5倍的性能提升。目前,InferenceX团队正全力扩展对更多新硬件架构的即时支持。

SemiAnalysis: SAN FRANCISCO, April 24, 2026 - InferenceX has added Day 0 DeepSeek v4 support for @sgl_project's amazing Blackwell B300...

产品更新开源生态部署/工程
4月25日
23:26
IT之家(RSS)
36
我国科学家发布"灵境造物"智能科研工具,面向全球科研主体开放

中国科学技术大学在合肥发布“灵境造物”智能科研工具,面向全球科研人员、机构及企业开放。该系统基于昇腾、鲲鹏、华为云等全栈国产化软硬件生态构建,整合了科学大模型、科研机器人、自动计算与实验等能力,形成操作系统级入口。它依托千余台科研机器人和万余台智能工作站,深度整合千余个科研技能,旨在实现自主科研与物质创制,以破解传统科研成本高、周期长、转化难等痛点。此举标志着人工智能驱动的科学研究正向工程化、平台化与开放共享迈进。

产品更新开源生态部署/工程
20:47
The Decoder:AI News(RSS)
47
Qwen3.6-27B 在多数编程基准测试中击败了规模大得多的前代模型

阿里巴巴新发布的开源模型 Qwen3.6-27B 在多项编程基准测试中超越了其前代模型。该模型仅拥有 270 亿参数,而其前代模型的参数量是其 15 倍。这一结果表明,模型在代码能力上实现了显著的效率提升,以更小的规模取得了更优的性能。

开源生态模型发布编码
‹ 上一页
1…2829303132…36
下一页 ›