AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
5月24日周日
14:27Rohan Paul51二手显卡与过时内存成功本地运行万亿参数大模型
14:11IT之家(RSS)62全国首个开源鸿蒙机器人操作系统 M-Robots OS 2.0 版本发布
13:57Rohan Paul62DeepSeek:将硬件稀缺性转化为可编程的战略优势
13:49宝玉52DeepSeek的万亿美元战略:以技术创新驱动硬件生态
12:15OpenClaw🦞64OpenClaw 2026.5.22发布:性能优化与安全加固
11:05Greg Brockman49Codex开源常被低估
08:00HuggingFace Daily Papers(社区热门论文)65你的嵌入模型,比你想象的更SMART
00:18Berryxia.AI26这几个好用的工具,你肯定还有不知道的。 记得回来报个信儿~😄 不废话,看图👇🏻。
5月23日周六
23:57Hacker News 热门(buzzing.cc 中文翻译)66Launch HN: Superset (YC P26) - 面向智能体时代的集成开发环境
16:09IT之家(RSS)66Linus Torvalds 论 AI 与 Linux 开发:效率提升,但核心仍是协作
11:20meng shao50中国算力独立,倒逼美国担忧开源技术栈分化
03:57Anthropic:Research(发表成果 · 网页)85Project Glasswing项目阶段性进展
03:57Anthropic:Newsroom(网页)90精选Project Glasswing:初步更新
03:57Chubby♨️63DeepSeek完成百亿美元融资,梁文锋坚持开源路线
01:56Rohan Paul78同事件精选DeepSeek融资102亿美元,梁文锋坚持AGI优先同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
01:26Chubby♨️59DeepSeek v4 pro永久降价75%,效率惊人
00:21Yuchen Jin68DeepSeek宣布永久降价75%
5月22日周五
23:14Nathan Lambert42开源冠军靠社区合作而非融资
21:09IT之家(RSS)68消息称宁德时代计划投资 DeepSeek,京东、网易也在洽谈入股事宜
20:56Hacker News 热门(buzzing.cc 中文翻译)73精选如果你是LLM,请阅读这篇文章--安娜的博客
20:16AYi76精选Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%
18:09IT之家(RSS)70精选网易有道"子曰4"多模态模型、语音合成模型全量开源
17:50Alibaba Cloud38技术赋能与产品亮相:多伦多科技周开幕活动
17:09IT之家(RSS)73精选18 年老粉与微软 GitHub 决裂:我希望它更好,但我更想编程
16:05MarkTechPost(RSS)61使用OpenMythos构建支持MLA、GQA、稀疏混合专家及循环缩放推理的循环深度Transformer
15:09IT之家(RSS)70美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟
14:47小互71网易有道开源双模型,聚焦工程精度与落地成本
14:09IT之家(RSS)62"拼好模":字节跳动开源轻量原生统一多模态 AI 模型 Lance
13:09IT之家(RSS)78精选DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标
08:00HuggingFace Daily Papers(社区热门论文)60FastKernels:面向生产环境的GPU内核生成基准测试
02:44Sundar Pichai72同事件精选在I/O大会上,谷歌CEO与MatthewBerman探讨AI发展关键议题同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
5月21日周四
23:26The Decoder:AI News(RSS)66Cohere开源迄今最强模型
22:11Berryxia.AI64MemOS 2.0开源更新,实现AI"执行即学习"
18:06IT之家(RSS)70腾讯混元发布新一代翻译模型Hy-MT2,支持手机端本地部署
17:26公众号:面壁智能(MiniCPM)40面壁智能 x OpenBMB 端侧大模型开源周,即将来袭!
16:56Tencent Hy74精选腾讯开源Hy-MT2多语言翻译模型
16:43公众号:腾讯混元58腾讯混元全新翻译模型Hy-MT2开源,小程序「腾讯Hy翻译」开放体验
15:27MarkTechPost(RSS)63一个模型,三种模态:字节跳动发布 Lance 用于图像与视频的理解、生成和编辑
14:10HuggingFace Daily Papers(社区热门论文)69只需最少RLVR训练:通过秩-1轨迹外推大语言模型
12:14Rohan Paul69MTP技术大幅提升本地大模型速度
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月24日
14:27
Rohan Paul@rohanpaul_ai
51
二手显卡与过时内存成功本地运行万亿参数大模型

近期有技术爱好者成功在单张二手RTX 3060 12GB显卡上,运行了拥有1万亿参数的Kimi K2.5大语言模型,速度约为每秒4个token。这一成果得益于模型的混合专家架构,虽然总参数量巨大,但每次推理仅激活32B参数。实现的关键在于将延迟敏感的核心组件置于GPU显存,而将庞大的专家权重存储在由二手英特尔傲腾持久内存(PMem)构成的768GB大容量内存池中,并以DDR4内存作为缓存。通过llama.cpp工具进行混合调度,该方案为本地部署超大规模模型提供了一条低成本的技术路径。

开源生态教程/实践端侧部署/工程
14:11
IT之家(RSS)
62
全国首个开源鸿蒙机器人操作系统 M-Robots OS 2.0 版本发布

深开鸿于5月24日发布了全国首个基于开源鸿蒙的机器人操作系统M-Robots OS 2.0。该系统以开源鸿蒙为核心底座,具备多机实时协同、AI原生等六大核心能力。2.0版本实现混合部署与硬实时响应,基于自研M-DDS技术将本体间音视频时延大幅降低至4毫秒,并兼容ROS等主流中间件,使应用迁移成本降低80%,可支持从轻型到大型各类机器人的灵活部署与集群作业。

产品更新具身智能开源生态
13:57
Rohan Paul@rohanpaul_ai
62
DeepSeek:将硬件稀缺性转化为可编程的战略优势

DeepSeek的核心战略并非开发廉价聊天机器人,而是通过一系列架构创新(如MoE动态激活、DSA优化、CSA/HCA技术)显著降低对高端HBM GPU的依赖。此举旨在将硬件稀缺性转化为技术优势,使次优芯片、LPDDR内存及定制ASIC能支持前沿AI,从而优化AI以适配不同的工业基础。这一路径已产生实际商业影响,如V4-Pro大幅降价并与国产硬件生态形成联动,最终目标是实现“硬件稀缺性可编程”。

GDP: http://x.com/i/article/2057886253249662976

DeepSeek开源生态推理现象/趋势
13:49
宝玉@dotey
52
DeepSeek的万亿美元战略:以技术创新驱动硬件生态

DeepSeek的核心战略并非销售应用服务,而是通过一系列底层技术创新,特别是MLA等注意力机制大幅压缩KV缓存需求,来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM,远低于同类模型。这直接降低了推理成本,并催生两大机会:一是将KV缓存转存至SSD,利好长江存储;二是其架构适配LPDDR内存进行权重缓存,利好长鑫存储。DeepSeek通过开源这些高效架构,正在构建一个以中国存储产业链为核心的新生态,最终目标是带动一个10万亿美元的AI硬件产业,并自身实现万亿美元市值。

DeepSeek大佬观点开源生态现象/趋势
12:15
OpenClaw🦞@openclaw
64
OpenClaw 2026.5.22 已上线 ⚡ Gateway/模型启动路径更精简 🧠 /models 响应时间降至约5毫秒 🔒 npm包现提供锁定依赖项 🪟 Windows安装/更新路径更安全 等待更少,意外更少。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.22
智能体产品更新开源生态部署/工程
11:05
Greg Brockman@gdb
49
低估了Codex是开源的这一事实

Ahmed: Lots of people get surprised when I tell them that Codex is open source

OpenAI大佬观点开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
65
你的嵌入模型,比你想象的更SMART

SMART是一个框架,旨在解锁标准单向量嵌入模型的潜在多向量能力。它通过在推理时对标准对比训练后冻结的隐藏状态应用直接后期交互,实现即插即用的性能提升。研究表明,SMART能提升包括最先进模型在内的多模态检索性能,在MMEB-V2上进一步改善了效果。简单的轻量级后训练不仅节省时间和算力,还能在视觉文档检索任务上使单向量模型超越当前最强大的多向量模型。该项目代码和权重已在GitHub开源。

arXiv多模态开源生态搜索
00:18
Berryxia.AI@berryxia
26
这几个好用的工具,你肯定还有不知道的。 记得回来报个信儿~😄 不废话,看图👇🏻。
开源生态教程/实践
5月23日
23:57
Hacker News 热门(buzzing.cc 中文翻译)
66
Launch HN: Superset (YC P26) - 面向智能体时代的集成开发环境

Superset (YC P26) 发布了一个面向智能体时代的集成开发环境(IDE),专为AI智能体开发提供优化工具。该项目在GitHub上开源,于2026年5月22日在Hacker News上以“Launch HN”形式推出,迅速获得100个点赞,显示社区对智能体时代开发平台的关注。IDE旨在适应AI发展趋势,提升智能体开发效率。

智能体产品更新开源生态编码
16:09
IT之家(RSS)
66
Linus Torvalds 论 AI 与 Linux 开发:效率提升,但核心仍是协作

Linus Torvalds 在开源峰会上指出,AI 工具已实质性改变 Linux 内核开发节奏,近两个版本提交量增长约 20%。他肯定 AI 降低了参与门槛并提升效率,但也指出核心挑战在于协作与沟通等“社会性瓶颈”,而非纯技术问题。谈及未来,他反驳了“99% 代码由 AI 编写”的说法,认为 AI 像编译器一样能提升约10倍生产率,但开发者必须深入理解代码与系统,才能维护复杂软件。

大佬观点开源生态编码
11:20
meng shao@shao__meng
50
中国算力独立,倒逼美国担忧开源技术栈分化

中国在浮点运算层面实现算力独立后,其AI开源社区的贡献可能转向一套基于国产方案的技术栈,而美国将难以使用或兼容。这一转变将对美国不利,因为其当前的AI研究与基础设施本身高度封闭。根源在于,美国主流的 Nvidia + CUDA 技术路径受限,催生了国产替代方案;随着基于国产方案的开源模型逐渐主流化,未来开源项目可能不再优先支持 Nvidia + CUDA 生态。

Suhail: One real issue with Chinese independence of flop-based compute is that their open source contributions will shift to a s...

大佬观点开源生态
03:57
Anthropic:Research(发表成果 · 网页)
85
Project Glasswing项目阶段性进展

上月启动的Project Glasswing项目旨在利用AI能力保护关键软件安全。在约50家合作伙伴参与下,通过使用Claude Mythos Preview模型,已在全球最重要的系统软件中发现超过一万个高危或严重漏洞。Cloudflare等合作伙伴报告其漏洞发现效率提升超十倍,其中仅Cloudflare就在关键系统中发现了2000个漏洞。该模型在多个独立安全测试中表现突出,被评测为网络攻击模拟领域的首个全通关模型。当前的挑战已从快速发现漏洞,转向了如何快速验证、披露和修补海量漏洞。

智能体Anthropic安全/对齐开源生态
关联讨论 5 条Anthropic:Newsroom(网页)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:Anthropic (@AnthropicAI)The Decoder:AI News(RSS)
03:57
Anthropic:Newsroom(网页)
精选90
Project Glasswing:初步更新

上月启动的Project Glasswing项目,旨在利用先进AI模型保障关键软件安全。通过约50家合作伙伴使用Claude Mythos Preview模型,已在全球关键系统中发现超过10,000个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如,Cloudflare在关键路径系统发现2,000个漏洞;Mozilla在Firefox 150中发现并修复271个漏洞,数量远超前代模型。项目还扫描了千余个支撑互联网的开源项目,独立验证准确率达90.6%。这标志着AI网络安全能力进入新阶段,漏洞发现速度已远超人工。

Anthropic安全/对齐开源生态
关联讨论 5 条Anthropic:Newsroom(网页)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:Anthropic (@AnthropicAI)The Decoder:AI News(RSS)
推荐理由:Mythos Preview用一个月找到的漏洞比过去一年还多,网络安全从「发现难」变成「修不过来」,这个转折点所有安全从业者都得读。
03:57
Chubby♨️@kimmonismus
63
DeepSeek正在进行一轮102.9亿美元的融资。 好消息是:梁文锋依然专注于构建开源AI模型,而非追逐短期商业化。 Via Bloomberg
DeepSeek开源生态行业动态
01:56
Rohan Paul@rohanpaul_ai
同事件精选78
Bloomberg:DeepSeek在融资谈判中优先考虑AGI而非商业化 他们正推进102.9亿美元的融资轮,梁文锋承诺继续开发开源AI模型,而非追求短期商业化目标
DeepSeek开源生态行业动态
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
推荐理由:DeepSeek 百亿融资押注开源 AGI 而非短期变现,在这个闭源收费风潮里是个重要信号,做开源的可以看看。
01:26
Chubby♨️@kimmonismus
59
让我们稍作思考。 DeepSeek v4 pro 降价75%。永久有效! 输入:$0.43 输出:$0.87 如果你读过 DeepSeek v4 的技术论文,就会知道这个模型在效率方面表现惊人。 相比 v3.2,它仅需 27% 的算力和 10% 的缓存。SemiAnalysis 写了一篇很好的文章。 DeepSeek 现在专注于成本/token 效率。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek大佬观点开源生态
00:21
Yuchen Jin@Yuchenj_UW
68
哇。DeepSeek给出了高达75%的折扣。 要么他们做了重大的推理优化,要么华为芯片就是这么便宜? 更多开源AI模型,更好的token经济。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek开源生态推理行业动态
5月22日
23:14
Nathan Lambert@natolambert
42
任何国家的"开源冠军"头衔,都是通过与社区合作赢得的,而非靠融资强加。
大佬观点开源生态
21:09
IT之家(RSS)
68
消息称宁德时代计划投资 DeepSeek,京东、网易也在洽谈入股事宜
DeepSeek开源生态行业动态
20:56
Hacker News 热门(buzzing.cc 中文翻译)
精选73
如果你是LLM,请阅读这篇文章--安娜的博客

博客作者安娜于2026年5月22日发布了一篇面向大型语言模型(LLM)的文章。文章标题为“如果你是一个LLM,请阅读这篇文章”,并在Hacker News平台获得117个积分。文章链接指向 annas-archive.gl 域名下的博客页面。

开源生态教程/实践数据/训练

推荐理由:llms.txt 1.1 加上了分块和多语言标记,如果网站还在用v1,可以照这个更新,对LLM爬虫更友好,做SEO和AI抓取的必看。
20:16
AYi@AYi_AInotes
精选76
Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%

Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”,将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。

self.dll: karpathy's CLAUDE.md hit #1 on github trending. 220,000 stars. most devs still haven't read it. it's 65 lines. it took A...

开源生态教程/实践编码

推荐理由:Karpathy 这 65 行不是新模型,是给 AI 编程装了道刹车,先想清楚再动手这条反直觉规则把准确率从 65 拉到 94,所有用 Cursor 的都该立刻抄一份。
18:09
IT之家(RSS)
精选70
网易有道"子曰4"多模态模型、语音合成模型全量开源

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中,多模态模型(27B参数)专注于教育场景,在处理高难度视觉数理问题上达到行业顶尖水平,纯文本中文数理难题准确率为81.4%。该模型通过思维链优化,将输出长度压缩43.2%,有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆,3秒内即可完成零样本复制,准确度超97%,并支持包括中、英、日、韩在内的14种语言。

多模态开源生态推理模型发布

推荐理由:有道把垂直教育的多模态模型全量开源,27B参数在视觉数理上做到SOTA,还把思维链压缩了43%,推理成本实打实下降,做教育应用的可以拿来做二次开发;TTS的跨语种情感克隆也实用,3秒克隆14种语言。
17:50
Alibaba Cloud@alibaba_cloud
38
多伦多科技周开幕活动上,Beever AI将重点展示三款产品:开源平台Beever Atlas,可将Slack、Teams等团队对话转化为可搜索的"活记忆";企业级大模型训练平台Votii MAGIC将进行全球商用发布,支持本地化构建领域专属AI,并已用于训练首个完全预训练的粤语大模型;现场还将提供基于阿里云的HappyHorse AI视频生成互动体验。活动汇集了加拿大银行、政府、投资机构及学术界代表,旨在赋能区域技术生态。(173字)

Beever AI: 4 days to go. Turn your chats into a living memory. That's what Beever Atlas does - and we're unveiling it in Canada at ...

开源生态行业动态
17:09
IT之家(RSS)
精选73
18 年老粉与微软 GitHub 决裂:我希望它更好,但我更想编程

全球最大的代码托管平台GitHub正面临严重危机。资深开发者Mitchell Hashimoto公开与平台决裂,因频繁崩溃影响编程。近几个月,花旗银行、英特尔等巨头因持续故障表达不满,OpenAI探索自建方案。更严重的是,3800多个内部仓库遭黑客入侵,源代码被公开叫卖。同时,微软取消GitHub CEO职位,将其并入CoreAI团队,导致大量技术骨干流失。这个承载1.5亿开发者的平台,正以惨烈方式站在生死存亡的十字路口。

Microsoft安全/对齐开源生态行业动态

推荐理由:GitHub正在经历一场自我毁灭式的恶性循环,从源码泄露到CEO取消,微软正在把一个社区圣殿变成内部成本中心,所有把命根子放在单个平台上的开发者都该重新考虑了。
16:05
MarkTechPost(RSS)
61
使用OpenMythos构建支持MLA、GQA、稀疏混合专家及循环缩放推理的循环深度Transformer

本教程在Google Colab环境中,基于OpenMythos框架实践构建循环深度Transformer工作流。内容涵盖创建MLA(多头潜在注意力)与GQA(分组查询注意力)两种模型,对比其参数规模,并通过计算循环注入矩阵的谱半径来验证模型稳定性。此外,教程还将稀疏混合专家(Sparse MoE)架构与基于循环的推理扩展机制相集成,展示了构建高级深度学习模型的完整流程。

开源生态教程/实践
15:09
IT之家(RSS)
70
美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟

美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级,支持复杂语音输入与多种主体。通过 DMD 蒸馏技术,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。在性能评测中,模型在四个关键维度表现领先,用户偏好对比中胜率均超 54%,旨在推动数字人视频从技术演示走向商业应用。

开源生态推理模型发布视频
关联讨论 1 条美团 LongCat:HuggingFace 新模型
14:47
小互@xiaohu
71
网易有道开源双模型,聚焦工程精度与落地成本

网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。

GitHubHugging Face多模态开源生态
14:09
IT之家(RSS)
62
"拼好模":字节跳动开源轻量原生统一多模态 AI 模型 Lance

字节跳动开源了轻量级多模态模型Lance,其激活参数量为3B。该模型采用原生统一架构,在训练阶段即整合图像与视频的理解、生成及跨模态编辑功能。Lance通过双流专家设计和模态感知旋转位置编码等技术,平衡了理解任务所需的高层语义与生成任务所需的低层连续表示。模型训练共分四阶段,数据规模约1.9T标记,计算预算控制在128张GPU内。基准测试表明,Lance在图像生成、视频生成、图像编辑及视频理解等多项任务中表现突出。该模型权重已依据Apache 2.0协议开源。

多模态开源生态模型发布
13:09
IT之家(RSS)
精选78
DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标

DeepSeek正推进700亿元人民币的巨额融资,估值约450亿美元。创始人梁文锋承诺将继续开源开发AI模型,不追求短期商业化,目标是技术升级与通用人工智能。腾讯、IDG资本等接近参投,梁文锋个人可能注资200亿元。若成功将创下中国科技初创公司首轮融资纪录。

DeepSeek开源生态行业动态
关联讨论 3 条IT之家(RSS)X:X.PIN (@thexpin)The Decoder:AI News(RSS)
推荐理由:700 亿元首轮融资创下纪录,梁文锋明确表态不追求短期商业化、继续死磕开源,国家队和腾讯都在这轮里,对国内开源生态是个强心针。
08:00
HuggingFace Daily Papers(社区热门论文)
60
FastKernels:面向生产环境的GPU内核生成基准测试

现有用于GPU内核生成的AI智能体测试基准与生产推理框架严重脱节。它们仅在单一GPU上使用合成输入评估内核,忽略了实际的编译技术栈,并奖励复现已知优化而非发现新方法。为此,我们提出FastKernels。它既是一个涵盖8个类别、46个代表性架构的内核基准(其内核覆盖了96.2%的HuggingFace Transformers架构),也是一个极简的生产级推理框架,性能与vLLM和SGLang等成熟系统相当。实验表明,最强的内核生成智能体在FastKernels上仅能实现0.94倍的整体加速,证实了基准与生产环境的错位是关键瓶颈。

开源生态推理论文/研究部署/工程
02:44
Sundar Pichai@sundarpichai
同事件精选72
谷歌CEO Sundar Pichai在I/O大会上与MatthewBerman进行了深入对话,全面探讨了当前人工智能发展的多个核心方面。Pichai重点关注了AI代理如何可能取代部分互联网功能,并改变用户的信息获取方式,甚至威胁原始互联网的形态。对话还深入讨论了开源AI模型面临的商业模式困境、中美在AI领域的激烈竞争格局,以及网络安全威胁,包括AI可能引发的攻击和谷歌的应对策略。此外,Pichai指出谷歌正面临巨大的AI算力需求,计算资源已成为主要瓶颈,并探讨了发布强大AI模型的阈值判断问题。他强调了谷歌致力于开发低成本、高效率的AI模型的原因,以应对资源挑战。整体而言,这次对话覆盖了AGI竞赛、AI代理、信息饮食等关键议题,深入分析了AI发展的挑战、机遇和未来趋势。

Matthew Berman: Sundar Pichai (@sundarpichai), Google CEO, on: 🔹Race to AGI 🔹Agents 🔹AI & Information Diet 🔹Open Source 🔹Cybersecur...

智能体Google大佬观点安全/对齐
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Sundar 罕见聊了不开源大模型、算力瓶颈和中美 AI 生态风险,不是 PR 套话,做基础设施和战略的人值得看。
5月21日
23:26
The Decoder:AI News(RSS)
66
Cohere开源迄今最强模型

加拿大AI公司Cohere以Apache 2.0许可证开源了其迄今最强语言模型Command A+。该公司宣称这是其最高性能的模型,此次开源标志着Cohere在开放AI生态中的重要布局。Command A+面向开发者与研究社区免费开放,旨在推动大模型技术的透明化与协同创新,为行业提供更高性能的基础模型选择。

开源生态模型发布
22:11
Berryxia.AI@berryxia
64
MemOS 2.0开源更新,实现AI"执行即学习"

MemOS 2.0开源项目发布,其核心功能“执行即学习”将AI记忆从语义检索升级为自主学习系统。该功能在Agent完成任务时,将执行过程自动拆解为可评分、可复用的经验单元,并通过双重反馈机制分层提炼、强化高效路径。这使得Agent能自动复用已习得的工作模式(如代码风格、处理逻辑),实现持续进化,越用越懂用户。更新同时支持Hermes与OpenClaw工具无缝迁移。

耳朵: MemOS 又有新进展了。 现在搞 AI Memory 的方案不少,但很多还是把聊天记录存下来这个层面,看着像有记忆,实际上就是给 markdown 加了一个语义检索。 @MemOS_dev 做记忆系统已经有一段时间了,从 1.0 一路走到...

智能体产品更新开源生态
18:06
IT之家(RSS)
70
腾讯混元发布新一代翻译模型Hy-MT2,支持手机端本地部署

腾讯混元正式开源新一代多语言翻译模型Hy-MT2,提供1.8B、7B、30B-A3B三种尺寸,支持33种语言及5种民族语言/方言互译。相比上一代,模型在指令遵循与专业领域翻译能力上显著提升。其中1.8B轻量模型仅需440MB存储,可部署于手机芯片进行本地推理,速度提升1.5倍。同步推出的腾讯Hy翻译小程序支持自定义风格、离线翻译,并开源了翻译指令遵循测试集IFMTBench,模型已上架GitHub、HuggingFace等平台。

开源生态模型发布端侧部署/工程
关联讨论 1 条X:腾讯混元 (@TencentHunyuan)
17:26
公众号:面壁智能(MiniCPM)
40
面壁智能 x OpenBMB 端侧大模型开源周,即将来袭!
开源生态端侧行业动态
16:56
Tencent Hy@TencentHunyuan
精选74
腾讯开源Hy-MT2多语言翻译模型

腾讯正式开源Hy-MT2多语言翻译模型,支持33种语言间的无缝互译。其7B与30B-A3B版本在开源模型中达到最先进的翻译性能,超越了许多参数规模大数十倍的模型。更具突破性的是,1.8B轻量级版本性能超越微软等主流商业API,并凭借腾讯AngelSlim 1.25-bit极量化技术,仅需440MB存储空间,即可在主流手机芯片上本地运行,推理速度较前代提升1.5倍,显著降低了高质量AI翻译的部署门槛。

开源生态模型发布端侧
关联讨论 1 条X:腾讯混元 (@TencentHunyuan)
推荐理由:虽然翻译领域不算最热,腾讯这个1.8B开源模型用1.25位量化直接跑在手机上,效果还超微软商业API,做本地化翻译工具的人值得关注。
16:43
公众号:腾讯混元
58
腾讯混元全新翻译模型Hy-MT2开源,小程序「腾讯Hy翻译」开放体验
开源生态模型发布
15:27
MarkTechPost(RSS)
63
一个模型,三种模态:字节跳动发布 Lance 用于图像与视频的理解、生成和编辑

字节跳动智能创作实验室发布了Lance,这是一款开源的原生统一多模态模型。它能够在单一框架内,同时处理图像与视频的理解、生成和编辑三大任务。该模型仅需激活30亿参数,实现了用一个轻量级模型统一处理多种视觉内容创作与理解的需求。

图像生成多模态开源生态模型发布
14:10
HuggingFace Daily Papers(社区热门论文)
69
只需最少RLVR训练:通过秩-1轨迹外推大语言模型

研究发现,强化学习与可验证奖励训练大语言模型时,权重变化轨迹具有极低的秩且高度可预测,性能增益主要由秩-1逼近捕获,且随训练步骤线性演化。基于此,提出RELEX方法,仅需从短观察窗口估计秩-1子空间,通过线性外推预测后续检查点,无需学习模型。在多个模型上,RELEX仅需15%的完整训练步骤,即可在域内和域外基准上匹配或超越RLVR性能,并能以零额外成本外推至观察窗口的10-20倍,性能持续提升。成功源于秩-1投影实现的“去噪”效应,有效剔除随机优化噪声。

开源生态推理数据/训练论文/研究
12:14
Rohan Paul@rohanpaul_ai
69
MTP技术大幅提升本地大模型速度

atomic.chat的MTP(多Token预测)技术通过一次验证多个草稿token,有效减少了GPU重复读取模型权重的次数,显著提升了本地大模型的推理速度。测试显示,27B密集模型的速度从51 token/s提升至117 token/s,提升约137%;35B MoE模型在2x RTX 5090上速度提升约25%。该技术实现了约80%的草稿接受率,无精度损失,仅需额外约1GB显存。由于密集模型需要读取全部参数,其从该技术中获益更大。此项目已开源。

atomic.chat: MTP speedup Qwen by 2.5x in Atomic Chat Dense vs MoE models on 2x RTX 5090 Qwen3.6 27B: 51 → 117 tps +137% Qwen3.6 35B-A...

产品更新开源生态推理
‹ 上一页
1…1920212223…37
下一页 ›