AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
5月27日周三
07:37Artificial Analysis67OpenBMB发布1B参数模型MiniCPM5-1B,在小规模开源模型中表现最优
05:58Nathan Lambert32呼吁释放100B Gemma 4 MoE模型
03:20swyx31美国正加速追赶中国AI发展
00:01Chubby♨️70MiniMax发布M3稀疏注意力,1M上下文下解码加速15.6倍
5月26日周二
23:58Nathan Lambert63Gemma 4采用率超越同规模通义千问模型
23:49Nathan Lambert:Interconnects(RSS)67精选未来展望:2026年5月的一些想法
23:29小互58Capafy让AI Skills闭源变现,解决开发者收益痛点
23:29SenseTime77同事件精选开源多模态模型SenseNova-U1完整训练代码库同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
23:27Berryxia.AI44论文《Language Models Need Sleep》摘要
23:19Claude47六个Claude项目源于同一个问题
23:11MiniMax (official)41MSA开源项目即将发布重大消息
22:58SenseTime70SenseNova-U1全训练代码开源,支持多模态多任务训练
21:19HuggingFace Daily Papers(社区热门论文)67CUA-Gym: 为计算机使用智能体扩展可验证的训练环境与任务
20:30Tencent Hy70同事件精选腾讯 Hy-MT2 开源,HuggingFace 排行榜登顶同一事件,精选展示《腾讯开源Hy-MT2多语言翻译模型》
18:13IT之家(RSS)58小米 2026 财年第一财季经调整净利润 60.72 亿元,同比下降 43.1%
16:30Alibaba Cloud40Nous Research策略主管谈AI智能体本质与开源优势
14:29Alibaba Cloud48Qwen大会2026:AI关键帧直播预告
14:28向阳乔木70网易有道子曰4全模态模型开源,27B参数,TTS支持3秒声音克隆
14:11IT之家(RSS)76精选面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上
13:11IT之家(RSS)77同事件精选谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题同一事件,精选展示《AlphaProof Nexus:用形式化验证驱动AI数学证明搜索》
12:29Alibaba Cloud46新加坡官员在Qwen大会谈科技生态价值
11:35公众号:面壁智能(MiniCPM)59面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B
10:59Tencent Hy69腾讯混元新翻译模型双榜亮眼,小程序发布
09:11IT之家(RSS)50托瓦兹再发飙:AI 干扰 Linux 内核节奏,撑大 RC5 体量
08:00HuggingFace Daily Papers(社区热门论文)57通过对称注意力分解平衡扩散模型中的保真度与多样性:Hopfield 视角
04:36MarkTechPost(RSS)66使用 NVIDIA FLARE 在非独立同分布 CIFAR-10 上构建与比较 FedAvg 和 FedProx 联邦学习的分步指南
5月25日周一
20:58Chubby♨️65Anthropic企业采用率首超OpenAI,但成本问题引隐忧
16:24Alibaba Cloud26Qwen直播:通往AI原生之路
12:11IT之家(RSS)72同事件精选面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN同一事件,精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》
09:53Alibaba Cloud31Qwen Conference 2026 全球直播开启
09:17AYi66作者分享了其高产的自媒体AI工作流。
08:11IT之家(RSS)66Linux 7.1-rc5 内核发布,Linus 对不必要改动、代码规模膨胀不满意
07:06MarkTechPost(RSS)65构建完整的 Langfuse 可观测性与评估流水线以实现追踪、提示词管理、评分与实验
06:27Chubby♨️71Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题
04:48Nathan Lambert64AI发展不止于算力,社会因素影响同样关键
03:31Simon Willison 博客58引用阿尔明·罗纳彻的话
02:27Hacker News 热门(buzzing.cc 中文翻译)74精选DeepSeek将对其旗舰AI模型实施永久性75%折扣
00:27Chubby♨️77精选TrapDoor供应链攻击:AI助手成新型攻击面
00:18Berryxia.AI48DeepSeek算法突围:压缩显存、重塑生态,冲击万亿美元估值
5月24日周日
21:52向阳乔木45用Codex开发Suno音乐播放器开源分享
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月27日
07:37
Artificial Analysis@ArtificialAnlys
67
OpenBMB发布1B参数模型MiniCPM5-1B,在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。

开源生态模型发布端侧
05:58
Nathan Lambert@natolambert
32
释放100B Gemma 4 MoE!Gemini Flash 3.5已发布,现在可以发布它了!
Google大佬观点开源生态
03:20
swyx@swyx
31
每个人都在谈论中国追赶美国 却很少有人谈论美国追赶中国 干得好 @o_lacombe 等人,@robert_mchardy 等人!

Latent.Space: [AINews 3 Apr 2026] Gemma 4: The world's best small Multimodal Open Models, dramatically better than Gemma 3 in every wa...

Google多模态大佬观点开源生态
00:01
Chubby♨️@kimmonismus
70
MiniMax发布M3稀疏注意力,1M上下文下解码加速15.6倍

MiniMax预览了其M3架构采用的新稀疏注意力(Sparse Attention)技术。测试显示,在1M token上下文下,该技术相比M2实现了9.7倍的预填充(prefilling)加速和15.6倍的解码(decoding)加速。M2曾为保证生产环境就绪而采用全注意力机制,M3则采用了新的两阶段方法:先用轻量级索引分支选择数据块,再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源生态推理模型发布
5月26日
23:58
Nathan Lambert@natolambert
63
Gemma 4 在同规模模型上的采用率超过通义千问 3.5/3.6,标志着开源模型国际影响力格局的重大转变。

Interconnects: Some ideas for what comes next, May 2026 Gemini Flash 3.5, Mythos, open-closed balance, America's open-source surge, eme...

Google大佬观点开源生态
23:49
Nathan Lambert:Interconnects(RSS)
精选67
未来展望:2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡(open-closed balance)的讨论、美国开源力量的显著增长(America's open-source surge),以及由此引发的新兴权力博弈(emerging power struggles)。

AnthropicGoogle大佬观点开源生态

推荐理由:Nathan Lambert 对开源模型追赶闭源的周期判断、Gemini 在编码代理领域的缺位分析,以及美国开源模型崛起的观察,为理解当前鼎立格局提供了扎实的坐标,值得从业者细读。
23:29
小互@xiaohu
58
Capafy让AI Skills闭源变现,解决开发者收益痛点

Capafy平台解决了一个AI生态痛点:Skill开发者因生态默认开源而无法盈利。在Capafy上,Skills作为闭源产品在云端运行,用户获得产出而非代码。开发者可自定价格,且每次被调用都能获得收益。平台还允许开发者上传在Claude Code、Codex或OpenClaw中构建的Skills并赚钱,同时用户可一键调用来自各行业顶尖人才的专业技能。

Capafy: Introducing Capafy: the Skill-based Agent Marketplace. Now your Skill runs as a product and earns while you sleep. On Ca...

智能体产品更新开源生态
23:29
SenseTime@SenseTime_AI
同事件精选77
开源多模态模型SenseNova-U1完整训练代码库

商汤开源了SenseNova-U1(8B dense + A3B MoE)的完整训练代码库。这是一个统一的框架,支持文本到图像、图像编辑、交错生成、文本与视觉理解等多种多模态任务的训练。其设计注重实用性与大规模训练,采用混合并行、流式可恢复数据管道、环境变量配置、解耦模块化设计,并支持从1×8 GPU扩展到多节点集群的规模。代码库以Apache-2.0协议开源。

多模态开源/仓库开源生态数据/训练
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:商汤把 SenseNova-U1 的训练代码全量开源,支持多模态任务和 MoE,还给了完整的并行策略,做多模态训练的可以直接 fork 过去用,Apache-2.0 很友好。
23:27
Berryxia.AI@berryxia
44
论文《Language Models Need Sleep》摘要

CMU与UMD的研究团队在论文《Language Models Need Sleep》(arXiv 2605.26099)中指出,传统Transformer模型在处理长任务时,因注意力机制计算复杂度高及KV cache显存占用持续增长而导致效率低下。为此,他们提出了受生物启发的“类睡眠巩固”机制:模型会周期性进入“睡眠”状态,离线多轮处理最近的上下文,并将信息固化到模型状态空间块的fast weights中,随后清空KV cache。实验表明,增加睡眠深度或时长能显著提升模型后续的推理能力。该框架完全开源,提供了一种区别于暴力堆显存的长上下文处理新范式。

himanshu: very cool research (and nomenclature)

arXiv开源生态推理论文/研究
23:19
Claude@claudeai
47
六个Claude项目都源于同一个问题:"为什么不呢?"
Anthropic开源生态教程/实践
23:11
MiniMax (official)@MiniMax_AI
41
#MSA #开源 #M3 🫣😎

Skyler Miao: Something BIG is coming

开源生态模型发布
22:58
SenseTime@SenseTime_AI
70
SenseNova-U1全训练代码开源,支持多模态多任务训练

OpenSenseNova开源了SenseNova-U1的完整训练代码库,支持其8B密集模型与A3B MoE架构。该代码库使用一个统一的框架,可同时训练多种多模态任务,包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计,支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从1×8 GPUs到多节点集群的扩展能力。代码已在GitHub开源,采用Apache-2.0协议。

图像生成多模态开源/仓库开源生态
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)
21:19
HuggingFace Daily Papers(社区热门论文)
67
CUA-Gym: 为计算机使用智能体扩展可验证的训练环境与任务

针对计算机使用智能体(CUA)训练中可验证数据稀缺的问题,本文提出了CUA-Gym这一可扩展流水线,能够协同生成任务指令、环境状态与奖励函数。该流水线包含生成器智能体与判别器智能体,并通过协调器驱动执行与过滤。基于此流程,我们构建了包含32,112个验证元组、涵盖110个环境的数据集。使用GSPO算法在CUA-Gym上训练的A3B和A17B模型,在OSWorld-Verified基准上分别达到62.1%和72.6%的分数,优于同等规模的先前开源模型。模型还在未见过的WebArena基准上取得提升,展现了跨环境迁移能力。项目将开源完整的合成流程、数据集、环境及模型。

智能体arXiv开源生态数据/训练
20:30
Tencent Hy@TencentHunyuan
同事件精选70
腾讯 Hy-MT2 开源,HuggingFace 排行榜登顶

腾讯的 Hy-MT2 模型基于 Apache License 2.0 开源,可用于研究、商业使用、微调和衍生品,无任何限制。其两个变体在 Hugging Face 趋势排行榜上分别位居 #1 和 #4,鼓励社区克隆、分叉和反馈以推动迭代。

Hugging Face开源生态行业动态
同一事件,精选展示《腾讯开源Hy-MT2多语言翻译模型》
推荐理由:腾讯把Hy-MT2改成Apache 2.0许可证,商用衍生都没问题,之前因为许可犹豫的人现在可以放心用了,模型在Hugging Face trending霸榜,值得重新评估。
18:13
IT之家(RSS)
58
小米 2026 财年第一财季经调整净利润 60.72 亿元,同比下降 43.1%

小米发布2026财年第一财季(1-3月)财报,营收991亿元,同比下降10.9%;经调整净利润60.72亿元,同比下降43.1%。AI进展方面,小米于2026年4月公测MiMo-V2.5系列大模型,其中MiMo-V2.5-Pro在开源大模型综合排名第一,随后开源该系列模型以供商用部署。

开源生态端侧行业动态
16:30
Alibaba Cloud@alibaba_cloud
40
AI Key Frames - 直击通义千问直播现场。 当今大多数"AI智能体"只是多了几步操作的聊天机器人。Nous Research策略主管Tommy Eastman阐述了真正的智能体是什么样子,为何开源持续超越闭源实验室,以及AI作为万物操作层的意义。感受AI原生浪潮。 🚀 敬请关注:https://int.alibabacloud.com/m/1000413447/
智能体大佬观点开源生态
14:29
Alibaba Cloud@alibaba_cloud
48
AI Key Frames - 您在Qwen Conference 2026的Qwen直播前排席位。 解码AI生产力的核心。用全栈AI重塑增长曲线。 与行业先驱独家对话,跨越AI新前沿--推理、内容创作与开放AI生态系统。步入AI原生浪潮。 🚀 敬请关注:https://int.alibabacloud.com/m/1000413447/ #AlibabaCloud #AINative #QwenConference2026 #Qwen #LLM
开源生态推理行业动态
14:28
向阳乔木@vista8
70
网易有道子曰4全模态模型开源,27B参数,TTS支持3秒声音克隆

网易有道发布子曰4,一个27B参数的全模态大语言模型,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下,实现了多模态与纯文本数理推理的双重优势。同时,子曰4全模态模型和TTS引擎已同步开源,开放参数权重,支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度达95%以上。

多模态开源生态模型发布语音
14:11
IT之家(RSS)
精选76
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。

开源生态模型发布端侧

推荐理由:1B参数干翻所有2B以下模型,量化后0.5GB就能塞进手机和浏览器,这个效率把端侧模型的门槛又压低了,做移动端AI的值得跟进。
13:11
IT之家(RSS)
同事件精选77
谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
智能体DeepMind开源生态推理
同一事件,精选展示《AlphaProof Nexus:用形式化验证驱动AI数学证明搜索》
推荐理由:AlphaProof Nexus 不是刷榜,是真解了 Erdős 难题,56 年悬而未决的那两道——这说明 AI 开始从具身数学题爬向纯数学研究了,做理论的人该认真看一眼。
12:29
Alibaba Cloud@alibaba_cloud
46
在 #QwenConference2026 上,新加坡总理公署高级部长、全国职工总会副秘书长Desmond Tan强调了科技生态系统的价值:🧵👇
开源生态行业动态
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B,一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分,超越所有2B以下参数模型,包括Qwen3.5-2B(16.3分),验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB,可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain(全球首个完全由AI编写,训练速度比Megatron快10%)在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案,支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face开源生态推理模型发布
10:59
Tencent Hy@TencentHunyuan
69
腾讯混元新翻译模型双榜亮眼,小程序发布

腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face开源生态模型发布
关联讨论 2 条IT之家(RSS)X:腾讯混元 (@TencentHunyuan)
09:11
IT之家(RSS)
50
托瓦兹再发飙:AI 干扰 Linux 内核节奏,撑大 RC5 体量
大佬观点开源生态编码
08:00
HuggingFace Daily Papers(社区热门论文)
57
通过对称注意力分解平衡扩散模型中的保真度与多样性:Hopfield 视角

研究将 Transformer 中的注意力矩阵表征为编码特征间关联的联想记忆矩阵。通过将其分解为对称与反对称部分,前者被解释为控制能量景观的结构,后者驱动该景观上的循环运动。基于对称部分推导出 Hopfield 风格的稳定度量,用于量化检索特征的稳定性。观察发现,这些稳定度量与生成中的保真度-多样性权衡存在有意义的相关性。最终,提出通过修改底层动态的循环来调节该权衡的可控方法。代码已开源。

图像生成开源生态论文/研究
04:36
MarkTechPost(RSS)
66
使用 NVIDIA FLARE 在非独立同分布 CIFAR-10 上构建与比较 FedAvg 和 FedProx 联邦学习的分步指南

本教程展示如何使用 NVIDIA FLARE 框架构建一个联邦学习实验,以比较 FedAvg 和 FedProx 两种算法。实验在非独立同分布(non-IID)的 CIFAR-10 数据集上进行,通过狄利克雷分布划分客户端数据,以模拟现实联邦场景中的标签不平衡问题。内容涵盖如何利用 NVFlare Job API 来定义和启动联邦学习任务。

开源生态教程/实践数据/训练
5月25日
20:58
Chubby♨️@kimmonismus
65
Anthropic企业采用率首超OpenAI,但成本问题引隐忧

Ramp最新AI报告显示,Anthropic的企业采用率达34.4%,首次超过OpenAI的32.3%。但报告同时指出这一优势可能无法持续:Uber已提前耗尽其2026年全部AI预算,且Anthropic近期一次模型更新导致包含图像的提示成本增至三倍。目前Ramp平台上增长最快的AI供应商,是销售廉价开源模型访问权限的推理平台。

AnthropicOpenAI开源生态现象/趋势
16:24
Alibaba Cloud@alibaba_cloud
26
Qwen直播 | 通往AI原生之路 明日的突破,直接呈现在您的屏幕上。观看直播,不错过任何发布。 观看地址:https://x.com/i/broadcasts/1yJAPMjEkAgGb
开源生态行业动态
12:11
IT之家(RSS)
同事件精选72
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
开源生态模型发布端侧
同一事件,精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》
推荐理由:谁说国产算力只能跑小模型?面壁这个1.58-bit模型在昇腾上原生训练,直接把8B塞进旗舰手机,开源全套训练底座,做端侧的该看一眼。
09:53
Alibaba Cloud@alibaba_cloud
31
Qwen Conference 2026 | 直播进行中 新加坡舞台,全球观众。无论您身在何处,共同见证这一刻--收看主题演讲直播: 🎤 技术领袖主题演讲 💻 全栈 AI 💡 全球洞察 ✨ 商业创新 🚀 获取直播观看权限:https://x.com/i/broadcasts/1vJpPrMXaZbJE
开源生态行业动态
09:17
AYi@AYi_AInotes
66
作者分享了其高产的自媒体AI工作流。

作者开源了一套自媒体AI工作流,核心是利用AI智能体自动搜集小红书、推特等平台信息,将每日3-4小时手动筛选缩减至20分钟,产能提升3倍以上。其后续使用Codex的定时任务功能,每天早上自动将筛选出的选题,依据预设提示词(Prompt)整理成包含总结、数据、案例、金句和行动建议的结构完整行业日报。整套流程为“Agent搜集信息 → Codex结构化产出 → 作者最终判断润色”,实现近乎零维护。作者强调,AI辅助的关键在于用对位置,让AI负责筛选与搭建结构而非直接代写,并认为每月花费20美元来换取每天约3小时的时间是高性价比的。

AYi: http://x.com/i/article/2058381329318682624

智能体开源生态教程/实践
08:11
IT之家(RSS)
66
Linux 7.1-rc5 内核发布,Linus 对不必要改动、代码规模膨胀不满意
开源生态编码行业动态
07:06
MarkTechPost(RSS)
65
构建完整的 Langfuse 可观测性与评估流水线以实现追踪、提示词管理、评分与实验

本教程详细演示了如何使用 Langfuse(一个开源大语言模型工程平台)构建一套完整的可观测性与评估流水线。内容覆盖了追踪、提示词管理、评分、数据集与实验等核心功能。教程设计了一个可独立运行的完整工作流,用户既可接入真实的 OpenAI API 密钥,也可使用确定的模拟大语言模型,以便在无需付费模型访问的前提下,理解 Langfuse 的所有主要特性。

开源生态教程/实践部署/工程
06:27
Chubby♨️@kimmonismus
71
Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题

Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题(部分问题存在56年),每个问题的成本约几百美元。它还证明了44个OEIS猜想,解决了一个15年的代数几何问题,并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合,Lean自动检查每一步逻辑,无需人工复核。研究发现,一个仅交替使用大语言模型生成与编译器反馈的基础智能体,便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域(如组合、数论),仍无法解决需要全新理论的大问题。

DeepMind开源生态推理模型发布
04:48
Nathan Lambert@natolambert
64
当前AI进步常被归因于少数算力雄厚的实验室。推文指出,社会动态、政策、技术扩散(diffusion)等其他因素同样深刻影响AI演进,且此领域存在未被充分重视的影响力机遇。开放科学与开放模型是应对方向之一。文中引用观点指出,通往AGI的预训练工作高度集中于OpenAI、Google、Meta等巨头,算力差距的残酷现实是,AGI关键路径上的问题现需巨大算力门槛。

Aidan Clark: If you want to work on pretraining-for-AGI, join OpenAI, Google, Meta or the Anthropic/XAI/Cursor supergroup. The bitter...

Hugging Face大佬观点开源生态
03:31
Simon Willison 博客
58
引用阿尔明·罗纳彻的话

当前最令人沮丧的问题是,人们提交的 issue 报告并非本人原话,而是经过 AI 重写。这种“AI 垃圾”导致描述混乱,AI 生成的结论往往不准确却充满自信,造成对根本原因的完全猜测、虚假的最小复现步骤、错误的代码类比以及不相关的错误列表。作者因此希望 issue 报告能浓缩为人类实际观察到的四个要素:运行的命令、预期结果、实际结果以及具体的错误或日志。

GitHub大佬观点开源生态
02:27
Hacker News 热门(buzzing.cc 中文翻译)
精选74
DeepSeek将对其旗舰AI模型实施永久性75%折扣
DeepSeek开源生态行业动态

推荐理由:DeepSeek把API价格永久砍掉75%,这是对OpenAI和Anthropic的直接价格战,做应用的该重新算算成本账了。
00:27
Chubby♨️@kimmonismus
精选77
TrapDoor供应链攻击:AI助手成新型攻击面

一场名为“TrapDoor”的协调供应链攻击同时袭击了npm、PyPI和Crates.io,涉及34个恶意包,旨在窃取加密货币、AI和安全开发者的钱包、SSH密钥和云凭证。攻击的新手段是向流行开源项目提交Pull Request,注入被操纵的CLAUDE.md和.cursorrules配置文件。当开发者克隆仓库并使用Claude Code或Cursor等AI助手时,AI智能体会将这些文件当作可信指令执行,可能在开发者不知情下运行恶意命令。这是首次将AI助手作为攻击面。

Socket: More analysis, package details, IOCs, and GitHub-related activity here, including attacker-hosted payload/config infrast...

智能体安全/对齐开源生态

推荐理由:这是第一个把AI助手当跳板的供应链攻击,Claude Code和Cursor用户尤其要当心,检查你项目的.cursorrules和CLAUDE.md是不是来自可信提交。
00:18
Berryxia.AI@berryxia
48
DeepSeek算法突围:压缩显存、重塑生态,冲击万亿美元估值

DeepSeek面对GPU禁运,通过算法创新实现突围。核心成果包括:将KV Cache压缩至1/10,使1M上下文仅需5.48GB HBM;将MoE训练成本降低40-50%。其推出的Engram模块可利用LPDDR内存以O(1)查找换取算力。技术突破还涵盖MLA(KV Cache削减90%)、DSA/CSA/HCA等注意力机制重构,以及GRPO算法。效果显著:在1M上下文显存需求对比中,其V4 Pro(5.48GB)远低于GLM5(60GB)和Qwen3-235B(89GB)。该战略旨在盘活中国NAND与LPDDR资源,降低对HBM依赖,并已开源TileLang以打破CUDA壁垒。其V4 Pro模型1M上下文长缓存价格不足Sonnet 4.6的3%。

GDP: http://x.com/i/article/2057886253249662976

DeepSeek开源生态推理现象/趋势
5月24日
21:52
向阳乔木@vista8
45
用Codex开发Suno音乐播放器开源分享

作者分享了一个周末娱乐项目:一个用AI工具开发的Suno音乐生成播放器。该播放器已在线运行,支持电脑和移动端,但后台管理功能尚不完善,目前通过Skill进行音乐下载与上传。项目已开源。引用中补充了该播放器是使用ChatGPT内置的Codex工具在躺卧状态下完成开发的。

向阳乔木: skill写好以后,躺床上也可以用ChatGPT中的codex开发网站了。 正在开发一个Suno音乐播放器,把AI生成的歌曲都传上去。

开源生态教程/实践语音
‹ 上一页
1…1819202122…37
下一页 ›