本周多项前沿AI研究取得突破。开源模型DeepSeek V4具备百万token上下文和1.6T参数,性能接近顶级闭源模型而成本更低。Autogenesis协议使AI Agent能自主发现能力缺口并自我进化。Apple Attention to Mamba提出将Transformer蒸馏至Mamba架构的新方法,实现线性推理加速。此外,Skill-RAG等研究也展示了领域的快速进展。
本周AI论文大爆炸! @dair_ai 精选Top 10最硬核研究
1️⃣ DeepSeek V4:原生百万token上下文开源模型!1.6T参数混合注意力(CSA+HCA),性能直逼GPT-5.2和Gemini 3.0-Pro,成本仅为闭源模型一小部分!开源长上下文新王者诞生🔥
2️⃣ Autogenesis:AI Agent自我进化协议!自主发现能力缺口、生成改进、测试验证、自动集成,无需人类打补丁,真正实现自我升级!
3️⃣ Apple Attention to Mamba:Transformer蒸馏成Mamba新方案!两阶段线性注意力过渡,1B模型接近Pythia-1B性能,推理速度线性加速!
还有Skill-RAG、Self-Generated World Knowledge、Self-Evolving Logic Synthesis、Stateless Decision Memory等重磅论文…
AI研究又一次集体起飞!哪个最让你兴奋?👇