智谱:研究(网页内嵌数据)
GLM-5技术报告
精选理由
智谱发布744B参数GLM-5,全面适配七大国产芯片平台,Agent与编码能力突出
AI 摘要
GLM-5参数规模达7440亿,训练Token 28.5万亿。核心创新包括DSA稀疏注意力机制降低算力开销,异步RL基础设施与异步Agent RL算法提升长周期交互与自主决策能力。全面原生适配华为昇腾、寒武纪等七大国产芯片平台,通过W4A8混合精度量化与定制融合算子实现高效部署。模型支持复杂软件工程、终端操作、PPT生成等长程Agent任务,提供交错思考、保留思考等多种推理模式。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文zhipuai.cn