智谱:研究(网页内嵌数据)
GLM-4.6V:支持原生工具调用的开源多模态模型
精选理由
智谱开源 GLM-4.6V,原生支持工具调用的多模态 Agent 底座
AI 摘要
智谱开源GLM-4.6V系列多模态模型,含106B-A12B基础版与9B轻量版Flash,支持128k tokens上下文。首次原生集成Function Call能力,支持图像、截图直接作为工具参数,并能理解工具返回的视觉内容。具备复杂文档理解、视觉网页搜索、前端代码生成及交互式编辑能力,适用于构建多模态Agent。已上架GitHub、Hugging Face及魔搭社区。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文zhipuai.cn