ChatGLM3是由智谱AI和清华大学KEG实验室联合发布的新一代对话预训练模型,它是ChatGLM系列的第三版。以下是关于ChatGLM3的一些关键信息:
-
性能提升和功能扩展:ChatGLM3继承了前两代模型对话流畅、部署门槛低等特性,并在此基础上进行了全面的性能提升和创新性功能扩展。
-
主要特性:
- 强大的语义能力:在中文问答方面表现出色,能够理解复杂的语境和语义,提供准确的信息和回答。
- 多模态大模型:支持多模态输入,包括文本、图像、声音等,能够处理和生成多模态数据。
- 工具调用和代码执行:支持工具调用和代码执行,能够根据用户需求生成代码并执行,完成复杂的数据分析和任务。
- 网络搜索增强:集成了网络搜索能力,能够自动根据问题在互联网上查找相关资料,并在回答时提供参考链接。
- 自研的AgentTuning技术:引入了自研的AgentTuning技术,提升了智能规划和执行能力。
-
应用场景:
- 自然语言处理:可用于文本生成、文本分类、情感分析等自然语言处理任务。
- 智能客服和助手:可以作为智能客服或个人助手,提供24/7的在线咨询服务。
- 内容创作和编辑:ChatGLM3也可以应用于内容创作和编辑领域。
-
开源模型:ChatGLM3-6B是ChatGLM3系列中的开源模型,它在保留了前两代模型的优秀特性的基础上,引入了更强大的基础模型、更完整的功能支持和更全面的开源序列。
-
多模态能力:官方宣称多模态理解能力的CogVLM,在10余个国际标准图文评测数据集上取得SOTA(State of the Art)。
-
端侧推理:推出了可手机部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持在手机端的调用,速度可以达到20 tokens/s。
ChatGLM3的发布标志着国产大语言模型系列的快速发展,它在AI Agent、代码执行、多模态等方面都有非常好的布局和提升,值得大家关注。