腾讯混元大模型是由腾讯全链路自研的通用大语言模型,具有以下特点:

  • 发展历程:2023年8月3日进入应用内测阶段;9月获国家网信办备案,9月6日“腾讯混元助手”小程序上线微信,9月7日在腾讯全球数字生态大会上正式亮相并通过腾讯云对外开放,拥有超千亿参数规模,预训练语料超2万亿tokens;12月通过国内“大模型标准符合性评测”测试。2024年,模型不断升级和拓展功能,如4月技术架构升级为混合专家模型(MoE)架构,参数规模达万亿;5月14日宣布混元大模型升级并对外开源;9月5日推出新一代大模型“混元Turbo”,性能显著提升。

  • 核心能力

    • 多轮对话:具备上下文理解和长文记忆能力,能流畅完成各专业领域的多轮问答。
    • 内容创作:支持文学创作、文本摘要、角色扮演等,生成内容流畅、规范、中立、客观。
    • 逻辑推理:可以准确理解用户意图,基于输入数据或信息进行推理、分析,还擅长数学推导。
    • 知识增强:能够有效解决事实性、时效性问题,快速检索相关内容,提升内容生成效果。
    • 多模态:支持文字生成图像、图片理解等多模态功能,输入指令即可将文字转化为图画,也可基于图片进行理解、创作等。
  • 产品规格

    • hunyuan - turbo - latest:混元旗舰大模型最新版本,最大输入28K,最大输出4K,有更好的模型效果和更快的性能表现。
    • hunyuan - turbo - 20241120:固定版本,最大输入28K,最大输出4K,具有更强大的中文创作、逻辑推理、数学计算和多轮对话能力,以及更优秀的泛化效果。
    • hunyuan - large - longcontext:重磅推出的版本,最大输入128K,最大输出6K,擅长处理长文任务,如文档摘要和文档问答等,在长文本的分析和生成上表现优异。
    • hunyuan - standard:高性价比版本,最大输入30K,最大输出2K,为32K多专家模型,可处理长文本输入。
    • hunyuan - standard - 256k:超长上下文版本,最大输入250K,最大输出6K,256K超长上下文多专家模型,长文效果表现优秀。
    • hunyuan - lite:免费体验版本,最大输入250K,最大输出6K,能满足绝大部分对效果、推理性能、成本控制相对平衡的需求场景。
    • hunyuan - translation:重磅推出的翻译模型,最大输入4K,最大输出4K,支持中文和15种语言互译,在十余种常用语种中外互译能力上整体优于市场同规模模型。
    • hunyuan - code:代码专属模型,最大输入4K,最大输出4K,在代码对话生成场景具有更好的基础效果,Python、C++、JS、Java、Go等代码语言效果评测优于市场同规模模型。
    • hunyuan - functioncall:专属模型,最大输入28K,最大输出4K,支持并行多工具调用,支持多轮对话下的工具调用等。
    • hunyuan - role:角色扮演专项模型,最大输入28K,最大输出4K,适用于角色扮演场景,在IP类角色、情感陪伴类角色设定与对话上具有更好基础效果。
  • 应用场景

    • 文档场景:提供文档创作、文本润色、文本校阅、表格公式及图表生成等能力,提高创作效率。
    • 会议场景:提供会中问答、会议总结、会议待办项整理等能力,简化会议操作并提高效率。
    • 客服场景:提供智能化的客服,提升工作效率。
    • 营销场景:构建智能导购,帮助商家提升服务质量和效率。

此外,腾讯混元大模型在不断发展和完善中,其技术实力获多方认可,在中国电子学会2023科学技术奖评选中,腾讯混元《面向大规模数据的Angel机器学习平台关键技术及应用》获科技进步一等奖。目前,腾讯内部近700个业务及场景已接入,包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等,并且还在积极推进对外应用落地,为广大用户和企业提供高效、智能的文本处理解决方案。