腾讯混元大模型

腾讯混元大模型是由腾讯全链路自研的通用大语言模型，具有以下特点：

发展历程：2023年8月3日进入应用内测阶段；9月获国家网信办备案，9月6日“腾讯混元助手”小程序上线微信，9月7日在腾讯全球数字生态大会上正式亮相并通过腾讯云对外开放，拥有超千亿参数规模，预训练语料超2万亿tokens；12月通过国内“大模型标准符合性评测”测试。2024年，模型不断升级和拓展功能，如4月技术架构升级为混合专家模型（MoE）架构，参数规模达万亿；5月14日宣布混元大模型升级并对外开源；9月5日推出新一代大模型“混元Turbo”，性能显著提升。
核心能力：
- 多轮对话：具备上下文理解和长文记忆能力，能流畅完成各专业领域的多轮问答。
- 内容创作：支持文学创作、文本摘要、角色扮演等，生成内容流畅、规范、中立、客观。
- 逻辑推理：可以准确理解用户意图，基于输入数据或信息进行推理、分析，还擅长数学推导。
- 知识增强：能够有效解决事实性、时效性问题，快速检索相关内容，提升内容生成效果。
- 多模态：支持文字生成图像、图片理解等多模态功能，输入指令即可将文字转化为图画，也可基于图片进行理解、创作等。
产品规格：
- hunyuan - turbo - latest：混元旗舰大模型最新版本，最大输入28K，最大输出4K，有更好的模型效果和更快的性能表现。
- hunyuan - turbo - 20241120：固定版本，最大输入28K，最大输出4K，具有更强大的中文创作、逻辑推理、数学计算和多轮对话能力，以及更优秀的泛化效果。
- hunyuan - large - longcontext：重磅推出的版本，最大输入128K，最大输出6K，擅长处理长文任务，如文档摘要和文档问答等，在长文本的分析和生成上表现优异。
- hunyuan - standard：高性价比版本，最大输入30K，最大输出2K，为32K多专家模型，可处理长文本输入。
- hunyuan - standard - 256k：超长上下文版本，最大输入250K，最大输出6K，256K超长上下文多专家模型，长文效果表现优秀。
- hunyuan - lite：免费体验版本，最大输入250K，最大输出6K，能满足绝大部分对效果、推理性能、成本控制相对平衡的需求场景。
- hunyuan - translation：重磅推出的翻译模型，最大输入4K，最大输出4K，支持中文和15种语言互译，在十余种常用语种中外互译能力上整体优于市场同规模模型。
- hunyuan - code：代码专属模型，最大输入4K，最大输出4K，在代码对话生成场景具有更好的基础效果，Python、C++、JS、Java、Go等代码语言效果评测优于市场同规模模型。
- hunyuan - functioncall：专属模型，最大输入28K，最大输出4K，支持并行多工具调用，支持多轮对话下的工具调用等。
- hunyuan - role：角色扮演专项模型，最大输入28K，最大输出4K，适用于角色扮演场景，在IP类角色、情感陪伴类角色设定与对话上具有更好基础效果。
应用场景：
- 文档场景：提供文档创作、文本润色、文本校阅、表格公式及图表生成等能力，提高创作效率。
- 会议场景：提供会中问答、会议总结、会议待办项整理等能力，简化会议操作并提高效率。
- 客服场景：提供智能化的客服，提升工作效率。
- 营销场景：构建智能导购，帮助商家提升服务质量和效率。

此外，腾讯混元大模型在不断发展和完善中，其技术实力获多方认可，在中国电子学会2023科学技术奖评选中，腾讯混元《面向大规模数据的Angel机器学习平台关键技术及应用》获科技进步一等奖。目前，腾讯内部近700个业务及场景已接入，包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等，并且还在积极推进对外应用落地，为广大用户和企业提供高效、智能的文本处理解决方案。

腾讯混元大模型

LLM相关文章

腾讯相关文章

最近热门

最常浏览