-
概述
- NRMS(Neural News Recommendation with Multi - Head Self - Attention)是一种基于神经网络的新闻推荐技术。随着互联网上新闻资讯的爆炸式增长,如何为用户精准地推荐他们感兴趣的新闻成为一个关键问题,NRMS技术应运而生。
-
模型结构
-
新闻表示层
- 文本嵌入(Text Embedding):首先,新闻文本中的每个单词会被转换为低维向量表示,这通常是通过预训练的词嵌入模型(如Word2Vec或Glove)来实现的。这些词向量能够捕捉单词的语义信息。例如,“苹果”这个词在词向量空间中会根据其上下文有不同的表示,若是在科技新闻中可能与“手机”“电子产品”等词向量接近;若是在水果新闻中则会和“水果”“果园”等词向量更相关。
- 多头自注意力机制(Multi - Head Self - Attention):这是NRMS的核心组件之一。多头自注意力机制能够在新闻文本内部计算单词之间的相互关系,它可以同时从多个角度捕捉新闻文本的语义信息。例如,在一篇体育新闻中,它可以关注比赛的比分、参赛队伍、比赛时间等不同元素之间的关系,而不仅仅是单词的顺序。通过这种方式,能够更有效地提取新闻的语义特征,生成更具代表性的新闻表示。
-
用户表示层
- 用户历史行为建模:为了表示用户的兴趣,NRMS会考虑用户过去阅读新闻的历史行为。通过将用户阅读过的新闻表示进行聚合,例如简单的平均或者更复杂的基于注意力的聚合方式,来构建用户的兴趣表示。假设一个用户经常阅读科技类新闻,那么通过聚合这些新闻的表示,就可以得到一个能够反映该用户对科技领域感兴趣的用户表示。
-
推荐层
- 匹配计算:在得到新闻表示和用户表示后,NRMS会计算它们之间的匹配分数。这个匹配分数可以通过点积或者其他更复杂的神经网络层来计算。匹配分数表示了用户对某条新闻感兴趣的程度。例如,匹配分数高的新闻会被认为是用户可能更感兴趣的新闻,从而可以推荐给用户。
- 排序和推荐:根据匹配分数对新闻进行排序,然后选择分数较高的新闻推荐给用户。同时,为了提高推荐的多样性和准确性,可能还会采用一些后处理技术,如去除相似度过高的新闻或者根据新闻的时效性等因素进行调整。
-
-
优势
- 语义理解能力强:通过多头自注意力机制,NRMS能够深入挖掘新闻文本的语义信息,更好地理解新闻内容。这使得它在处理复杂的新闻主题和多样化的语言表达时具有优势,能够更准确地把握新闻的关键信息。
- 个性化推荐效果好:考虑用户的历史阅读行为来构建用户表示,能够有效地捕捉用户的个性化兴趣。这种个性化的推荐方式可以提高用户对推荐新闻的接受度和满意度,增加用户在新闻平台上的粘性。
- 灵活性和可扩展性:NRMS技术基于神经网络架构,具有很好的灵活性和可扩展性。可以方便地与其他技术(如知识图谱、多模态信息)相结合,进一步提升推荐性能。例如,结合知识图谱可以引入更多的背景知识,使推荐更加智能。
-
应用场景
- 新闻媒体平台:在各大新闻网站和移动新闻客户端中,NRMS技术可以帮助平台根据用户的兴趣为他们精准推荐新闻。如今日头条、腾讯新闻等平台可以利用NRMS来提高用户体验,增加用户留存率和阅读量。
- 资讯聚合应用:一些资讯聚合应用通过收集多个来源的新闻资讯,然后利用NRMS技术为用户筛选和推荐感兴趣的新闻。这可以帮助用户快速找到自己关心的新闻,节省搜索时间。
NRMS(Neural News Recommendation with Multi - Head Self - Attention)
推荐系统相关文章
- 推荐系统中序列建模优化的思路和常见模型(DIN、DIEN等)
- MMoE - Multi-gate Mixture-of-Experts - 多任务排序算法
- 论文:Modeling the Sequential Dependence among Audience Multi-step Conversions with Multi-task Learning in Targeted Display Advertising(AITM)
- 论文:A Survey on Large Language Models for Recommendation,大语言模型在推荐系统中的应用综述
- 推荐系统 | 疲劳度建模
- Self-Attentive Sequential Recommendation(SASRec)
- 推荐系统中的时长建模
- HPMN:基于个性化记忆的终身顺序建模用于用户响应预测
- 推荐模型提效常用方法
- 样本稀疏问题和解决方案
最近热门
- Straight-Through Estimator(STE, 直推估计器)
- 流匹配(Flow Matching,FM)
- 模型证据下界(Evidence Lower Bound,ELBO)
- LLM | Chain of Thought(CoT,思维链)
- Zero Redundancy Optimizer(ZeRO)内存优化技术
- 面向任意目标的全库向量召回技术PDM
- 多模态对齐(Multimodal Alignment)
- STT模型(Speech-to-Text)
- 论文:HoME - Hierarchy of Multi - Gate Experts for Multi - Task Learning at Kuaishou
- RQ-VAE(Residual-Quantized VAE)变分自编码器和残差量化
最常浏览
- 016 推荐系统 | 排序学习(LTR - Learning To Rank)
- 偏微分符号
- i.i.d(又称IID)
- 利普希茨连续条件(Lipschitz continuity)
- (error) MOVED 原因和解决方案
- TextCNN详解
- 找不到com.google.protobuf.GeneratedMessageV3的类文件
- Deployment failed: repository element was not specified in the POM inside distributionManagement
- cannot access com.google.protobuf.GeneratedMessageV3 解决方案
- CLUSTERDOWN Hash slot not served 问题原因和解决办法
×