关于偏好表示(preference representations)和偏好嵌入(preference embeddings),以下是一些关键点:
- 偏好表示与嵌入在机器学习中的应用:
- 在自然语言处理(NLP)中,偏好表示和嵌入被用来从文本中识别和预测偏好。例如,通过使用基于transformer的词嵌入和图神经网络等现代机器学习技术,可以从单个文本片段中预测两者之间的偏好。
-
大型语言模型(LLMs)和基础模型在多智能体场景中,如谈判、委托和群体决策等问题中,展现出了识别文本中表达的偏好的潜力。
-
偏好表示学习:
-
有研究提出了一种方法,通过将响应嵌入到潜在空间中来捕获复杂的偏好结构,这种方法被称为偏好表示学习。这种方法能够高效地实现线性查询复杂度,并且提出了基于偏好分数的通用偏好优化(GPO),它从人类反馈中泛化了基于奖励的强化学习。
-
通过偏好对学习人类偏好表示:
-
另一项研究介绍了一个框架,通过偏好对来学习人类偏好的表示,这个框架超越了传统的奖励建模,以构建更丰富、更有结构的人类偏好表示。
-
用户嵌入模型:
-
在推荐系统中,为了增强对用户偏好的理解,有研究提出了用户嵌入模块(UEM),它通过将用户历史压缩并表示为嵌入,用作语言模型的软提示,以处理自然语言中的长用户历史。
-
融合学习偏好和偏差:
-
还有研究提出了一个偏好和偏差导向的融合学习(PBFL)模型,该模型基于评论和用户偏好来预测评分,同时嵌入了传统的用户偏好、交互特征和评分特征。
-
基于自适应图神经网络的偏好学习:
- 在多标准决策支持系统中,有研究探讨了如何使用图神经网络(GNNs)来捕获决策因素之间的偏好关系,以提高决策性能。
这些研究表明,偏好表示和嵌入在机器学习和NLP领域中是一个活跃的研究领域,它们有助于提高模型对人类偏好的理解,并在多种应用中实现更精准的预测和决策支持。