Node2vec是一种用于网络中节点嵌入的半监督算法,它通过随机游走和深度学习模型的结合来生成能够保留网络拓扑结构与节点相似性的高效节点嵌入。Node2vec的核心思想是定义了一个灵活的二阶随机游走模型,通过调节游走策略的偏置参数,能够在网络中模拟不同类型的游走行为,从而捕捉到节点间的多种局部和全局关系。这种方法可以看作是DeepWalk的一种扩展,它综合考虑了DFS(深度优先搜索)邻域和BFS(广度优先搜索)邻域。
Node2vec的关键贡献在于为一个顶点的网络邻节点定义了一个灵活的概念。通过选择一个合适的概念,node2vec可以学到网络表示,它们可以基于现在的网络角色,或者属于的社群来进行组织。论文通过开发一个有偏的随机游走(biased random walks)的族谱,它可以有效探索一个给定顶点的邻居分布。结果算法很灵活,提供可调参数给我们以对搜索空间进行控制,而不是进行严格搜索(rigid search)。相应的,论文的方法可以建模网络等价物。参数管理着搜索策略,具有一个直观解释,会让walk朝着不同的网络搜索策略进行偏移。
Node2vec的应用包括社区检测、链路预测、节点分类和网络结构的可视化展示。它通过学习节点的嵌入表示,可以用于多种预测任务,如多标签分类和链路预测,在多个领域的实际网络中都显示出了优于现有技术的效果。Node2vec算法框架为学习网络中节点的连续特征表示提供了一种新的方法,它通过最大化保留节点网络邻域的可能性来学习这种映射。