目录

negative sampling

负采样似然函数

![avatar](/static/ueditor/php/upload/image/20171214/135146218199.png)

P(w)通常取为U(w)3/4

幂次项对超高频的word起到了下采样的作用。

同时与之前的方法一致,负采样时根据词频决定采样的可能性大小。

某个单词采样的可能性大小如下,参数取3/4。

模型涉及的超参

  • 向量的维度
  • context window的大小

评估方法

Intrinsic评估,向量类比(word vector analogies),评估一组词向量在语义和句法上表现出来的线性关系。

参考