LabelEncoder
简单说,LabelEncoder就是对不连续的数字或者文本进行编号。
示例代码
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit([1,5,67,100])
le.transform([1,1,100,67,5])
输出
array([0, 0, 3, 2, 1])
OneHotEncoder
OneHotEncoder用来将表示分类的数据扩维。
示例代码
from sklearn.preprocessing import OneHotEncoder
ohe = OneHotEncoder()
ohe.fit([[1],[2],[3],[4]])
ohe.transform([[2],[3],[1],[4]]).toarray()
输出
array([[ 0., 1., 0., 0.],
[ 0., 0., 1., 0.],
[ 1., 0., 0., 0.],
[ 0., 0., 0., 1.]])