评估指标
precision, recall, f1-score, area under ROC
SGD
SGD算法支持使用L1和L2正则化方法。
SGD优化的终止条件是通过指定numIterations也就是迭代次数终止的。
input:输入数据集合,分类标签lable只能是1.0和0.0两种,feature为double类型
SGD默认参数
numIterations:迭代次数, 默认为100
stepSize:迭代步伐大小,默认为1.0
miniBatchFraction:每次迭代参与计算的样本比例,默认为1.0
initialWeights:weight向量初始值,默认为0向量
regParam:regularization正则化控制参数,默认值为0.0
LBFGS
LBFGS算法只支持L2正则化,不支持L1正则化。
LBFGS优化的终止条件是通过指定convergenceTol(两次迭代loss function变化的容忍度)和maxNumIterations(最大迭代次数)来终止的。