评估指标

precision, recall, f1-score, area under ROC


SGD

SGD算法支持使用L1和L2正则化方法。

SGD优化的终止条件是通过指定numIterations也就是迭代次数终止的。

input:输入数据集合,分类标签lable只能是1.0和0.0两种,feature为double类型


SGD默认参数

numIterations:迭代次数, 默认为100

stepSize:迭代步伐大小,默认为1.0

miniBatchFraction:每次迭代参与计算的样本比例,默认为1.0

initialWeights:weight向量初始值,默认为0向量

regParam:regularization正则化控制参数,默认值为0.0


LBFGS

LBFGS算法只支持L2正则化,不支持L1正则化。

LBFGS优化的终止条件是通过指定convergenceTol(两次迭代loss function变化的容忍度)和maxNumIterations(最大迭代次数)来终止的。