目录
流程篇
处理日志
该步骤包括各种数据清洗工作,很繁琐
特征抽取和处理
特征抽取的工作包括离散特征、连续特征的抽取,特征处理包括特征归一化等
生成样本
生成不同模型所需要的样本形式
训练模型
选择模型进行训练
评估效果
使用合理的指标评估相应效果
线上预测
如果是线上使用,还需要将模型安装到线上
工具篇
科学计算库
- pandas
- numpy
机器学习库
- sklearn
- lgb
- xgboost
稀疏矩阵库
- Scipy.sparse
深度学习库
- Tensorflow