目录

流程篇

处理日志

该步骤包括各种数据清洗工作,很繁琐

特征抽取和处理

特征抽取的工作包括离散特征、连续特征的抽取,特征处理包括特征归一化等

生成样本

生成不同模型所需要的样本形式

训练模型

选择模型进行训练

评估效果

使用合理的指标评估相应效果

线上预测

如果是线上使用,还需要将模型安装到线上

工具篇

科学计算库

  • pandas
  • numpy

机器学习库

  • sklearn
  • lgb
  • xgboost

稀疏矩阵库

  • Scipy.sparse

深度学习库

  • Tensorflow