简介
通过调节机器学习模型的容量,可以控制模型是否偏于过拟合还是欠拟合。
模型容量
容量从本质上说是描述了整个模型的拟合能力的大小。如果容量不足,模型将不能够很好地表示数据,表现为欠拟合;如果容量太大,那么模型就很容易过分拟合数据,因为其记住了不适合与测试集的训练集特性,表现为过拟合。
因此控制好模型的容量是一个关键问题。
控制方法
容量的控制可以通过多种方法控制,包括:
- 控制模型的假设空间。
- 添加正则项对模型进行偏好排除。
相关结论
当机器学习算法的容量适合于所执行任务的复杂度和所提供训练数据的数量时, 算法效果通常会最佳。
容量不足的模型不能解决复杂任务。 容量高的模型能够解决复杂的任务,但是当其容量高于任务所需时,有可能会过拟合。