简介

  • 双下降现象:在一段时间内,模型越大效果越差。
  • 这些现象会导致数据越多效果越差,此时在更大的训练集上训练一个深层网络的效果实际上更差。

参考

  • https://blog.csdn.net/u011984148/article/details/103471096