• 太多的Worker会导致梯度过时问题更严重
  • PS太少会导致参数更新慢,也会降低训练速度