问题状态
问题已解决
解决方案
主要设置以下两个参数,单位为秒,根据执行时间,设置相应值就可以,这里是300s,表示执行5min
spark.akka.timeout=300
spark.network.timeout=300
其他参考
可以考虑使用以下参数配置。
1. 效率及稳定性相关参数
建议打开map(注意,在spark引擎中,也只有map和reduce两种task,spark叫ShuffleMapTask和ResultTask)中间结果合并及推测执行功能:
spark.shuffle.consolidateFiles=true
spark.speculation=trure
2. 容错相关参数
建议将这些值调大,比如:
spark.task.maxFailures=8
spark.akka.timeout=300
spark.network.timeout=300
spark.yarn.max.executor.failures=100