前言

蒙特卡洛树搜索是一种经典的树搜索算法,名镇一时的 AlphaGo 的技术背景就是结合蒙特卡洛树搜索和深度策略价值网络,因此击败了当时的围棋世界冠军。它对于求解这种大规模搜索空间的博弈问题极其有效,因为它的核心思想是 把资源放在更值得搜索的分枝上,即 算力集中在更有价值的地方。

步骤

  • MCTS的算法主要分为四个步骤,分别为 选择、扩展、模拟、回溯。

参考

  • https://blog.csdn.net/weixin_41960890/article/details/125915825