它用蒙地卡罗模拟许多可能,再用算法决定最好的一步。所以这一步是唯一的。那它开局应该每手棋都一样啊?当然据说它会从下过的棋学习。那第四盘它输了它怎么知道是那几手下错了?前三盘李输了,它也能知道李那几手下错了?