2016年阿尔法go 以4:1的比分打败李世石,从这一时刻开始,优化程序在很多垂直领域比人类更敏捷、更具备高效率的观点被越来越多的人所理解。虽然大家知道是AI ,但是和我们目前所理解的 LLM (大语言模型)是不同的。阿尔法go 是采用的是深度学习的方式去实现找到“最优解”, 其实这个过程和工厂里边的排产是一模一样的。首先我们先来看看阿尔法go 的原理。对于每下一手,可能都存在无数多种可能性的方案,如果在各种方案中找到找到最好的一种下法(最优决策),那么就需要完成三个事情:①:让决策引擎知道围棋的规则,例如已经被落子的位置不能再落子、每次落子只能落1子、棋子的气是......②:让决策引擎知道...