阿尔法狗(AlphaGo)是一款 围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的团队开发。它通过深度学习和强化学习技术,在2016年击败了世界冠军李世石,引起了全球轰动。阿尔法狗的主要工作原理是深度学习,它利用“价值网络”去计算局面,用“策略网络”去选择下子。在与李世石对阵之前,谷歌首先用人类对弈的近3000万种走法来训练“阿尔法狗”的神经网络,让它学会预测人类专业棋手怎么落子。然后更进一步,让AlphaGo自己跟自己下棋,从而又产生规模庞大的全新的棋谱。