设为首页 - 加入收藏 惠州站长网 (http://www.0752zz.com)- 国内知名站长资讯网站,提供最新最全的站长资讯,创业经验,网站建设等!
热搜: 如何 企业 用户 中国
当前位置: 首页 > 创业 > 经验 > 正文

为什么又说,AlphaGo挺“笨”的?

发布时间:2019-03-02 12:41 所属栏目:[经验] 来源:互联网
导读:记得小时候,城里来了个机器人展,于是买了门票,兴致勃勃的去看,有踢球的,有打球的,有玩游戏的,有讲故事的,有谈情说爱的,等等。我最感兴趣的是一个能和我对话的机器人,她会问我问题,也会回答我的问题,好神奇呀。 天真无暇的我,玩的很开心,心中

  记得小时候,城里来了个机器人展,于是买了门票,兴致勃勃的去看,有踢球的,有打球的,有玩游戏的,有讲故事的,有谈情说爱的,等等。我最感兴趣的是一个能和我对话的机器人,她会问我问题,也会回答我的问题,好神奇呀。

  天真无暇的我,玩的很开心,心中有了追求科学的梦想。

  但是,后来有人告诉我,其实当时每个机器人里面都是藏着一个真人,于是心中咯噔一下,有些沮丧,幼小的心灵就这么受伤了。

为什么又说,AlphaGo挺“笨”的?

  现在,人工智能取得了飞速发展和进步,儿时的记忆的场景已经完全反转了。看看AlphaGo和李世石的围棋比赛,其中最大的看点和吐槽应该是图片中的石头人黄博士。

  这时,机器人走到了后台,充当了智能的核心,而人,也就是黄博士,只是起到了人机交互的媒介。

为什么又说,AlphaGo挺“笨”的?

  看来,这次和柯洁的比赛,依然没有改变这种现状,因为现状太难改变了。

  还是黄博士,而不是黄博士化身的机器人,我是多么期待真正的机器和人下围棋。

为什么又说,AlphaGo挺“笨”的?

  这么来说,有些异样,为什么这么聪明的AlphaGo,不真正做成一个机器人,能看棋盘,能下棋子,能思考,还能说笑,会不会更好玩。

  其实,有时看起来简单的事情,让机器来做不一定简单,这是后话,不啰嗦了。

  好了,段子讲完了,该言归正传了。

  为免被唾沫淹死,首先申明一下,AlphaGo确实很厉害的,也不简单。但是,为什么又说,AlphaGo挺“笨”的呢?

  我们知道,围棋的搜索空间很大,有3的19x19次方个状态,要在这么大的空间去找最优算法,一个一个看是不可能的,所以被认为人类智能的一个高点,解决时需要优化搜索。

  人是根据一些输入空间和参数较少的模式识别来记忆和搜索,而机器采用的却是大数据,大记忆和大计算来实现的。

  说到AlphaGo后面的智能和算法,就不能不说深度学习(DL)、强化学习(RL),和蒙特卡洛树搜索(MCTS)。

  深度学习,主要用来学习和建立两个模型网络。一个是评测现在的棋盘状态如何,也就是说给当前的棋盘状态打个分,评估一下赢的期望值,它就是价值网络(ValueNetwork)。输入是棋盘19x19每个点的状态,有子或无子,输出是赢的期望值。

  按理说,如果要是有一个聪明的数学家或是机器足够聪明,说不准他马上就能在黑板上写一个高级的数学公式。很遗憾,现在还没有,所以,只能用多层的神经元网络来近似表示这个高级的函数。这么来说,是不是有点“笨”。

  二是根据现在的棋盘状态,决定下一个棋子该如何走才能有最大的赢的概率,它就是AlphaGo的策略网络(PolicyNetwork)。也就是说,给一个19x19的棋盘状态,在所有空的地方,哪个是最佳的选择,会有最大的赢率。

  同样,也可以用一个函数来描述,输入是当前棋盘状态,输出是每个空处和它期望的赢的期望值,但这个函数还没有一个高级的数学公式,所以,最后也求助于多层神经网络。

为什么又说,AlphaGo挺“笨”的?

  但是,这两个深度学习网络模型,怎么训练出来的呢?这时,不得不说随机梯度下降(SGD),这个“笨”办法。

为什么又说,AlphaGo挺“笨”的?

  为了求一个目标函数的最优值,复杂一点的,不能像解一个二次方程一样,用一个简单的公式就能得到方程的解。

为什么又说,AlphaGo挺“笨”的?

  对于,围棋这种深度学习要求的目标函数,没有一个简单的求解公式,那怎么办?

  只能求助于迭代,随机梯度下降迭代(SGD),就像爬山,每往上走一步,都是接近山顶一点点,或者叫摸着石头过河。毕竟机器的计算能力强,这种数值计算,是它的强项,就让它拼命的算,直到算到一个还算满意的结果。

  这回知道了吧,为什么GPU这种东西来做这种重复简单的计算。这么说来,是不是有点“笨”?

  就像我们一个公式不会解时,就从1开始带入计算,看看是不是满足条件。或是,做选择题有四个选项,每个选项代入公式算一下。

为什么又说,AlphaGo挺“笨”的?

  这些玩意儿,都是线下用大量数据,做大量的辛苦计算得到的,赚的是不是辛苦钱呀。那么,在真正下棋的时候,用它们就能减少或是已经预算了很大的搜索空间,不好的状态,,不好的棋子,就不用花时间去看了。

  在平时不比赛的时候,机器也不会闲着,毕竟还有很多状态没有尝试过,毕竟那些暂时认为不好的棋子不一定最后不好,那怎么办?

为什么又说,AlphaGo挺“笨”的?

  AlphaGo有自己的想法,它求助于强化学习,也就是self-play,或是左右手互搏,来提前尝试更多的搜索空间,减少未知空间,同时通过深度学习的网络模型记录下来,提高前面两个模型网络的效果,那么真正下棋的时候就能用上。

  这就是平时多努力,老大不白头。这种劳模的精神,在现实生活中,有时会不会被认为时有点“笨”,只会死干。

为什么又说,AlphaGo挺“笨”的?

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

网友评论
推荐文章