宠物百科

宠物百科

Products

当前位置:首页 > 宠物百科 >

AlphaGo成阿老师,萌宠逆袭成大师!🐾👩‍🏫

原生态宠物号 2025-02-25 03:39 9


哎呦,你们猜猜看,最近围棋界出了个大新闻,AlphaGo摇身一变,成了阿老师!😱👩‍🏫 对,就是那个曾经打败柯洁的围棋机器人,现在竟然变成了围棋界的萌宠大师!🐾👩‍🏫

说到围棋,那棋盘可真大啊,一共19*19个点,每个点上还有白子、黑子和无子三种可能性。如果小狗狗真的每一步棋都把情况都算尽,按它脑子现在的运算速度,不只会把对面的柯洁熬成一个老柯,也得把自己活活耗成一条老狗。😂

不过,学习方法嘛,第一步可以算是“题海战术”——给小狗狗投喂大量人类棋手的棋谱数据,让它记住最经常出现的套路。📚

价值网络可以帮助小狗狗判断的是:按照策略网络里会出现的那些可能性,棋子落在特定位置的胜率会怎么样。👀

根据策略网络能算出来的可能性,小狗狗还可以用同样的方法,更深入地预测接下来可能会发生的走棋。小狗狗不会真的把所有可能性算完,而是举出下一步棋的几种主要可能,再算出来它们在后续各种可能性中的平均胜率。🎯

但是,如果策略网络算漏了几种厉害的棋可怎么办?小狗狗眉头一皱,打算在已经原本想放弃的可能性中,尽可能地多挑几个都算一下试试。💪

小狗狗也会找机会跟人类高手互相殴打。切磋之后,狗爹DeepMind会带着小狗狗回伦敦老家,研究这次比赛的数据,继续闭关修炼。🏠

有一天,武林上突然出现一位自称Master的人物,通过网络嗷嗷跟人类玩家过招,且从来没有输过。👊

事后大家才知道,它就是小狗狗。不过,据狗爹DeepMind讲,小狗狗进化成阿老师啦,以前三个月的事儿,现在他们一星期就可以搞定!🎉

阿老师真身跟柯洁对弈的第二天,DeepMind就介绍了如今阿老师的功力。简单说就是:阿老师可以让小狗狗3个子儿。🏆

从大脑发育程度上讲,小狗狗只有12层神经网络,而成年后的阿老师已经有40层了。无敌太寂寞,阿老师已经开始减少对人类棋谱的依赖,更多地依靠深度学习、自我对弈来修行了。🎓

阿老师聪慧起来,算法也就更高效。所以,阿老师需要进行的运算量,只是勤劳但是笨拙的小狗狗的十分之一。小狗狗需要耗用50个TPU,阿老师在单个TPU机器上就可以战斗。🔥

阿老师的自我修行,也给它积累了最好的训练数据。阿老师勤劳分析自己跟自己打架之后的每一地鸡毛,通过各种复盘和回想,逼着自己找出最关键的那步棋。🔍

狗爹的目标,可是大海星辰呀。在解决围棋问题的过程中,阿老师要利用策略网络来减少搜索的宽度,再利用价值网络减少搜索的深度。让阿老师下围棋,只是为了训练它深度学习、强化学习的能力,最终化身通用智能,实现人机合作,走上狗生巅峰!🌟

让人类跟阿老师互相殴打,是为了让两边熟悉一下彼此,更方便合作。狗爹打比方说,阿老师其实是新的哈勃望远镜,就像人类以前可以用哈勃望远镜探索宇宙,现在也可以借助阿老师来发现新的知识。🔭

AlphaGo变成阿老师,真是让人眼前一亮!👍🐾👩‍🏫 以后围棋界又多了一位萌宠大师,不知道柯洁会怎么应对呢?😉

标签:

提交需求或反馈

Demand feedback