问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

阿尔法狗:围棋之巅的人工智能挑战者

创作时间:
作者:
@小白创作中心

阿尔法狗:围棋之巅的人工智能挑战者

引用
百度
1.
https://baijiahao.baidu.com/s?id=1822824533380995454

从“狗狗”到“阿老师”,从AlphaGo到AlphaZero,人工智能在围棋领域不断突破人类认知的界限。本文带你走进这场智能革命,揭秘打败李世石的机器人——阿尔法狗(AlphaGo)背后的科技奇迹,并探讨其深远影响。

“狗狗”的升级与定型运用

《阿尔法狗二十大震撼瞬间》中介绍到, 在网络围棋界掀起狂澜的Master,以其惊人的战绩和对传统围棋定式的颠覆性运用,引起了广泛关注。特别是其作为AlphaGo升级版的身份揭晓后,更是激起了棋界对其棋艺的深入研讨。本章节将详细探讨“狗狗”在实战中如何灵活运用定式,以及这些新变着对围棋界的影响。

Master的战绩与身份揭晓

Master在网络上的出现,以其60:0的完美战绩震惊了围棋界。当其身份被揭晓为AlphaGo的升级版时,这一成就更加令人瞩目。AlphaGo作为先前已经击败过人类顶尖棋手的智能程序,其升级版“狗狗”展现出了更加卓越的棋艺。

“狗狗”的定式运用与创新

“狗狗”在实战中表现出了对传统定式的独特理解和运用。例如,在面对黑棋的冲断时,白棋通常有多种应法可选。然而,“狗狗”却选择了出人意料的着法,如30挡等,这些新变着不仅打破了常规,也引领了棋界对定式运用的新思考。

棋界对“狗狗”新变着的反应与研究

“狗狗”的新变着引起了棋界高手们的广泛研究和深入探讨。这些新着法不仅在实践中取得了显著成效,也为围棋理论的发展注入了新的活力。棋手们开始重新审视和思考传统定式的运用,以及如何在实战中更加灵活地运用和创新定式。

“狗狗”对围棋界的影响

“狗狗”的出现和其对定式的独特运用,无疑对围棋界产生了深远的影响。它不仅挑战了人类对围棋的认知极限,也推动了围棋理论的创新和发展。随着对“狗狗”棋艺的深入研究,棋手们对围棋的理解将更加深入,实战中的变化也将更加丰富多彩。

在网络上横空出世的“Master”吸引了圈内外棋友的极大关注,它以60:0狂扫围棋顶尖高手的战绩,令人叹为观止!不仅如此,Master还总是以出人意料的着法颠覆我们对围棋的认知。这是人机大战60局中的第4局,化身Master在网络上势不可挡的升级版“狗狗”。此时还没有引起太多人的关注,但打破常规的白30挡还是引起了棋界诸多高手们的深入研究。牵动人心的人机大战进行到最後一局时,Matr的实际操作员黄士杰博士终于揭开了大家猜测已久的谜底——Master就是2016年3月战胜李世石九段的AlphaGo的升级版。从有迹可循的棋谱中检索,一共有533盘实战出现了这个经典的小目定式。同时,面对黑27、黑29的冲断,白一共有A、B、C、D四种应法,其中绝大多数情况下白都选择A位碰。

书中所用数据均来自网络棋谱库。棋谱库收录了多年来有记载的10万余盘棋谱,变化图1我们先来看看棋迷朋友们最熟悉、也是职业赛事中最常见的定型。由于局部战斗黑棋子力占优,白1碰(A点),寻求腾挪,以下黑2长,堂堂正正,至白5双方割据一方,各有所得,这也是双方均可接受的基本定式。不过假如黑4变着在5位立,变化图2黑1立虽然强硬,但白2、白4简明定型是冷静的好手。至白8,由于左边的断点,黑只能9位自补。白先手加强自身后,10位尖出十分严厉。变化图3然而,掌握定式最重要的一点就是灵活运用。实战中黑A位的接应使右上角的定型变得截然不同,变化图2中,原本需要黑9自补的毛病,已经提前被A位的援军解决了问题,这样黑9就有时间补住右边的弱点。也许正是考虑到了周边配置的特殊性,“狗狗”实战才超越常规,选择了最为罕见的下法30挡。

深度学习:实现人工智能突破的关键

《块数据4.0:人工智能时代的激活数据学》有相关描述, 深度学习的概念源于对人工神经网络的研究,目的是模拟人脑进行分析学习的能力。通过建立有效的学习模型,让机器从海量数据中自行总结特征,实现自主学习。阿尔法狗的成功就是深度学习的典型应用,它不再使用传统的“蛮力”算法,而是通过深度神经网络系统模仿人脑神经元的工作机理,通过自我对弈强化学习,在千万次的实践中提升棋艺。这一突破性的技术展示了深度学习在人工智能领域的巨大潜力,为人工智能之梦的实现撒下了希望的种子。

更重要的是,阿尔法狗在它的神经网络之间运行数千局围棋局势,利用反复试验调整连接点来完成研究工作。因此,阿尔法狗不再拘泥于人为的指导,而是在广泛学习了人类围棋棋谱后再通过不断与自己对弈强化学习,在千万次的自我对垒中提升棋艺,并自行研究新战略。这种更为强大的学习能力是阿尔法狗战胜人类顶尖棋手的关键所在。

如果说20年前的超级计算机还需依靠穷举手段才能战胜人类,那么到了阿尔法元,其所表现出来的智慧和超强学习能力更令人惊叹,并让人进一步确信人工智能之梦不再遥远,而深度学习为成功之路撒下了希望的种子。深度学习的概念源于人工神经网络的研究,其动机在于建立、模拟人脑进行分析学习的神经网络,让机器能够像人一样思考。从本质上来说,深度学习是一项“大数据工程”,需要让机器从数以百万计的图像、声音和文本数据中,通过建立有效的学习模型,自行总结出特定事物的特征,从而实现自主学习。其背后是计算速度可以媲美人脑的高性能计算集群快速完成海量数据的“学习”。

AlphaGo Zero:从零开始的新里程碑

《暗知识:机器认知如何颠覆商业和社会》中介绍到, 在围棋领域,AlphaGo已经创造了历史,它先后战胜了世界冠军李世石和排名第一的棋手柯洁,展现了机器学习的强大能力。然而,AlphaGo的研发团队DeepMind并没有止步于此,他们推出了一个全新的版本——AlphaGo Zero。这个版本的最大特点在于它完全是从零开始学习围棋的,没有依赖任何人类的棋谱或经验。通过一种名为“强化学习”的机器学习技术,AlphaGo Zero在短短几天的自我对弈中,就迅速超越了之前的版本,展现出了惊人的进步速度。这一成果不仅证明了机器学习的巨大潜力,也让我们对未来人工智能的发展充满了期待。

当人们以为这是对弈类程序的高峰时,AlphaGo的研发团队DeepMind(谷歌收购的人工智能企业,位于伦敦)团队再度碾轧了人类的认知。

2017年12月,DeepMind团队发布了AlphaGo Zero(阿尔法围棋零)。AlphaGo Zero使用了一种叫作“强化学习”的机器学习技术,它只使用了围棋的基本规则,没有使用人类的任何棋谱经验,从零开始通过自我对弈,不断地迭代升级,仅仅自我对弈3天后,AlphaGo Zero就以100:0完胜了此前击败世界冠军李世石的AlphaGo Lee版本。自我对弈40天后,AlphaGo Zero变得更为强大,超过了此前击败当今围棋第一人柯洁的AlphaGo Master(大师版),这台机器和训练程序可以横扫其他棋类。经过4个小时的训练,打败了最强国际象棋AI Stockfish,2个小时打败了最强将棋(又称为日本象棋)AI Elmo。

AlphaGo Zero证明了即使在最具有挑战性的某些领域,没有人类以往的经验或指导,不提供基本规则以外的任何领域的知识,仅使用强化学习,仅花费很少的训练时间机器就能够远远超越人类的水平

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号