澎湃Logo
下载客户端

登录

  • +1

国内思想周报|围棋人机大战预示了怎样的未来

贾敏
2016-03-14 09:21
来源:澎湃新闻
思想市场 >
字号

2016年3月9日-15日,谷歌旗下公司DeepMind开发的人工智能AlphaGo挑战世界排名第二、韩国棋手李世石九段,这场在首尔四季酒店举行的五番棋大赛被视作有着重大历史意义的世纪大战,谷歌设置了100万美元的基础奖金。目前五番棋胜负已分,AlphaGo连取三盘后,李世石在第四盘扳回了一局。

此前,AlphaGo于去年10月与欧洲围棋冠军樊麾二段进行了一场秘密赛事,AlphaGo以5:0获胜,令棋界哗然。计算机对棋类运动的挑战可以追溯到1949年第一款国际跳棋软件,而在1997年超级计算机深蓝击败象棋大师卡斯帕罗夫的比赛上,更多人了解到人工智能在棋类运动上的超强能力。但是,由于围棋分支系数大,巨大的计算量连计算机也难以企及,因此一直以来被视为人类智能的最后堡垒。

《自然》杂志在评论樊麾的失利时称:“面对谷歌围棋AI,人类最后的智力骄傲崩塌了?”因此,李世石与AlphaGo的这场比赛被看作人类与人工智能一决胜负的大战而举世瞩目。作为围棋的起源国,围棋在中国有着超过2500年的历史,国内社会各界对这场比赛尤为关注,对于比赛本身和背后折射的人工智能问题的讨论在过去一周内层出不穷,下文将略作梳理。

李世石为什么输,AlphaGo凭什么赢?

正在与AlphaGo对弈的李世石

开赛前,李世石对获胜十分有信心,认为“到目前为止还是人类比人工智能强”。中国国家围棋队总教练俞斌、围棋国手柯洁、创新工场董事长李开复等人都认为李世石将会赢得比赛,尽管也有一些相反的声音,但随着比赛的展开几乎所有人都被AlphaGo的能力所震撼。

无论AlphaGo和李世石的棋艺是否对等,人机博弈都不是公平的比赛。樊麾接受科技媒体《机器之心》采访时回顾了他与AlphaGo的那场对战,他认为最大的问题在于人都会犯错,而机器犯错的概率远低于人,这会形成负担,“我的形势不管好还是不好,我都担心自己犯错”,而人工智能没有人类棋手的心理感觉,因此双方的地位是不对等的。

这次人机大战前夕,象棋大师卡斯帕罗夫在《新科学家》撰文评论称,“围棋,你的时间不多了”。他在文中回顾了与超级计算机深蓝交手时的情形,分析可能决定比赛结果的因素时同样强调了心理因素,指出心智运动需要高度集中精神,而面对早期机器的盲点时棋手可能会受到干扰。他认为,人和机器的关键差异就在于机器有着保持前后一致的优势,计算机不会犯下大错,也不会苦于骄傲、焦虑和精疲力尽。

另一方面,AlphaGo的表现令很多职业棋手叹服,1997年出生的柯洁曾8次击败李世石,他赛前对人工智能不屑一顾的,但在第三场比赛结束后也坦言电脑“强得可怕”,“同样的条件下我输的可能性非常大”。

DeepMind创始人Demis Hassabis在接受英国《卫报》采访时曾表示,“围棋是一个终极目标:它是一个游戏的巅峰,有着最丰富的智力深度。它如此迷人与美丽,令我们感到兴奋不仅在于我们掌握了这个游戏,还在于我们还用漂亮的算法完成了它。”

AlphaGo的漂亮算法究竟是什么样的?卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员、Facebook人工智能围棋程序Darkforest负责人田渊栋在知乎分享了《自然》杂志上发表的关于AlphaGo的文章中对其系统的介绍。AlphaGo的系统主要由以下四个部分组成:

1.走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋;

2.快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍;

3.估值网络(Value Network),给定当前局面,估计是白胜还是黑胜;

4.蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。

依赖上述系统,凭借学习3000万步人类棋谱和昼夜不停息的自我对弈,AlphaGo获得了在比赛中展现出的高超棋艺。

李世石接连失利后,有人质疑他是不是代表人类出战的最佳人选,职业围棋棋手李喆六段的《这两盘棋,没人会比李世石做得更好!》一文激烈反驳了这种论调。李喆认为AlphaGo的目标只有赢,不求最优,其强势表现是李世石的强大逼出来的。李喆称,“我不知道AlphaGo的极限在哪里,看到无法用言语来表达的震撼和美,新时代真的来了。”李世石在第三场告负后接受采访时表示,“今天失败的是李世石,而不是人类。”不过,也有人认为李世石尽管输掉了比赛,但并非输给了机器,而是输给了机器背后人类的智慧结晶,这仍然是人类的胜利。

谁的未来:围棋的?人工智能的?还是人类的?

DeepMind创始人Demis Hassabis

这场世纪大战被视为一个重大的改变未来的转折点。在围棋领域,AlphaGo恐怕真的将会改写历史。在封闭系统博弈中,人类早晚会被人工智能远远甩在后头。围棋运动会就此衰落吗?在知识分子公号刊发的“人工智能赢了棋,人类赢了未来”一文中,作者沈庞并不这样认为。他指出当1997年深蓝多次击败顶级象棋棋手之后,人们都以为这个游戏终结了,但事实并非如此。在那场比赛之后,卡斯帕罗夫率先提出了“人加机器”(Man-plus-Machine)的概念,即在比赛中使用人工智能增强国际象棋手的水平,而不是让双方相互对抗。这种比赛在之后被称为自由式国际象棋赛。选手们可以独自参赛,或者带一台人工智能照着它的路子下棋,也可以偶尔否决人工智能的选择,在2014年的自由式国际象棋对抗锦标赛上,纯粹使用人工智能的选手赢得了42场比赛,而人机一起参加的选手赢得了53场。人工智能并未削弱国际象棋的魅力,而是让人类成为了更好的棋手,这或许也会成为围棋的未来。

那么AlphaGo的胜利是否意味着人工智能将进入一个新阶段?复旦大学计算机科学技术学院教授危辉认为对此应该保持审慎乐观,因为人工智能的核心科学难题,从50年多前人工智能的诞生到现在,还一个都没解决。他在日前的讲座中指出,人工智能能够解答的问题必须符合两个条件:能够精确定义以及范围有限。但现实生活中的大量问题既无法被精确定义也无一定范围。因此,AlphaGo并未带来颠覆性的改变。

不过,AlphaGo或许预示着改变的方向。正如卡斯帕罗夫指出的那样,完美计算一直以来都是计算机的长项,而人类大脑擅长的是通用(generalities)、长期计划和将通用主题运用于新情况,这正是DeepMind努力的方向。创始人Hassabis正在把他从人脑中得到的启发用于构建首个“通用学习机器”:一套能像生物系统一样学习的灵活、自适应的算法,仅使用原始数据就能从头开始掌握任何任务,也就是通用人工智能(artificial general intelligence ,简称AGI)。他认为未来超级智能机器将与人类专家合作解决一切问题,“癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂。”通用人工智能思维的方式能从巨大的人类无法掌握的信息量中转换出可使用的东西,“我们所研究的东西可能是针对任何问题的元解决方法(meta-solution)。”

另一方面,这场比赛的结果再度激起了人们对于人工智能带来的威胁的担忧,人类与机器的对抗很容易让人联想起科幻小说和电影中机器人反叛的骇人场景。去年7月,物理学家霍金、哲学家乔姆斯基、技术专家伊隆·马斯克和数千名知识分子在一封呼吁取缔“机器人杀手”的研发和应用的联名公开信中警告称人工智能方面的军备竞赛可能是人类的灾难。霍金近期总结道:“在创造人工智能方面取得的成功将会是人类历史上最重要的事情。不幸的是,这也可能是最后一件。”

但Hassabis认为至少在目前这种担忧是过虑了,他认为现在距离能够达到人类级别的通用智能还差好几十年,并且DeepMind也在积极采取措施来避免通用人工智能的潜在危险,包括发布它的代码,在与谷歌的收购协议中附带“禁止将该技术应用于军事或情报用途”的条款、在公司内部召集伦理委员会和咨询董事会等。不过他也坦言,“技术本身是中立的,但它是一个学习系统,所以不可避免的,它们会承担一些价值体系的印记和设计者的文化,所以我们需要非常小心翼翼地思考这些价值观。”

Hassabis还在《卫报》的采访中提到,他不久前跟霍金就人工智能问题进行了长达4个多小时的谈话,他认为那次会面可能一定程度上改变了霍金对人工智能的看法,因为从那之后霍金就不在媒体面前提及“人工智能煽动性言论”了。

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈