23.5 C
Taipei
星期三, 26 10 月, 2022
Home科技新聞AI人工智慧人工智慧快毀了西洋棋比賽?前西洋棋冠軍聯手AlphaZero AI改寫西洋棋

人工智慧快毀了西洋棋比賽?前西洋棋冠軍聯手AlphaZero AI改寫西洋棋

以西洋棋賽為主題的 Netflix 影集《后翼棄兵》近來大受好評,其中刺激精彩的棋局對弈,不但讓這齣劇高佔台灣熱門排行榜第一名,也讓原本對西洋棋不了解的觀眾產生興趣、紛紛探查起這個歷史悠久的二人對弈遊戲。而西洋棋——這個世界上最流行的遊戲之一,現在正遭受人工智慧的破壞與威脅?而前西洋棋世界冠軍又正和 AI 聯手拯救西洋棋?人工智慧快毀了西洋棋比賽?前西洋棋冠軍聯手AlphaZero AI改寫西洋棋

▲ 現在的西洋棋比賽,贏家幾乎都是人工智慧。(Photo by Felix Mittermeier on Unsplash)

人工智慧與西洋棋的愛恨情仇

西洋棋在世界各地有數以百萬計的粉絲,而編寫出一個能與人類對弈的軟體程式,曾是科學家追求的目標。

首個挑戰人類棋王的電腦系統為 1997 年 IBM 的「深藍」(Deep Blue),更成為首個在標準比賽時限內擊敗人類冠軍的電腦系統。其後依然有數次「人機大戰」,但人類始終難以在 64 格的天地裡戰勝電腦。

人工智慧公司 DeepMind 的 AlphaZero 登場時,AI 只是憑藉自我對弈的不斷學習,在完全沒有輸入人類的棋譜、沒有特別設計的專用計算程式的情況下,就已經征服西洋棋、將棋、圍棋等最複雜的棋類遊戲,打敗這些領域中最頂尖的人類玩家了。

在科學家們將 AlphaZero 稱為「深度學習 AI 的終極解答」、欣喜於人工智慧技術的快速進步時,另一方面也有人開始擔憂 AI 正在毀滅這些棋類遊戲——因為棋手們開始死記硬背 AI 的下棋手法來擊敗對手,讓棋類遊戲失去了原先的美麗。

前西洋棋世界冠軍克拉姆尼克就是憂心忡忡的其中一人。不過,他現正與開發 AlphaZero 的DeepMind團隊合作,嘗試開發出西洋棋的若干變種形式,試圖找回棋類遊戲的迷人風采。

64 個方格構成無限可能的世界


西洋棋下棋示意圖

▲ 西洋棋下棋示意圖(Photo by JESHOOTS.COM on Unsplash)

曾為世界冠軍多年的俄羅斯職業棋手弗拉基米爾.克拉姆尼克(Vladimir Kramnik)認為,西洋棋也是一門美麗的藝術。思維在棋盤上彼此碰撞,優雅而又複雜的挑釁、反擊、你來我往——「這是一種創造。」克拉姆尼克這樣表示。

克拉姆尼克熱愛西洋棋,他於 2000 年至 2007 年間坐擁世界西洋棋冠軍的寶座,在國際西洋棋奧林匹克上獲得了三枚團體金牌和三枚個人獎牌。儘管如此,克拉姆尼克依然還是決定退休。他於去年宣布退出西洋棋比賽,表示自己心愛的棋類遊戲變得越來越缺乏創造力了。

他認為部分原因需歸咎於科技,因為電腦欠缺靈魂的計算,打造出一個龐大的開局、進攻和防守的下法資料庫,人類選手便開始死記硬背這些下法。「即使是在最頂級的比賽當中,常有將近一半、甚至是整場比賽的下法都是靠記憶走完的。你甚至都沒有自己的下法,全都是電腦的下法。」

即使對現狀感到憂慮,但克拉姆尼克並未放棄希望。他設想了幾種讓西洋棋革新的方變體規則,並與「敵人」──也就是開發出 AlphaZero 的 DeepMind 團隊合作,讓研究人員向這個超人玩家 AlphaZero 發起挑戰,看後者能不能學習選擇出來的九種西洋棋的變體,進而讓棋手進入到富有創新、創造力的新模式。

前世界冠軍與人工智慧讓西洋棋起死回生

經過雙方的合作研究,最終於 2020 年 9 月發表一篇長達98頁的論文:《使用 AlphaZero 評估遊戲平衡:探索西洋棋中的替代規則》(Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess),由 Deepmind 的 Nenad Tomasev、Ulrich Paquet、Demis Hassabis 以及克拉姆尼克一同撰寫。

在此篇論文中,團隊發表了九種西洋棋變體型式,AlphaZero 則負責在幾個小時內模擬出數十年遊戲會怎麼發展、探索不同規則的西洋棋具有什麼樣的可能性。有 AlphaZero 的助力,使研究團隊能看到在不同規則下的人類玩家能開創出什麼別出心裁、出乎意料的玩法。

AlphaZero 測試出的九種西洋棋變體規則:

  1. 禁止「國王入堡」(No-castling):整個棋局都禁止使用「國王入堡」走法。這種走法讓棋國王躲進由其他棋子組成的防護後面,減少國王被威脅的機會,但也會令比賽變得沉悶。
  2. 10 步內禁止「國王入堡」(No-castling (10)):在前10步以內禁止使用「國王入堡」下法。
  3. 兵走一格(Pawn one square):兵棋(Pawn)只能前進一格。目標為增加彈性,減緩遊戲速度。
  4. 無子可動時即勝(Stalemate=win):其中一方無子可動時,即為另一方勝利(原先為平局)。
  5. 水雷(Torpedo):兵可以選擇在棋盤的任何地點走 1 或 2 格。這意味著隨時都可以使用吃過路兵(En passant)走法。
  6. 半水雷(Semi-torpedo):兵只有在第 2 或 3 線時才能移動 2 格。
  7. 兵可以後退(Pawn-back)棋子可以向後移動到一個正方形內的格上,只能返回到 2nd/7th 橫線上(此時的移動不計入「50步規則」內)。
  8. 兵可以橫走(Pawn-sideways):棋子也可以橫向移動一格。(此時的移動不計入「50步規則」內)
  9. 自己吃棋(Self-capture):可以吃自己的棋子,用自己的棋子開路。


AlphaZero標誌▲ 在 AlphaZero 的幫助下,研究團隊設計出引人入勝西洋棋變體規則。(Photo by chess.com)

克拉姆尼克說,如果大家願意對既定規則做出一些小小的改動的話,一幅令人著迷的西洋棋新圖景就有可能展現。「人類已經玩了1500年的西洋棋了,調整規則不是什麼新鮮事,抱怨電腦讓這個遊戲變的無聊也不算新鮮。」

論文共同作者之一的 Nenad Tomasev 表示:「開發西洋棋 AI 目的一開始是想看看人工智慧能不能打敗人類。現在,像 AlphaZero 這樣的人工智慧將會跟人類一起探索西洋棋的創造性,而不是讓人類成為AI的手下敗將。」

這是 AI「獻給西洋棋界的禮物」

AlphaZero 早已展示了它無師自通、自我學習的能力,而研究團隊便物盡其用、借助它來更快地探索西洋棋的新玩法,而不是像過去人類折騰了幾十年、甚至幾個世紀,才摸清楚這個複雜遊戲的美麗與缺陷。Nenad Tomasev 對此表示:「你當然不希望自己花了幾個月、甚至幾年才摸清楚這個遊戲,卻意識到『噢,不,這遊戲一點都不美。』」

同時,AlphaZero 不會受到傳統的棋藝理論束縛,而會發展自己的直覺與策略,帶來全新的想法,顛覆了長久以來人類對這些棋藝遊戲的思考。

克拉姆尼克從他們與AI一起建立的新規則中看到了令人振奮展望,例如「可以吃自己的棋子」(self-capture)是極端的新規則,克拉姆尼克說,這條規則實際上會讓棋手有更多可能,例如選擇犧牲一顆棋子來取得優勢。「總而言之,這只會讓遊戲變得更加美麗。」

AI會毀滅西洋棋嗎?克拉姆尼克與DeepMind告訴我們不會,並且人類可以與AI並肩作戰、開拓出嶄新的可能。若沒有人工智慧的助力,或許就難以達成這個願景了。

最新文章

熱門文章