AdrianAu
AdrianAu

需要藍天

AI棋士

2016年3月的韓國,發生一件驚人的事:棋士李世乭與AlphaGo對弈。這個5場3勝的比賽,被喻為人機大戰的圍棋賽。

電腦與人對奕已非第一次,但圍棋已被喻為最後一個堡壘,因為圍棋的下棋點極多,變化之大,機器未必能計算。所以當時太多人覺得人機對奕,人有勝算機會。結果,AlphaGo連贏3場。雖然第4局李世乭贏,但第5局AlphaGo回復正常水平,以總數4比1勝。

當時除了知道AI之外,還有一樣東西叫深度學習(Deep Learning)。這兩個字彙,在今日已廣為人知,因為現在日常生活都有運用AI。

~~~~~~~~~~~~~~~~~~

2020年有不少獨立書店開幕。因為一場講座認識了Hong Kong Book Era閱讀書代的店主,襯著某日放工去逛一逛。書店處於旺角花墟的商業大廈中。到書店的那晚,街上仍是那麼多人選花買花,甚是熱鬧。轉入大廈到書店樓層,變得很寧謐,跟樓下的情況大相逕庭。書店雖不大,但設有坐位讓讀者閱讀。想店主是位整潔之人,地板一塵不染,很想席地而坐選書閱讀。

書店書量其實不少,除了文學書、政治書外,很驚訝有不少關於蒙古史的書籍。更驚訝有一本陳玉箴的《「台灣菜」的文化史:食物消費中的國家體現》這本枕頭書,也有一本《棋士與AI》。我最後選了後者,因為前者我已買了電子版(可惜我仍未開始閱讀)。

~~~~~~~~~~~~~~~~~~

AI向人類挑戰,棋士明明應該討厭AI。偏偏有兩位棋士對AI「友好」,一位是協助DeepMind去訓練AlphaGo的樊麾,另一位是王銘琬,亦是《棋士與AI》的作者。先介紹王銘琬棋士︰日本棋院九段棋士,曾奪本因坊及王座頭銜,他亦有參與AI軟體開發。正因為這樣,這書不但讓讀者了解AI的開發歷史,AlphaGo的自我學習過程,及往後AlphaGo的進化;亦同時有棋士分析AlphaGo如何影響圍棋發展。

王老師用了一個很易明的例子講圍棋:選舉。白子黑子都在拉選票,盡可能得到多票數(即圍棋術語中的「地」)。每行一步就如拉票以增加勝算。只是每次拉票不代表會有幫助,有些可能是即時性,有些則影響往後發展。到終局時,就看誰拿到最多票,還是中途放棄。

當然,圍棋不止於此,王老師另外經常提及AI及棋士的分別就是「感覺」。「感覺」是指下棋時與全局的感覺。所以當AlphaGo與李世乭對奕時,下子時總會出現「估你唔到」的情況,評論員(特別是韓國)都會露出不太懂的樣子;李世乭更因此陷入思緒混亂,因為一般人是不會這樣下子。書與AlphaGo的紀錄片都提及,AlphaGo本身只計算下那一子的勝負率,不會處理所謂的全局「感覺」。當然,「感覺」一詞本身就「好人類」(Human),要機器明白這點比較困難。不過王老師給予很正面的評價,認為這樣會刺激棋士想法,要跳出那固有思維,考慮不同的下子方式。他亦表述如何受AlphaGo啟發而改變棋路。這讓我想起《棋魂》中進藤光與關西棋院社清春對奕的那一場,他們二人開局,一個是5之5,一個是天元,完全是「嚇親人」。

AlphaGo之後「進化」到AlphaZero,然後退出圍棋界。它留下來的棋譜,成為了圍棋愛好者/棋士的學習對象。或許是一個很好的結束,因為它的自我學習程度,已經超過大家想像。AI的發展已經無法停止,只能盼望放在好的位置上。

~~~~~~~~~~~~~~~~~~

《棋士與AI》
https://www.books.com.tw/products/0010799461

棋靈王 - 進藤光 vs 關西棋院 社清春【天元 與 5之5 的激戰】https://www.youtube.com/watch?v=BoiS6N_ZP4I

AlphaGo - The Movie (Full Documentary)
https://www.youtube.com/watch?v=WXuK6gekU1Y

圖片來源:網絡截田

圖片來源:網絡截圖


CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论