自己学習のみで最強に 囲碁人工知能「アルファ碁ゼロ」、旧アルファ碁との対局で100戦全勝の結果がでてツイッターで話題になっています。
自己学習のみで最強に 囲碁人工知能「アルファ碁ゼロ」
AlphaGoは、数千もの打ち手のデータを学習し強化しましたが、AlphaGo Zeroは、答えなしの白紙の状態からランダムにプレイし強化学習する手法を取り入れました。
3日間で500万回の対戦を強化学習したところ、トップ棋士を破ってきたAlphaGoを、100勝0敗という圧倒的強さで打ち破りました。
人間が数千年におよぶ歴史の中で生み出した低席をいくつも思いついただけでなく、まったく新しい定石も生み出したという。
アルファ碁ゼロをドラゴンボールで例えると
囲碁の棋士大橋拓文さんによるドラゴンボールの例えについて
大雑把にいうとAyaZがフリーザでZenがセルでAlphaGoが魔人ブウぐらいですね。。どの段階かはディープラーニングによりますw
— 大橋拓文🌗 (@ohashihirofumi) September 7, 2016
#AlphaGo ドラゴンボール例えの続き。Masterは人間の棋譜を使って学習していたけど、そこも強い人間の細胞集めてたセルっぽい。#AlphaGoZero は自分自身が生成した棋譜で学習するので、魔人ブウの中から色んな魔人ブウが出てきたイメージと似てる。
— 大橋拓文🌗 (@ohashihirofumi) October 19, 2017
魔人ブウレベルらしい。
AlphaGo Zero: Learning from scratch | DeepMind
https://deepmind.com/blog/alphago-zero-learning-scratch/
https://www.youtube.com/watch?time_continue=3&v=-Wh4CfsWDyM
ALPHAGO ZERO new series ! Game 1 vs Alphago Master version.
attripは、こう思う。
過去のデータを元に強くするタイプからまったく何もない状態から魔神ブウレベルの強さのAIが誕生したことで将棋でも信じられない新しい将棋の打ち方がでてくるかもしれないね。これからも注目していきたい。
コメントを残す