自己学習のみで最強に囲碁人工知能「アルファ碁ゼロ」、旧アルファ碁との対局で100戦全勝

自己学習のみで最強に囲碁人工知能「アルファ碁ゼロ」、旧アルファ碁との対局で100戦全勝

公開日 2017年10月19日更新日 2017年10月19日読了2分

自己学習のみで最強に囲碁人工知能「アルファ碁ゼロ」、旧アルファ碁との対局で100戦全勝の結果がでてツイッターで話題になっています。

自己学習のみで最強に囲碁人工知能「アルファ碁ゼロ」

AlphaGoは、数千もの打ち手のデータを学習し強化しましたが、AlphaGo Zeroは、答えなしの白紙の状態からランダムにプレイし強化学習する手法を取り入れました。

3日間で500万回の対戦を強化学習したところ、トップ棋士を破ってきたAlphaGoを、100勝0敗という圧倒的強さで打ち破りました。

人間が数千年におよぶ歴史の中で生み出した低席をいくつも思いついただけでなく、まったく新しい定石も生み出したという。

アルファ碁ゼロをドラゴンボールで例えると

囲碁の棋士大橋拓文さんによるドラゴンボールの例えについて

大雑把にいうとAyaZがフリーザでZenがセルでAlphaGoが魔人ブウぐらいですね。。どの段階かはディープラーニングによりますｗ

— 大橋拓文🌗 (@ohashihirofumi) September 7, 2016

#AlphaGo ドラゴンボール例えの続き。Masterは人間の棋譜を使って学習していたけど、そこも強い人間の細胞集めてたセルっぽい。#AlphaGoZero は自分自身が生成した棋譜で学習するので、魔人ブウの中から色んな魔人ブウが出てきたイメージと似てる。

— 大橋拓文🌗 (@ohashihirofumi) October 19, 2017

魔人ブウレベルらしい。

AlphaGo Zero: Learning from scratch | DeepMind
https://deepmind.com/blog/alphago-zero-learning-scratch/

ALPHAGO ZERO new series ! Game 1 vs Alphago Master version.

attripは、こう思う。

過去のデータを元に強くするタイプからまったく何もない状態から魔神ブウレベルの強さのAIが誕生したことで将棋でも信じられない新しい将棋の打ち方がでてくるかもしれないね。これからも注目していきたい。

関連

attrip

考えたことを、記事・AI・音楽に変えて発信しています。

盆栽、音楽、ブログ運営、日々の試行錯誤について書いています。

2010年から発信中

コメントを残すコメントをキャンセル