進捗報告 その6

「提出手比較による大貧民プレイスタイル解析」からは、
モンテカルロ法クライアントのプレイにもなんらかの特徴(プレイスタイル)はある
ということはわかるんですが、
あくまで比較するだけなので、何割違うとかしか言えない。
どんな特徴がある、というところまではなかなか言えないのが難しいところです。
(論文中では、「行動を限定させたクライアント」と比較することで特徴を見つけてはいます)

(なのでそういうのは
 決定木を用いた大貧民プログラムの分析に関する研究
 が参考になりそうですが、これを読むには課金が必要なのでまた今度。)

ある局面で何を提出したか、というデータから
なんやかんやでクライアントごとに分類するというのはなんとなくうまくいきます。
自分も実験したりしました。
大貧民プログラムのn-gram統計による特徴抽出とクラスタ分析
【実験】大貧民クライアントを分類できるか? - koganie’s blog
けれど、これはこれで「特徴」が人のわかる形には表れてこない。
というか、そんなものが人にわかるのなら、わざわざモンテカルロ法に頼らずともよかろう。
ただ、分類できるのに、
・何が違いとして生じるのか
・何が強さに繋がっているか
がわからないのはなんだかさびしい。

まあ、提出手比較用の環境を作ってから、これなにに使うんだ…と。

・・・

次の図は、kou2×5の試合中、
1つのkou2に対してParty,default,beersong,snowl,Glicineの提出手を受け取り、比較させたグラフ。
横軸は自分の手札枚数。
簡単な必勝手探索は行っており、当該局面はのぞいている。
f:id:koganie:20180114230408p:plain

ほんとうは、Party-defaultなど、5体それぞれの一致率も求めているのだが、
まとめるのがめんどうなので、kou2とだけをグラフにした。

同じライト級クライアントのPartyとの一致率の高さが目立っているが、
序盤、モンテカルロ法クライアントのGlicineとの一致率が高い。
終盤以外は、6割程度の一致率をみている。

同様のことをkou2にかえてsnowlにしてみる。
f:id:koganie:20180114232148p:plain

正直、みてもあんまり面白くない^^

やっぱりモンテカルロ法クライアントはそれぞれの手が一致する傾向にあるようで、
これが分類がうまくいく要因なのかもしれない。
ただ、これで「分類ができた!」って本当に言えるのかね。
「正解の手」をそれだけライト級クライアントよりも多くモンテカルロ法クライアントが見つけている、
理想の行動に近い、というだけで、
それがクライアントの特徴を使って分類できたと、いえるのだろうか。
まあ、そういう行動に現れる特徴が、プレイスタイルと言えるのかもしれないけれど。。。

こんどは全カードの未提出の札の枚数毎に一致率を求めたもの。
(試合は10000試合しかやっていないので、枚数の極端に多い・少ない局面は登場数が少ない。)

これはなんか、面白い。
f:id:koganie:20180114232733p:plain

序盤・中盤・終盤で、クッキリとsnowlとの提出手一致率が違っている。
と思ったが、これは単純に、序盤と終盤でsnowlの行動が甘い、ということなんだろうか。

kou2との一致率も出してみると、今度はわりと平坦なグラフだ。
(縦軸の範囲が少し違うけど)
f:id:koganie:20180114233042p:plain
序盤・中盤・終盤という区切り(が本当にあるのかもわからんが)に関わらず、
概ね同じような行動を取っているらしい。
この中ではdefaultが最も単純な行動をしているが、終盤になるほど手の一致率が高くなっていく。
「いかに序盤をうまく乗り切るか」が大事、という感じか(そりゃそうだろ)。

いちおう、デフォルトとのデータも取ってみた。
f:id:koganie:20180115001637p:plain
f:id:koganie:20180115001652p:plain

対戦クライアントによって、現れる局面の特徴も変わってしまうので、
それぞれのグラフを比較するのは難しいことには注意。