大貧民

進捗報告 その6

「提出手比較による大貧民プレイスタイル解析」からは、 ・モンテカルロ法クライアントのプレイにもなんらかの特徴(プレイスタイル)はある ということはわかるんですが、 あくまで比較するだけなので、何割違うとかしか言えない。 どんな特徴がある、とい…

コンピュータ大貧民の研究報告を読む。④

「提出手比較による大貧民プレイスタイル解析」 は、同一局面に対して何を提出するか、を比較することで、 プレイスタイルの違いを明らかにすることを目的とした研究。 http://id.nii.ac.jp/1001/00082814/研究報告の中での実験環境としては、 ある一つのク…

コンピュータ大貧民の研究報告を読む。③(特集:相手手札推定の有効性)

大貧民は、将棋や囲碁などと異なって、 多人数で、しかも非開示の情報がある中で行われるゲームだ。 これを多人数不完全情報ゲームという。そんなゲームを優位に戦うためにぱっと思いつくのが、 「相手の手札を推測できてしまえば攻略できてしまうんではない…

【実験】大貧民クライアントを分類できるか?

大貧民はとかく、プレイスタイルがよくわからない問題があります。 これは、試合を見ていても、 何が強さにつながっているのか、よくわからないということでもあります。そんなこんなで大貧民AIはクライアントの特徴なんかの研究って (知る限りでは)あまり…

進捗報告 その5

前回の大貧民関連投稿が「143日前」とかなっていてすごい。 その間、さぼっていました。でもまた最近ぼちぼちと再開してみました。 必勝手探索はめちゃめちゃバグがあったり、 学習の手違いのもとになりそうなところは直したり、 そんなこんなで試しに学習さ…

進捗報告 その4

大貧民の成果はまったく出ていない。簡単な必勝手探索は実装したものの、まったくもって強くならない。 これはもう抜本的な問題があるのだろうと、 重い腰をあげて調査に乗り出した。結果からすると、バグのオンパレード。 学習の際の評価値と、 大貧民クラ…

コンピュータ大貧民の研究報告を読む②

「大貧民における初期手札の不均等性を考慮したレーティングアルゴリズムの提案」では、コンピュータ大貧民のクライアント(プレイヤ)のレーティングを提案している。 http://id.nii.ac.jp/1001/00099271/レーティングというのは、「プレイヤの強さ(レート…

進捗報告 その3

前回の記事で 理想とすれば、もう少し緩やかな傾斜を描いて、 一致率を向上させていく、というのがよさそうな感じはある。 もう少し学習率の微調整を試すべきであろうか。 と書いたので、これの続きです。 学習率を小さくとって、少しずつ動かしていきます。…

進捗報告 その2

前回の、コンピュータ大貧民挑戦の続き。 進捗報告 その1 - koganie’s blog前回、特徴要素を増やし、kou2相手に学習したところ、 対デフォルトでようやく勝ち越すことができました。 学習の仕方を変えてみたらもっと強くなるでしょうか?学習率0.00005で100…

進捗報告 その1

以前紹介した「方策勾配を用いた教師有り学習によるコンピュータ大貧民の方策関数の学習とモンテカルロシミュレーションへの利用」 を実装したい、と臨んだ私だったが、 プログラミング能力も足らず要領も悪く、なかなか遅々として進まない。 というところで…

大貧民の棋譜について

機械学習とかにあたって棋譜は重要だが、コンピュータ大貧民には決まった棋譜の形式などはないのである。 ということでサンプルを作ってみた。 いかがでせう。 TEFUDA 0 2 0 S3 S4 SX SA S2 D5 D9 DA C3 CK 1 4 1 H4 HQ HA D6 D7 C5 C7 C9 CA C2 2 0 2 S5 H5…

コンピュータ大貧民の研究報告を読む

「方策勾配法による局面評価関数とシミュレーション方策の学習」の中で教師有り学習についても提案されている。この研究報告は数式が難しそうで読める気がしない(クズ)が、この手法が最近、コンピュータ大貧民に持ち込まれ、一定の成果を上げている。 これ…

UECdaの大貧民クライアントと簡易的に対戦するプログラム

コンピュータ大貧民大会UECdaが毎年開催されており、大貧民をプレイする人工知能のレベルも年々向上している。そんなので、自分でもプレイして強さを実感したい、というところで、簡易的な人手のプレイ用クライアントを作った。 本当はGUIとかのほうが見やす…