読者です 読者をやめる 読者になる 読者になる

進捗報告 その3

前回の記事で 理想とすれば、もう少し緩やかな傾斜を描いて、 一致率を向上させていく、というのがよさそうな感じはある。 もう少し学習率の微調整を試すべきであろうか。 と書いたので、これの続きです。 学習率を小さくとって、少しずつ動かしていきます。…

進捗報告 その2

前回の、コンピュータ大貧民挑戦の続き。 進捗報告 その1 - koganie’s blog前回、特徴要素を増やし、kou2相手に学習したところ、 対デフォルトでようやく勝ち越すことができました。 学習の仕方を変えてみたらもっと強くなるでしょうか?学習率0.00005で100…

進捗報告 その1

以前紹介した「方策勾配を用いた教師有り学習によるコンピュータ大貧民の方策関数の学習とモンテカルロシミュレーションへの利用」 を実装したい、と臨んだ私だったが、 プログラミング能力も足らず要領も悪く、なかなか遅々として進まない。 というところで…

大貧民の棋譜について

機械学習とかにあたって棋譜は重要だが、コンピュータ大貧民には決まった棋譜の形式などはないのである。 ということでサンプルを作ってみた。 いかがでせう。 TEFUDA 0 2 0 S3 S4 SX SA S2 D5 D9 DA C3 CK 1 4 1 H4 HQ HA D6 D7 C5 C7 C9 CA C2 2 0 2 S5 H5…

コンピュータ大貧民の研究報告を読む

「方策勾配法による局面評価関数とシミュレーション方策の学習」の中で教師有り学習についても提案されている。この研究報告は数式が難しそうで読める気がしない(クズ)が、この手法が最近、コンピュータ大貧民に持ち込まれ、一定の成果を上げている。 これ…

UECdaの大貧民クライアントと簡易的に対戦するプログラム

コンピュータ大貧民大会UECdaが毎年開催されており、大貧民をプレイする人工知能のレベルも年々向上している。そんなので、自分でもプレイして強さを実感したい、というところで、簡易的な人手のプレイ用クライアントを作った。 本当はGUIとかのほうが見やす…