スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

久々の更新

かなり久々に更新してみる。

ブログは3日坊主になってたけど、
一応麻雀AIの研究は細々と続けてる。

仕事やら生活環境の変化で昔より時間取れなくなってるけど、
仕事でも機械学習や深層学習も扱う機会もあって
知識は増えている感じ。

ブログを書いてない間に、
爆打が9段になったり、Googleのアルファ碁が人間をあっさり越えたりはしてるけど
まだ麻雀AIが人間を越えた、みたいな状態にはなってないので
麻雀AI作る価値はありそう。

記事書いてない2年弱の間にやってきたことをざっと書くと
↓のような感じ。

天鳳用プログラムの強化

昔は門前で切るだけだったけど、バグ修正したりで、
アルゴリズムさえしっかり作れば、天鳳で打てるだけの環境にはなった。
あと副露もしょぼいアルゴリズムだけど一応出来る。

危険牌読み

これは未完成。
深層学習を使った危険牌読みをずっとやってて
ようやく最低限の予測はできるようになった。
ただ、ルールベースでやったほうがまだ精度良さそうな感じ。
他の機械学習手法使えば簡単にできそうだけど、
データ量とか考えても深層学習に向いてると信じて引き続きやる予定

強化学習の応用

強化学習というのは、正解データから学習するのではなく、
実際にやってみながら成長させていくような学習方法。

DeepQ Network(DQN)という深層強化学習の方法で今も試している。
まずは門前の何切るの学習で、少しずつ学習で強くなるんだけど、まだまだ弱い。
かつ、何切るはモンテカルロ法がかなり牌効率がいいので、実用性は今のところ低い。

ただ何切るである程度うまくいったら、押し引きとかに応用できると思っているので、
そうなると使えるかも。
そして、研究として強化学習が純粋に面白い。



こんな感じで
強くする部分よりも深層学習の技術的な興味に重きがいっていて
あまり強くなっていない状態。
感覚的には天鳳2~3段くらいかな。。
他の方の開発してるAIのほうがずっと強いはず。

また次あかずに更新できるようにと思ってます!
スポンサーサイト
プロフィール

pao

Author:pao
AIに興味を持った社会人天鳳民。
ID:ppaaoo 最高9段。だいたい8段くらい。

最新記事
最新コメント
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。