スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

久々の更新

かなり久々に更新してみる。

ブログは3日坊主になってたけど、
一応麻雀AIの研究は細々と続けてる。

仕事やら生活環境の変化で昔より時間取れなくなってるけど、
仕事でも機械学習や深層学習も扱う機会もあって
知識は増えている感じ。

ブログを書いてない間に、
爆打が9段になったり、Googleのアルファ碁が人間をあっさり越えたりはしてるけど
まだ麻雀AIが人間を越えた、みたいな状態にはなってないので
麻雀AI作る価値はありそう。

記事書いてない2年弱の間にやってきたことをざっと書くと
↓のような感じ。

天鳳用プログラムの強化

昔は門前で切るだけだったけど、バグ修正したりで、
アルゴリズムさえしっかり作れば、天鳳で打てるだけの環境にはなった。
あと副露もしょぼいアルゴリズムだけど一応出来る。

危険牌読み

これは未完成。
深層学習を使った危険牌読みをずっとやってて
ようやく最低限の予測はできるようになった。
ただ、ルールベースでやったほうがまだ精度良さそうな感じ。
他の機械学習手法使えば簡単にできそうだけど、
データ量とか考えても深層学習に向いてると信じて引き続きやる予定

強化学習の応用

強化学習というのは、正解データから学習するのではなく、
実際にやってみながら成長させていくような学習方法。

DeepQ Network(DQN)という深層強化学習の方法で今も試している。
まずは門前の何切るの学習で、少しずつ学習で強くなるんだけど、まだまだ弱い。
かつ、何切るはモンテカルロ法がかなり牌効率がいいので、実用性は今のところ低い。

ただ何切るである程度うまくいったら、押し引きとかに応用できると思っているので、
そうなると使えるかも。
そして、研究として強化学習が純粋に面白い。



こんな感じで
強くする部分よりも深層学習の技術的な興味に重きがいっていて
あまり強くなっていない状態。
感覚的には天鳳2~3段くらいかな。。
他の方の開発してるAIのほうがずっと強いはず。

また次あかずに更新できるようにと思ってます!
スポンサーサイト

コメントの投稿

非公開コメント

管理人のみ閲覧できます

このコメントは管理人のみ閲覧できます

Re: 麻雀AIの動かし方について

> 最近、打牌選択のアルゴリズムを作ったので天鳳で打たせてみたいと考えています。そこでパケット解析やマウスエミュレートを行いたいのですが、
> 私自身ネットワーク系に疎く、方法がわからず困っております。
> せひ、ブログに掲載されているAIの動かし方を教えていただければ幸いです。

どういった言語でやられる予定でしょうか。
言語毎にライブラリ等変わってくるので。
パケット解析について
私は、C#で「SharpPcap」というものを使ってやっています。
他の言語でも言語名とパケット解析で調べると出てくると思います。

パケットが取得できるようになったらあとは、天鳳の牌譜と同じ形式のデータが送られてくるので
http://d.hatena.ne.jp/xlc/20170225/1488036549
あたりを参考にしたら良いと思います。

追加で何かあればtwitterのDMのほうが早く回答出来ると思います。
https://twitter.com/pppaaaooo

管理人のみ閲覧できます

このコメントは管理人のみ閲覧できます
プロフィール

pao

Author:pao
AIに興味を持った社会人天鳳民。
ID:ppaaoo 最高9段。だいたい8段くらい。

最新記事
最新コメント
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。