マリオを強化学習で育てる YoLo v5 Pytorch

2 min 2,737 views

スーパーマリオを使って簡単に強化学習を体感できるということでチャンレンジしました。
利用するのはYoLo v5とPytorchです。
PythorchはFaceBookのAIチームが開発したPython向けのオープンソース機械学習ライブラリです。
YoLoは物体検知のアルゴリズムです。流行ってますよね。

基本的にはこちらの動画を参考に進めています。

Macでの環境構築

基本的には先ほどの動画の通りにすればすんなりいくのですが、似た名前のGithubがたくさんあるらしくただしいリンクは以下の通りです。
環境も足りないものがあればジャンジャン追加するだけです。

Python環境がない方はAnaconda3をインストールしましょう。

次にGitHubからプログラムをダウンロードします。
Githubサイトはこちら
任意のフォルダを作成して以下のコマンドをターミナルからうちましょう。

git clone https://github.com/uvipen/Super-mario-bros-PPO-pytorch.git

おなじくyolo v5をクローンします。

git clone https://github.com/ultralytics/yolov5

yolo v5 にあるequirements.txt をつかって必要なものをインストールします。

cd yolov5
pip install -U -r requirements.txt

もし足りなければ、ですが以下のものを追加でインストールしました。

pip install tensorboard

Anacondaを起動します。

左側のメニューのEnvironmentsを選択肢、Createをクリックします。
それから任意の名前をつけて起動します。画像の例ではsuper-marioになっています。
出来上がったら▶︎マークをクリックしてopen terminalをクリックしてターミナルを起動します。

マリオの学習を始める

Super-mario-bros-PPO-pytorchをインストールしたフォルダに移動します。

cd Super-mario-bros-PPO-pytorch

学習を開始します。

python train.py

するとマリオの1-1が動き出します。
初めはとまったままであまり動きませんが、学習がすすむとどんどん前に進むようになります。
MacはGPUが使えないのでかなりCPU負荷が高くなりますが、
午前中ぶんまわすとゴールできるところまでいくようになりました。すごいですね。

関連記事

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です