ML-Agentsおさわり回

きっかけ

深層強化学習でリアアリスちゃんを己の力で歩かせたい！！！！

純粋な欲求をUnityとML-Agentsを使って叶えていきたい。
ML-Agentsとは、ゲームの敵AIの行動パターンなどをプログラミングではなく、深層強化学習と模倣学習を使って構築できるライブラリ。
Pythonの小難しい環境構築周りと、Unityとのコミュニケーションはうまいことラッピングされていて初学者でも比較的楽に使える印象。

今回は、目的の前段としてGetting StartedとシンプルなSceneを構築したときの感想を書いてみる。

環境

OS: Windows10
Unity: 2021.1
ML Agents: 1.0.7(Package Manager経由)
Python: Python 3.8(Anaconda)

基本的に書いている時点での最新を脳死で入れたら、エラー無く動きました。
Pythonは素でいれると毎回ハマるのでAnaconda使ってます。

やったことのおおまかな流れ

Getting Started Guideで環境構築とサンプルの実行
ml-agents/Learning-Environment-Create-New.md at main · Unity-Technologies/ml-agents · GitHub
ML-Agents Toolkit Overviewでざっくり概要を把握
ml-agents/ML-Agents-Overview.md at release_2_verified_docs · Unity-Technologies/ml-agents · GitHub
Making a New Learning Environmentで自分でシンプルな構成のSceneを作っていろいろ実験してみる
ml-agents/Learning-Environment-Create-New.md at release_2_verified_docs · Unity-Technologies/ml-agents · GitHub

基本的に公式のドキュメントが豊富かつ頻繁にメンテナンスされているので上のドキュメントを参考にすれば、最初の一歩は踏み出せそう。

サンプル実行の様子。
ちょこちょこ動いてて、めちゃくちゃかわいい・・・

f:id:takeda_san:20210328233354g:plain

ちょっとハマったところ

Making a New Learning EnvironmentのハイパーパラメータのYAMLの設定をそのまんまコピペしただけだとエラーが出て学習の実行途中落ちる。

ml-agents/Learning-Environment-Create-New.md at release_2_verified_docs · Unity-Technologies/ml-agents · GitHub

エラー内容

mlagents.trainers.exception.UnityTrainerException: The hyper-parameter sequence_length could not be found for the <class 'mlagents.trainers.ppo.trainer.PPOTrainer'> trainer of brain RollerBall.

書いてある通りなんですが、sequence_lengthを指定すればOKっぽい。
ここのコメントの通り。

Add needed indent to fix config file by awjuliani · Pull Request #3968 · Unity-Technologies/ml-agents · GitHub

なんのパラメータかはコード読むなり、NNのお勉強しないといけないっぽいので一旦、動いたからヨシ。
試行回数が増えるほど上達していくのが目で確認できるのが面白い。

f:id:takeda_san:20210328234404g:plain