物体認識M2Detお試し

■環境

OS: Ubuntu 16.04 LTS

GPU: GeForce GTX 1080 Ti

※pythonでopencv-pythonとCUDAが利用できる環境が整っている前提ですので、まだの場合は下記の必要そうな部分だけご参考にして頂ければと思います。

Ubuntu16.04を入れたばかりの状態からkerasとchainerでCUDAを使えるようにする

pythonでopencvとdlibを使う

 

■準備

・pytorchのインストール

公式: https://pytorch.org/get-started/locally/
get startedのページで項目を設定するとインストールコマンドが表示されますので、そのまま実行します。
今回はCUDA9.0が入っている環境でしたのでそのように選択しました。

※condaを使用せず、下記の様にpipでインストールしましたが、その辺は適宜。

※pip install  tqdm 入れろと言われるかも。

インストール後、一度確認します。

 

■本題

・M2Detをダウンロード

M2Det512_vggという学習済みモデルが公開されていますのでそれを利用します。

場所は、https://github.com/qijiezhao/M2Det.git に記載されています。baidu cloudとgoogle driveに置かれているようですが、今回はgoogle driveにあったものを使用しました。

ダウンロードしたモデルファイル(m2det512_vgg.pth)を weights/ というディレクトリに置くだけでOK。

※pip install addict 入れろと言われるかも。

 

・実行

imgs/にある画像ファイルを処理して、結果が表示されます。

カメラ入力もできます。

 
・結果

 

 

・学習

学習についてはgithubの情報だけではよく分からなかったのですが、下記サイトに大変分り易く掲載されていて助かりました。ありがとうございます。

https://taktak.jp/2019/04/02/4014

モデルのダウンロード

データセットのダウンロード

data/annotations/annotations/

をdata/annotations/に移動。

同じ場所に、instances_valminusminival2014.json.zipをダウンロード

M2Det/configs/m2det512_vgg.pyを修正

M2Det/data/coco.pyを修正

学習開始

 

1080Ti 1個では学習は現実的ではありませんでした。