Ubuntu16.04を入れたばかりの状態からkerasとchainerでCUDAを使えるようにする

Ubuntu16.04を入れたばかりの状態からkerasとchainerでCUDAを使えるようにするまでの作業メモです。

■環境


OS:Ubuntu16.04LTS (DELL Aurora R7をWindows10とデュアルブートで使用)

 

■準備


●必要そうなものをざっくりインストール

Ubuntu16.04が入ったばかりの状態から始めますので、まずは一通り必要そうなものを入れておきます。

 

●pyenvで3.6にする

.bashrcに下記を追加する

設定を反映する

今回は3.6.5を入れます。

 

●また必要そうなものを入れます。

 

 

■NVIDIAドライバのインストール


NVIDIAドライバのインストール方法はいくつかあるようなのですが、公式サイトからダウンロードしたスクリプトではうまく行かず(NVIDIA-Linux-x86_64-390.77.run)、

参考:NVIDIA CUDA INSTALLATION GUIDE FOR LINUX http://developer.download.nvidia.com/compute/cuda/9.0/Prod/docs/sidebar/CUDA_Installation_Guide_Linux.pdf

検索してみるとPPAから入れるというやり方があり、試したらうまく行きました。

  1. 現状確認して古いドライバが入っていたら削除する。
  2. 再起動して、Ctrl + Alt + F2でCUIコンソールに行きxserverを止める。
  3. PPAレポジトリからドライバをインストールする。
  4. 再起動して「1」の手順で確認。

     

■CUDA ToolKitのインストール


nvidiaサイトから9.0のdebをダウンロード

https://developer.nvidia.com/cuda-toolkit-archive

インストールコマンドはそこに書かれている通り

sudo dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
sudo apt-key adv –fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

で入るのですが、最後の

だけ、このままだと何故か9.2が入ってしまいました。(何か間違えていただけの気もしますが、ご参考までに)

tensorflowは9.0を指定していますので

https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#package-manager-metas

を参考にして下記のように指定して入れます。

 

●PATHの設定

.bashrcにPATHとLD_LIBRARY_PATHを追加して、

反映する。

再起動

 

■cuDNNのインストール


https://developer.nvidia.com/rdp/cudnn-download から「Download cuDNN v7.1.4 (May 16, 2018), for CUDA 9.0」のUbuntu用の3ファイルをダウンロードする。

  1. cuDNN v7.1.4 Runtime Library for Ubuntu16.04 (Deb)
  2. cuDNN v7.1.4 Developer Library for Ubuntu16.04 (Deb)
  3. cuDNN v7.1.4 Code Samples and User Guide for Ubuntu16.04 (Deb)

それぞれをインストールする。

 

■chainerのインストール

「必要そうなものをざっくりインストール」の所でやっていますが、もし飛ばしていたら入れます。

これが無いとchainer実行時にtinkerが無いよエラーになります。後で入れても何故かうまくいかないので、ここで再確認します。

もし、先にchainer入れてしまっても、pyenvで違うpython バージョンをインストールしたり(3.6.5で進めてたのを3.6.4も入れてglobalに設定したり)、一度アンインストールして、ここまでにpipインストールしたもの入れ直して上手く行きました。

 

サンプルを実行して確認

 

 

■tensorflow + kerasのインストール


tensorflowのgpuありをインストール

一度確認します。

kerasをインストール

 

サンプルを実行して確認

 

実行中に

で、温度上昇や電力などが確認できます。