環境
- Ubuntu14.04
- Python2.7.6
インストール
作業はすべてホームディレクトリ上で行うとする。あとpylearn2のインストール方法はgit clone
sudo apt-get install python-numpy python-scipy python-dev python-matplotlib python-pip python-setuptools git sudo pip install Theano git clone git://github.com/lisa-lab/pylearn2.git cd pylearn2 python setup.py develop
ImportError: No module named nose.plugins.skip
って出たらsudo pip install nose
後で使う「データの保存パス」を用意 別にpylearn2内じゃなくてもいいらしい
mkdir /pylearn2/pylearn2/data
.bascrc
に登録しておく
export PYLEARN2_DATA_PATH=~/pylearn2/pylearn2/data
サンプルを動かす
テストデータの鉄板である手書き数字のデータセットを用いる
データ詳細は以下
- 28 x 28 ピクセルの白黒画像で、0から9までの数字のいずれかの画像が沢山
- 学習用データ60000個
- テストデータ10000個
テストデータのダウンロード
さっきのPYLEARN2_DATA_PATH
に保存される
python ~/pylearn2/pylearn2/scripts/datasets/download_mnist.py
サンプルを見てみる
データセットを定義したyamlファイルを~/pylearn2/pylearn2/scripts
にdataset.yaml
で作成
!obj:pylearn2.datasets.mnist.MNIST { which_set: 'train' }
実行
python show_examples.py dataset.yaml --out dataset.png
img2sixel
等でみると20*20の合計400件サンプルが表示される
学習
いわゆる特徴点抽出を行う