おっぱいそん!

pythonを数値計算に使うときのテクニックとかをまとめていきたい。

Caffeのsolverの設定

Caffeで学習する際のsolverの設定は[modelName]_solver.prototxtみたいな名前のファイルを作り、そこに書く。
例:caffe/lenet_solver.prototxt at master · BVLC/caffe · GitHub
以下で設定できるパラメータについて説明する。

続きを読む

Caffeで学習する時のモデルの設定

Caffeでは、データはblob(Binary Large OBject)というクラスで管理する。
モデルのネットワークはLayerを組み合わせて構成される。
各LayerはBlobを受け取ってBlobを出力する。
モデルの定義は[model_name]_train_test.prototxtみたいな感じのファイルに保存する。
ファイルの中身にはモデルの名前と、各Layerの構成を書く。
例 : caffe/lenet_train_test.prototxt at master · BVLC/caffe · GitHub
モデルとしては学習・評価・Deployの3種類が必要で前者2つは今は共通のファイルに書くことになっている(昔は別だった)。

続きを読む

Caffeの使い方

自分用にCaffeの使い方をメモしておく。
オライリーの本(読みやすいのでおすすめです)を参考に勉強してます。

  • インストール
  • データベースの作成
    • 学習・テストデータをDLしてくる
    • 正解ラベルが書かれたファイルをつくる
    • DBの作成
  • ネットワークを定義するprototxtを作る
  • solverの設定するprototxtを作る
  • 学習を開始する
続きを読む

OpenCV3なのにcv2でimportする件について

OpenCV2でも3でも、importする時は

import cv2

としますが、cv2の"2"はバージョンの番号でないらしいです。
元々、OpenCVはCで実装されていて、その時のAPIを"cv"と表していたのに対して、C++で実装されたAPIを"cv2"と名付けていた経緯があるみたいです。
気になったので調べたまで。

参考:
Why do python bindings for v3 still use package name "cv2"? - OpenCV Q&A Forum
convert toの略だという説が...w

Unix系OSでの基本

Unix系のOSでの基本を自分用にメモしておく。

ホームディレクトリへの移動とか

ログインした時の場所(MACだと/Users/ゆーざーねーむ)に移動するには

cd ~/

のように~で移動できる。
なぜUnix&Linuxではホームディレクトリを「~」文字で表現するのか。 - [モ]Modern Syntax

環境変数pathやエイリアスを書く場所:~/.bashrc or ~./bash_profile

後者はログイン時のみで、前者はbashが起動する度に読み込まれる。
.bash_profile ? .bashrc ? いろいろあるけどこいつらなにもの? - Qiita
本当に正しい .bashrc と .bash_profile の使ひ分け - Qiita
例えばエイリアスを作りたい時は
alias hoge="hogehoge"みたいな感じで。
source .bashrcとかで反映させられる。
Macのターミナルでよく使うコマンドにエイリアスを作りました - Qiita

よく使うコマンド

ls, pwd, mkdir, mv, ln -s,

パッケージ管理

MAC:Homebrew
Red-Hat系:yum
Debian系(Ubuntu含む):apt-get

anacondaでインストールしたpython2とpython3をsublimeText上で使う

普段はMACでpython2.7でSublimeTextというエディターを使ってコードを書いていますが、python3を使いたいことがあったので、ptthon2と3を今の環境のまま共存できるようにしました。
(完全に自分用の忘備録で他のサイトを見たほうが分かりやすいと思うので、この記事は読まない方がいいです。)

anacondaでPython2と3を共存させる

まず、anacondaでpython3を追加でインストールするには、ターミナルで

conda create -n py3 python=3.6

conda create -n py35 python=3.5 anaconda

ちなみに、この"py3"という部分は自分でpython3に切り替える時に使う名前なので、好きな名前にできます。

[追記]
2017.1.4現在anacondaでインストールできる安定版はPython3.5(Python3の安定版はPython3.6だが、Anacondaでパッケージまで含めてインストールできるのは恐らく3.5まで)。上の"conda create -n py35 python=3.5 anaconda"の"anaconda"を書き忘れると、パッケージ類(numpyとか)がインストールされず、Pythonだけしか入らないっぽいので注意。

インストールが完了すると、以下のメッセージが出ました。

# To activate this environment, use:
# $ source activate py3
#
# To deactivate this environment, use:
# $ source deactivate

書いてある通り、何もしなければ元々入っているpython2が使われ、python3を使う際には"source activate py3"と、python2に戻るには"source deactivate"をターミナルで行います(最初、activateをactiveとタイプしていて、怒られた...)。

これでpython2とpython3を切り替えられるようになりました。実際、

import sys
print(sys.version_info)

のようなファイルを作って、ターミナルで実行してみると、

sys.version_info(major=2, minor=7, micro=11, releaselevel='final', serial=0)

sys.version_info(major=3, minor=6, micro=0, releaselevel='final', serial=0)

と確かに2と3を切り替えれられていることが確認できました。

AnacondaでインストールされているpythonとそのPATHの一覧は

conda info -e

を使って見ることができます。私の場合は、

# conda environments:
#
py3                      /Users/おっぱいそん/anaconda/envs/py3
root                  *  /Users/おっぱいそん/anaconda

で、rootの方が元々インストールされているpython2でpy3が今、インストールしたpython3です。*が付いている方が今、アクティブになっているpythonです。
参考:PENGUINITIS - Anaconda における Python 2 と Python 3 の共存

[追記]
最初、Python3しかインストールされず、パッケージが入っていなかったが、それは"conda create -n py35 python=3.5 anaconda"のanacondaを書き忘れたためっぽい。(以下は解決したので削除)

*** 必要なパッケージ−のインストール
上記だけではPython3がインストールされただけで、Numpyなどのパッケージはインストールされていません。
(Python2に対しては必要となるパッケージがインストールされるのに、追加でインストールするPython3に対してはパッケージがインストールされないのは仕様なのだろうか?)
必要なパッケージがある場合は、"source activate py3"(py3の部分は自分で付けた名前)でPython3に切り替えてから、

conda install numpy
conda install scipy
conda install matplotlib

などで適宜、必要なパッケージをインストールしてください。
私の場合はMatplotlibが以下のようなエラーが出て、インストールできなかった... (とりあえず、すぐに使わないので放置する....)

UnsatisfiableError: The following specifications were found to be in conflict:
  - matplotlib
  - python 3.6*
Use "conda info <package>" to see the dependencies for each package.


SublimeTextでPython2と3を切り替える

次に、SublimeTextでpython2と3を切り替えられるようにします。
SublimeTextではSublimeRopeという統合開発環境をインストールすることで、SublimeText上でpythonを実行できる(⌘Cmd+b)ようになります。
実行する際に使うPythonのPATHは、"Preferences/Settings - User"で設定できます。

{
	"build_env":
	{
		"PATH": "/Users/おっぱいそん/anaconda/bin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin:/opt/X11/bin:/usr/texbin"
	},
}

に書いてあるのがPythonのPATHなので、"/Users/おっぱいそん/anaconda/bin"を上記で調べた"/Users/おっぱいそん/anaconda/envs/py3/bin"にすることで、python3に切り替えられます。
毎回、設定を書きかえるのは結構めんどうなので、もっといいやり方がありそうですが... (もっといいやり方があったら誰か教えてくださいm(__)m)
参考:Sublime TextでPython環境を構築する話 - 酒飲みの備忘録

リストの最大値(最小値)のindexを取得する

NumpyのArrayだと、argmaxを使って、最大値のindexを取得できる。
(ただし、最大値が重複して存在する場合は、一番小さいindexを返す仕様になっている)
numpy.argmax — NumPy v1.10 Manual


PythonのListにも同じような関数が用意されているかと思ったんだけど、ないみたいなので、書き方を調べてみた。
例えば、以下のようなListがあるとする。

list_name = [2, 3, 4, 8, 3, 1, 3, 5, 7, 8, 3, 2]

最大値は8で、最大値の位置するindexは3と9である(最大値には重複がある)。


Numpyのargmaxと同様に、重複がある場合に一番小さいindexを返したい場合には、以下のような書き方がある。

print list_name.index(max(list_name))
print max(enumerate(list_name), key=lambda x: x[1])[0]
print max(xrange(len(list_name)), key=lambda i: list_name[i])
import operator
print max(enumerate(list_name), key=operator.itemgetter(1))[0]
print max(zip(list_name, range(len(list_name))))[1]

一番小さいindexの3を返してくれる。
最後のやつだけ、大きいindexを返してくるが理由は良く分からん。


一部のindexだけでなく、全てのindexを返したい場合には、

print [i for i, x in enumerate(list_name) if x == max(list_name)]
[3, 9]

とリスト内包表記を使って、全ての最大値のindexを求めることが出来る。


いろいろ書き方がありましたが、速度などは比較してないです。
Ref:
リスト内の最大値を見つける - Screaming Loud
python - How to find all positions of the maximum value in a list? - Stack Overflow
python - Pythonic way to find maximum value and its index in a list? - Stack Overflow