WindowsでPythonを使って『機械学習』を学ぶための環境構築

はじめに

logo_horizontal.png

WindowsでPythonの機械学習の環境構築をする方法は1通りではなく、色々な方法でインストールを試みることができます。 方法が複数あることは失敗しても他の方法で試せるためありがたいことですが、初心者にとってはどの方法で環境構築をすれば良いか迷ってしまう原因にもなってしまいます。

そこで、本記事では次のような方をターゲットに書いています。

  • Pythonを初めて使う方
  • Pythonはプロジェクトでなく自分用で使う方(要するに、仮想環境は不要な人)

失敗しない環境構築を行うためにも、ぜひこちらの記事を参考にしてみてください。

Pythonのインストール

まず、こちら (https://www.anaconda.com/distribution/) のページにアクセスしてAnacondaのディストリビューションファイルをダウンロードして、インストールを行います。 ※ Pythonがすでにインストール済みの方は、すでにインストールされているPythonをアンインストールしてから行うと安全です(推奨)。

AnacondaはPythonの環境構築からある程度必要なライブラリのインストールまで一気に済ませてくれるものです。

anaconda.png

22.png

ダウンロードに少し時間がかかります。

ダウンロード後に、ダウンロードしたファイルをダブルクリックしてインストールを実行していきます。

ana.png

2.png

基本的にOKで進めていきますが、ダウンロードファイルの場所をどこか指定しておきたい場合は、こちらの場所をご自身の好きな場所に変更してください。 ※ 特にこだわりのない方はそのままで大丈夫です。

2.png

「PATHを追加(上部)」と「AnacondaでインストールしたPythonをデフォルトに設定(下部)」のチェックしてあるかを確認してインストールを行いましょう。

数分程度でインストールが完了します。

なぜPythonの公式なインストールファイルを使わないの?

スクリーンショット 2017-03-18 10.15.25.png

Pythonの公式ページからインストールファイルをダウンロードして、インストールすることももちろん可能です。

しかし、この方法であればPCによってnumpyscipyと呼ばれる機械学習ライブラリのscikit-learnをインストールするために必要なライブラリをインストールする際に、『BLASやATLASがない』『Cコンパイラがない』といった対処が難しいエラーに遭遇する場合が多々ありました。 これを解決することが非常に難しく、Anacondaであれば、この環境も一発で構築してくれるため、誰一人環境構築で失敗することはなかったという経緯があります。

Pythonとライブラリがインストールされていることの確認

Windowsに標準で搭載されている「Windows PowerShell」(※なければコマンドプロンプトでも可)を開きます。

この画面上で以下のコマンドを入力し、以下のように正しく動作すればインストール完了になります。

$ python
>>> import numpy         # 線形代数用ライブラリ
>>> import scipy         # 数式処理用ライブラリ
>>> import matplotlib    # 可視化用ライブラリ
>>> import pandas        # データ処理用ライブラリ
>>> import sklearn       # 機械学習用ライブラリ
>>> exit()               # Pythonの対話モードを終了

6.png

ここで特にエラーが起きなければ、インストールは完了しています。

Flaskのインストール

AnacondaにはNumpyやPandasといったライブラリがデフォルトでインストールされるようになっていますが、標準で付属しているライブラリ以外は別途手動でインストールする必要があります。ただし、インストールの手順もとても簡単です。

Webフレームワークとして有名なFlaskのインストールを試しに行ってみましょう。

Pythonではpipと呼ばれるコマンドによって管理を行っており、以下のようにAnaconda経由でインストールした場合、Windows Power Shell もしくは コマンドプロンプト上で、以下のようにライブラリのインストールを行います。

python -m pip install <ライブラリ名> 

インターネットへの接続は必要であるため、注意しましょう。

では、Flaskをインストールする場合は、以下のようになります。

python -m pip install flask

Flaskはflaskという名前で登録されているため、小文字にしています。これで、ダウンロードが始まれば、自動的にインストールまで行われるため完了です。

Jupyter Notebookの起動を確認

Pythonの実行環境であり、解析によく使用されるJupyter Notebookの起動を確認しておきましょう。うまく動かない場合は、もう一度Anacondaのインストールをやり直してみてください。

Windows Power Shell もしくは ターミナル上で、以下のコマンドを入力してみましょう。

jupyter notebook

これで、以下のように、ブラウザが起動し、Jupyter Notebookの画面が立ち上がれば確認完了です。

中に入っているフォルダ名は違っていても大丈夫です。ここまでができれば環境構築完了です。

おわりに

Windowsでの環境構築、お疲れ様でした。 スムーズに環境構築を行うことができたでしょうか。

Anacondaを使用して、非常にスッキリした状態でインストールを行ったため、今後他のライブラリが必要になった際も pip や今回は出てきませんでしたが、conda のコマンドを使えば、追加のライブラリをだいたいうまくインストールできるため、今後もご安心ください。

みなさまがこれから機械学習を学ばれ、色々な産業で革命を起こしていただけることを非常に楽しみにしており、この記事がその一助となっていれば嬉しく思います。