AnacondaでPythonの環境構築!概要~インストール方法まで解説
web開発
2018/05/29
機械学習やディープラーニングの技術が浸透するにつれて、これらの技術と親和性の高い言語であるPythonを習得したいという方が増えてきています。
Pythonではデータ処理に実用的なライブラリが多数提供されていますが、今、最も評価されているディストリビューションのひとつが「Anaconda(アナコンダ)」です。
こちらでは、Anacondaの概要やインストール方法、活用のポイントについてご紹介します。
Anacondaとは?Pythonとの関係を紹介!
「Anaconda」とは、Pythonのライブラリが詰め込まれたパッケージです。Pythonそのもののほか、Pythonとともに利用されることが多いライブラリが複数パッケージングされています。
有料ライセンスも用意されていますが、高速演算や並列演算が必要にならない限り、無料のタイプで対応可能です。
機械学習やデータ分析、高度な数値計算など、Pythonを使った処理はAnacondaで簡単に実現できます。Anacondaを利用するメリットや、含まれている代表的なライブラリについて紹介していきます。
Python環境構築にAnacondaを利用するメリットは?
Python環境構築の際に、Anacondaを利用するメリットは何でしょうか?
Pythonで処理を行うためには、OSに応じてライブラリをコンパイルしてインストールする必要があります。この作業は、開発従事経験があればさほど難しくないものの、単にPythonで処理がしたい方にとっては煩雑です。
そこで、Anacondaをインストールすれば、役立つライブラリがあらかじめインストールされた状態でPython環境を構築できるという点は、大きなメリットと言えます。
また、Anacondaはとりわけデータ解析に特化したプラットフォームとして制作されています。Pythonを使ったデータ解析を想定している方にとっては、非常に役立つツールとなるでしょう。
さらに、バージョン違いのPythonを切り替えて使用できる点も、古いプログラムを運用するユーザーには評価されています。
Anacondaに含まれるPythonの機械学習ライブラリ
Anacondaに含まれるPythonのライブラリを簡単にご紹介します。
NumPy | 大量データ配列の処理に特化したライブラリです。 |
SciPy | NumPyでできる処理に加え、信号処理や統計の処理も可能なライブラリです。 |
Matplotlib | データをプロットしたグラフ画像を出力できるライブラリです。 |
Pandas | NumPyのデータに対し、統計処理を実施できるライブラリです。 |
Scikit-Learn | 「アルゴリズムチートシート」を用いて、機械学習を行えるライブラリです。 |
Jupyter | 「ノートブック」形式のプログラムを実行しながら結果を記録し、分析できるライブラリです。 |
ご紹介したのはどれも機械学習に有効活用できるライブラリばかりです。
通常、Pythonだけを導入した場合は各ライブラリを個別に集める必要がありますが、Anacondaには最初からこれらのライブラリが格納されていますので、メリットと言えるでしょう。
Anacondaの使い方!環境やインストール方法は?
続いて、実際にAnacondaを導入する際に要求される環境や、インストール方法についてご紹介しましょう。
対応しているのはWindows・MacOX・Linuxです。インストールするためには、ストレージに最低3GBの空き容量が必要です。ダウンロードページで各OSに対応したプログラムファイルをダウンロードできます。
ファイルをダウンロードした後はインストーラーを起動し、画面の指示どおりに進めていけば簡単にインストールは終了します。
途中、インストールする場所やPATHの設定を求められますが、特にこだわりがない限りはデフォルトのままでよいでしょう。
バージョンについて
各OSにはそれぞれ、旧バージョンのPythonである2.x系と、最新のバージョンである3.x系が用意されています。特別な理由がない限りは、最新の3.xを選んでおけば問題ありません。
提供されているのは基本的に64ビット版のみ。Linuxのみ32ビット版が提供されています。使用しているマシンに応じて選択してください。
condaとは?
「conda」とは、Python用のパッケージ管理システム、および環境マネジメントシステムです。Anacondaをインストールすると、自動的にcondaも使える状態になっています。代表的なコマンドをいくつか紹介します。
l 仮想環境の作成
$ conda create –name <仮想環境名> python=<バージョン> |
l 仮想環境の確認
$ conda info -e |
l インストール済みパッケージの一覧を表示
$ conda list |
Anacondaを使う上で知っておくべきこと
Anacondaは、デフォルトでも十分便利なツールですが、いくつかのポイントを知っておくとさらに利便性が向上します。
最後に、Anacondaで機械学習を実施する上で、知っておいていただきたい代表的なポイントをご紹介しましょう。
Miniconda
上述したとおり、Anacondaはデータ分析に最適な構成のパッケージです。一方で、さらにシンプルな構成で十分なユーザー向けに「Miniconda」というディストリビューションも提供されています。
Minicondaの構成はPythonとCondaのみ。複雑な構成が不要な方は、こちらをチョイスしてもよいでしょう。
Anaconda Cloud
ほかのユーザーがアップした非公式ライブラリを利用できる「Anaconda Cloud」というツールが存在します。
GitHubのようなものをイメージしていただけるとわかりやすいかもしれません。プリインストール以外のライブラリが欲しくなった際に役立つので、登録をおすすめします。
Anacondaにはデータ解析に必要なライブラリがひととおり網羅されており、ビギナーにはうってつけのパッケージを言えます。
レベルに応じて最適な講座を受けて利用すると、さらにデータ分析への理解が深まるでしょう。
Udemyでは、Pythonデータサイエンス入門レベルの講座を提供しています。データサイエンスの基礎固めとして活用してみてはいかがですか?
目的別!最先端ITスキル講座
海外の人気講師によるWeb制作のベストセラ―講座
【世界で30万人が受講】フルスタック・Webエンジニア講座(2017最新版)
ウェブデザインの基礎、サーバーサイドプログラミング、モバイルアプリ開発、APIプログラミングなどを網羅的にマスターできる
最新!iOS11アプリ開発講座
【6日で速習】iOS 11 Swift 4アプリ開発入門 決定版 20個のアプリを作る ARKit,CoreML,NFC
地図検索、ARなど20個以上のアプリを作って学べる実践講座
日本を代表するデータサイエンティスト辻真吾氏による人気講座
【世界で5万人が受講】実践 Python データサイエンス
データ解析の基本、可視化、統計、機械学習などデータサイエンスに関するあらゆる実践的なスキルがPythonで身に付く!
初級者から学べる人工知能講座の決定版
みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習
初心者向けの人工知能と機械学習のコース。文字認識や株価分析なども実施
【プログラミング初心者向け】データサイエンスを学びたい方におすすめ!
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門 | Udemy
分析コンペティションに参加しながら回帰分析による売上予測、機械学習での顧客ターゲティングなど実践的なビジネス課題でデータ分析の一連の流れを身に着けよう。 プログラミング初心者にもおすすめ。