新しいコース「 ブロックチェーン基礎 」が追加されました!
2018/03/14新しいコース「 CNNを用いた画像認識 」が追加されました!
2018/02/22Pandas もNumpyのようにデータの集合を扱うためのライブラリです。Numpyはデータを数学的な行列として扱うことができ、科学計算に特化しています。一方、Pandasでは 一般的なデータベースにて行われる操作が実行でき、数値以外にも氏名や住所といった文字列データも簡単に扱うことができます。 データ分析においてNumpyとPandasを使い分けることで効率的にデータ分析を行うことができます。
Pandasには Series と DataFrame という二種類のデータ構造が存在します。主に使われるデータ構造は以下の二次元のテーブルで表される DataFrame です。横方向のデータを行、縦方向のデータを列と呼びます。各行、各列に対してそれぞれラベルが付与されており、行ラベルは インデックス 、列ラベルは カラム と言います。 Series は1次元の配列で、DataFrameの行、もしくは列として捉えることができます。こちらも各要素にラベルが付与されています。
DataFrameのラベル情報
インデックス:[0,1,2,3,4]
カラム:["Prefecture", "Area", "Population", "Region"]
Seriesのラベル情報
インデックス:["Prefecture", "Area", "Population", "Region"]