新しいコース「 ブロックチェーン基礎 」が追加されました!

2018/03/14

新しいコース「 CNNを用いた画像認識 」が追加されました!

2018/02/22
ご意見箱
快適に学んでいただくために、Aidemy では Google Chrome を推奨しています。
MISSION COMPLETE
次へ進む
コースの進捗をシェアしよう!
  ツイートする
  シェアする
Pandasを用いたデータ処理
1.1.1 Pandasとは
前へ
チャプター
次へ

Pandas もNumpyのようにデータの集合を扱うためのライブラリです。Numpyはデータを数学的な行列として扱うことができ、科学計算に特化しています。一方、Pandasでは 一般的なデータベースにて行われる操作が実行でき、数値以外にも氏名や住所といった文字列データも簡単に扱うことができます。 データ分析においてNumpyとPandasを使い分けることで効率的にデータ分析を行うことができます。

Pandasには SeriesDataFrame という二種類のデータ構造が存在します。主に使われるデータ構造は以下の二次元のテーブルで表される DataFrame です。横方向のデータを行、縦方向のデータを列と呼びます。各行、各列に対してそれぞれラベルが付与されており、行ラベルは インデックス 、列ラベルは カラム と言います。 Series は1次元の配列で、DataFrameの行、もしくは列として捉えることができます。こちらも各要素にラベルが付与されています。

DataFrameのラベル情報

インデックス:[0,1,2,3,4]
カラム:["Prefecture", "Area", "Population", "Region"]

Seriesのラベル情報

インデックス:["Prefecture", "Area", "Population", "Region"]
本のマーク課題
  • 次のDataFrameのカラムは次の選択肢のうちのどれでしょうか

ヒントを見る
   
SUBMIT