(cache)Pandasを用いたデータ処理 - Pandasとは | 10秒で始めるAIプログラミング学習サービスAidemy［アイデミー］

新しいコース「ブロックチェーン基礎」が追加されました！

2018/03/14

新しいコース「 CNNを用いた画像認識」が追加されました！

2018/02/22

ご意見箱

快適に学んでいただくために、Aidemy では Google Chrome を推奨しています。

MISSION COMPLETE

次へ進む

コースの進捗をシェアしよう！

ツイートする

Pandasを用いたデータ処理

1.1.1 Pandasとは

チャプター

Pandas もNumpyのようにデータの集合を扱うためのライブラリです。Numpyはデータを数学的な行列として扱うことができ、科学計算に特化しています。一方、Pandasでは 一般的なデータベースにて行われる操作が実行でき、数値以外にも氏名や住所といった文字列データも簡単に扱うことができます。 データ分析においてNumpyとPandasを使い分けることで効率的にデータ分析を行うことができます。

Pandasには Series と DataFrame という二種類のデータ構造が存在します。主に使われるデータ構造は以下の二次元のテーブルで表される DataFrame です。横方向のデータを行、縦方向のデータを列と呼びます。各行、各列に対してそれぞれラベルが付与されており、行ラベルは インデックス 、列ラベルは カラム と言います。 Series は1次元の配列で、DataFrameの行、もしくは列として捉えることができます。こちらも各要素にラベルが付与されています。

DataFrameのラベル情報

インデックス：[0,1,2,3,4]
カラム：["Prefecture", "Area", "Population", "Region"]

Seriesのラベル情報

インデックス:["Prefecture", "Area", "Population", "Region"]

課題

次のDataFrameのカラムは次の選択肢のうちのどれでしょうか

"Prefecture", "Area", "Population", "Region"

0, 1, 2, 3, 4

ヒントを見る

SUBMIT

Aidemy Tech Blog