ヒープソート (Heap Sort)

これまで２つのソートは，実際にはソートのためのアルゴリズムとしては，ほとんど使われない．その理由は，時間計算量が，O(n²)と非常に遅かったからである．以下では，より高速なアルゴリズムをいくつか学ぶ．

バブルソートのような方法では総当たり的に比較を行なっていた．やみくもに最小値を探すことを繰り返し，その過程の比較演算で得られた情報はすべて捨てていた．時間効率のよいアルゴリズムは，この情報を何らかの方法である程度残すことによって，効率を稼いでいる．

ヒープソートではデータ構造として木構造を用いる．木構造は組織の構成やものの分類などを表現するのに広く用いられる．１冊の本も，章がいくつかあって，各章の中にはいくつかの節があり，その中にまた小節がある，というように木構造をしている．木構造は，日々目にする通り，節目（ノード）と枝（アーク）からなる．節目のうち他の枝の先につかないものがひとつあって，これを根といい，その先に枝の出ない節目を葉という．ヒープソートで用いる木構造は，二分木 (binary tree)，すなわち葉でないノードからは1本または2本のアークしか出ないものである．ヒープソートのアルゴリズムは，まず与えられたデータ列を次のような性質をもつ二分木--ヒープに構成する（図１参照）．

各ノード（根を含む）には，データが１つだけ書いてある．
葉を除く各ノードにおいて，自分のデータは，その子のデータより，大きくない．

ひとたび，ヒープが構成できれば，その根には必ず最小のデータがあるので，これを取り除く．次に，根を取り除くことによって壊れたヒープを再構築する．この手順を繰り返せばソートができる．

図１．ヒープの例

ヒープを配列で実現する場合は，各レベル（根をレベル０とし，レベルｎの子ノードをレベルｎ＋１とする）のノードを左から右に順番に並べた配列とするのがよい．図１の例では，1, 2, 5, 6, 3, 7, 10, 9, 8, 4 という順番に並ぶ．

課題６（オプショナル）

注意！この課題はオプショナルである（必修ではない）．余力のある人，あるいは，興味がある人がトライすること．

課題３のソーティングモジュールをヒープソートによるものに差し替えて動かせ．なお，ヒープを作る関数を，再帰的，非再帰的の両方で書いてみよ．

発展課題として，ヒープソートの時間計算量を考えよ．

この課題を解いた場合の提出方法は以下の通り．

Subject: ex1 6th
To: ex1kadai-2012@ai.soc.i.kyoto-u.ac.jp
Cc: 自分のユーザ名
フォーマット
2012 年度の締切は 7/18 (水) とする．

再帰に関する補足

ヒープは，木である．木は本質的に再帰的な構造であり，以下で定義される．

ひとつのノードは木である．（根だけからなる木．）
ノードに，１つまたは２つの木をつけたものも，木である．

したがって，これを処理するプログラム構造も再帰構造（自分自身を呼び出す制御構造）が自然である．

再帰的関数（モジュール）の例として，階乗を計算する関数（入力が自然数であることを仮定）をあげておく．

        int	factorial(int n)
        {
                if (n == 0)
                        return(1);
                else
                        return(n * factorial(n-1));
        }

この関数はもちろん再帰を使わないでも以下のように書ける．

        int     factorial(int n)
        {
                int     pi;

                for (pi=1; n>1; n--)
                        pi *= n;
                return(pi);
        }

再帰的関数の方が，アルゴリズムを自然に，かつ，簡明に表現することが多い．一方，上記の例では，非再帰的な後者の方が，実行時の効率がよい．そこで，両方の書き方について学ぶ必要がある．

次へ進む．