ビットDP(bit DP)の考え方 ~集合に対する動的計画法~

2020年2月22日動的計画法bit演算, 動的計画法, bitDP, DP, テーマ記事, 競プロ

競技プログラミングで良く使われる動的計画法の1種、「ビットDP」と呼ばれるものについてまとめました。

ビットDPとは

ビットDP(bit DP) とは、ビットで表現した集合を添え字に持つ動的計画法(DP)のことです。

基本的には、以下のような DPを考えます。

dp[S] := 部分集合 S に対して|S|! 通りの順序の中から最適なものを選んだときの、何かしらの値

漸化式の更新式としては、

dp[S{v}]=dp[S]+cost(S,v)

のように集合を1つずつ増やしていく形になることが多いです。

この集合に対するDPによって、n 個のものに対してn! 通りの順序の中から最適なものを計算するのを高速化できる場合があります。

集合をビットで表現する

実際には集合を配列の引数にするために、集合を2進数で表現します。全体集合 {0,1,2,…,n-1} の部分集合 S を n 桁の2進数で表現するのです。

例えば、全体集合 {0,1,2,…,9} の部分集合 {0,3,5} については、0bit目と3bit目と5bit目が 1で、それ以外が0となるような2進数の数字 100101000002 で表現することができます。

このような「集合をビットで管理する」という考え方が、ビットDPと呼ばれる理由です。

巡回セールスマン問題

頂点数 n の重み付き有向グラフが与えられる。以下を満たす最短経路の距離を求めよ。

  • 閉路である
  • 始点と終点を除いて、全ての頂点を1度ずつ通る

リンク:AOJ Traveling Salesman Problem

ビットDPで効率的に計算できる代表例として、以上のような巡回セールスマン問題があります。始点と終点を除いて、全ての頂点を1度ずつ通る閉路のことを、ハミルトン閉路などと言います。

先程の概要だけではイマイチ理解しにくいと思います。実際にこの問題を通して、ビットDPの使い方を見ていきましょう。

全探索では間に合わない場合がある

純粋に全探索することを考えると、条件を満たすような経路は n! 通り考えることができます。

これを全探索して最短経路を求めても良いのですが、nが非常に小さくとも、n! は非常に大きい値になり計算が間に合わないことがあります。

ビットDPで高速化

そこでビットDPを使って高速化することを考えてみましょう。ビットDPの基本的な式から考えると、

  • dp[S] := {0,1,2,…,n-1} の部分集合 S を巡回する |S|! 通りの経路のうち最短のものの距離

としたくなりますが、これでは動的計画法の漸化式を立てることができません。漸化式を立てるためには、「直前にどの頂点にいたのか」という情報が必要不可欠だからです。

そこで以下のように DP を定義して更新式を考えましょう。

dp[S][v] := {0,1,2,…,n-1} の部分集合 S を巡回する |S|! 通りの経路のうち最短のものの距離。ただし、最後に頂点 v に到達した時のみを考える。

更新式は、頂点 u から v までの距離を cost(u,v) とすると以下の通りとなります。

dp[S{v}][v]=minuS(dp[S][u]+cost(u,v))

計算量の変化

このようにすると、全探索のときは O(n!) だった計算量が、 O(n22n) 程度にまでなります。

O(n!) では n=10 を超えるとかなり時間がかかりますが、O(n22n)なら軽い計算で n=20 前後まで数秒で計算ができるようになります。

実装上の注意

最短経路を求める問題なので、存在しないパスは非常に大きい値(INFなど)にしてしまえば大丈夫です。(オーバーフローには注意しましょう。)

また、更新の順序に関しては「集合の要素が1の時, 2の時, 3の時, … 」のように考えるとループで表現することが難しいです。このような時はメモ化再帰などで実装するのが一般的です。
しかし、実際には2進数の数 i,j が表す集合が S(i)S(j) ならば ij となる性質から、以下のようなループで更新してしまっても問題ありません。

さらに、どの頂点からスタートしても最短となるハミルトン閉路が存在することを考えると、自分で適当にスタートとなる頂点を決めてしまって大丈夫です。
始点と終点を一致させるためには、頂点0からスタートしたとして以下のようにすれば良いです。

dpの定義

  • dp[S][v] := 頂点0からスタートして、{0,1,2,…,n-1} の部分集合 S を巡回する |S|! 通りの経路のうち最短のものの距離。ただし、最後に頂点 v に到達した時のみを考える。

dpの初期化

  • dp[0][0]=0
  • その他は全て INF

頂点0 からスタートするので以上の通りです。

dpの更新

  • dp[Sv][v]=minuS(dp[S][u]+cost(u,v))

更新式は先程説明した通りです。

答え

  • dp[{0,1,,n1}][0]

最終的に頂点0 に到達した時が求める答えになります。

実装例

メモ化再帰での実装と、配るDPを利用した実装です。

メモ化再帰

実装上の注意でも述べましたが、更新の順序に関しては「集合の要素が1の時, 2の時, 3の時, … 」のように考えるとループで表現することが難しいです。

このような時は以下のようにメモ化再帰などで実装するのが一般的です。

配るDP

実際には2進数の数 i,j が表す集合が S(i)S(j) ならば ij となる性質から、配るDPのループを利用した更新順序でも問題なく更新ができます。

G – Revenge of Traveling Salesman Problem

先程のトラベリングセールスマン問題を、重み付き無向グラフについて考える。ただし、パス itimei 時間経過すると通れなくなる。
この時の最短経路の距離と、最短距離で戻る経路の総数を出力せよ。

リンク:[AtCoder] square869120Contest #1 G – Revenge of Traveling Salesman Problem

先程のトラベリングセールスマン問題の上位互換の問題です。

トラベリングセールスマン問題との相違点

この問題も、基本的にはビットDPによって解くことができますが、いくつか違いがあるので注意しましょう。

有向グラフではなく無向グラフ

ちょっとした違いですが、先程の問題とは異なり無向グラフなので双方向にパスができるように注意しましょう。

入力が非常に大きい

入力が非常に大きく 32bit の整数型では収まらないことに注意しましょう。

最短距離だけではなく、最短距離となる経路の数も求める

最も大きな違いが、最短距離だけではなく、最短距離の経路数まで求める必要があることです。これは以下のように経路数を含めて dp を定義してやればうまく計算ができます。

dp[S][v] := {0,1,2,…,n-1} の部分集合 S を巡回する |S|! 通りの経路のうち最短のものの距離と経路数のペア。ただし、最後に頂点 v に到達した時のみを考える。

パスに時間制限がある

2つ目に大きな違いが、時間によって通れる辺と通れない辺が生じることです。これは更新式を少し変更してやれば対応可能で、

  • dp[S{v}][v]=minuS(dp[S][u]+cost(u,v)) (ただし、dp[S][u]+cost(u,v) の値が time(u,v)以内の時に限る )

などとしてやれば良いです。

もちろん、dp は距離と経路数のペアなので、実際にはもう少し複雑なコードになります。

実装例

メモ化再帰での実装です。

D – 部活のスケジュール表 (Schedule)

J君・O君・I君の3人が部活に参加するかどうかのN日間のスケジュールの決め方が何通りあるか知りたい。ただし、スケジュールは以下を満たすようにしなければならない。

  • 鍵を持っている人が参加しなくてはならない
  • 予め定められたその日の責任者は必ず参加する
  • 鍵はその日参加した人のうち誰が持ち帰っても良い
  • 鍵は一つしかない

考えられるスケジュールの決め方を10007で割った余りで答えよ。

リンク:第13回日本情報オリンピック 予選(オンライン)D – 部活のスケジュール表 (Schedule)

先程までのトラベリングセールスマンの話と少し毛色が異なりますが、これも集合を添え字にした動的計画法が利用できる問題です。つまりビットDPが使えます。

考え方

参加者の集合をビットで表現できる

1日ごとの参加者がどうなるかを考えてみると、J君・O君・I君のそれぞれについて、参加したかしなかったかの2通りで表現することができます。

つまり、J君を0bit目, O君を1bit目, I君を2bit目として参加したかどうかを0,1で表すことを考えると、参加者の集合を3bitの2進数で表すことができるのです。

例えば、1日目に J と I が参加した時を考えてみましょう。このときの参加者を2進数で表現すると 1012 などと表すことができます。

動的計画法が使える問題だと見ぬく

鍵の受け渡しを考えると、前日の参加者がどうだったかによって、当日は誰が来るべきで誰が来なくても良いのかが変わってきます。

それを踏まえると、以下のように DP を定義すれば、漸化式を作れることが分かります。

dp[ 参加者の集合S ][ i ] := i 日目に参加者の集合が S だった時の、0~i 日目までのスケジュールの決め方の総和

漸化式の更新は以下のようになります。

  • dp[next][i + 1] = now{J,O,I} dp[now][ i ] (ただし next は i+1 日目の責任者を含み、now と next で共通の参加者がいる時のみを考える)

はじめに部室の鍵を持っているのは J 君なので、初期化は以下のようにしてやれば大丈夫です。

  • dp[ { J } ][ 0 ] = 1
  • それ以外は全て 0

実装例

配るDPでの実装例です。実際には 10007で割った余りを出力しなければならないので忘れないようにしましょう。

練習問題