凸集合と表現測度Choquet's theorem


画像
画像
画像
画像
画像
画像
画像
画像
画像
画像
画像
画像
画像
画像


コンパクト集合の閉凸包の単純だが有用な特徴づけは、測度とその重心の観点から与えることができます。 (手書きメモ:点が、closed convex hull に入るための特徴づけ)

命題 1.2. Y を局所凸空間 E のコンパクト部分集合とする。E の点 xY の閉凸包 X に属するための必要十分条件は、x を表現する Y 上の確率測度 \mu が存在することである。

証明: \mux を表現する Y 上の確率測度であるとすると、E^* の各 f に対して、f(x) = \mu(f) \leqq \sup f(Y) \leqq \sup f(X) となる。X は閉集合かつ凸集合なので、これから xX に属することがわかる。

\boxed{質問1}

ご質問の数式は、提供された資料の「命題 1.2」の証明の冒頭に登場する重要なステップです。この数式は、「確率測度 \mu が点 x を表現しているならば、点 xY の閉凸包 X に必ず含まれる」ということを示すために使われています。

この数式は3つの部分から成り立っています。前提となる記号を確認した上で、それぞれの意味を順番に解説します。

【記号の前提】

  • E: 局所凸空間

  • E^*: E の連続的双対空間(E 上の連続線形汎関数の集まり)

  • f: E^* の要素(連続線形汎関数)

  • Y: E のコンパクトな部分集合

  • X: Y の閉凸包(手書きメモにも Y \subset X とある通り、Y を含む集合です)

  • \mu: Y 上の確率測度(全体の重みの和が 1 となる測度)

1. f(x) = \mu(f) について これは、測度 \mu が点 x を「表現する(represents)」ということの定義そのものです。ここでの \mu(f) は、関数 f を測度 \mu によって Y 上で積分した値(\int_Y f d\mu)を意味します(資料の後半の証明でも \int_Y f d\mu という表記が使われています)。つまり、任意の線形関数 fx を代入した値 f(x) が、f を測度 \mu で重心をとるように積分した値と一致するという意味です。

2. \mu(f) \leqq \sup f(Y) について \mu は「確率測度」であるため、Y 全体での測度の総和(重み)は 1 になります。ある関数 fY 上で積分した値 \mu(f) は、Y 上での f の最大値(上限である \sup f(Y))を超えることは決してありません。最大値に全体の重み 1 を掛けたものが上限となるためです。

3. \sup f(Y) \leqq \sup f(X) について
XY を含んで膨らませた集合(閉凸包)なので、YX の一部です(Y \subset X)。したがって、狭い範囲 Y で探した f の上限値よりも、より広い範囲 X で探した f の上限値 \sup f(X) の方が大きい(または等しい)ことになります。


【この数式が意味する結論】 以上の連なった式により、E^*すべての連続線形汎関数 f に対して、f(x) \leqq \sup f(X) が成り立つことが示されました。

※ここから先は提供資料外の一般的な関数解析(ハーン・バナッハの分離定理)の知識に基づく補足となりますが、もし点 x が閉凸集合 X の外側にあった場合、f(x) > \sup f(X) となるような関数 f が必ず存在してしまいます。 しかし、上記の数式によって「どんな f を持ってきても f(x) \leqq \sup f(X) になる」ことが証明されたため、「xX に属している」と結論付けることができます。資料の該当箇所の直後でも、まさに「X は閉集合かつ凸集合なので、これから xX に属することがわかる」と証明が締めくくられています。


逆に、xX に属するならば、x に収束する Y の凸包内のネットが存在する。同値な言い方をすれば、
y_\alpha = \sum_{i=1}^{n_\alpha} \lambda_i^\alpha x_i^\alpha\lambda_i^\alpha > 0\sum \lambda_i^\alpha = 1x_i^\alphaY の要素、\alpha はある有向集合の要素)の形をした点 y_\alpha で、x に収束するものが存在する。 各 y_\alpha は、確率測度 \mu_\alpha = \sum \lambda_i^\alpha \varepsilon_{x_i^\alpha} によって表現することができる。リースの定理により、Y 上のすべての確率測度の集合は C(Y)^* の弱コンパクトな凸部分集合と同一視できるため、\mu_\alpha の部分ネット \mu_\beta で、Y 上の確率測度 \mu に(C(Y)^* の弱位相において)収束するものが存在する。

\boxed{質問2}
ご質問の一文は、「命題 1.2」の証明の後半において、**「点 x に近づいていく点の列(ネット)に合わせて、対応する確率測度も何らかの確率測度 \mu に近づいていく(収束する)はずだ」**ということを保証するための最も重要な根拠となる部分です。

提供された資料内では、これらは関数解析における既知の事実として詳細な説明なしに使われています。そのため、以下は一般的な関数解析の知識に基づく補足を含めた解説となります。

この一文を理解するために、いくつかのパーツに分けて解説します。

1. C(Y)C(Y)^* について

  • C(Y): コンパクトな集合 Y 上で定義された、実数(または複素数)に値をとる「連続関数」全体の集まりがつくる空間です。

  • C(Y)^*: C(Y) の「双対空間」と呼ばれるものです。これは、C(Y) に属する連続関数を入力として受け取り、あるルールに従って数値を返す「連続な線形関数(線形汎関数)」全体の集まりです。

2. リースの定理(Riesz representation theorem)について

リースの表現定理と呼ばれる有名な定理は、**「C(Y)^* の要素(線形汎関数)は、Y 上の測度を用いた『積分』という形で完全に表すことができる」**ということを主張しています。

つまり、ある関数 f を入力して数値を返す働きは、必ずある測度 \mu を使って \int_Y f d\mu と計算することと同じになる、ということです。

3. 「同一視できる」とは

リースの定理により、「Y 上の測度」と「C(Y)^* の要素(線形関数)」は11に対応します。そのため、測度の集まりを、そのまま C(Y)^* という関数空間の中の図形(部分集合)であるかのようにみなして扱うことができます。

特に「確率測度」(全体の重みが 1 で、マイナスにならない測度)は、C(Y)^* の中でも特定の条件(ノルムが 1 で正値であること)を満たす要素の集まりに対応します。

4. なぜ「凸部分集合」なのか

2つの確率測度を、たとえば 0.30.7 の割合で混ぜ合わせても(凸結合しても)、全体の重みは 1 のままであり、やはり確率測度になります。このように、集合内の要素同士を混ぜ合わせたものもまたその集合内に収まる性質を「凸」であると言います。

5. なぜ「弱^*(弱スター)コンパクト」なのか*

関数解析の重要な定理(バナッハ・アラオグルの定理)により、「双対空間の単位球(大きさ 1 以下の要素の集まり)は、弱^位相という特別な距離の測り方においてコンパクト*になる」ことが知られています。

確率測度の集まりは、この単位球の中に含まれる閉じた集合になるため、自動的に「弱^*コンパクト」な集合になります。


【この一文が証明で果たしている役割】

証明の前半で、点 x に収束する点 y_\alpha と、それに紐づく確率測度 \mu_\alpha を作りました。しかし、\mu_\alpha がそのままどこかの測度に収束するとは限りません。

ここで「コンパクト」という性質が非常に強力な武器になります。数学においてコンパクトな空間の中の点列(ネット)は、**「必ず、ある点に収束する部分的な列(部分ネット)を持つ」**という素晴らしい性質があります。

したがって、確率測度の集合が「弱^*コンパクト」であるという事実のおかげで、測度のネット \mu_\alpha の中から、ある確率測度 \mu にきれいに収束していく部分ネット \mu_\beta を見つけ出すことができるのです。これが、点 x を表現する測度 \mu の正体となります。


特に、E^* の各 f は(Y に制限されたとき)C(Y) に属するため、\lim f(y_\beta) = \lim \int f d\mu_\beta = \int f d\mu となる。 y_\alphax に収束するので、部分ネット y_\beta も同様に x に収束し、したがって E^* の各 f に対して f(x) = \int_Y f d\mu となり、証明が完了する。□

上記の命題により、Krein-Milman(クレイン・ミルマン)の定理を容易に再定式化することができる。そのステートメントを思い出そう:
X が局所凸空間のコンパクト凸部分集合であるならば、X はその端点(極値点)の閉凸包である。
我々の再定式化は以下の通りである:
局所凸空間のコンパクト凸部分集合 X のすべての点は、X の端点の閉包を台とする X 上の確率測度の重心(barycenter)である。

\boxed{質問3}
ご質問の「X の端点の閉包を台とする X 上の確率測度の重心」という表現は、これまでの会話履歴に登場した「Krein-Milman(クレイン・ミルマン)の定理」の再定式化における最も重要な結論部分です。

この一文は、「コンパクトで凸な集合 X の中にあるどんな点 x であっても、それは X の『カド』にあたる部分に適切に重みを配置したときの『重心』として表現できる」ということを数学的に厳密に述べています。

それぞれの用語を分解して解説します。

1. 「X の端点の閉包」

  • 端点: 集合 X の中で、他の 2 点を結ぶ線分の内分点(中途半端な場所)として表すことができない「カド」や「輪郭」にあたる点のことです。

  • 閉包: 端点の集まりに、その極限点(限りなく近づく先の点)も付け加えて、境界を含めて閉じた(コンパクトな)集合にしたものです。以前の会話履歴の「命題 1.2」の適用部分では、これを Y と置いています。

2. 「〜を台とする X 上の確率測度」

  • 確率測度: 全体の重みの合計が 1 になるような重みの分布(測度 \mu)のことです。

  • 台(サポート)とする: その測度の重みが、指定された場所(ここでは Y、つまり「端点の閉包」)にのみ集中して置かれている、という意味です。それ以外の場所の重みは 0 になります。

3. 「重心(barycenter)」

  • 資料の手書きメモに「~によって表現されるもの」とある通り、ここでの「重心」は、点 x が測度 \mu によって「表現される(represents)」ことと同じ意味です。

  • 物理的な重心のイメージと同じように、端点(の閉包)の上に散らばった重み(確率測度 \mu)の「平均的な位置」が点 x になるということです。

  • 数学的な数式としては、任意の連続な線形関数 f に対して f(x) = \int_Y f d\mu が成り立つ(関数 f を、測度 \mu を用いて積分して得られる期待値が、x での関数値 f(x) に一致する)ことを意味します。

【全体の意味まとめ】 元のクレイン・ミルマンの定理は「集合 X は、その端点たちを混ぜ合わせて膨らませたもの(閉凸包)である」という主張です。 これを測度の言葉で言い換えたものがご質問の一文であり、「X の中の任意の点 x は、端点(およびその極限点)の上だけに合計 1 となる重みをうまく散りばめたときの、ピッタリ釣り合う中心点(重心)として表すことができる」という非常に美しい幾何学的・解析的な事実を示しています。




これら2つの主張が同値であることを証明するために、前者が成り立ち、xX に属すると仮定する。YX の端点の閉包とする(手書きメモ:Y \subset X);このとき xY の閉凸包に属する。すると、命題 1.2 により、xY 上の確率測度 \mu の重心となる。もし \mu を(自明な方法で)X に拡張すれば、求める結果が得られる。逆に、第2の主張が正しく、xX に属すると仮定する。このとき(上記のように Y を定義すると)命題 1.2 により、xY の閉凸包に属し、したがって X の端点の閉凸包に属することになる。(証明終)

X の端点の閉包ではなく、端点そのものを台とする測度による表現は、Krein-Milmanの定理をより鋭くしたものであることは今や明らかである。実際、Klee は、ある意味で(彼はこれを厳密に定義しているが)無限次元バナッハ空間のほとんどすべてのコンパクト凸部分集合は、その端点の閉包であることを示している。そのような集合については、Krein-Milman の表現は「点質量(point mass)」による表現以上の情報を与えない。

X の端点を台とする測度を見つけることの困難さは、大部分において、端点の集合が必ずしもボレル集合になるとは限らないという事実 [Bishop and de Leeuw, "the representation of linear functionals by measures on sets of extreme points, Ann.Inst.Fouier 9(1959), p. 327] に由来する。X が距離化可能である場合、この困難は以下の結果に示されるように回避される。 (\RightarrowChoquet II. p.178 Cor.27.3)

命題 1.3 X が位相ベクトル空間の距離化可能なコンパクト凸部分集合であるならば、X の端点は G_\delta 集合をなす。

証明: X の位相が距離 d によって与えられていると仮定し、各整数 n \geqq 1 に対して
F_n = \{x: x = 2^{-1}(y + z),\ y \text{ と } z \text{ は } X \text{ の要素},\ d(y, z) \geqq n^{-1}\} とする。各 F_n が閉集合であること、そして X の点 x が端点ではないための必要十分条件が、それが何らかの F_n に属することであることは、容易に確認できる。したがって、端点の補集合は F_\sigma 集合である。(証明終)

\boxed{質問4}

今回新しく提供された資料には命題1.3への直接的な言及がありませんが、これまでの会話履歴の最初の書き出し内容に基づいて、「命題1.3」が何を意味し、どのような役割を果たしているのかを解説します。

命題 1.3X が位相ベクトル空間の距離化可能なコンパクト凸部分集合であるならば、X の端点は G_\delta 集合をなす」は、一言で言えば、「端点の集まりが、測度(重み)を矛盾なく定義できる『行儀の良い』集合になる」ということを保証するための定理です。
この命題の意味と証明のロジックについて、3つのポイントに分けて解説します。 ※なお、G_\delta 集合や F_\sigma 集合、ボレル集合の詳細な定義については、提供された資料外の一般的な位相空間論・測度論の知識に基づき補足しています。必要であれば独立してご確認ください。

1. なぜこの命題が必要なのか(文脈とモチベーション) これまでの議論で、集合 X の任意の点 x は「端点の『閉包』」に置かれた確率測度の重心として表せる(クレイン・ミルマンの定理の再定式化)ことがわかりました。しかし、数学者たちはさらに条件を鋭くし、「閉包」のような余分なものを付け足さず、「端点そのもの」の上にだけ重みを置いて重心を表現したいと考えます。 しかしここで、「端点の集まりが複雑でグチャグチャすぎると、数学的に『積分』や『測度(重み)』を厳密に定義できない(ボレル集合にならない)」という問題が発生します。命題1.3は、X に「距離が測れる(距離化可能)」という条件を付け加えれば、端点の集まりは必ず G_\delta 集合という測度論的に扱いやすい集合になるため、この困難を回避できることを示しています。

2. F_n の幾何学的な意味(「端点ではない」ことの表現) 証明の中に
F_n = \{x: x = 2^{-1}(y + z),\ y \text{ と } z \text{ は } X \text{ の要素},\ d(y, z) \geqq n^{-1}\}
という数式が登場します。 これは、**「距離が 1/n 以上離れている 2 点 y, z のちょうど真ん中(中点)として表せる点 x の集まり」**を意味しています。 「端点」とは、集合の輪郭にあって「他の 2 点を結ぶ線分の内分点にならない点」のことです。したがって、ある点 x がどれかの F_n に入っているということは、「ある程度の長さを持つ線分の真ん中である」ことを意味し、すなわち「端点ではない」ということになります。

3. F_\sigma 集合と G_\delta 集合の関係
x が「端点ではない」ための必要十分条件は、n=1, 2, 3, \dots のどれかの F_n に含まれることです。

  • F_\sigma 集合: 一般に、閉集合の可算個(番号 n が振れる個数)の和集合(F_1 \cup F_2 \cup F_3 \cup \dots)のことを F_\sigma 集合と呼びます。今回の証明により、「端点ではない点の集まり」は F_\sigma 集合になることが示されました。

  • G_\delta 集合: 一般に、開集合の可算個の共通部分のことを G_\delta 集合と呼びます。位相空間の性質として、F_\sigma 集合の補集合(残り物)は必ず G_\delta 集合になります。

端点の集合は「端点ではない点」の補集合であるため、自動的に G_\delta 集合になります。G_\delta 集合はボレル集合(測度が定義できる集合の枠組み)の一種であるため、これで**「端点そのもの」の上に確率測度(重み)を矛盾なく配置して積分を行うための理論的な準備が整った**ことになります。

X の点 x に対する自明な表現測度 \varepsilon_x を思い出そう。もし xX の端点ではないならば、他の表現測度が存在することは容易にわかる。実際、X の端点は、それが他の表現測度を持たないという事実によって特徴づけられる。 (手書きメモ:端点であることの特徴づけ)


いいなと思ったら応援しよう!

コメント

コメントするには、 ログイン または 会員登録 をお願いします。
凸集合と表現測度Choquet's theorem|ari1110
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1