確率の公理

確率論

コルモゴロフの公理は、1933年にアンドレイ・コルモゴロフが導入した、確率論の基礎となる公理である[1]。これらの公理は依然として確率論の基盤となっており、数学、物理科学、および現実世界の確率の事例の理解にとりわけ重要である[2]ベイズ確率を形式化する代替的アプローチは、コックスの定理(英語版)によって与えられる[3]

コルモゴロフによる公理系

まず、コルモゴロフ自身による公理系を解説し、次節で現代の定義について解説する。

Ω {\displaystyle \Omega } は、根元事象と呼ばれる要素の集合、 F {\displaystyle {\mathfrak {F}}} Ω {\displaystyle \Omega } の部分集合から構成される族であり、その要素は事象と呼ばれる。 P {\displaystyle P} F {\displaystyle {\mathfrak {F}}} 上の集合関数とする。以下の5公理を満たす系 ( Ω , F , P ) {\displaystyle (\Omega ,{\mathfrak {F}},P)} を確率空間と呼ぶ[4]

1. F {\displaystyle {\mathfrak {F}}} は有限個の要素による集合和集合差共通部分について閉じている[注釈 1]
2. F {\displaystyle {\mathfrak {F}}} Ω {\displaystyle \Omega } を含む。すなわち Ω F . {\displaystyle \Omega \in {\mathfrak {F}}.} [注釈 2]
3. P {\displaystyle P} は非負の実数値をとる。すなわち、 P : F R 0 {\displaystyle P:{\mathfrak {F}}\rightarrow \mathbb {R} _{\geq 0}}
4. P ( Ω ) = 1. {\displaystyle P(\Omega )=1.}
5. A , B F {\displaystyle A,B\in {\mathfrak {F}}} 互いに素な集合 (Disjoint sets) ならば、 P ( A B ) = P ( A ) + P ( B ) . {\displaystyle P(A\cup B)=P(A)+P(B).} 有限加法性

さらに Ω {\displaystyle \Omega } が無限集合の場合には次の連続牲の公理を導入する[5][注釈 3]

6. F {\displaystyle {\mathfrak {F}}} の減少列 A 1 A 2 A 3 {\displaystyle A_{1}\supset A_{2}\supset A_{3}\supset \cdots } が、 n = 1 A n = {\displaystyle \textstyle \bigcap \limits _{n=1}^{\infty }A_{n}=\emptyset } を満たすならば、 lim n P ( A n ) = 0. {\displaystyle \lim _{n\to \infty }P(A_{n})=0.}

公理5と6より、次の一般化加法定理(完全加法牲)が導かれる[7]

一般化加法定理
集合列 { A n } n N {\displaystyle \{A_{n}\}_{n\in \mathbb {N} }} は、互いに素であり、 n = 1 A n F {\displaystyle \textstyle \bigcup \limits _{n=1}^{\infty }A_{n}\in {\mathfrak {F}}} ならば、
P ( i = 1 A i ) = i = 1 P ( A i ) . {\displaystyle P{\bigl (}\textstyle \bigcup \limits _{i=1}^{\infty }A_{i}{\bigr )}=\sum \limits _{i=1}^{\infty }P(A_{i}).}

一般化加法定理を満たす P {\displaystyle P} は、 F {\displaystyle {\mathfrak {F}}} が生成する完全加法族(σ-集合体)上の非負かつ完全加法的な集合関数に一意的に拡張可能である[8]

公理

以上の議論をまとめて、現代では以下のように要約する[注釈 4]

Ω {\displaystyle \Omega } は任意の集合、 F {\displaystyle {\mathfrak {F}}} Ω {\displaystyle \Omega } 上の完全加法族(σ-集合体)(あるいは有限加法族)、 P {\displaystyle P} F {\displaystyle {\mathfrak {F}}} 上の集合関数とする。 P {\displaystyle P} が次の3条件を満たすとき、 P {\displaystyle P} ( Ω , F ) {\displaystyle (\Omega ,{\mathfrak {F}})} 上の確率測度となり、 Ω {\displaystyle \Omega } は標本空間、 F {\displaystyle {\mathfrak {F}}} は事象空間と呼ばれる。

第一の公理

事象の確率は非負の実数を取る。

P : F R 0 {\displaystyle P:{\mathfrak {F}}\rightarrow \mathbb {R} _{\geq 0}}

ここで F {\displaystyle {\mathfrak {F}}} は事象空間である。従って確率測度 P {\displaystyle P} は、測度の中でも特に、有限値しか取らない。負の確率を取る理論では、第一の公理は緩和される。

第二の公理

これは、単位測度(英語版)の仮定である。すなわち、標本空間全体において、少なくとも1つの根元事象が起こる確率は1となる。

P ( Ω ) = 1. {\displaystyle P(\Omega )=1.}

第三の公理

これは、σ-加法性の仮定である。互いに素な集合 (Disjoint sets) の任意の可算個の列(排反事象(英語版)と同義) E 1 , E 2 , F {\displaystyle E_{1},E_{2},\cdots \in {\mathfrak {F}}} は、下記を満たす。

P ( i = 1 E i ) = i = 1 P ( E i ) . {\displaystyle P{\Bigl (}\textstyle \bigcup \limits _{i=1}^{\infty }E_{i}{\Big )}=\sum \limits _{i=1}^{\infty }P(E_{i}).}

単に有限加法的な確率空間を考えている研究者もおり、この場合、 F {\displaystyle {\mathfrak {F}}} 完全加法族ではなく有限加法族であることだけが要求される[9]。一般に、偽確率分布(英語版)は第三の公理を緩和する。

結果

コルモゴロフの公理から、確率を研究する上でその他の有用な法則を演繹することができる。これらの法則の証明[10][11][12]は、第三の公理の力と、残りの2つの公理との相互作用を深い洞察をもって描き出す手順となる。即座に導ける4つの系とその証明を以下に示そう。

単調性

A B P ( A ) P ( B ) . {\displaystyle A\subseteq B\Longrightarrow P(A)\leq P(B).}

AがBの部分集合の場合、Aの確率はBの確率以下となる。

単調性の証明[10]

単調性を作るため、 E 1 = A , E 2 = B A {\displaystyle E_{1}=A,E_{2}=B\setminus A} とする。ただし、 A B {\displaystyle A\subseteq B} とし、 i 3 {\displaystyle i\geq 3} に対して E i = {\displaystyle E_{i}=\varnothing } とする。集合列 { E i } i N {\displaystyle \{E_{i}\}_{i\in \mathbb {N} }} は互いに素であり、 i = 1 E i = B {\displaystyle \bigcup _{i=1}^{\infty }E_{i}=B} となることは自明である。したがって、第三の公理から次が得られる。

P ( A ) + P ( B A ) + i = 3 P ( E i ) = P ( B ) . {\displaystyle P(A)+P(B\setminus A)+\sum _{i=3}^{\infty }P(E_{i})=P(B).}

第一の公理により、この左辺の各項は非負であり、有限値 P ( B ) {\displaystyle P(B)} に収束するため、 P ( A ) P ( B ) {\displaystyle P(A)\leq P(B)} および P ( ) = 0 {\displaystyle P(\varnothing )=0} が得られる。

空集合の確率

P ( ) = 0. {\displaystyle P(\varnothing )=0.}

事象が非可算の場合において、逆に確率が0でも事象が {\displaystyle \varnothing } とは限らない。

空集合の確率の証明

1つ前の証明で、 P ( ) = 0 {\displaystyle P(\varnothing )=0} は示されている。ただし、この結論は背理法で示される。

P ( B ) = P ( A ) + P ( B A ) + i = 3 P ( E i ) {\displaystyle P(B)=P(A)+P(B\setminus A)+\sum _{i=3}^{\infty }P(E_{i})}

は収束するから、 P ( ) =: a {\displaystyle P(\varnothing )=:a} とおくと、

i = 3 P ( E i ) = i = 3 P ( ) = i = 3 a = { 0 ( a = 0 ) ( a > 0 ) {\displaystyle \sum _{i=3}^{\infty }P(E_{i})=\sum _{i=3}^{\infty }P(\varnothing )=\sum _{i=3}^{\infty }a={\begin{cases}0&(a=0)\\\infty &(a>0)\end{cases}}}

も収束する。 a > 0 {\displaystyle a>0} と仮定すると、右辺は発散し、矛盾するから、 a = P ( ) = 0 {\displaystyle a=P(\varnothing )=0} となる。

余事象の法則

P ( A c ) = P ( Ω A ) = 1 P ( A ) {\displaystyle P\left(A^{c}\right)=P(\Omega \setminus A)=1-P(A)}

余事象の法則の証明

A , A c {\displaystyle A,A^{c}} は排反であり、 A A c = Ω {\displaystyle A\cup A^{c}=\Omega } である。よって、

P ( A A c ) = P ( A ) + P ( A c ) {\displaystyle P(A\cup A^{c})=P(A)+P(A^{c})} (公理3に従う)

そして P ( A A c ) = P ( Ω ) = 1 {\displaystyle P(A\cup A^{c})=P(\Omega )=1} (公理2に従う)

P ( A ) + P ( A c ) = 1 {\displaystyle \Rightarrow P(A)+P(A^{c})=1}
P ( A c ) = 1 P ( A ) {\displaystyle \therefore P(A^{c})=1-P(A)}

確率の値域

単調性から即座に次が従う。

0 P ( E ) 1 E F . {\displaystyle 0\leq P(E)\leq 1\qquad \forall E\in F.}

有界性の証明

E Ω {\displaystyle \varnothing \subset E\subset \Omega } に単調性の性質を使うと、 P ( ) = 0 {\displaystyle P(\varnothing )=0} より、

0 P ( E ) 1 {\displaystyle 0\leq P(E)\leq 1}

その他の性質

もう一つの重要な性質は下記である。

P ( A B ) = P ( A ) + P ( B ) P ( A B ) . {\displaystyle P(A\cup B)=P(A)+P(B)-P(A\cap B).}

これは、確率の加法定理と呼ばれる。つまり、AまたはBが起こる確率は、Aが起こる確率とBが起こる確率の和からAとBの両方が起こる確率を引いたものである。この証明は次の通りである。

まず、

P ( A B ) = P ( A ) + P ( B A ) {\displaystyle P(A\cup B)=P(A)+P(B\setminus A)} (公理3による)

であるから、

P ( A B ) = P ( A ) + P ( B ( A B ) ) {\displaystyle P(A\cup B)=P(A)+P(B\setminus (A\cap B))} B A = B ( A B ) {\displaystyle B\setminus A=B\setminus (A\cap B)} であるため)

また、

P ( B ) = P ( B ( A B ) ) + P ( A B ) {\displaystyle P(B)=P(B\setminus (A\cap B))+P(A\cap B)}

P ( B ( A B ) ) {\displaystyle P(B\setminus (A\cap B))} を消去すれば、求める結果が得られる。

加法定理の任意の数の集合への拡張は、包除原理である。

また、加法定理においてBをAの余事象Acとすると

P ( A c ) = P ( Ω A ) = 1 P ( A ) {\displaystyle P\left(A^{c}\right)=P(\Omega \setminus A)=1-P(A)}

つまり、事象が発生しない確率(つまり余事象)は、1から発生する確率を引いたものである。

簡単な例:コイントス

一回のコイントスを考え、コインが表 (H) または裏 (T) のいずれかで着地するものとする(両方は起きえない)。コインが公正であるかどうかに関して仮定はしない。

この場合、下記のように定義できよう。

Ω = { H , T } {\displaystyle \Omega =\{H,T\}}
F = { , { H } , { T } , { H , T } } {\displaystyle F=\{\varnothing ,\{H\},\{T\},\{H,T\}\}}

コルモゴロフの公理から次が分かる。

P ( ) = 0 {\displaystyle P(\varnothing )=0}

表でも裏でもない確率は0となる。

P ( { H , T } c ) = 0 {\displaystyle P(\{H,T\}^{c})=0}

表か裏かいずれかの確率は、1となる。

P ( { H } ) + P ( { T } ) = 1 {\displaystyle P(\{H\})+P(\{T\})=1}

また、上記の通り、表の確率と裏の確率の合計は1である。

参照項目

注釈

  1. ^ コルモゴロフはこのような系を「集合体」と呼んでいるが、これだけの条件では補集合について閉じていることは言えないので、現代の意味での集合体とは異なる。
  2. ^ この条件を加えることにより、 F {\displaystyle {\mathfrak {F}}} は、現代の意味での集合体になる。
  3. ^ 有限加法性は満たすが連続性を満たさない確率関数を構成することができる[6]
  4. ^ 以下は通常の確率論のテキストには大抵最初に書かれている内容であるが、参考文献の代表として、(伊藤 1953, p. 1)を挙げておく。

出典

  1. ^ Kolmogorov (1933), pp. 2–3, 14–18
  2. ^ David, Aldous. “What is the significance of the Kolmogorov axioms?”. David Aldous. 2019年11月19日閲覧。
  3. ^ Terenin Alexander; David Draper (2015). Cox's Theorem and the Jaynesian Interpretation of Probability. arXiv:1507.06597. Bibcode: 2015arXiv150706597T. https://archive.org/details/arxiv-1507.06597. 
  4. ^ Kolmogorov (1933), pp. 2–3
  5. ^ Kolmogorov (1933), p. 14
  6. ^ extension-th.pdf 若木宏文(広島大学大学院先進理工系科学研究科)
  7. ^ Kolmogorov (1933), p. 15
  8. ^ Kolmogorov (1933), p. 17
  9. ^ Alan, Hájek (2019年8月28日). “Interpretations of Probability”. Stanford Encyclopedia of Philosophy. 2019年11月17日閲覧。
  10. ^ a b Ross, Sheldon M. (2014). A first course in probability (Ninth ed.). Upper Saddle River, New Jersey. pp. 27, 28. ISBN 978-0-321-79477-2. OCLC 827003384 
  11. ^ David, Gerard (2017年12月9日). “Proofs from axioms”. 2019年11月20日閲覧。
  12. ^ Bill, Jackson (2010年). “Probability (Lecture Notes - Week 3)”. School of Mathematics, Queen Mary University of London. 2019年11月20日閲覧。

参考文献

  • Andrey Kolmogorov (1950) [1933]. Foundations of the theory of probability. New York, USA: Chelsea Publishing Company. https://archive.org/details/foundationsofthe00kolm 
  • Morris H. DeGroot (1975). Probability and Statistics. Reading: Addison-Wesley. pp. 12–16. ISBN 0-201-01503-X. https://archive.org/details/probabilitystati0000degr/page/12 
  • McCord, James R.; Moroney, Richard M. (1964). “Axiomatic Probability”. Introduction to Probability Theory. New York: Macmillan. pp. 13–28. https://archive.org/details/introductiontopr00mcco 
  • 伊藤清『確率論』岩波書店、1987年(原著1953年)。ISBN 4-00-005141-5。 
  • Mizarシステムにおける確率の正式な定義、および正式に証明されている定理の一覧。
確率の歴史
確率の定義
客観確率
  • 統計的確率
  • 古典的確率
  • 公理的確率
主観確率
確率の拡張
基礎概念
モデル
確率変数
確率分布
関数
用語
確率の解釈
問題
法則・定理
測度論
確率微分方程式
確率過程
情報量
応用
数理ファイナンス
系統学
カテゴリ カテゴリ