(昨日の続き)
今日は非可算集合 (数え上げることができない無限集合。自然数全体からの単射は存在するが、全射は存在しない) について。
非可算集合は可算集合の場合と事情が異なる。解釈によっては無作為に1つ要素を選ぶことが可能なのである。
0以上1以下の実数から無作為に1つ選んだときにそれの小数第1位が偶数である確率は?
— a (@a151595) 2022年8月13日
問2.1「0以上1以下の実数から無作為に1つ選んだときにそれの小数第1位が偶数である確率は?」
0以上1以下の一様分布から実数を1つサンプリングすることが可能なのはみんな認めてくれるだろう。このサンプリングを「0以上1以下の実数から無作為に1つ要素を選んだ」と表してもそんなには怒られなそうである。
このとき、選んだ実数の小数第1位が偶数である確率は普通に \(1/2\) である。まあ別にこれを答えとしても悪くはない。
なんかずっと歯切れの悪い言い方をしているが、それは他にも無作為な抽出と呼べるような方法が無数に存在するからである。
例えば、0以上0.5以下が1.5でそれ以外が0.5の確率密度関数\(f\)を考えよう。
「無作為に1つ選ぶ」というのが、各要素が同じ確率で選ばれることであるのはとりあえず認めてもらおう。そういえば要素という言葉をテキトーに使ってきたけど、標本空間の元のことです。思い出したように言葉の定義をしたけど、本当はこういう言葉の定義を一番最初にやらなくてはいけない。まあ数学的に厳密な議論をするつもりはないので許してくれという甘えはある (一応書いておくと、厳密な議論はしないけど間違ったことを書くつもりもないのでやはり許してほしい。あまりに愚劣で無責任な癌細胞の私を許してくれ)。
確率密度関数\(f\)に基づいて1つ実数を選んだとき、選ばれた実数が \([0.3-\varepsilon,0.3+\varepsilon], [0.6-\varepsilon,0.6+\varepsilon]\) の範囲に含まれる確率はそれぞれ \(3\varepsilon,\varepsilon\) なので選ばれる実数に偏りが存在するように感じられるが、選ばれた実数がちょうど \(0.3,0.6\) である確率はどちらも \(0\) である。無作為に1つ選ぶときに同じ確率であるべきものは前者のそれぞれの範囲ではなく後者のそれぞれの実数であり、任意の実数についても同じくちょうどその実数が選ばれる確率は\(0\)であるから、この\(f\)に従って選ぶときそれは無作為に1つ選ぶと言える。
一般的な確率密度関数のほとんども同じく任意の実数が選ばれる確率は\(0\)なので、むしろ無作為に選べないことのほうが少ない。すわなち無作為に1つ0以上1以下の実数を選んだときに小数点第1位が偶数である確率を好きな数に設定できる。
まあ有限の標本集合において定義される「無作為に1つ選ぶ」を実数直線に拡張するとしたら、(定義域内の) 任意の実数において確率密度が等しいような分布から選ぶ、すなわち「一様分布から選ぶ」とするのが一番自然な気がするので、普通に考えたら \(1/2\) を答えとしていいと思う。
ただし気をつけなくてはいけないことがあって、今まで何も考えずに「実数から無作為に1つ選ぶ」を「実数直線から無作為に1つ選ぶ」と解釈してきたけど、必ずしもそうする必要はない。実数の集合を単なる非可算無限集合と見て、実数を実数直線上の位置とは完全に独立に選ぶやり方も考えられる。このとき確率密度は必ずしも定義できないので、各要素を選ぶ確率の話に帰着せざるをえない。
また、実数直線上から選ぶとした場合においても、確率密度関数を決める前に密度を測る基準となる実数直線上の「長さ」を決める必要があるが、その決め方は1つではない。たとえ確率密度関数が一様分布であったとしても、この「長さ」が異なれば求める確率は違う値をとる。例えば区間 \([0,0.1]\) の長さが \(0.99\) で区間 \([0.1,1]\) の長さが \(0.01\) となるような「長さ」を基準とした一様分布を考えることができて、このとき求める確率は \(1/2\) ではない。まあここまで来ると言いがかりっぽいけど、でもしかし「無作為に1つ選ぶ」が定義されていない以上、こういうことが言えてしまう。
さて、それでは改めて、0以上1以下の実数から無作為に1つ選んだときにそれの小数第1位が偶数である確率はいくつだろうか?
答えは、普通に考えたら「1/2」だが厳密には「1/2とは限らない」である。問題の不備により全員正解です。
今日の例のように非可算集合の場合は各要素が同様に確率\(0\)で選ばれるような確率を定義できるが、昨日のような可算集合の場合は各要素が同様に確率\(0\)で選ばれるような確率はどうあがいても定義することができない。昨日の問題は確率が定義できないことに起因するが、今日の問題は確率が定義可能だがその方法が無数にあることに起因するのである。同じ無限集合についての確率の話だが、問題の構造は異なる。非可算集合が実数の集合の場合は実数直線と確率密度関数というある程度直感的に扱えるものを導入することで問題を解決することができる (ように見える) が、明日はそうではない非可算集合の場合を見ていく。
以上、本日は非可算集合の例について、あまりに愚劣で無責任な癌細胞がお送りしました。
(続く)