例えば、サイコロを振ったときに出る目を考えましょう。サイコロの目は1から6までありますから、それらの目のどれかが出るのですが、サイコロを振る前はどの目が出るかわかりません。サイコロを振ったとき、サイコロの目が1となる事象を1、サイコロの目が2となる事象を2、というように、サイコロの目に対して1から6までの整数値が対応することにしますと、サイコロを振る前はどの数値をとるかはわからない、というです。この数値を対応させた変数が、確率変数です。
したがって、確率変数は、試行を行うと値が決まる変数です。試行を行ったとき、起きた事象に対応した具体的な数値は、実現値といいます。サイコロの目が1となる事象を1、サイコロの目が2となる事象を2、としたように、1とか2とかの数値が実現値です。確率変数は大文字で、その実現値は小文字で記述されることが多いです。
1 | 2 | 3 | 4 | 5 | 6 |
$x_1$ | $x_2$ | $x_3$ | $x_4$ | $x_5$ | $x_6$ |
少し厄介なのは、離散的な値をとる場合と連続的な値をとる場合があることです。サイコロの目のように確率変数の実現値が$x_1 = 1$、$x_2 = 2$、、、といようにとびとびの値をとる場合、確率変数が離散的な値をとるといいます。一方、人の身長のように確率変数の実現値が$-150 \leq X \leq 190$というように連続的な値をとる場合、確率変数が連続的な値をとるといいます。確率変数を使うメリットとして、「サイコロの目が1となる事象」という代わりに、「$X = 1$」といえば済むということがあります。