試行の結果として取りうる値が確率を伴って定まる変数を「確率変数」という。 例えばコインを投げて表が出る回数 \(X\) など。 ([turn0search6])
確率変数 \(X\) が値 \(x_1, x_2, \dots, x_n\) をとるとき、それぞれの確率を \(p_1, p_2, \dots, p_n\) とすると \[ p_i \ge 0,\quad \sum_{i=1}^{n} p_i = 1 \] を満たし、\(\{x_i, p_i\}\) で表されるものを確率分布という。 ([turn0search6])
確率変数 \(X\) が値 \(x_i\) を確率 \(p_i\) でとるとき、 \[ E(X) = \sum_{i=1}^{n} x_i p_i \]
期待値を \(m = E(X)\) とすると \[ V(X) = E( (X - m)^2 ) = \sum_{i=1}^{n} (x_i - m)^2 \, p_i \]
\[ \sigma(X) = \sqrt{V(X)} \]
\[ V(X) = E(X^2) - [E(X)]^2 \] という公式もよく使われる。
成功確率 \(p\) の試行を独立に \(n\) 回行ったとき、成功回数を確率変数 \(X\) とすると \[ P(X = k) = \binom{n}{k} p^k (1-p)^{\,n-k}, \quad k = 0,1,2,\dots,n \] を満たす分布を二項分布という。 ([turn0search6])
\[ E(X) = np, \quad V(X) = np(1-p) \]
連続確率変数 \(X\) が平均 \(m\)、標準偏差 \(\sigma\) をもつとき、 確率密度関数 \[ f(x) = \frac{1}{\sqrt{2\pi}\,\sigma} \exp\!\left( -\frac{(x-m)^2}{2\sigma^2} \right) \] を持つ分布を正規分布という。 ([turn0search6])
\[ Z = \frac{X - m}{\sigma} \] によって、平均 0・分散 1 の標準正規分布に変換できる。
図で理解することが多い:例えば「A 点以上である確率」「区間 \([a,b]\) にある確率」など。
母集団:興味あるすべてのデータ集合。 標本:母集団から抽出された部分集合。
標本平均の分布や、標本分散の分布などについての概念。 高校Cでは簡単な導入のみ。
新課程・大学入試でも「統計的な推測」として扱われる可能性があるため,高校Cでも押さえておくと良い。 ([turn0search9])