対象試験と出題頻度

正規分布(Normal Distribution)は、基本情報技術者・応用情報技術者で出題されるテーマです。

「グラフの形状を選ぶ問題」や「平均と標準偏差から特定範囲のデータ割合を求める問題」の土台となる知識であり、分散・標準偏差とセットで理解しているかが問われます。

詳細をクリックして確認
対象試験:
基本情報技術者
応用情報技術者
出題頻度:
★★★☆☆
ランクB(標準)覚えておくと有利

用語の定義

情報処理試験を勉強していると、「正規分布って何が正規なの?グラフの形だけ覚えればいいの?」と疑問を持ちがちです。

正規分布(Normal Distribution)とは、一言で言うと

 「平均値を中心に左右対称の釣鐘型カーブを描く確率分布」

のことです。

 

イメージとしては、「クラス全員のテスト結果をヒストグラムにしたとき、平均点付近に人数が集中し、極端に高い点・低い点の人は少ない、あの山なりの形」です。

 

身長、体重、製品の寸法誤差など、自然界や工業製品の多くのデータはこの分布に従います。ガウス分布とも呼ばれます。

📊 正規分布の基本情報

項目 内容
英語名 Normal Distribution
別名 ガウス分布(Gaussian Distribution)
決定するパラメータ 平均(μ)と標準偏差(σ)の2つだけ
最大の特徴 平均値=最頻値=中央値で、左右対称

解説

確率分布にはポアソン分布、二項分布、指数分布などさまざまな種類がありますが、その中でも最も基本的かつ出現頻度が高いのが正規分布です。

 

正規分布が重要視される理由は、中心極限定理にあります。どのような分布のデータであっても、大量にサンプルを取って平均を計算し続けると、その平均値の分布は正規分布に近づくという性質です。そのため、品質管理や統計分析の多くの場面で「データは正規分布に従う」という前提が使われます。

グラフの形状と2つのパラメータ

正規分布のグラフは、平均(μ)を中心に左右対称の釣鐘型になります。形を決めるのは平均と標準偏差(σ)の2つだけです。

平均が変わるとカーブ全体が左右にスライドし、標準偏差が変わると山の高さと裾の広がりが変化します。標準偏差が小さいほど山は鋭くなり、大きいほどなだらかに広がります。

📈 正規分布の概念図(平均μ、標準偏差σ)

                   
                   
                   
                   
                   
 
μ−3σ μ−2σ   μ−σ μ(平均) μ+σ   μ+2σ μ+3σ

±1σ:約68%
±2σ:約95%
±3σ:約99.7%

68-95-99ルール

正規分布では、平均と標準偏差の関係から、データが特定の範囲に収まる割合が一意に決まります。これは試験で直接問われる最重要ポイントです。

📊 68-95-99ルール

範囲 含まれるデータの割合 範囲外のデータ
平均 ± 1σ 68% 約32%(片側 約16%)
平均 ± 2σ 95% 約5%(片側 約2.3%)
平均 ± 3σ 99.7% 約0.3%(片側 約0.15%)
▶ 標準正規分布表の読み方(クリックで展開)

試験問題では「標準正規分布表」が付されることがあります。標準正規分布とは、平均0・標準偏差1に変換した正規分布のことです。

任意のデータ値 x を標準化するには、次の式で確率変数 u を求めます。

u = (x − μ) ÷ σ

たとえば平均5.2kg、標準偏差0.1kgのとき、5.0kg未満の割合を求めるなら u = |5.0−5.2| ÷ 0.1 = 2.0 となり、表から u=2.0 に対応する P(上側確率)を読み取ります。P=0.023 なら不合格品は約2.3%です。

▶ 他の確率分布との違い(クリックで展開)
確率分布 特徴 具体例
正規分布 連続値。平均を中心に左右対称の釣鐘型 身長、テストの点数分布
二項分布 離散値。成功/失敗の試行をn回繰り返したときの成功回数の分布 コインをn回投げて表が出る回数
ポアソン分布 離散値。一定期間・一定範囲内でまれな事象が起こる回数の分布 1時間あたりの電話着信数
指数分布 連続値。次の事象が起こるまでの待ち時間の分布 故障までの時間(MTBF)

正規分布は「連続値・左右対称」が最大の目印です。グラフが左に偏っている、階段状であるなどの場合は正規分布ではありません。

では、この用語が試験でどのように出題されるか見ていきましょう。

💡 正規分布の核心を3行で

・平均値を中心に左右対称の釣鐘型カーブを描く確率分布で、平均と標準偏差の2つだけで全特性が決まる
・平均±1σに約68%、±2σに約95%、±3σに約99.7%のデータが含まれる(68-95-99ルール)
・標準偏差が大きいほど山はなだらかに広がり、小さいほど鋭くなる


試験ではこう出る!

正規分布は、基礎理論(応用数学)の統計分野として繰り返し出題されています。

出題パターンは大きく2つに分かれます。

📊 過去問での出題実績

試験回 出題内容 問われたポイント
FE R1秋
午前 問5
平均60・標準偏差10の正規分布を表すグラフを4択から選ぶ問題。 ・左右対称でないグラフを除外
・山の中心=平均、裾の広がり=標準偏差で判定
AP R5春
午前 問2
FE R1秋 問5と同一構成の流用問題。 ・FEとAPで同じ問題が流用される典型例
AP H30秋
午前 問3
4教科の平均と標準偏差が与えられ、90点以上の得点者が最も多い教科を推定する問題。 ・「90点が平均から何σ離れているか」を教科ごとに計算
・σの数が小さい=90点以上の人数が多い
FE H19春
午前 問8
平均5.2kg・標準偏差0.1kgの製品で、5.0kg未満の不合格品の割合を標準正規分布表から求める問題。 ・標準化の計算 u=(x−μ)÷σ
・表の読み取りができれば得点できる

📝 IPA試験での出題パターン

パターン1:「正規分布のグラフを選べ」
平均と標準偏差の値が与えられ、対応するグラフを選ぶ形式。「左右非対称のグラフは除外」「山の中心が平均に一致する」の2点で選択肢を絞れる。ひっかけは、標準偏差が異なるグラフの取り違え。

 

パターン2:「特定範囲のデータ割合を求めよ」
平均と標準偏差が与えられ、ある値以上(以下)のデータが全体の何%かを問う形式。標準正規分布表が問題用紙に添付される。標準化の計算(u = (x−μ)÷σ)さえできれば表を読むだけで解ける。

 

試験ではここまででOKです。正規分布の確率密度関数の数式そのものが問われることはないので、深追いは不要です。


【確認テスト】理解度チェック

ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。


Q. 正規分布の特徴として、最も適切なものはどれでしょうか?

  • A. 一定期間内にまれな事象が発生する回数を表す離散型の確率分布であり、発生頻度が低い現象の分析に使われる。
  • B. 平均値を中心に左右対称の釣鐘型カーブを描く連続型の確率分布であり、平均と標準偏差の2つのパラメータで全特性が決まる。
  • C. ある事象が次に発生するまでの待ち時間を表す連続型の確率分布であり、システムの故障間隔の分析に使われる。

正解と解説を見る

正解:B

解説:
正規分布は、平均値を中心に左右対称の釣鐘型をした連続型の確率分布です。平均(μ)と標準偏差(σ)の2つのパラメータだけで分布の形が完全に決まります。

選択肢Aはポアソン分布の説明です。単位時間あたりにまれな事象が起こる回数を扱う離散型の分布であり、連続値を扱う正規分布とは性質が異なります。選択肢Cは指数分布の説明です。次の事象が発生するまでの時間間隔を扱う連続型の分布で、グラフは右肩下がりの形になり、左右対称にはなりません。


よくある質問(FAQ)

Q. 「正規分布」と「標準正規分布」は何が違いますか?

標準正規分布は、平均が0・標準偏差が1になるよう変換(標準化)した正規分布です。任意の正規分布を u=(x−μ)÷σ の式で標準化すれば標準正規分布に変換でき、付録の標準正規分布表が使えるようになります。試験で表を使う問題が出た場合は、まずこの標準化の計算を行うのが定石です。

Q. 品質管理で「3σ」や「6σ(シックスシグマ)」という言葉を聞きますが、正規分布と関係がありますか?

直接関係しています。「3σ」は正規分布で平均±3σの範囲内に約99.7%のデータが収まることを利用し、この範囲を逸脱した製品を不良品と判定する品質管理の基準です。「シックスシグマ」はさらに厳格で、平均±6σの範囲を管理基準とすることで不良率を100万個あたり3.4個以下に抑える手法です。IPA試験で直接問われる範囲ではありませんが、知っておくと応用情報の午後問題で背景知識として役立ちます。

Q. 実際のデータが正規分布に従わないこともありますか?

あります。たとえば年収の分布は右に裾が長い(少数の高額所得者が分布を引っ張る)ため、正規分布にはなりません。Webサイトのアクセス数やSNSのフォロワー数なども同様です。正規分布を前提にした統計手法を適用する際は、データが本当に正規分布に近い形をしているか確認する必要があります。ただし、試験問題では「データは正規分布に従う」と明記されるので、この点を疑う必要はありません。