対象試験と出題頻度
分散(Variance)は、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。
標準偏差や偏差値の計算、正規分布のグラフ選択といった問題の土台となる知識であり、「分散の求め方」と「標準偏差との関係」を正しく理解しているかが問われます。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★★☆
ランクA(重要)必ず覚えておくべき
用語の定義
情報処理試験を勉強していると、「分散って結局何の数値?標準偏差と何が違うの?」と混乱しがちです。
分散(Variance)とは、一言で言うと
「各データが平均値からどれだけ離れているかを2乗して平均した値」
のことです。
イメージとしては、「クラス全員のテストの点数が平均点からどれくらいバラバラかを、1つの数字で表したもの」です。
分散が大きいほどデータのばらつきが大きく、分散が0ならば全員が同じ値です。
📊 分散の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Variance |
| 記号 | σ²(シグマの2乗)、V、s² |
| 関連指標 | 標準偏差(σ)= 分散の正の平方根 |
| 最大の特徴 | 偏差を2乗するため、元データと単位が異なる |
解説
データのばらつきを測りたいとき、最も素朴な発想は「各データと平均値の差(偏差)を合計する」ことです。しかし、偏差をそのまま足すとプラスとマイナスが打ち消し合い、合計は必ず0になります。
この問題を解消するために、偏差を2乗してからすべて足し合わせ、データの個数で割る。これが分散の計算です。
計算手順
具体例で確認します。データが「2, 4, 6, 8, 10」の5個のとき、分散は以下の手順で求めます。
📊 分散の計算手順(データ:2, 4, 6, 8, 10)
| 手順 | 内容 | 計算 |
|---|---|---|
| ① | 平均値を求める | (2+4+6+8+10) ÷ 5 = 6 |
| ② | 各データと平均の差(偏差)を求める | -4, -2, 0, +2, +4 |
| ③ | 偏差を2乗する | 16, 4, 0, 4, 16 |
| ④ | 2乗した値の合計をデータ数で割る | (16+4+0+4+16) ÷ 5 = 8 |
分散 = 8 / 標準偏差 = √8 ≒ 2.83
▶ 分散の数式(クリックで展開)
n個のデータ x₁, x₂, …, xₙ の平均を μ とすると、分散 σ² は次の式で表されます。
試験では母分散(÷ n)が問われます。統計学で使われる不偏分散(÷ (n−1))との違いはIPA試験の範囲外なので、深追いは不要です。
標準偏差との関係
分散は偏差を2乗しているため、元データと単位が合いません。テストの点数(点)に対して分散の単位は「点²」になってしまいます。
そこで分散の正の平方根を取ることで、元データと同じ単位に戻した指標が標準偏差(σ)です。「標準偏差 = √分散」という関係を押さえておけば、両者を混同することはありません。
▶ 定数を加算・乗算したときの分散の変化(クリックで展開)
ここだけは確実に押さえてください。試験で繰り返し問われるポイントです。
| 操作 | 分散 | 標準偏差 | 理由 |
|---|---|---|---|
| 全データに定数 a を加算 | 変わらない | 変わらない | データ全体が平行移動するだけで、ばらつきは不変 |
| 全データを定数 a 倍 | a² 倍 | |a| 倍 | データ間の差も a 倍に広がるため |
では、この用語が試験でどのように出題されるか見ていきましょう。
💡 分散の核心を3行で
・各データと平均値の差(偏差)を2乗し、その平均を取った値がデータの散らばり度合いを示す
・標準偏差は分散の正の平方根であり、元データと同じ単位に戻したもの
・全データに定数を加えてもばらつきは不変、定数倍するとばらつきも拡大する
試験ではこう出る!
分散・標準偏差は、基礎理論(応用数学)の統計分野として各試験区分で繰り返し出題されています。
出題パターンは大きく3つに分かれます。
📊 過去問での出題実績
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| FE R5年 科目A免除 問3 |
標準偏差の性質として適切なものを選ぶ問題。 | ・定数加算でばらつきは不変 ・全データ2倍で標準偏差も2倍 |
| FE R1秋 午前 問5 |
平均60・標準偏差10の正規分布グラフを選ぶ問題。 | ・分布の中心=平均値 ・ばらつきの大小=標準偏差の値で山の広がりが決まる |
| AP R5春 午前 問2 |
FE R1秋 問5と同一構成の流用問題。 | ・FE・AP間で同じ問題が流用される典型例 |
| IP R5 問77 |
平均点と標準偏差から偏差値が最も高い教科を選ぶ問題。 | ・偏差値の計算式に標準偏差が含まれる ・ばらつきが小さいほど同じ得点差で偏差値は大きく動く |
📝 IPA試験での出題パターン
パターン1:「標準偏差の性質を選べ」
定数の加算・乗算による標準偏差の変化を問う形式。「加算で不変」「a倍で|a|倍」の2点を知っていれば即答できる。
パターン2:「正規分布のグラフを選べ」
平均と標準偏差の値が与えられ、対応するグラフを選ぶ形式。山の中心が平均、裾の広がりが標準偏差に対応する。
パターン3:「偏差値を求めよ/比較せよ」
偏差値 = (得点−平均)÷標準偏差×10+50 の計算式を使う問題。分散・標準偏差の意味を理解していないと解けない。
試験ではここまででOKです。不偏分散やカイ二乗分布といった応用的な概念は問われないので、深追いは不要です。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. 分散に関する説明として、最も適切なものはどれでしょうか?
- A. データの中で最も頻繁に出現する値であり、データの代表値として使われる。
- B. データを小さい順に並べたとき、ちょうど中央に位置する値であり、外れ値の影響を受けにくい。
- C. 各データと平均値の差を2乗して平均した値であり、データの散らばり度合いを示す指標である。
正解と解説を見る
正解:C
解説:
分散は、各データと平均値との差(偏差)を2乗し、その合計をデータ数で割った値です。データがどれだけばらついているかを1つの数値で表す統計指標になります。
選択肢Aは最頻値(モード)の説明です。最も出現回数が多い値を指し、ばらつきの指標ではありません。選択肢Bは中央値(メジアン)の説明です。データを順に並べたときの中央の値であり、こちらもデータの代表値であってばらつきを示すものではありません。
よくある質問(FAQ)
Q. 分散ではなく標準偏差を使うのはどういう場面ですか?
元データと同じ単位で「平均からどれくらい離れているか」を直感的に把握したいときは標準偏差を使います。たとえば、テストの平均点が60点で標準偏差が10点なら「大半の人は50点〜70点あたりに収まる」と読み取れます。分散(100点²)ではこの感覚がつかめないため、実務や試験問題のグラフ読解では標準偏差が多用されます。
Q. 正規分布の「68-95-99ルール」とは何ですか?
正規分布に従うデータでは、平均±1σの範囲に約68%、平均±2σの範囲に約95%、平均±3σの範囲に約99.7%のデータが含まれます。これを「68-95-99ルール」と呼びます。FE R1秋 午前 問5のようにグラフの裾の広がりを読み取る問題で、この知識が直接役立ちます。
Q. 偏差値の計算式で分散はどう関わりますか?
偏差値は「(得点−平均点) ÷ 標準偏差 × 10 + 50」で求めます。標準偏差は分散の平方根なので、分散を求めてから平方根を取り、偏差値の式に代入する流れです。IP R5 問77のように教科ごとの偏差値を比較する問題では、標準偏差が小さい教科ほど同じ点差でも偏差値が大きく動くという点がポイントになります。
Q. 実務ではどのような場面で分散が使われますか?
品質管理の工程能力分析、金融商品のリスク評価(ポートフォリオ理論)、機械学習モデルの予測精度評価など、データのばらつきを定量的に扱うあらゆる場面で使われています。たとえばWebサービスのレスポンスタイムの分散が大きければ「応答速度が不安定」と判断でき、パフォーマンス改善の根拠になります。