対象試験と出題頻度
中央値(メジアン)は、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。
平均値や最頻値(モード)とセットで計算させる問題が定番で、「外れ値がある場合にどの代表値が適切か」を正しく判断できるかが問われます。
R4年度 ITパスポート 問59、H30秋期 応用情報 午前問3など、複数の試験区分で繰り返し出題されています。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★☆☆
ランクB(標準)覚えておくと有利
用語の定義
情報処理試験を勉強していると、「中央値って真ん中の数でしょ?」とざっくり理解して終わりがちです。しかしデータの個数が偶数のときの処理で間違える人が続出するので、ここで正確に押さえておく必要があります。
中央値(Median / メジアン)とは、一言で言うと
「データを小さい順(または大きい順)に並べたとき、ちょうど真ん中に位置する値」
のことです。
イメージとしては、「生徒を背の順に並ばせて、列のど真ん中に立っている人の身長」です。
背の順に並んだ7人なら4番目の人、10人なら5番目と6番目の身長を足して2で割った値が中央値になります。
📊 中央値(メジアン)の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Median(メジアン) |
| 分類 | 代表値(データの中心傾向を示す指標)の一種 |
| 求め方 | データを昇順に並べ、真ん中の値を取る (偶数個の場合は中央2つの平均) |
| 最大の特徴 | 極端な外れ値の影響を受けにくい |
解説
代表値にはいくつかの種類がありますが、中央値は平均値では見えにくい「データの実態」を把握するのに適しています。
奇数個と偶数個で求め方が変わる
中央値の計算で最も間違えやすいのが、データの個数が偶数のケースです。
📊 奇数個と偶数個の中央値の求め方
| データ個数 | 求め方 | 具体例 |
|---|---|---|
| 奇数個 | 昇順に並べた(n+1)÷ 2 番目の値 | 「3, 5, 7, 9, 11」→ 中央値は 7(3番目) |
| 偶数個 | 昇順に並べた n÷2 番目と n÷2+1 番目の平均 | 「3, 5, 7, 9」→ 中央値は(5+7)÷ 2 = 6 |
📊 中央値の求め方(奇数個の場合)
7個のデータの中央(4番目)= 10 が中央値
📊 中央値の求め方(偶数個の場合)
6個のデータの中央は3番目と4番目 →(8 + 12)÷ 2 = 10 が中央値
平均値ではなく中央値を使うべき場面
平均値はすべてのデータの合計を個数で割るため、1つでも桁外れの値が混ざると大きく引っ張られます。一方、中央値は並び順の真ん中だけを見るため、外れ値の影響をほとんど受けません。
年収の統計で「平均年収」と「年収の中央値」が大きく異なるのは、高所得者の値が平均を押し上げているためです。実態に近い数値を知りたい場合は中央値が有効です。
▶ 3つの代表値の使い分け早見表(クリックで展開)
| 代表値 | 特徴 | 向いているデータ |
|---|---|---|
| 平均値 | 全データの合計÷個数。外れ値に弱い | 偏りの少ない均等なデータ |
| 中央値 | 昇順で真ん中の値。外れ値に強い | 外れ値を含む偏りのあるデータ |
| 最頻値 | 最も多く出現する値。外れ値に強い | カテゴリデータやばらつきの大きいデータ |
では、この用語が試験でどのように出題されるか見ていきましょう。
💡 中央値(メジアン)の核心を3行で
・データを昇順に並べて真ん中に来る値であり、外れ値の影響を受けにくい
・データ個数が偶数のときは中央2つの値を足して2で割る
・平均値は「合計÷個数」、最頻値は「最も多い値」と区別する
試験ではこう出る!
中央値は、代表値の計算問題としてITパスポートを中心に出題されています。応用情報では正規分布の特徴を問う問題の選択肢に登場します。
📊 過去問での出題実績
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| IP R4年度 問59 |
9個のデータから平均値と中央値の組合せを選ぶ問題。 | ・平均値300に対し中央値は40 ・外れ値で平均と中央値が大きく乖離する例 |
| AP H30秋 午前 問3 |
正規分布の特徴として適切なものを選ぶ問題。 | ・正規分布では平均値・中央値・最頻値が一致する ・「左右対称の釣鐘型」がキーワード |
| IP H26秋 中問C 問94〜96 |
テスト結果の分析問題。平均点・標準偏差・ばらつきの関係を問う。 | ・平均点付近にデータ集中=標準偏差が小さい ・代表値とばらつきの関連 |
📝 IPA試験での出題パターン
パターン1:「平均値と中央値を計算せよ」
具体的な数値データが与えられ、平均値と中央値の正しい組合せを選ばせる形式。R4年度 IP 問59が典型例。ひっかけとして、平均値の数字を中央値の選択肢に紛れ込ませるパターンがある。
パターン2:「正規分布の性質を選べ」
H30秋 AP 問3のように、正規分布では平均値・中央値・最頻値が一致するという知識を問う形式。「左右対称」「釣鐘型」「平均±標準偏差の範囲に約68%」が正解のキーワードになる。
試験ではここまででOKです。「昇順に並べて真ん中 = 中央値」「偶数個なら中央2つの平均」の2点を即答できれば得点できます。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. データ「4, 7, 9, 12, 15, 80」の中央値として、最も適切なものはどれでしょうか?
- A. 10.5 ― データを昇順に並べたとき、中央に位置する3番目の値(9)と4番目の値(12)の平均を取った値である。
- B. 21.2 ― データの合計127を個数6で割った値である。
- C. 9 ― データを昇順に並べたとき、3番目に位置する値である。
正解と解説を見る
正解:A
解説:
データは6個(偶数)なので、昇順3番目の「9」と4番目の「12」の平均を取ります。(9+12)÷ 2 = 10.5 が中央値です。
選択肢Bは平均値の説明です。(4+7+9+12+15+80)÷ 6 ≒ 21.2 ですが、これは中央値ではなく算術平均であり、外れ値(80)に引っ張られて大きくなっています。選択肢Cは「3番目」を取っただけで、偶数個のルール(中央2つの平均)を適用していません。偶数個のときは真ん中の2つを平均する処理が必要です。
よくある質問(FAQ)
Q. 正規分布のとき、中央値と平均値と最頻値はどうなりますか?
3つとも同じ値になります。正規分布は平均値を中心に左右対称の釣鐘型を描くため、真ん中の値(中央値)も最も多く出現する値(最頻値)も平均値と一致します。H30秋期の応用情報 午前問3ではこの性質が直接問われました。
Q. 中央値は箱ひげ図のどこに対応しますか?
箱ひげ図の「箱の中央にある線」が中央値(第2四分位数)です。箱の左端が第1四分位数(下位25%の境目)、右端が第3四分位数(上位25%の境目)を表します。応用情報のシラバスでは箱ひげ図も用語例に含まれており、四分位数と中央値の関係を整理しておくと盤石です。
Q. プログラミングで中央値を求めるにはどうしますか?
配列をソートして中央のインデックスを参照するのが基本です。Pythonなら statistics.median() 関数を使えば1行で求められます。データ件数が大規模な場合はソートのコスト(O(n log n))が課題になるため、中央値を効率的に求めるアルゴリズム(中央値の中央値法など)が存在しますが、IPA試験ではそこまで問われません。