対象試験と出題頻度

中央値(メジアン)は、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。

平均値や最頻値(モード)とセットで計算させる問題が定番で、「外れ値がある場合にどの代表値が適切か」を正しく判断できるかが問われます。

 

R4年度 ITパスポート 問59、H30秋期 応用情報 午前問3など、複数の試験区分で繰り返し出題されています。

詳細をクリックして確認
対象試験:
ITパスポート
基本情報技術者
応用情報技術者
出題頻度:
★★★☆☆
ランクB(標準)覚えておくと有利

用語の定義

情報処理試験を勉強していると、「中央値って真ん中の数でしょ?」とざっくり理解して終わりがちです。しかしデータの個数が偶数のときの処理で間違える人が続出するので、ここで正確に押さえておく必要があります。

中央値(Median / メジアン)とは、一言で言うと

 「データを小さい順(または大きい順)に並べたとき、ちょうど真ん中に位置する値」

のことです。

イメージとしては、「生徒を背の順に並ばせて、列のど真ん中に立っている人の身長」です。

背の順に並んだ7人なら4番目の人、10人なら5番目と6番目の身長を足して2で割った値が中央値になります。

📊 中央値(メジアン)の基本情報

項目 内容
英語名 Median(メジアン)
分類 代表値(データの中心傾向を示す指標)の一種
求め方 データを昇順に並べ、真ん中の値を取る
(偶数個の場合は中央2つの平均)
最大の特徴 極端な外れ値の影響を受けにくい

解説

代表値にはいくつかの種類がありますが、中央値は平均値では見えにくい「データの実態」を把握するのに適しています。

 

奇数個と偶数個で求め方が変わる

中央値の計算で最も間違えやすいのが、データの個数が偶数のケースです。

📊 奇数個と偶数個の中央値の求め方

データ個数 求め方 具体例
奇数個 昇順に並べた(n+1)÷ 2 番目の値 「3, 5, 7, 9, 11」→ 中央値は 7(3番目)
偶数個 昇順に並べた n÷2 番目と n÷2+1 番目の平均 「3, 5, 7, 9」→ 中央値は(5+7)÷ 2 = 6

📊 中央値の求め方(奇数個の場合)

3
5
8
10
12
15
42

7個のデータの中央(4番目)= 10 が中央値

📊 中央値の求め方(偶数個の場合)

3
5
8
12
15
42

6個のデータの中央は3番目と4番目 →(8 + 12)÷ 2 = 10 が中央値

平均値ではなく中央値を使うべき場面

平均値はすべてのデータの合計を個数で割るため、1つでも桁外れの値が混ざると大きく引っ張られます。一方、中央値は並び順の真ん中だけを見るため、外れ値の影響をほとんど受けません。

年収の統計で「平均年収」と「年収の中央値」が大きく異なるのは、高所得者の値が平均を押し上げているためです。実態に近い数値を知りたい場合は中央値が有効です。

▶ 3つの代表値の使い分け早見表(クリックで展開)
代表値 特徴 向いているデータ
平均値 全データの合計÷個数。外れ値に弱い 偏りの少ない均等なデータ
中央値 昇順で真ん中の値。外れ値に強い 外れ値を含む偏りのあるデータ
最頻値 最も多く出現する値。外れ値に強い カテゴリデータやばらつきの大きいデータ

では、この用語が試験でどのように出題されるか見ていきましょう。

💡 中央値(メジアン)の核心を3行で

・データを昇順に並べて真ん中に来る値であり、外れ値の影響を受けにくい
・データ個数が偶数のときは中央2つの値を足して2で割る
・平均値は「合計÷個数」、最頻値は「最も多い値」と区別する


試験ではこう出る!

中央値は、代表値の計算問題としてITパスポートを中心に出題されています。応用情報では正規分布の特徴を問う問題の選択肢に登場します。

📊 過去問での出題実績

試験回 出題内容 問われたポイント
IP R4年度
問59
9個のデータから平均値と中央値の組合せを選ぶ問題。 ・平均値300に対し中央値は40
・外れ値で平均と中央値が大きく乖離する例
AP H30秋
午前 問3
正規分布の特徴として適切なものを選ぶ問題。 ・正規分布では平均値・中央値・最頻値が一致する
・「左右対称の釣鐘型」がキーワード
IP H26秋
中問C
問94〜96
テスト結果の分析問題。平均点・標準偏差・ばらつきの関係を問う。 ・平均点付近にデータ集中=標準偏差が小さい
・代表値とばらつきの関連

📝 IPA試験での出題パターン

パターン1:「平均値と中央値を計算せよ」
具体的な数値データが与えられ、平均値と中央値の正しい組合せを選ばせる形式。R4年度 IP 問59が典型例。ひっかけとして、平均値の数字を中央値の選択肢に紛れ込ませるパターンがある。

 

パターン2:「正規分布の性質を選べ」
H30秋 AP 問3のように、正規分布では平均値・中央値・最頻値が一致するという知識を問う形式。「左右対称」「釣鐘型」「平均±標準偏差の範囲に約68%」が正解のキーワードになる。

 

試験ではここまででOKです。「昇順に並べて真ん中 = 中央値」「偶数個なら中央2つの平均」の2点を即答できれば得点できます。


【確認テスト】理解度チェック

ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。


Q. データ「4, 7, 9, 12, 15, 80」の中央値として、最も適切なものはどれでしょうか?

  • A. 10.5 ― データを昇順に並べたとき、中央に位置する3番目の値(9)と4番目の値(12)の平均を取った値である。
  • B. 21.2 ― データの合計127を個数6で割った値である。
  • C. 9 ― データを昇順に並べたとき、3番目に位置する値である。

正解と解説を見る

正解:A

解説:
データは6個(偶数)なので、昇順3番目の「9」と4番目の「12」の平均を取ります。(9+12)÷ 2 = 10.5 が中央値です。

選択肢Bは平均値の説明です。(4+7+9+12+15+80)÷ 6 ≒ 21.2 ですが、これは中央値ではなく算術平均であり、外れ値(80)に引っ張られて大きくなっています。選択肢Cは「3番目」を取っただけで、偶数個のルール(中央2つの平均)を適用していません。偶数個のときは真ん中の2つを平均する処理が必要です。


よくある質問(FAQ)

Q. 正規分布のとき、中央値と平均値と最頻値はどうなりますか?

3つとも同じ値になります。正規分布は平均値を中心に左右対称の釣鐘型を描くため、真ん中の値(中央値)も最も多く出現する値(最頻値)も平均値と一致します。H30秋期の応用情報 午前問3ではこの性質が直接問われました。

Q. 中央値は箱ひげ図のどこに対応しますか?

箱ひげ図の「箱の中央にある線」が中央値(第2四分位数)です。箱の左端が第1四分位数(下位25%の境目)、右端が第3四分位数(上位25%の境目)を表します。応用情報のシラバスでは箱ひげ図も用語例に含まれており、四分位数と中央値の関係を整理しておくと盤石です。

Q. プログラミングで中央値を求めるにはどうしますか?

配列をソートして中央のインデックスを参照するのが基本です。Pythonなら statistics.median() 関数を使えば1行で求められます。データ件数が大規模な場合はソートのコスト(O(n log n))が課題になるため、中央値を効率的に求めるアルゴリズム(中央値の中央値法など)が存在しますが、IPA試験ではそこまで問われません。