対象試験と出題頻度
平均値(代表値)は、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。
データの代表値を計算させる問題が定番で、「中央値(メジアン)」「最頻値(モード)」との違いを正確に区別できるかが問われます。
R4年度 ITパスポート 問59、H26秋期 ITパスポート 中問Cなど、複数の試験回で繰り返し出題されています。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★☆☆
ランクB(標準)覚えておくと有利
用語の定義
情報処理試験を勉強していると、「平均値って小学校で習ったやつでしょ?」と軽く考えがちです。しかし試験では中央値や最頻値と混同させるひっかけが定番なので、改めて正確に整理しておく必要があります。
平均値(Mean / Average)とは、一言で言うと
「データの値をすべて合計し、データの個数で割った値」
のことです。
イメージとしては、「全員の荷物をいったん1か所に集めて、人数分に均等に配り直したときの一人あたりの量」です。
5人の所持金が 100円・200円・300円・400円・1000円なら、合計2000円を5人で割った400円が平均値になります。
📊 平均値の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Mean / Average(算術平均の場合は Arithmetic Mean) |
| 分類 | 代表値(データの中心的な傾向を示す指標)の一種 |
| 計算式 | 平均値 = データの合計 ÷ データの個数 |
| 注意点 | 極端に大きい値(外れ値)に引っ張られやすい |
解説
代表値とは、データの分布全体を1つの数値で要約するための指標です。平均値はその中で最もよく使われますが、万能ではありません。データの特徴に応じて中央値や最頻値を使い分ける場面があります。
平均値が「ズレる」場面
平均値は外れ値に弱いという性質があります。
たとえば、社員5人の年収が 300万・350万・400万・450万・5000万円だった場合、平均年収は1300万円です。実態とかけ離れた数値になるのは、1人だけ飛び抜けた値に全体が引きずられるためです。
こうした偏りのあるデータでは、中央値(メジアン)を使うほうが実態に近い数値を得られます。
3つの代表値の違い
平均値を正しく使うには、他の代表値との違いを押さえる必要があります。
📊 3つの代表値の比較
| 代表値 | 求め方 | 外れ値の影響 | 使いどころ |
|---|---|---|---|
| 平均値 (Mean) |
合計 ÷ 個数 | 受けやすい | データが均等に分布している場合 |
| 中央値 (Median) |
昇順に並べて真ん中の値 (偶数個なら中央2つの平均) |
受けにくい | 外れ値が含まれるデータ |
| 最頻値 (Mode) |
最も多く出現する値 | 受けにくい | カテゴリデータや大きくばらつくデータ |
計算例で確認
データ:10, 20, 20, 20, 40, 50, 100, 440, 2000(9個)
平均値:(10+20+20+20+40+50+100+440+2000)÷ 9 = 2700 ÷ 9 = 300
中央値:データを昇順に並べたときの5番目 = 40
最頻値:最も多く出現する値 = 20(3回出現)
平均値が300なのに中央値は40です。2000という外れ値が平均を大きく引き上げていることが分かります。
📊 外れ値が平均値を引き上げるイメージ
10
20
20
20
40
50
100
440
2000
平均値 300(外れ値に引っ張られる)
中央値 40(データの実態に近い)
では、この用語が試験でどのように出題されるか見ていきましょう。
💡 平均値の核心を3行で
・データの合計を個数で割った値であり、全データの影響を受ける
・外れ値に引っ張られやすいため、偏ったデータには中央値を使うほうが適切
・中央値は「並べて真ん中」、最頻値は「最も多い値」と整理する
試験ではこう出る!
平均値は、代表値の計算問題としてITパスポートを中心に出題されています。
出題パターンは大きく2つに分かれます。
📊 過去問での出題実績
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| IP R4年度 問59 |
9個のデータから平均値と中央値の組合せを選ぶ問題。 | ・合計÷個数で平均値を正しく算出できるか ・中央値との違いを理解しているか |
| IP H26秋 中問C 問94〜96 |
テストの採点結果から、平均点・標準偏差の組合せを選ぶ問題群。 | ・平均点付近にデータが集中=標準偏差が小さい ・ばらつきの概念との関連 |
| IP R5年度 問77 |
4教科の平均点と標準偏差から偏差値が最も高い教科を選ぶ問題。 | ・平均値と標準偏差を用いた偏差値の計算 ・「(得点−平均点)÷ 標準偏差」の大きさで比較 |
📝 IPA試験での出題パターン
パターン1:「平均値と中央値を求めよ」
具体的な数値データが与えられ、平均値・中央値・最頻値のいずれかを計算させる形式。ひっかけとして、中央値の求め方を平均値と取り違えさせる選択肢が用意される。R4年度 問59がこの典型。
パターン2:「平均値+標準偏差の応用問題」
R5年度 問77のように、平均値と標準偏差を組み合わせて偏差値を求めさせる応用問題。計算自体は四則演算で済むが、「偏差値 =(得点 − 平均点)÷ 標準偏差 × 10 + 50」の公式を知らないと解けない。
試験ではここまででOKです。「合計 ÷ 個数 = 平均値」「昇順に並べて真ん中 = 中央値」「最も多い値 = 最頻値」の3つの定義を即答できれば得点できます。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. データ「5, 8, 8, 10, 12, 15, 42」の代表値に関する説明として、最も適切なものはどれでしょうか?
- A. 平均値は約14.3であり、これはデータの合計100を個数7で割った値である。外れ値(42)の影響で中央値(10)より大きくなっている。
- B. 中央値は約14.3であり、データを昇順に並べたときに中央に位置する値のことである。
- C. 最頻値は10であり、データの中で最も多く出現する値のことである。
正解と解説を見る
正解:A
解説:
データ「5+8+8+10+12+15+42 = 100」を個数7で割ると約14.3です。中央値は4番目の値「10」、最頻値は2回出現する「8」です。外れ値の42が平均値を押し上げている典型的なケースです。
選択肢Bは誤りです。14.3は平均値であって中央値ではありません。中央値は昇順4番目の「10」です。選択肢Cは誤りです。最頻値は最も多く出現する値であり、このデータでは2回登場する「8」が最頻値です。10は1回しか出現していません。
よくある質問(FAQ)
Q. データの個数が偶数のとき、中央値はどう求めますか?
データを昇順に並べたとき、真ん中の2つの値の平均を取ります。たとえば「3, 5, 7, 9」なら中央の2つは5と7なので、中央値は(5+7)÷ 2 = 6 です。平均値の計算と混同しやすいですが、対象となるのは中央の2つだけです。
Q. 実務ではどの代表値が使われることが多いですか?
ケースによって使い分けます。テストの成績や製品の品質管理など、データが正規分布に近い場合は平均値が適切です。一方、年収やWebサイトのアクセス数のように一部の外れ値が大きく偏る場合は中央値が使われます。政府の「世帯所得の中央値」が報道でよく見られるのは、高所得世帯の外れ値で平均が実態から乖離するためです。
Q. 「加重平均」と普通の平均値は何が違いますか?
通常の平均値(算術平均)はすべてのデータを等しい重みで合計しますが、加重平均はデータごとに重み(ウェイト)を付けて計算します。たとえば、科目A(配点60点)と科目B(配点40点)の得点を合計する場合、単純に足して2で割るのではなく、それぞれの配点比率を反映させたものが加重平均です。IPA試験では稼働率の計算などで加重平均の考え方が使われることがあります。