対象試験と出題頻度
最頻値(モード)は、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。
平均値・中央値(メジアン)との違いを正確に区別し、与えられたデータから正しく代表値を求められるかがポイントになります。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★☆☆
ランクB(標準)覚えておくと有利
用語の定義
情報処理試験を勉強していると、「平均値と中央値は分かるけど、最頻値って何?」と引っかかることがあります。
最頻値(モード/Mode)とは、一言で言うと
「データの中で最も多く出現する値」
のことです。
イメージとしては、「クラスで一番人気のお弁当メニュー」です。
30人のクラスで昼食のアンケートを取ったとき、「唐揚げ弁当」が12人で最多だったなら、唐揚げ弁当が最頻値に当たります。
合計金額を割り算する平均値とも、真ん中の人を探す中央値とも、やっていることがまったく違います。
📊 最頻値(モード)の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Mode(モード) |
| 分類 | 代表値(平均値・中央値と並ぶ3本柱の1つ) |
| 求め方 | データの中で出現回数が最も多い値を探すだけ(計算不要) |
| 特徴 | 外れ値(極端に大きい・小さい値)の影響を受けない |
解説
統計でデータ全体の傾向をつかむとき、「代表値」と呼ばれる指標を使います。
代表値には平均値・中央値(メジアン)・最頻値(モード)の3種類があり、それぞれ着眼点が異なります。
3つの代表値の違い
次のデータで比較すると、違いが一目で分かります。
【データ】10, 20, 20, 20, 40, 50, 100, 440, 2000
| 代表値 | 求め方 | 結果 | 外れ値の影響 |
|---|---|---|---|
| 平均値 | 合計 ÷ 個数 = 2700 ÷ 9 | 300 | 受けやすい |
| 中央値 | 小さい順に並べて真ん中(5番目) | 40 | 受けにくい |
| 最頻値 | 最も多く出現する値(20が3回) | 20 | 受けない |
2000のような極端な値が1つ入るだけで平均値は300まで引き上げられますが、最頻値は20のまま変わりません。これが「外れ値に強い」という最頻値の性質です。
▶ 最頻値をヒストグラムで視覚的に理解する(クリックで展開)
ヒストグラム(度数分布グラフ)で見ると、最頻値は「一番高い棒」に対応します。
データ: 10, 20, 20, 20, 40, 50, 100, 440, 2000
10
20
40
50
100
440
2000
※ オレンジ色の棒が最も高い=出現回数が最多 → 最頻値は20
平均値や中央値と違い、最頻値は計算が不要です。「どの値が一番多いか」を数えるだけで求められます。
最頻値が複数になるケース
データの中で同じ出現回数の値が複数あれば、最頻値も複数になります。たとえばデータが {10, 10, 20, 20, 30} なら、10と20がそれぞれ2回ずつ出現しているため、最頻値は10と20の2つです。
また、すべての値が1回ずつしか出現しない場合は「最頻値なし」と判断します。
では、この用語が試験でどのように出題されるか見ていきましょう。
💡 最頻値(モード)の核心を3行で
・データの中で出現回数が最も多い値のこと
・平均値は「合計÷個数」、中央値は「真ん中の値」、最頻値は「一番多い値」と整理する
・極端な値の影響を受けないため、偏りのあるデータの傾向把握に適している
試験ではこう出る!
最頻値(モード)は、代表値の計算・識別問題として各試験区分で出題されています。
最頻値そのものを単独で問う出題は少なく、平均値や中央値とセットで「正しく求められるか」を試す形式が中心です。
📊 過去問での出題実績(クリックして表示)
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| IP R4 問59 |
9個のデータから平均値と中央値の正しい組合せを選ぶ問題。選択肢に最頻値の値(20)を紛れ込ませるひっかけ構成。 | ・平均値300と中央値40を正しく算出できるか ・最頻値20を平均値と混同させる選択肢 |
| AP R6秋 午前 問76 |
ベイズ統計の説明を選ぶ問題。選択肢ウに「平均値・中央値・最頻値を求める」記述統計の説明がひっかけとして登場。 | ・記述統計とベイズ統計の区別 ・代表値(平均値・中央値・最頻値)は記述統計の範囲 |
📝 IPA試験での出題パターン
パターン1:「データから代表値を求めよ」
具体的な数値データが提示され、平均値・中央値の正しい組合せを選ぶ形式。最頻値の値を平均値と入れ替えた選択肢がひっかけになる。「合計÷個数=平均値」「並べて真ん中=中央値」「最多出現=最頻値」と機械的に区別できれば即答できる。
パターン2:「統計手法の説明を選べ」
AP R6秋期のように、記述統計の説明文が選択肢に含まれ、他の統計理論との区別を問う形式。「代表値を求める=記述統計」と分かれば消去法で正解にたどり着ける。
試験ではここまででOKです。IPAのシラバス(FE Ver.9.2・AP Ver.7.1)では「応用数学 > 統計」の用語例に最頻値(モード)が明記されていますが、高度な計算は問われないので深追いは不要です。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. 次のデータの最頻値(モード)として、最も適切なものはどれでしょうか?
【データ】5, 10, 10, 20, 20, 20, 30, 50, 100
- A. 20(出現回数が3回で最多であり、データの中で最も多く現れている値)
- B. 29.4(データの合計265を個数9で割った値)
- C. 20(データを小さい順に並べたとき、真ん中の5番目に位置する値)
正解と解説を見る
正解:A
解説:
最頻値(モード)は、データの中で出現回数が最も多い値です。このデータでは20が3回出現しており最多のため、最頻値は20になります。
選択肢Bは平均値の説明です。合計÷個数で求めるのは平均値であり、最頻値の求め方ではありません。選択肢Cは中央値(メジアン)の説明です。値こそたまたま20で同じですが、「真ん中の位置」を探す手法は中央値であり、最頻値とは考え方が異なります。
よくある質問(FAQ)
Q. 最頻値と中央値が同じ数値になることはありますか?
あります。上の確認テストのデータ {5, 10, 10, 20, 20, 20, 30, 50, 100} がまさにその例で、最頻値も中央値も20です。ただし求め方が異なるため「同じ値になったから同じ意味」ではありません。最頻値は出現回数、中央値は並び順の真ん中という別々の観点で算出されています。
Q. 正規分布のとき、3つの代表値はどういう関係になりますか?
左右対称な正規分布(釣鐘型の分布)では、平均値・中央値・最頻値の3つがすべて一致します。逆に、データが左右どちらかに偏った分布(右に裾が長いなど)では、平均値だけが極端な値に引っ張られて中央値や最頻値と大きくずれます。この性質は試験で直接問われることは少ないですが、「なぜ代表値を使い分けるのか」の理解に役立ちます。
Q. 実務で最頻値はどんな場面で使われていますか?
マーケティング調査でよく使われます。たとえば「最も売れた価格帯はいくらか」を知りたい場合、平均値では外れ値(高額商品)に引っ張られて実態と乖離する恐れがあります。最頻値を使えば「購入者が最も多く選んだ価格帯」を正確に把握できるため、品揃えや価格設定の意思決定に活用されます。