対象試験と出題頻度

統計は、ITパスポート・基本情報技術者・応用情報技術者の全試験区分で出題されるテーマです。

平均値・分散・標準偏差の計算問題、正規分布のグラフ読み取り、散布図と相関係数の判断問題など、出題パターンが幅広い分野です。

 

FE R1秋期 科目A 問5(正規分布のグラフ選択)、AP H30秋期 午前 問3(正規分布と標準偏差の読み取り)、IP R5年度 問77(偏差値の計算)など、各試験区分で繰り返し出題されています。

詳細をクリックして確認
対象試験:
ITパスポート
基本情報技術者
応用情報技術者
出題頻度:
★★★★☆
ランクA(重要)必ず覚えておくべき

用語の定義

情報処理試験を勉強していると、「統計って数学の話でしょ?ITの試験でなぜ出るの?」と疑問を持つ人は多いです。

統計(Statistics)とは、一言で言うと

 「大量のデータを収集・整理し、平均や散らばりなどの数値で特徴を要約して、傾向や法則を読み取る手法」

のことです。

イメージとしては、「クラス全員のテスト結果を、『平均点は70点、ばらつきは大きめ』と一言でまとめる作業」です。

 

100人分の点数を1つずつ眺めても全体像はつかめません。

平均や散らばり具合といった代表的な数値に要約することで、初めてデータの傾向が見えてきます。これが統計の基本的な考え方です。

📊 統計の基本情報

項目 内容
英語名 Statistics
IPA試験での分類 テクノロジ系 > 基礎理論 > 応用数学
主な構成要素 代表値(平均値・中央値・最頻値)、分散、標準偏差、正規分布、相関係数、回帰分析
ITとの関連 データ分析、AI・機械学習の前処理、品質管理(QC)、システム性能評価

詳細解説

統計の分野は範囲が広いため、IPA試験で問われるポイントに絞って整理します。

覚えるべき概念は大きく分けて「代表値」「散布度」「正規分布」「相関と回帰」の4つです。

 

代表値 ― データの中心を表す3つの指標

代表値とは、データ全体の「中心がどこにあるか」を1つの数値で示す指標です。

指標 意味 例(データ:2, 3, 3, 5, 7)
平均値 すべてのデータを足してデータ数で割った値 (2+3+3+5+7) ÷ 5 = 4.0
中央値 データを小さい順に並べた真ん中の値 2, 3, 3, 5, 7 → 3
最頻値 最も出現回数が多い値 3(2回出現)

平均値は極端に大きい値や小さい値(外れ値)に引っ張られやすい性質があります。

年収データのように分布が偏る場合は、中央値のほうが実態に近い代表値になります。某SNSでもよく平均年収等が話題になりますが、平均値と中央値で全く異なる実態であるのはこのような原因です。

 

散布度 ― データの散らばり具合を数値化する

平均値だけではデータの全体像はつかめません。

「平均70点」でも、全員がほぼ70点なのか、0点と100点に分かれているのかで意味がまったく異なります。この散らばり具合を数値にしたものが分散と標準偏差です。

▶ 分散と標準偏差の計算手順(クリックで展開)

具体的な数値で手順を追います。データは 2, 4, 4, 4, 6 の5件、平均値は 4.0 です。

ステップ1:偏差を求める
各データから平均値を引きます。

2−4 = −2
4−4 = 0
4−4 = 0
4−4 = 0
6−4 = +2

ステップ2:偏差を2乗する
マイナスをなくすために各偏差を2乗します。

(−2)² = 4
0² = 0
0² = 0
0² = 0
(+2)² = 4

ステップ3:分散を求める
偏差の2乗の平均を取ります。

分散 = (4+0+0+0+4) ÷ 5 = 1.6

ステップ4:標準偏差を求める
分散の正の平方根を取ります。

標準偏差 = √1.6 ≒ 1.26

分散は単位が「元のデータの2乗」になってしまうため、元のデータと同じ単位に戻した標準偏差のほうが直感的に使いやすい指標です。

正規分布 ― 統計の土台となる確率分布

正規分布は、平均値を頂点にして左右対称のベルカーブ(釣り鐘型)を描く確率分布です。

身長、テストの点数、製品の重量など、自然界や社会の多くのデータがこの形に近い分布を示します。

📊 正規分布と標準偏差の関係(68-95-99ルール)

← 平均(μ)を中心に左右対称 →
±3σ の範囲:約99.7% のデータが含まれる
±2σ の範囲:約95.4% のデータが含まれる
±1σ の範囲:約68.3% のデータが含まれる

標準偏差が小さいほど平均の周りにデータが集中し、グラフは細長く高い山になります。標準偏差が大きいほどデータは広く散らばり、グラフはなだらかで低い山になります。

 

相関と回帰 ― 2つの変数の関係を調べる

「気温が上がるとアイスの売上が増える」のように、2つの変数の関連性を数値で示すのが相関係数、一方の値から他方を予測する式を求めるのが回帰分析です。

用語 意味 値の範囲・ポイント
相関係数(r) 2つの変数の直線的な関連の強さと方向を表す指標 −1 ≦ r ≦ 1
1に近い=正の相関(一方が増えると他方も増える)
−1に近い=負の相関
0に近い=相関なし
回帰分析 結果(目的変数)と要因(説明変数)の関係を数式で表し、予測に使う手法 y = ax + b の形で表す(単回帰分析の場合)
散布図 2つの変数をX軸・Y軸にとってデータを点で打った図 相関の方向や強さを視覚的に確認できる

ここだけは確実に押さえてください。相関係数は「−1から1の範囲」であること、「x→yの回帰式とy→xの回帰式は別物」であることの2点は頻繁に問われます。

では、統計が試験でどのように出題されるか見ていきましょう。

💡 統計の核心を3行で

・平均値・中央値・最頻値はデータの中心を示し、分散・標準偏差はデータの散らばりを示す
・正規分布では ±1σ に約68%、±2σ に約95%、±3σ に約99.7%のデータが含まれる
・相関係数は −1〜1 の範囲で2変数の直線的関係の強さを表し、回帰分析は予測式を求める手法


試験ではこう出る!

統計は、計算問題・グラフ読み取り・用語の定義問題と出題形式が多彩な分野です。出題パターンは大きく3つに分かれます。

📊 過去問での出題実績

試験回 出題内容 問われたポイント
IP R5年度
問77
4教科の得点・平均点・標準偏差から、最も偏差値が高い教科を選ぶ計算問題。 ・偏差値の計算式を知っているか
・「(得点−平均)÷標準偏差」が大きい教科を選べばよい
FE R1秋
科目A 問5
平均60・標準偏差10の正規分布を表すグラフを選ぶ問題。 ・左右対称のベルカーブを選ぶ
・±σの範囲(50〜70)に約68%が収まるグラフを判別
AP H30秋
午前 問3
4教科の平均と標準偏差から、90点以上の人数が最も多い教科を推定する問題。 ・標準偏差が大きいほど高得点者の割合が増える
・平均からの距離をσの倍数で換算する
FE R6年度
科目A 問19
散布図を見て相関係数や回帰分析に関する正しい記述を選ぶ問題。 ・散布図の傾きから正・負の相関を判断
・「xからyの回帰式≠yからxの回帰式」がひっかけ

📝 IPA試験での出題パターン

パターン1:「正規分布のグラフを選べ」
平均と標準偏差が与えられ、対応するベルカーブを選ぶ形式。左右対称でない選択肢をまず除外し、±σの幅が正しいものを選ぶ。FE・APで繰り返し出題されている定番問題。

 

パターン2:「偏差値や散らばりを計算せよ」
偏差値の公式「(得点−平均)÷標準偏差×10+50」を使う計算問題。公式を暗記していなくても、「平均からの離れ具合をσで割る」という考え方を理解していれば解ける。

 

パターン3:「散布図から相関・回帰の性質を選べ」
散布図が提示され、相関係数の正負や回帰分析に関する正しい記述を選ぶ形式。「相関係数が正=右肩上がり」「xからyとyからxの回帰式は別物」を押さえていれば得点できる。

 

試験ではここまででOKです。母集団と標本の違いや推定・検定といった踏み込んだ内容は出題されないため、深追いは不要です。


【確認テスト】理解度チェック

ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。


Q. 受験者1,000人のテスト結果が正規分布に従うとき、「平均±1σ(標準偏差)」の範囲に含まれるデータの割合として、最も適切なものはどれでしょうか?

  • A. 約50%
  • B. 約68%
  • C. 約95%

正解と解説を見る

正解:B

解説:
正規分布では、平均を中心として ±1σ の範囲に全データの約68.3%が含まれます。これは「68-95-99ルール」と呼ばれる性質の一部です。

選択肢Aの「約50%」は、中央値を境にデータを半分に分けた場合の割合であり、標準偏差とは無関係です。選択肢Cの「約95%」は ±2σ の範囲に含まれるデータの割合であり、±1σ ではありません。


よくある質問(FAQ)

Q. 統計と確率は何が違いますか?

統計は「すでにあるデータを分析して特徴をつかむ」手法で、確率は「まだ起きていない事象がどれくらいの割合で起こるかを計算する」手法です。IPA試験のシラバスでは同じ「応用数学」に分類されていますが、統計は過去のデータの整理、確率は未来の可能性の算出と役割が異なります。

Q. 偏差値の計算式は暗記すべきですか?

暗記しておくのが確実です。式は「(得点−平均)÷標準偏差×10+50」です。ただし式を忘れても、「偏差値は平均からの離れ具合をσで測ったもの」という原理を理解していれば、選択肢の大小比較で正解にたどり着けます。ITパスポートではR5年度 問77のように実際に出題されています。

Q. 実務では統計はどの場面で使われていますか?

Webサービスのアクセスログ分析(ページ閲覧数の平均・中央値の比較)、AI・機械学習モデルの精度評価、製造業の品質管理(不良率の算出と正規分布による管理図)など、IT業界のあらゆる場面で使われています。近年はデータサイエンスの需要拡大に伴い、IPAシラバスでも統計分野の出題範囲が広がっています。

Q. 「相関がある」と「因果関係がある」は同じ意味ですか?

違います。相関は「2つの変数が連動して動く」という事実を示すだけで、どちらが原因でどちらが結果かは示しません。たとえば「アイスの売上と水難事故の件数」には正の相関がありますが、アイスが水難事故を引き起こしているわけではなく、背後に「気温」という共通の要因があるだけです。この混同は「疑似相関」と呼ばれ、回帰分析の解釈で注意が必要です。