対象試験と出題頻度
相関関係は、ITパスポート・基本情報技術者・応用情報技術者の全試験区分で出題されるテーマです。
散布図を読んで正・負の相関を判断する問題や、相関係数の性質に関する正誤問題が定番化しており、統計分野の中でも特に出題頻度が高い領域です。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★★☆
ランクA(重要)必ず覚えておくべき
用語の定義
情報処理試験を勉強していると、「相関関係って、要するに因果関係と何が違うの?」と混乱しがちです。
相関関係(Correlation)とは、一言で言うと
「2つの変数が連動して変化する関係」
のことです。
イメージとしては、「気温が上がるとアイスの売上も上がる」という現象。
片方の数値が動くと、もう片方もつられて動く 。 この「つられ具合」を数値で表したものが相関係数であり、図で表したものが散布図です。
📊 相関関係の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Correlation |
| IPA試験での分類 | テクノロジ系 > 基礎理論 > 応用数学 |
| 関連キーワード | 相関係数、散布図、回帰分析、正の相関、負の相関、無相関 |
解説
2つの変数の関係を分析する場面は、品質管理やデータ分析など実務でもIPA試験でも数多く登場します。ここでは、相関の種類と、それを数値化・可視化する方法を整理します。
3種類の相関パターン
相関には「正の相関」「負の相関」「無相関」の3パターンがあります。
📊 相関の3パターンと散布図イメージ
| y |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| x |
xが増えるとyも増える
相関係数:0 < r ≦ 1
| y |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| x |
xが増えるとyは減る
相関係数:−1 ≦ r < 0
| y |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| x |
規則性がない
相関係数:r ≒ 0
相関係数の読み方
相関の強さを−1から1の範囲で数値化したものが相関係数(r)です。
📊 相関係数の値と意味
完全な負の相関
0
無相関
+1
完全な正の相関
| 相関係数の範囲 | 解釈 |
|---|---|
| r = +1 | 完全な正の相関(すべての点が右上がりの直線上にある) |
| 0.7 ≦ |r| < 1 | 強い相関がある |
| 0.4 ≦ |r| < 0.7 | 中程度の相関がある |
| 0 < |r| < 0.4 | 弱い相関がある |
| r = 0 | 無相関(2変数に直線的な関連がない) |
| r = −1 | 完全な負の相関(すべての点が右下がりの直線上にある) |
▶ 相関関係と因果関係の違い(クリックで展開)
ここだけは確実に押さえてください。
相関関係は「2つの値が連動している事実」を示すだけであり、「どちらが原因でどちらが結果か」は示しません。
たとえば、「アイスの売上」と「水難事故の件数」には正の相関がありますが、アイスが事故を引き起こしているわけではありません。背後に「気温」という共通の要因(交絡因子)が存在するだけです。このように見かけ上の関連を「疑似相関」と呼びます。
「AとBに相関がある = AがBの原因である」とは限らない。この区別は回帰分析の解釈でも重要になります。
では、この用語が試験でどのように出題されるか見ていきましょう。
💡 相関関係の核心を3行で
・2つの変数が連動して動く関係であり、相関係数は−1〜+1の範囲で強さと方向を示す
・散布図が右上がりなら正の相関(r > 0)、右下がりなら負の相関(r < 0)
・相関があっても因果関係があるとは限らない(疑似相関に注意)
試験ではこう出る!
相関関係は、散布図の読み取り問題と相関係数の性質を問う正誤問題の2パターンで繰り返し出題されています。
📊 過去問での出題実績(クリックして表示)
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| FE R6年度 科目A 問19 |
製造上の要因xと品質特性yの散布図から読み取れることを選ぶ問題。 | ・右下がりの分布 → 負の相関と判断できるか ・「xからyの回帰式 ≠ yからxの回帰式」がひっかけ |
| AP H29秋 午前 問1 |
相関係数に関する記述のうち、適切なものを選ぶ問題。 | ・すべての点が正の傾きの直線上にあるとき r = +1 ・「非線形なら負」「無相関なら−1」はひっかけ |
| IP R5年度 問38 |
ステップ数と不良件数の関係性を示す図として適切なものを選ぶ問題。 | ・2変数の関係を示す図 = 散布図と判断できるか ・パレート図・管理図・ヒストグラムとの区別 |
| IP H23特別 問15 |
4つの散布図から負の相関を示すものを選ぶ問題。 | ・右下がり = 負の相関を視覚的に識別できるか |
📝 IPA試験での出題パターン
パターン1:「散布図から相関の正負を判断せよ」
散布図が提示され、読み取れることを4択から選ぶ形式。右上がりなら正、右下がりなら負と即答できる。ひっかけとして「回帰式の対称性」に関する誤った選択肢が混じる。
パターン2:「相関係数の性質として正しいものを選べ」
AP H29秋 問1のように、相関係数の定義に関する正誤判断を求める形式。「すべての点が直線上にあるとき r = ±1」「無相関のとき r = 0」を正確に覚えていれば得点できる。
試験ではここまででOKです。相関係数の計算式そのものが問われることはないため、深追いは不要です。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. 相関関係に関する記述として、最も適切なものはどれでしょうか?
- A. 相関係数は−1以上+1以下の値をとり、すべての標本点が正の傾きを持つ直線上にあるとき+1になる。
- B. 相関係数が0に近いとき、2つの変数には強い正の相関がある。
- C. 2つの変数に相関関係があれば、必ず一方が他方の原因であるといえる。
正解と解説を見る
正解:A
解説:
相関係数は−1〜+1の範囲をとり、すべてのデータ点が正の傾きを持つ直線上に並ぶとき、2変数は完全な比例関係にあるため相関係数は+1になります。AP H29秋 午前 問1でも同じ論点が出題されています。
選択肢Bは誤りです。相関係数が0に近い状態は「無相関」を意味し、2変数に直線的な関連がないことを示します。選択肢Cも誤りです。前述の通り、相関は連動の事実を示すだけであり、因果の方向は示しません。背後に共通の要因がある疑似相関の可能性もあります。
よくある質問(FAQ)
Q. 相関係数と回帰分析は何が違いますか?
相関係数は「2つの変数がどれくらい連動しているか」を−1〜+1の数値で示す指標です。一方、回帰分析は「一方の変数(説明変数)から他方の変数(目的変数)を予測する数式(y = ax + b)」を求める手法です。相関係数は関連の強さの測定、回帰分析は予測モデルの構築と、目的が異なります。
Q. 散布図以外に相関を調べるグラフはありますか?
ヒートマップ(相関行列を色の濃淡で表す図)が代表的です。変数が3つ以上あるときは散布図だけでは組み合わせが膨大になるため、すべてのペアの相関係数を一覧できるヒートマップのほうが効率的です。ただしIPA試験ではヒートマップは出題されないため、散布図の読み取りに集中すれば十分です。
Q. 「xからyの回帰式」と「yからxの回帰式」が異なるのはなぜですか?
回帰分析は「目的変数の誤差を最小化する」直線を引く手法です。xからyを予測する場合はy方向の誤差を最小化し、yからxを予測する場合はx方向の誤差を最小化します。最小化する方向が異なるため、得られる直線の傾きも異なります。FE R6年度 科目A 問19でも、この点がひっかけ選択肢として出題されています。