「2つの数値データに関係があるかをパッと見で判断したい」——そんなときに使うのが散布図です。本記事では、IPA試験で問われる散布図の見方と相関関係の判定方法を、図解中心で整理します。
対象試験と出題頻度
散布図は、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。QC七つ道具の比較問題として定番化しており、「特性要因図」「パレート図」「ヒストグラム」との違いを正確に区別できるかが問われます。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★★☆
ランクA(重要)必ず覚えておくべき
用語の定義
情報処理試験を勉強していると、「散布図って結局どんなときに使う図なの?」と混乱しがちです。
散布図(Scatter Diagram)とは、一言で言うと
「2種類のデータをX軸とY軸にとり、点の散らばり方で相関関係を見る図」
のことです。
イメージとしては、「勉強時間とテスト点数の関係を点でプロットしたグラフ」です。
勉強時間が長い人ほど点数が高ければ、点は右肩上がりに並びます。逆に関係がなければ、点はバラバラに散らばります。
📊 散布図の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Scatter Diagram / Scatter Plot |
| 分類 | QC七つ道具 |
| 用途 | 2変数間の相関関係の有無と強さを把握する |
| 判定パターン | 正の相関/負の相関/無相関 |
解説
品質管理や業務改善の現場では、「気温が上がるとアイスの売上は伸びるのか」「作業時間と不良品数に関係はあるのか」といった、2つの数値の関連性を確かめたい場面が頻繁に出てきます。
表で数字を眺めても傾向はつかみにくいですが、点としてプロットすると一目で関係性が見える。
これが散布図の役割です。
3つの相関パターン
散布図から読み取れる関係は、大きく3パターンに分かれます。試験ではこの見分けが核心です。
正の相関
Xが増えるとYも増える
例:気温↑→アイス売上↑
負の相関
Xが増えるとYは減る
例:気温↑→灯油消費↓
無相関
XとYに関係なし
例:身長↑と数学の点数
点が右上がりに並べば正の相関、右下がりなら負の相関、バラついていれば無相関です。
さらに点が直線に近いほど相関は「強い」、離れているほど「弱い」と判定します。
注意点:相関 ≠ 因果
散布図で相関が見えても、原因と結果(因果関係)があるとは限りません。
例えば「アイスの売上」と「水難事故件数」は正の相関がありますが、原因はどちらも「気温」であって、アイスが事故を引き起こしているわけではありません。これを疑似相関と呼びます。
QC七つ道具との位置づけ
| 図の名称 | 何を見るか |
|---|---|
| 散布図 | 2変数の相関関係 |
| ヒストグラム | データのばらつき・分布 |
| パレート図 | 項目別の影響度の大きさ(重点課題の特定) |
| 特性要因図 | 結果に対する原因の体系的整理 |
| 管理図 | 工程の異常検知(時系列) |
では、この用語が試験でどのように出題されるか見ていきましょう。
試験ではこう出る!
散布図は、QC七つ道具の比較問題として午前で繰り返し出題されています。出題パターンは2つに集約できます。
📊 過去問での出題実績
| 試験回 | 出題内容 |
|---|---|
| IP R4 問31 |
QC七つ道具のうち、2種類のデータの関連を見るのに適した図を選ぶ問題。正解は散布図。 |
| FE H30秋 問75 |
散布図の説明文を選ぶ問題。「2つの変数の相関を点の分布で表す」が正解。 |
| AP H29春 問75 |
提示された散布図から相関の有無を判断する問題。点の並び方で正・負・無を判定。 |
📝 出題パターンとひっかけ
パターン1:「2つのデータの関連を見る図」を選ぶ
キーワードは「2種類」「相関」「対応関係」。ひっかけ選択肢として、項目別の大きさを示すパレート図、原因を体系化する特性要因図、ばらつきを見るヒストグラムが並びます。
パターン2:図そのものから相関を読み取る
右上がり=正、右下がり=負、ばらつき=無。これだけ押さえれば足ります。深追いは不要です。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. QC七つ道具の一つである散布図の説明として、最も適切なものはどれでしょうか?
- A. 2種類のデータをX軸とY軸にとり、点の分布によって両者の相関関係の有無や強さを把握する図である。
- B. データの値の範囲を区間に分け、各区間に属するデータの個数を棒の高さで表し、ばらつきの分布を把握する図である。
- C. 項目を出現頻度の大きい順に並べた棒グラフと累積比率の折れ線を組み合わせ、重点的に取り組むべき課題を特定する図である。
正解と解説を見る
正解:A
解説:
散布図は2つの変数を縦横の軸にとり、点の散らばり方から相関関係(正・負・無)を読み取る図です。設問の「点の分布で両者の関係を把握する」が定義に一致します。
選択肢Bはヒストグラムの説明です。1種類のデータのばらつきの分布を見るものであり、2変数の関係を扱う散布図とは目的が異なります。選択肢Cはパレート図の説明です。重点課題の特定に使う図であり、相関の判定には使いません。
よくある質問(FAQ)
Q. 相関係数と散布図の関係は?
相関係数は−1から+1までの数値で相関の強さを表す指標で、散布図を数値化したものと考えると分かりやすいです。+1に近いほど強い正の相関、−1に近いほど強い負の相関、0付近は無相関です。IPA試験では「相関係数の符号と散布図の傾きの向きが一致する」程度を押さえれば足ります。
Q. 「層別」とは何ですか?散布図と関係ありますか?
層別はQC七つ道具の一つで、データを機械別・作業者別などのグループに分けて分析する手法です。散布図に層別を組み合わせると、全体では無相関に見えても、グループごとに分けると相関が現れる、といった隠れた傾向を発見できます。実務では非常に強力な組み合わせです。
Q. 散布図に「外れ値」が混じったらどうしますか?
点群から大きく外れた点は外れ値と呼びます。実務では原因を調査し、測定ミスや特殊要因によるものなら除外、本物のデータなら別途分析対象とします。除外の判断を誤ると相関の解釈を歪めるため、まず原因を確認するのが鉄則です。
Q. Excelで散布図はどう作りますか?
2列のデータを範囲選択し、「挿入」→「グラフ」→「散布図」を選ぶだけで作成できます。「近似曲線の追加」を有効にすれば回帰直線も引けます。実務でも最初の傾向把握に使われる定番の手順です。