情報処理試験を勉強していると、「アーカイブって結局何?バックアップと何が違うの?」と疑問に思う場面があります。日常で目にするZIPファイルの正体、ここでしっかり整理しましょう。
対象試験と出題頻度
アーカイブは、ITパスポート・基本情報技術者・応用情報技術者で出題されるテーマです。
ITパスポートでは用語の意味を直接問う問題が出ており、FE・APでは選択肢の一つとして登場する形が中心です。
詳細をクリックして確認
ITパスポート
基本情報技術者
応用情報技術者
★★★☆☆
ランクB(標準)覚えておくと有利
用語の定義
アーカイブ(Archive)とは、一言で言うと
「複数のファイルを一つにまとめて保管すること、またはその書庫ファイル自体」
を指します。
イメージとしては、「段ボール箱に書類をまとめて倉庫にしまう作業」です。
デスクの上に散らばった書類を1箱にまとめれば、探しやすくなりスペースも空きます。
パソコン上で複数ファイルをZIPやtarで1つにまとめる操作が、まさにこの「段ボール詰め」にあたります。
📊 アーカイブの基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | Archive |
| 語源 | ラテン語 archivum(記録保管所) |
| 代表的な形式 | ZIP、tar、7z、RAR |
| 関連操作 | 圧縮・展開(解凍) |
解説
「まとめる」と「縮める」は別の操作
アーカイブとデータ圧縮はセットで語られることが多いですが、本来は別の操作です。
アーカイブは「複数のファイルを1つにまとめる」操作であり、圧縮は「データ量を削減する」操作です。Linux系でよく使われるtarコマンドは、ファイルをまとめるだけで圧縮はしません。
圧縮したい場合はgzip等と組み合わせて「tar.gz」形式にします。一方、Windowsで馴染み深いZIPは、まとめると同時にハフマン符号などのアルゴリズムで圧縮も行います。
📦 アーカイブと圧縮の関係
| 操作 | やること | 代表例 |
|---|---|---|
| アーカイブのみ | 複数ファイルを1つにまとめる(サイズは変わらない) | tar |
| 圧縮のみ | データ量を削減する(まとめない) | gzip |
| アーカイブ+圧縮 | まとめてから縮める | ZIP、tar.gz、7z |
バックアップとの違い
試験の選択肢で最も紛らわしいのがバックアップとの混同です。両者は目的が根本的に異なります。
バックアップは「障害に備えてデータの複製を作る」行為です。元データと複製データの両方が存在し、障害発生時に復旧する目的で使います。
一方、アーカイブは「保管・整理のためにデータをまとめて格納する」行為です。
使用頻度の低い古いデータを倉庫に移すイメージで、元の場所からは削除することもあります。
バックアップとアーカイブの違い
🔄 バックアップ
目的:障害からの復旧
元データ:残る(複製を作る)
保存期間:短~中期
例:毎日の定期コピー
📦 アーカイブ
目的:長期保管・整理
元データ:削除する場合もある
保存期間:長期
例:過去年度のデータ格納
では、この用語が試験でどのように出題されるか見ていきましょう。
💡 アーカイブの核心を3行で
・複数のファイルを1つにまとめて保管する操作、またはその書庫ファイルのこと
・「まとめる(アーカイブ)」と「縮める(圧縮)」は本来別の操作
・バックアップは「復旧目的の複製」、アーカイブは「長期保管目的の格納」で目的が異なる
試験ではこう出る!
アーカイブは、IPの午前問題で「用語の意味を選ばせる問題」として直接出題された実績があります。FE・APでは、他の用語を問う問題の選択肢としてアーカイブが登場するパターンが中心です。
📊 過去問での出題実績
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| IP R3 問83 |
「複数のファイルを一つにまとめることを何と呼ぶか」を選ぶ問題。 | ・正解は「アーカイブ」 ・関係データベース、ストライピング、スワッピングがひっかけ |
| IP R7 問82 |
「データベースの内容を他のDBに複製して同期させるDBMSの機能はどれか」を選ぶ問題。 | ・正解は「レプリケーション」 ・アーカイブは不正解選択肢として登場 |
📝 IPA試験での出題パターン
パターン1:「アーカイブの意味を選べ」
IP R3 問83のように、アーカイブの定義を正面から問う形式。「複数のファイルを一つにまとめる」が正解のキーワード。ストライピング(RAID0のデータ分散書込み)やスワッピング(主記憶と補助記憶の入替え)が紛らわしい選択肢として出る。
パターン2:他の用語の問題で不正解選択肢として登場
IP R7 問82のように、レプリケーションやバックアップなど別の用語が正解の問題でアーカイブが選択肢に混ざる。「アーカイブ=ファイルをまとめて保管」と即座に判断できれば、消去法で正解にたどり着ける。
試験ではここまででOKです。tarコマンドのオプションやZIPの内部アルゴリズムまで問われることはないので、深追いは不要です。
【確認テスト】理解度チェック
ここまでの内容を理解できたか、簡単なクイズで確認してみましょう。
Q. 多くのファイルの保存や保管のために、複数のファイルを一つにまとめることを何と呼ぶか。最も適切なものを選んでください。
- A. データを複数のディスクに分散して書き込むことで、アクセス性能を向上させる方式。
- B. 複数のファイルを一つの書庫ファイルとしてまとめて保管する操作。
- C. 主記憶の内容と補助記憶の内容を優先度に応じて入れ替えながら処理を行う管理方式。
正解と解説を見る
正解:B
解説:
アーカイブ(Archive)は、複数のファイルを一つの書庫ファイルにまとめて保管する操作です。IP R3 問83でも同趣旨の問題が出題されています。
選択肢Aはストライピング(RAID0)の説明です。ストライピングはデータを複数ディスクに分散書込みする方式であり、ファイルをまとめる操作ではありません。選択肢Cはスワッピングの説明です。スワッピングは主記憶と補助記憶の間でプログラムを入れ替える記憶管理方式であり、ファイルの保管とは無関係です。
よくある質問(FAQ)
Q. ZIPファイルは「アーカイブ」ですか?それとも「圧縮ファイル」ですか?
両方です。ZIPは複数ファイルを一つにまとめる(アーカイブ)操作と、データ量を削減する(圧縮)操作を同時に行う形式です。そのため「圧縮アーカイブ」と呼ぶのが正確です。一方、Linuxのtarコマンドで作成される.tarファイルは、まとめるだけで圧縮はしないため「非圧縮アーカイブ」に該当します。
Q. メールの「アーカイブ」機能とは同じ意味ですか?
根本の考え方は同じです。GmailやOutlookの「アーカイブ」は、受信トレイから非表示にして別の保管場所に移す機能です。「削除ではなく保管する」というアーカイブ本来の意味がそのまま適用されています。ただし、ファイルを1つにまとめるIT用語としてのアーカイブとは操作内容が異なるため、試験では区別してください。
Q. 実務でアーカイブが使われる場面を教えてください。
代表的なのはログファイルの管理です。Webサーバーは大量のアクセスログを日々生成しますが、古いログは参照頻度が低いため、月ごとにtar.gzにまとめて安価なストレージへ移します。また、プロジェクト完了後のソースコードや設計書をZIPにまとめて社内の文書管理システムに格納するケースも一般的です。法令で一定期間の保存が義務づけられた帳票データのアーカイブも、企業のIT部門では重要な業務の一つです。
Q. 「アーカイブ」と「レプリケーション」は何が違いますか?
レプリケーションは、データベースの内容をリアルタイムまたは準リアルタイムで別のサーバーに複製し、両者を同期させる技術です。目的は可用性の確保やアクセス負荷の分散であり、「古いデータをまとめて長期保管する」アーカイブとは方向性がまったく異なります。IP R7 問82ではこの2つが同じ選択肢群に並んでいるため、違いを押さえておくと安心です。