「高可用性って、ただの”可用性”と何が違うの?」──これ、試験勉強中にけっこう引っかかるポイントです。結論から言うと、高可用性は「可用性をとことん突き詰めた設計の考え方」のこと。この記事では、そのど真ん中にあるHAクラスタの仕組みを、身近な例えと図解で整理します。
対象試験と出題頻度
高可用性は、基本情報技術者・応用情報技術者で出題されるテーマです。
HAクラスタやフェールオーバーとセットで問われるのが定番で、冗長化やフォールトトレランスとの違いを正確に区別できるかが毎回カギになります。
詳細をクリックして確認
基本情報技術者
応用情報技術者
★★★★☆
ランクA(重要)必ず覚えておくべき
用語の定義
高可用性(High Availability / HA)とは、一言で言うと
「障害が起きてもシステムを止めず、利用者がいつでも使える状態を保ち続ける設計思想」
のことです。
身近な例えで言えば、「24時間営業のコンビニ」がぴったりです。
夜中にレジ担当のスタッフが体調を崩しても、バックヤードにいた別のスタッフがすぐレジに入って営業を続けますよね。お客さんから見れば「いつ行っても開いている」状態が途切れません。
高可用性のシステムもこれと同じで、メインのサーバが壊れた瞬間に控えのサーバが自動で仕事を引き継ぎ、利用者には「止まった」と気づかせない。
これがHAの狙いです。
高可用性の基本情報
| 項目 | 内容 |
|---|---|
| 英語名 | High Availability(略称:HA) |
| 分類 | システムの信頼性設計(コンピュータシステム) |
| NIST定義 | 「デバイスやコンポーネントの中断時に可用性を確保するフェールオーバー機能」(NIST SP 800-113) |
| 代表的な構成 | HAクラスタ(ホットスタンバイ形式) |
| 目標稼働率の例 | 99.999%(ファイブナイン = 年間停止わずか約5分) |
解説
そもそも、なぜ「高」可用性が必要なのか
銀行のATMが日中3時間止まったら、窓口はパンクします。航空管制システムが落ちたら、上空の飛行機は行き場を失います。このように「止まった瞬間に大きな被害が出るシステム」は世の中にたくさんあります。
こういったシステムでは「バックアップを取ってあるから、後で復旧すればいいよね」では間に合いません。壊れた瞬間に、自動で、止まらずに動き続ける仕組みが要る。
だから通常の可用性からさらに一歩踏み込んだ「高可用性」という設計思想が生まれました。
HAクラスタの仕組み──主系・待機系・ハートビート
高可用性を実現する代表的な構成がHAクラスタ(High Availability Cluster)です。基本構造はシンプルで、「主系(現用系)」と「待機系(予備系)」の2台を用意しておき、主系がダウンしたら待機系が自動で処理を引き継ぎます。この自動切替えのことをフェールオーバーと呼びます。
では、待機系はどうやって「主系が壊れた」と判断するのか。ここで登場するのがハートビート(心拍信号)です。主系は一定間隔で「自分は生きているよ」という小さなパケットを待機系に送り続けます。
このパケットが一定時間届かなくなると、待機系は「主系に異常が起きた」と判断し、自動で処理を引き継ぎます。
HAクラスタ(ホットスタンバイ)の動き
① 正常時
② 障害発生 → フェールオーバー
③ 復旧後 → フェールバック
フェールオーバー=障害時の自動切替え / フェールバック=復旧後に主系へ戻す操作
稼働率の目安──「ナイン」の数え方
「どのくらい止まらなければ”高”可用性と呼べるのか?」を示す物差しが稼働率です。
業界では「9がいくつ並ぶか」で水準を表現します。
| 稼働率 | 通称 | 年間で止めていい時間 |
|---|---|---|
| 99% | ツーナイン | 約3.65日 |
| 99.9% | スリーナイン | 約8.76時間 |
| 99.99% | フォーナイン | 約52.6分 |
| 99.999% | ファイブナイン | 約5.3分 |
9が1つ増えるだけで、止めていい時間は約10分の1に減る
ファイブナイン(99.999%)だと、1年間で許されるダウンタイムはたったの5分ちょっと。
この数値はSLA(サービスレベル契約)に書かれることが多く、金融や通信の基幹システムではこのクラスの稼働率が当たり前のように要求されます。
負荷分散クラスタとの違い
同じ「クラスタ構成」でも、HAクラスタと負荷分散クラスタは目的がまるで違います。
ここを混同すると試験で確実に落とすので、表で整理しておきます。
| 比較項目 | HAクラスタ | 負荷分散クラスタ |
|---|---|---|
| 一言で言うと | 「止めない」ための構成 | 「速くする」ための構成 |
| サーバの役割 | 主系1台+待機系1台(ホットスタンバイ) | 全サーバが同時に稼働+ロードバランサで振分け |
| 障害が起きたら | 待機系が丸ごと引き継ぎ → スループット維持 | 残りのサーバに処理が集中 → スループット低下 |
| スケールアウト | 目的外(サーバ追加で性能は上がらない) | サーバ追加で処理能力を拡張できる |
では、この用語が試験でどう問われるかを見ていきましょう。
💡 高可用性の核心を3行で
・障害が起きてもサービスを止めない設計思想(HA)
・主系+待機系のHAクラスタ構成で、フェールオーバーにより自動切替え
・稼働率の目安はファイブナイン(99.999%)=年間停止わずか約5分
試験ではこう出る!
FE・APの午前問題では、「HAクラスタ構成の特徴を選べ」「障害時に働く機能はどれか」という2パターンで繰り返し出題されています。
過去問での出題実績
| 試験回 | 出題内容 | 問われたポイント |
|---|---|---|
| FE H28秋 午前 問14 |
ホットスタンバイ形式によるHAクラスタ構成の特徴を、負荷分散クラスタと比較して選ぶ。 | 「待機系に引き継ぐのでスループット維持」が正解。負荷分散側の特徴3つがひっかけ。 |
| AP H27秋 午前 問12 |
クラスタリングシステムでノード障害時に信頼性を向上させる機能を選ぶ。 | 「フェールオーバー」が正解。ホットプラグ・再起動・フェールバックがひっかけ。 |
| AP H28秋 午前 問13 |
仮想サーバの冗長化設計で、クラスタソフトウェアによる可用性評価として適切なものを選ぶ。 | HAクラスタの知識をベースにした応用問題。 |
📝 押さえるべき出題パターン
パターン1:「HAクラスタ vs 負荷分散クラスタ」
負荷分散クラスタの特徴(「処理を均等に分散」「拡張性が高い」「データベース共有が必要」)をひっかけとして並べ、HAクラスタの特徴を選ばせる。「待機系サーバ」「スループット維持」が正解の目印。
パターン2:「障害時に働く機能名を選べ」
フェールオーバー・フェールバック・ホットプラグを混ぜて出す。フェールオーバーは「障害時の自動切替え」、フェールバックは「復旧後に主系へ戻す」。この区別さえできれば確実に取れる。
試験ではここまででOK。ハートビートの具体的なプロトコルや、ファイブナインの計算式までは問われないので、深追いは不要です。
【確認テスト】理解度チェック
ここまでの内容が頭に入っているか、1問だけ確認しておきましょう。
Q. ロードバランサを使用した負荷分散クラスタ構成と比較した場合の、ホットスタンバイ形式によるHA(High Availability)クラスタ構成の特徴として、最も適切なものはどれか。
- A. 処理を均等にサーバへ分散できるので、サーバマシンが有効に活用でき、将来の処理量増大に対して拡張性が確保できる。
- B. 障害が発生すると稼働中の他のサーバに処理を分散させるので、稼働中のサーバの負荷が高くなり、スループットが低下する。
- C. 待機系サーバとして同一仕様のサーバが必要になるが、障害発生時には待機系に処理を引き継ぐので、スループットを維持することができる。
正解と解説を見る
正解:C
解説:
HAクラスタのホットスタンバイ形式では、主系と同じ仕様の待機系サーバを用意し、障害発生時に待機系が丸ごと処理を引き継ぎます。そのためスループットは低下しません。FE H28秋 午前 問14で実際に出題された論点です。
選択肢Aは負荷分散クラスタの利点です。ロードバランサで複数サーバに処理を振り分ける構成の特徴であり、HAクラスタには当てはまりません。選択肢Bも負荷分散クラスタで障害が起きた場合の話です。HAクラスタでは待機系が主系の役割を全面的に引き受けるので、「残りのサーバに負荷が集中する」という状況は発生しません。
よくある質問(FAQ)
Q. ホットスタンバイとコールドスタンバイはどう違いますか?
ホットスタンバイは、待機系サーバの電源を入れたままOSやアプリもすべて起動した状態で待たせる方式です。障害時には数秒〜数十秒で切替えが完了します。一方、コールドスタンバイは待機系の電源を落とした(または最低限の起動だけの)状態で待たせる方式で、切替えにはOSの起動やアプリの設定が必要になり、復旧まで数分〜数十分かかります。高可用性が求められるシステムでは、切替え時間が短いホットスタンバイが使われます。
Q. 高可用性とフォールトトレランスは同じ意味ですか?
違います。フォールトトレランスは「障害が起きても処理を一切中断しない」設計で、CPUやメモリを物理的に二重化して障害を完全に吸収します。対して高可用性は「中断時間を限りなくゼロに近づける」設計で、フェールオーバー時に数秒程度の瞬断は許容範囲です。達成難度もコストもフォールトトレランスのほうが上で、ミッションクリティカルな分野(航空宇宙・医療機器など)で採用されます。
Q. クラウド環境でも高可用性は使われていますか?
当然使われています。AWS・Azure・GCPなどの主要クラウドは、物理的に離れたデータセンター群(アベイラビリティゾーン/AZ)をまたいだ冗長構成を提供しています。利用者側でも「マルチAZ配置」を選ぶことで、片方のデータセンターが丸ごと停止してもサービスを継続できる設計が標準的なパターンです。
Q. SLAに書かれた稼働率を下回ったらどうなりますか?
SLA(サービスレベル契約)で定めた稼働率を下回った場合、多くのクラウドサービスでは利用料の一部を返金(サービスクレジット)する仕組みが設けられています。ただし返金額は一般的に月額料金の10〜30%程度で、ビジネス損害を全額補償してくれるわけではありません。だからこそ、利用者側でもマルチリージョン構成や自動復旧の仕組みを自前で組んでおくことが重要です。