TOP > コラム > システムダウン時の事業継続における課題と有効な対策とは?

システムダウン時の事業継続における課題と有効な対策とは?

公開日:2020/10/19   更新日:2023/04/26
システムダウン時の事業継続における課題と有効な対策とは?

ビジネスのデジタル化が進む現代では、Web関連サービスや社会インフラを支えるITシステムは重要な役割を担っています。しかし残念なことに、IT化によって便利になるごとにシステム障害の発生件数は増加傾向にあります。システムダウン時でも通常どおり事業を継続するには、システム運用において対策を講じる必要がありますが、多くの企業ではまだ不十分だと言えるでしょう。

そこで今回は、システムダウンがもたらす経営への影響、事業継続における課題と有効な対応策についてご紹介します。

1. システムダウンがもたらす影響

昨今、ECサイトやオンライン証券など店舗に行かずとも、オンラインサービスでビジネスが完結する時代になりました。ECサイトであれば、商品検索画面や決済システムにリアルタイム性が求められ、システムの反応速度がユーザー満足度に直結し、サイトの信頼性を左右します。

しかし、アクセス集中などでシステムダウンが頻繁に起きれば、サイトユーザーの購入意欲が下がりかねません。障害復旧が遅延すれば、「このECサイトは信用できない」「不便で使えないサイトだ」と利用客に不信に思われ、サイトの離脱を招くことにもなるでしょう。

また、社内システムに障害が発生した場合、通常通り事業を継続することが困難になる可能性もあります。

さらに銀行や証券会社のオンラインサービスがシステムダウンして取引中のお客様に損害が生じれば、賠償責任を負うリスクも少なからず発生します。システムダウンは、企業のブランドイメージを下げるほどの影響があるにもかかわらず、サイトやサービスの品質面ばかりを重視し、システム運用管理にコストをかけたがらない企業もあります。

しかし、ひとたびシステム障害が発生した場合、社会に及ぼす影響は甚大になる可能性も高く、被害が深刻化するリスクを忘れてはなりません。ITシステムの信頼性向上のためにも、システム運用時のさまざまなリスクへの対応は必須と言えるでしょう。

2. 情報インフラの障害対応における課題

ITシステムに大きく依存している社会では、システムの複雑化によってシステム障害は年々増加傾向にあります。

情報処理推進機構(IPA)が国内のシステム障害情報を半期ごとにまとめたデータによると2019年通年では112件にのぼり、2009年以降上昇傾向だったシステム障害件数のなかで過去最多でした。

IT化の進展によって、受発注やカスタマーサポート、社内外の連絡、請求処理に伴う入出金などほとんどの業務がITシステムを通じて行われます。そのため、システム障害が発生すると、たちまち業務に影響をきたし、事業停止によって被害は甚大なものとなります。システム障害において事業継続に影響を与える3大要因は、次の通りです。

【システム障害の3大要因】

  • ハードウェア障害
  • ヒューマンエラー
  • ソフトウェア障害

※参照元:システム障害事例情報の分析に基づく教訓・対策を共有する仕組み(IPA)

これらの3大要因は、コンピュータウイルス感染による問題性を上回るものと報告されています。近年は、人的ミスによる障害やハードウェアの故障、サイバー攻撃などに加え、災害による被害も増加しているため、個々の企業の単独対策では不十分です。下記は、システム障害で脅威の問題となりやすい種類と具体例です。

脅威の種類 具体例
意図的要因 ブラックハッカーによるデータ改ざんや破壊、情報漏えい、不正コマンド実行、事業の機密情報の詐取
非意図的要因 設定ミスやプログラムの欠陥、監査不備、不十分なメンテナンス、機械の故障、ヒューマンエラーに該当する行為全般
災害要因 落雷や地震、洪水、台風による電力設備の破損、電力網の破損、インターネット環境の途絶

今後も大規模化・複雑化するITシステムの障害対応には、運用保守において監視、異常検知、障害特定、復旧体制など障害発生時の対応手順や対策を事前に見直すことが重要です。

※参照元:情報システムの障害状況 2019 年前半データ
情報システムの障害状況 2019 年後半データ

3. 障害発生時に備えておくべき対策

「社内システムが障害で起動しない」「システムダウンでECサイトが動かない」など、トラブルが発生した際はシステム担当者が速やかに復旧対応にあたる必要があります。

障害発生時の対応フローで最も大切なのは、慌てずに冷静に対応するのはもちろん、システム障害の症状や原因を復旧担当のエンジニアへ確実に早く伝え、解決に導くことです。一般的なシステム障害発生時の対応フローは、下記のとおりです。

障害発生時の対応フロー

【ステップ1】:システム障害の発見
【ステップ2】:障害範囲を影響ごとにグルーピング
【ステップ3】:事前に決定しておいた関係者への障害発生連絡
【ステップ4】:2次被害を防ぐため、障害箇所の切り離し
【ステップ5】:システム障害の原因を分析
【ステップ6】:分析結果に基づいて、障害復旧
【ステップ7】:障害復旧後、関係者へ連絡
【ステップ8】:システム障害の問題点や対応策など一連の流れを記録

障害が発生すれば、問題の原因を追究し、関係各所への正しい情報伝達が求められます。しかし、いざトラブルが起きてしまうと慌ててしまい、対応に遅れが出ることも。これは、上記フロー【ステップ3】に該当します。そうならないよう、障害発生時の迅速な復旧体制を確保するために、現場間をつなぐ連絡手段の確保が重要です。

4. 障害復旧のカギを握る転送電話

システム障害が発生すれば、システム運用会社やインフラサービスの管理部門の担当者は、休日や昼夜を問わず、速やかに障害復旧を行います。

そのため、緊急コールの取りこぼしは、絶対に避けなければいけません。1秒でも早く障害を復旧し、ITサービスや社内システムを通常どおりに稼働させるには、インターネット回線を利用した転送電話による効率的な連絡が有効です。

銀行などインフラ系のシステムは24時間稼働のため、障害が起きたときには迅速な復旧が必要です。そこで、オンコール保守対応を行うIT部門やシステム管理者は、夜間や休日であろうとすぐに対応しなくてはいけません。また、IT部門の管理者との情報伝達も頻繁に行うため、障害復旧を行うエンジニアにとって携帯電話は必需品であり、現場の連絡手段確保のために欠かせないものとなっています。

5. 障害発生時の連絡手段として頼れる「転送録」

「障害発生時の対応フローを自動化したい」
「システム復旧を担うエンジニアへ迅速に連絡できる手段を探している」

という方は、ワイドデックの「転送録」をぜひご利用ください。転送録は、1サービス1回線単位で手軽に利用できるクラウド型の電話転送サービスです。「転送録」なら、休日や夜間に届く障害通知から効率的な電話連絡が可能です。

「転送録」の一斉呼出転送サービスでできること

・事前に登録した複数の電話番号を一度に呼び出せるため、障害復旧までの時間を短縮できます。
・事前に設定しておいた最大10件の転送先を一斉に呼び出せます。
・オプションの「スケジュール機能」を利用すれば、平日や休日、営業時間外など、曜日や時間に合わせて一斉呼出転送サービスの自動変更が可能。設定内容に合わせてシステム担当者に電話が転送されるため、大切な電話の取りこぼしがありません。

システム障害発生時に起こりがちな、「急いで社内システムを復旧してほしいのに、システム担当者に電話をしてもつながらない」といった事態の発生を防止できます。

6. まとめ

システムダウン時の事業継続における課題と有効な対策とは?

システムダウンによる最大のデメリットは、長期化により事業継続が低迷し、大きな不利益をもたらすことです。緊急コールの取りこぼしを防ぎます。1秒でも早く障害復旧にあたることで、システム障害の長期化を防ぎ、システムダウンを発端とする不利益を最小限に抑えることができるでしょう。

ご紹介した「転送録」一斉呼出転送サービスは、登録した複数の電話番号を一斉に呼び出すことが可能な、IP電話を活用したサービスです。

BCP対策として、システム障害復旧時の現場間連携の手段の一つとなる「転送録」を活用してみてはいかがでしょうか?

また、特定のメールだけを電話で知らせる「急コール」は、緊急時の対応遅れを防ぐツールとして障害対応を担当するシステム運営者にご利用いただいております。ぜひこちらもご覧ください。