COLUMN

死活監視はシステムの安定運用に欠かせない!理由・使いこなし方を解説

死活監視とは、システムなどを安定運用するために、機器やネットワークなどが正常に動いているかどうかを、継続してチェックすることです。死活監視の対象には、サーバーの稼働状態やネットワーク機器類などがあります。

重要なシステムが突然止まってしまうと、業務を続けられなくなる、サービスを提供できなくなるなど、大きな損失につながります。このような事故を防ぐために、異常を速やかに検知することが、死活監視の目的です。死活監視は、専用のソフトウェアを導入したり、代行サービスに依頼したりすることで、実施できます。

人間が稼働中のシステム類を常時監視しなくても、異常を早期発見することができるようになるのが、死活監視を導入する大きなメリットです。労力や人件費を最低限に抑えて、システム停止による損害を防ぐことができます。

ただし、システムを安定運用するために、死活監視のみ行っていれば安心とは言えないことに、注意が必要です。死活監視でチェックできる範囲がどこまでか、正しく理解して取り入れる必要があります。

この記事では、「死活監視とは何なのか」その意味や仕組みなど基本的な知識から、「システムの安定運用のために死活監視をどう活用すべきか」という実践的なポイントまで、解説します。

【この記事の内容】

  • 死活監視とは
  • 死活監視の実施方法
  • 死活監視は監視できる範囲が限られることに注意が必要
  • 死活監視に加えて監視すべきポイント例

後半では、死活監視に加えて監視しておくべきポイントなども、具体的にご紹介しています。

今回ご紹介する内容を把握することで、死活監視について基本的なことを理解したうえで、システムの安定運用実現のために活用できるようになるでしょう。手間を抑えて、重要なシステムを停止させることなく安定運用するためにも、ぜひ、チェックしてみてください。

1. 死活監視とは

死活監視とは、システムの機器類やネットワークなどが正常に動いているかどうかを、継続してチェックすることです。

正常に動いているかどうかは、ツールなどを使って自動で調べます。生死監視と呼ぶこともあります。

死活監視は、デジタル化が進み、障害によって停止してしまうと重大な影響が発生するシステムが増えたことで、重要性が高まっている監視作業です。

▼死活監視の目的

◎システムの異常を速やかに検知すること。これによって重要なシステムが突然止まり、業務を続けられなくなる、サービスを提供できなくなるなど、大きな損失を防ぐことができます。

現代において、Webサイトを運営する企業や業務でシステムを利用する企業にとって、死活監視の導入は必須です。実際に自社でWebサイトやシステムの運営を行っている多くの企業は死活監視を導入しています。

ここでは、死活監視が必要な理由や死活監視の対象、異常を検知するための基本的な仕組みなど、死活監視の基本について解説します。

1-1. 死活監視が必要な理由

企業に死活監視が必要な理由は、システムやネットワークなどが停止すると、大きな損害につながりかねないからです。

近年、デジタル化が進んだことで、

  • 会計管理システムや在庫管理システム、顧客管理システムなど、業務で必須のシステム
  • ECサイトなど顧客にサービスを提供するサイト

など、企業は、大事なシステムを多数使っています

万一、これらに障害が発生し停止してしまうと、生じ得るデメリットは次のとおりです。

◆重要なシステム類が停止することのデメリット例

  • 業務が滞り、作業効率や生産性が低下する
  • サービスや商品を顧客に提供できなくなり、営業機会が失われることに加え、収益が低下する
  • 安定的に業務継続やサービス提供ができない企業と認識され、顧客や取引先、投資家などの信頼を失う

以上のとおり、現代においてシステムやサイトがダウンすることは、企業にとって大きな痛手となります。

システム類の障害発生自体は完全に防ぐことはできませんが、早期発見することで、大事にならずに済ませることができるでしょう。だからこそ、異常を速やかに検知できる死活監視は、重要視されているのです。

以上のことから、死活監視は、停止すると業務や事業に影響の出るシステムがある、すべての企業が行う必要があります。

1-2. 死活監視の対象

死活監視の主な対象は、以下のとおりです。

死活監視の対象の代表例
サーバー
  • アクセス集中などによる過剰な負荷によってダウンしていないか、死活監視でチェックする
ネットワーク関連機器
  • ルーターやWi-Fiのアクセスポイントなどが、停電や故障により停止していないか確認できる
監視カメラ
  • インターネットに接続できる監視カメラ(Webカメラ)であれば、死活監視が可能
デジタルサイネージ
  • 遠隔地に設置したデジタルサイネージなども死活監視し、異常があればリモート操作で再起動をして復旧することができる

このように、死活監視は、さまざまなシステムが対象となります。ただし、監視できるのはシステム全体ではなく、その機器の稼働状態のみという部分的なものに限られる点に、注意が必要です。次項で説明しますが、監視範囲は限定的であることを覚えておきましょう。

1-3. 死活監視の監視方法

死活監視の監視方法は、大きく分けて次の2種類があります。

死活監視の監視方法
アクティブ監視
  • 代表的なのが「PING監視」
  • PING監視では、監視対象に定期的に応答を求める信号(pingコマンド、ICMPパケット)を送り続け、応答がないと異常が発生したと判断する
パッシブ監視
  • 代表的なのが「WATCHDOG機能」
  • 監視対象が継続して発信するパケットを監視し、これが一定時間途切れたときに異常が発生したと判断する

死活監視を使いこなすには、上記のような監視活動において、何をどのように確認しているのかを把握しておく必要があります。死活監視で確認した範囲では異常が認められなくても、確認していない範囲では異常がある可能性もあるからです。

2. 死活監視の実施方法

死活監視を実施する主な方法は、次の2つです。

主な死活監視の実施方法
死活監視ツールを使う
  • 無料ソフトウェア(OSS)を利用することで、コストを抑えることができる
  • 導入や運用に専門知識が必要
代行サービスに依頼する
  • 専門知識不要で、障害発生時の対応もまとめて任せることができる
  • 月々の利用料が発生するケースが多く、長期間利用する場合は注意が必要

ここでは、それぞれの方法について、もう少し詳しく説明していきます。

2-1. 死活監視ツールを使う

死活監視を実施する方法の一つ目が、死活監視ツールを使う方法です。死活監視ツールは、インターネット上で「死活監視 ツール」で検索することで、無料ソフトウェア(OSS)から有料のものまで、さまざまな種類を見つけることができるでしょう。基本的に、サイトの情報を見ながら、予算や欲しい機能を備えるツールを選ぶことになります。

死活監視ツールを利用すると、無料で死活監視を実施することが魅力です。有料には、月々費用がかかる場合と、年間ライセンス費用がかかる場合の2つのパターンが多い傾向にあります。

注意点としては、特に無料ソフトウェアの場合、導入や運用に専門知識が必要になることと、導入・運用から障害発生時の対応まで自社で行う必要があることが挙げられます。死活監視やシステムについて詳しい人材がいない場合、使いこなすのは難しいでしょう。

死活監視ツールのメリット・デメリット・向いているケース
メリット
  • コストを抑えやすい
デメリット
  • 導入や運用をするには専門知識が必要
  • 障害発生時の対応もすべて自分で行う必要がある
向いているケース
  • システム保守や死活監視に詳しい人材がいる
  • 手間はかかっても、費用を抑えたい

2-2. 代行サービスに依頼する

死活監視の実施方法のもう一つは、代行サービスに依頼することです。この場合、死活監視のみを依頼するというよりは、システムの監視や障害対応をまとめて依頼することになるでしょう。

代行サービスは、インターネット上で「死活監視 代行」で検索することで、業者を探すことができます。また、すでに業者に依頼してシステムを構築しているなら、その業者が代行サービスを行っていないか確認してみるのもよいでしょう。

代行サービスに依頼すると、導入・運用の手間がかからず、障害発生時の対応もお願いできるため、専門知識も手間も不要なのが嬉しいところです。

一方で、毎月の料金が発生する点には、注意する必要があるでしょう。監視対象の種類や台数にもよりますが、月額数万円程度の料金が発生します。詳しい料金は、各代行サービスに、依頼したい監視対象の種類・台数や監視内容などを伝えて、見積もってもらいましょう。

代行サービスのメリット・デメリット・向いているケース
メリット
  • 導入や運用の手間がかからない
  • 障害発生時の対応も任せられる
  • 専門知識不要
デメリット
  • 毎月のサービス利用料金が発生する
向いているケース
  • 死活監視やシステムの運用・保守に詳しい人材がいない
  • システムの監視や復旧に、人を割く余裕がない

3. 死活監視は監視できる範囲が限られることに注意が必要

死活監視は、障害の早期発見をするために欠かせません。しかし、システムなどを安定運用するうえで注意すべきことは、死活監視だけ行っていても、障害の早期発見対策としては不十分であるという点です。

死活監視は、システム全体を網羅的に監視するのではなく、スポット的に異常をチェックする監視手法だからです。

PING監視を例に挙げると、現在サーバーが動いているかどうかは、リアルタイムでチェックすることができますが、内部のプログラムなどまでは監視できません。

サーバーやパソコンなどのOSまでは正常でも、そのうえで動いているはずのアプリケーションに異常が発生し停止してしまえば、機能は失われてしまいます。

そのため、スポットだけ正常であることが確認できても、それだけで安心はできないのです。死活監視を含めた複数の監視を組み合わせて行うことが、システムなどを安定運用するうえで大事であることを、覚えておいてください。

4. 死活監視に加えて監視すべきポイントの例

前の章でお伝えしたとおり、システムなどを安定運用するには、死活監視を含めた複数の監視を組み合わせることが大切です。死活監視対象の代表例であるサーバー監視や、ネットワーク監視の場合は、次のような監視を組み合わせる必要があるでしょう。

死活監視に加えて監視すべきポイントの例
サーバー監視の場合
  • ログに対する監視
  • リソース利用に対する監視
ネットワーク監視の場合
  • トラフィックの監視
  • 遅延状況の監視
  • リソース利用に対する監視

それぞれ、どういう監視を組み合わせることで、安心してシステムなどを運用していける環境になるのか、以下で説明します。

4-1. サーバー監視の場合

サーバー監視で、死活監視と組み合わせて行いたい監視が、ログに対する監視とリソース利用に対する監視です。

サーバー監視で死活監視と組み合わせて行いたい監視の例
ログに対する監視
  • サーバー内の処理やエラーなどが時系列に沿って記録されたログファイルを監視する
  • 表面的な監視では見つかりにくい内部的な異常を発見できる
リソース利用に対する監視
  • CPUやメモリといったリソースの利用状況を監視する
  • 想定しているよりもリソースを多く使っているなら、負荷が高くなって停止する危険性があるので、リソースの変更などを検討する

死活監視は、サーバーという機器自体が正常に動作できているかどうかを監視するものなので、上記のような機器の内部で起きている異常を検知する監視を組み合わせることが、必要になります。

4-2. ネットワーク監視の場合

ネットワーク監視で、死活監視と組み合わせて行いたい監視が、トラフィックの監視・遅延状況の監視・リソース利用に対する監視です。

ネットワーク監視で死活監視と組み合わせて行いたい監視の例
トラフィックの監視
  • ネットワークの通信量が過剰に集中していないか監視する
  • ネットワーク内の通信内容までチェックすることができる
遅延状況の監視
  • ネットワークなどのレスポンス速度を監視する
  • アクセス状況と反応速度などをグラフ化するなどして、原因の切り分けを行う
リソース利用に対する監視
  • ネットワーク関連機器のCPUやメモリの使用状況を監視する
  • 負荷がかかり過ぎて機器がダウンしないように対策を取ることができる

死活監視は、機器類が正常に動作できているかどうかをチェックするものですが、ネットワークは通信の集中などによる過負荷によってもダウンするため、上記のような監視が必要になります。

5. 手間をかけずに安定運用できるシステムの構築なら、NTT東日本へ

「システムなどを安定運用できる環境を構築したいが、どうすればよいのかわからない」

「クラウド化で自社にメリットがあるのか知りたい」

このようにお考えでしたら、まずはNTT東日本にご相談ください。クラウドのプロによる的確なアドバイスと手厚いサポートで、手間をかけずに悩みや課題を解決することができます。

NTT東日本のクラウド導入・運用サービスは、次の3つの特長で、最適なITインフラ環境の構築やクラウドに関する困りごとの解決を徹底サポートしています。

NTT東日本のクラウド導入・運用サービス3つの特長

1. AWS・Azure認定クラウドのプロ多数在籍!中立的なアドバイスで安心

2. 見えないコストも可視化!総合的な高コストパフォーマンスを実現できる

3. 24時間365日の対応保守サポートで、手間をかけずに安定運用

  • Amazon Web Services(AWS)は、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。
  • Microsoft Azureは、Microsoft Corporationの米国及びその他の国における登録商標または商標です。

5-1. AWS・Azure認定クラウドのプロ多数在籍!中立的なアドバイスで安心

NTT東日本には、AWS(Amazon Web Services)・Microsoft Azureの認定資格者が多数在籍し、中立的な立場からご提案をさせていただいております。

例えば、次のような検討段階の疑問にも、クラウドのプロの見地から明確なご提案が可能です。

  • 自社のシステム運用環境を構築する場合に、オンプレとクラウド、コストパフォーマンスが良いのはどちらか?
  • どの社内システムからクラウド化をはじめるべきなのか?
  • AWSとAzureで、目的を達成するために必要かつベストなサービスはどれか?

無理なくコストパフォーマンスのよい方法で、安定的なシステム運用環境を構築したいとお考えなら、まずは、NTT東日本のクラウドの専門家をご活用ください。

5-2. 見えないコストも可視化!総合的な高コストパフォーマンスを実現できる

NTT東日本では、初期コストはもちろんのこと、導入開始後の保守管理や周辺環境のコストまで含めて、最適なプランをご提案しています。

例えば、

  • システム運用時にかかる人的なコスト
  • 潜在的なリスクによる機会損失

など、見逃しがちなコストもまとめて見える化します。

だから、「導入費用は安かったけれど、労力がかかった」「関係するシステムやソフトウェアの調整で、かえって高くついた」などの失敗がありません。

導入時にリーズナブルなのは当たり前、導入後や関連する部分も含めて業務全体で、総合的にコストパフォーマンスを最適化するのが、NTT東日本です。

5-3. 24時間365日の対応保守サポートで手間をかけずに安定運用

システムの運用環境やクラウドは、導入して終わりではなく使い続けるものです。だからこそ、サポート体制が重要になります。NTT東日本では、24時間365日体制で運用開始後も徹底的にサポート。しかも、「もしものとき」だけでなく「いつもの運用業務」もご支援可能です。

「システム運用環境を変更すると、運用担当者の負担が増えて大変」という事態も、NTT東日本なら無縁です。

まずは、お気軽にお話をお聞かせください。

6. まとめ

死活監視とは、システムの機器類やネットワークなどが正常に動いているかどうかを、継続してチェックすることです。

現代においてシステムやサイトがダウンすることは、企業にとって大きな痛手となります。システム類の障害発生自体は完全に防ぐことはできませんが、早期発見することで、大事にならずに済ませることができるでしょう。だからこそ、異常を速やかに検知できる死活監視は、重要視されています。

死活監視の実施方法は、次の2つです。

主な死活監視の実施方法
死活監視ツールを使う
  • 無料ソフトウェア(OSS)を利用することで、コストを抑えることができる
  • 導入や運用に専門知識が必要
代行サービスに依頼する
  • 専門知識不要で、障害発生時の対応もまとめて任せることができる
  • 月々の利用料が発生するケースが多く、長期間利用する場合は注意が必要

それぞれメリット・デメリットがあるので、一概にどちらがよいとは言えません。ただ、システムの保守管理や死活監視について詳しい人材がいないなら、代行サービスを利用しましょう。

死活監視は、監視できる範囲が限られることに注意が必要です。そのため、システムを安定運用するには、死活監視に加えて、次のような監視を組み合わせる必要があります。

死活監視に加えて監視すべきポイントの例
サーバー監視の場合
  • ログに対する監視
  • リソース利用に対する監視
ネットワーク監視の場合
  • トラフィックの監視
  • 遅延状況の監視
  • リソース利用に対する監視

システムなどを停止させないためには、異常の早期発見が欠かせません。異常の発生リスクはゼロにはできないので、死活監視を含めた監視方法を取り入れて、安定運用を実現しましょう。

ネットワークからクラウドまでトータルサポート!!
NTT東日本のクラウド導入・運用サービスを確認してください!!

ページ上部へ戻る

無料ダウンロード

自社のクラウド導入に必要な知識、ポイントを
このに総まとめ!

あなたはクラウド化の
何の情報を知りたいですか?

  • そもそも自社は本当にクラウド化すべき?オンプレとクラウドの違いは?
  • 【AWS・Azure・Google Cloud】
    どれが自社に最もマッチするの?
  • 情シス担当者の負荷を減らしてコストを軽減するクラウド化のポイントは?
  • 自社のクラウド導入を実現するまでの具体的な流れ・検討する順番は?

初めての自社クラウド導入、
わからないことが多く困ってしまいますよね。

NTT東日本では
そんなあなたにクラウド導入に必要な情報を

1冊の冊子にまとめました!

クラウド化のポイントを知らずに導入を進めると、以下のような事になってしまうことも・・・

  • システムインフラの維持にかかるトータルコストがあまり変わらない。。
  • 情シス担当者の負担が減らない。。
  • セキュリティ性・速度など、クラウド期待する効果を十分に享受できない。。
理想的なクラウド環境を実現するためにも、
最低限の4つのポイントを
抑えておきたいところです。
  • そもそも”クラウド化”とは?
    その本質的なメリット・デメリット
  • 自社にとって
    最適なクラウド環境構築のポイント
  • コストを抑えるため
    具体的なコツ
  • 既存環境からスムーズにクラウド化
    実現するためのロードマップ

など、この1冊だけで自社のクラウド化のポイントが簡単に理解できます。
またNTT東日本でクラウド化を実現し
問題を解決した事例や、
導入サポートサービスも掲載しているので、
ぜひダウンロードして読んでみてください。

クラウドのわからない・
面倒でお困りのあなたへ

クラウドのご相談できます!
無料オンライン相談窓口

NTT東日本なら貴社のクラウド導入設計から
ネットワーク環境構築・セキュリティ・運用まで
”ワンストップ支援”が可能です!

NTT東日本が選ばれる5つの理由

  • クラウド導入を
    0からワンストップでサポート可能!
  • 全体最適におけるコスト効率・業務効率の改善
    中立的にご提案
  • クラウド環境に問題がないか、
    第3者目線でチェック
    してもらいたい
  • 安心の24時間・365日の対応・保守
  • NTT東日本が保有する豊富なサービスの組み合わせで
    ”課題解決”と”コスト軽減”を両立

特に以下に当てはまる方はお気軽に
ご相談ください。

  • さまざまな種類やクラウド提供事業者があってどれが自社に適切かわからない
  • オンプレミスのままがよいのか、クラウド移行すべきなのか、迷っている
  • オンプレミスとクラウド移行した際のコスト比較を行いたい
  • AWSとAzure、どちらのクラウドが自社に適切かわからない
  • クラウド環境に問題がないか、第3者目線でチェックしてもらいたい
  • クラウド利用中、ネットワークの速度が遅くて業務に支障がでている

クラウドを熟知するプロが、クラウド導入におけるお客さまのLAN 環境や接続ネットワーク、
クラウドサービスまでトータルにお客さまのお悩みや課題の解決をサポートします。

相談無料!プロが中立的にアドバイスいたします

クラウド・AWS・Azureでお困りの方はお気軽にご相談ください。