多くの企業は、費用対効果が高く、顧客の負担が軽減されるため、クラウドコンピューティングに移行しつつあります。 このことが、モニタリングの活用に大きく起因している可能性があります。 モニタリングサービスは、リスクを事前に特定し、潜在的な損失を回避し、可能な限り迅速にトラブルシューティングするためのリアルタイムの運用データを提供します。
前提条件
始める前に、以下の操作を完了する必要があります。
- ECS モニタリングエージェントがメトリックデータを収集するために機能していることを確認します。 それ以外の場合は、エージェントを手動でインストールする必要があります。 詳細については、「CloudMonitor エージェントのインストール方法」をご参照ください。
- アラーム連絡先と連絡先グループを追加します。 モニタリングアラームに対するリアルタイムの応答を確実にするために、少なくとも 2 つの連絡先を追加することを推奨します。 メトリクスの詳細については、「クラウドサービスの概要とアラームの概要」をご参照ください。
- CloudMonitor ダッシュボードを使用すると、リソース使用率と運用状態についてシステム全体の状況を把握することができます。 メトリクスディメンションを選択できます。
インスタンスが複数ある場合のみ、インスタンスごとのメトリクスディメンションを選択できます。
それ以外の場合は、ECS グループディメンションまたはユーザーディメンションを選択して、平均値を選択できます。
アラームしきい値の設定
業務の状況に応じて、アラームしきい値を設定することを推奨します。 しきい値が低すぎると頻繁にアラームが作動し、モニタリングが無意味になる可能性がありますが、しきい値が高すぎると、主要なイベントに応答する時間がなくなる可能性があります。
アラームのルールの設定
例として CPU 使用率を取り上げます。 次の図に示すように、正常な機能を保証するためにある程度の処理能力を確保する必要があるため、しきい値を 70% に設定し、しきい値を 3 回連続で超えた場合にアラームが作動するようにできます。
プロセスモニタリングの設定
Web アプリケーションの場合、 プロセスのモニタリングを追加することができます。 詳細については、「プロセスのモニタリング」をご参照ください。
サイトのモニタリングの設定サイトのモニタリングは、可用性をテストするためにネットワークアクセス層で行われます。
RDS モニタリングの設定RDS CPU 使用率アラームしきい値を 70% に設定し、しきい値を 3 回連続で超えた場合にアラームが作動するようにすることを推奨します。 必要に応じて、ディスク使用率、IOPS 使用率、合計接続数などのメトリクスを設定できます。
Server Load Balancer モニタリングの設定
始める前に、Server Load Balancer インスタンスのヘルスチェックを有効にしていることを確認してください。
必要なメトリクスがカバーされていない場合は、カスタマイズモニタリングメトリクスを使用できます。