アラームサービスは、測定値の例外を簡単に検出して障害を迅速にトラブルシューティングできるように、アラームをモニターするための強力な機能を提供します。

パラメーターの説明

  • プロダクト: ECS、 RDS、 OSS などが含まれます。
  • リソース範囲: アラームルール適用の範囲です。 使用できるアラームルールの範囲には、[すべてのリソース][アプリケーショングループ][インスタンス] の 3 つがあります。 [リソース範囲][すべてのリソース] に設定すると、最大 1000 のリソースに対してアラームを報告できます。 リソースの数が 1000 を超える場合、リソースの中には、アラームに設定されたしきい値を超えても、アラームの報告ができないものがあります。 したがって、この問題を回避するために、アラームルールを設定する前に、アプリケーショングループを使用してリソースをサービス別に分割することを推奨します。
    • すべてのリソース: 指定されたアラームルールがユーザーのすべてのインスタンスに適用されます。 たとえば、リソース範囲をすべてのリソースに設定し、MongoDB CPU 稼働率のアラームしきい値を 80% に設定した場合、MongoDB インスタンスの CPU 稼働率が 80% を超えるとアラームがトリガーされます。
    • アプリケーショングループ: 指定されたルールがアプリケーショングループのすべてのインスタンスに適用されます。 たとえば、リソース範囲をアプリケーショングループに設定し、ホスト CPU 稼働率のアラームしきい値を 80% に設定した場合、ホストインスタンスの CPU 稼働率が 80% を超えるとアラームがトリガーされます。
    • インスタンス: 指定されたルールは特定のインスタンスにのみ適用されます。 たとえば、リソース範囲をインスタンスに設定し、ホスト CPU 稼働率のアラームしきい値を 80% に設定した場合、指定したインスタンスの CPU 稼働率が 80% を超えるとアラームがトリガーされます。
  • アラームルール: アラームルール名です。
  • ルールの内容: 関連する測定値のアラーム発生条件または値のしきい値を定義するアラームルールの主な内容です。 たとえば、ルールを [1 分間の平均 CPU 稼働率が 90%以上] と記述した場合、アラームサービスは毎分、1 分以内の平均測定値が 90% 以上になるかどうかを確認します。

    次の例をご検討ください。 ホストモニタリングのアラームサービスの場合、1 つのサーバー測定項目により、15 秒に 1 データポイント、5 分に 20 データポイントが報告されます。 これは以下のアラームルールに関連しています。

    • 5 分間の平均 CPU 稼働率 が 90%以上: 5 分間 20 データポイントで平均 CPU 稼働率が 90% を超えることを示します。
    • 5 分間の CPU 稼働率が常に 90%を超える: 5 分間 20 データポイントですべての CPU 稼働率が 90% を超えることを示します。
    • 5 分間の CPU 稼働率 が一度 90%を超える: 5 分間 20 データポイントで少なくとも 1 回は CPU 稼働率が 90% を超えることを示します。
    • 5-分間のインターネット送信トラフィックの合計が 50 MB を超える: 5 分間 20 データポイントの送信トラフィック値の合計が 50 MB を超えることを示します。
  • しきい値を超過したらトリガー: 検出された値がアラームルールのしきい値に連続して複数回達すると、アラーム通知が送信されます。
  • 有効期間: アラームルールが有効である期間。 アラームサービスは測定値をチェックし、この期間中にのみアラームを生成するかどうかを決定します。
  • アラーム 送信先: アラーム通知を受け取る送信先のグループ。
  • 通知方法: アラームレベルごとに別々の通知方法を利用できます。 [重大][警告][通知] という 3 つのアラームレベルが利用可能です。
    • 重大: 音声通話、SMS メッセージ、メール、および DingTalk チャットボット
    • 警告: SMS メッセージ、メール、および DingTalk チャットボット
    • 通知: メールおよび DingTalk チャットボット
  • Email Remark: アラームメール用にカスタマイズされた補足情報 備考はアラーム通知メールの一部として送信されます。

アラームルールの管理

CloudMonitor には、アラームサービスのアプリケーショングループページ、測定値リストページ、アラームルールリストページという、3 つのアラームルール管理ポータルがあります。
  • アプリケーショングループでのアラームルールの管理については、「アラームルールの管理」をご参照ください。
  • ホストモニタリングでのアラームルールの管理については、 「アラームルールの管理」をご参照ください。
  • カスタムモニタリングでのアラームルールの設定については、「アラームルールの設定」をご参照ください。
  • クラウドサービスモニタリングでアラームルールを設定することもできます。