Log Service のアラームルールは、CloudMonitor で設定します。Log Service のステータスが設定したアラームルールに適合すると、SMS または電子メールでアラームが送信されます。CloudMonitor コンソールより Log Service をモニタリングするアラームルールを設定し、Logtail のログ収集状況、シャード使用状況、およびプロジェクトの書き込みトラフィックをモニタリングします。

手順

CloudMonitor コンソールで、Logstore の右側のCloudMonitor コンソール >  Log Serviceアラームルールをクリックし、右上隅の新規アラームルールをクリックします。

  1. 関連リソースを設定します
    1. 製品ドロップダウンリストより、Log Serviceを選択します。
    2. リソースの範囲を選択します。

      すべてのリソースアプリケーショングループ、またはプロジェクト単位のいずれかを選択します。

      • すべてのリソース - Log Service インスタンスがアラームルールに適合すると、アラーム通知は送信されます。
      • アプリケーショングループ - アプリケーショングループ内のインスタンスがアラームルールに適合した場合にのみ、アラーム通知は送信されます。
      • プロジェクト単位 - 選択したインスタンスがアラームルールに適合した場合にのみ、アラーム通知は送信されます。
    3. リージョンを選択します。
    4. プロジェクトおよびLogstoreを選択します。プロジェクトおよび Logstore は複数選択できます。
    図 1. 関連リソース


  2. アラームルールを設定します。

    アラームルールは複数設定できます。

    1. アラームのルール名を入力します。
    2. ルールの詳細を設定します。

      モニタリングポリシーを定義します。モニタリング項目を選択し、モニタリング項目にしきい値を設定します。しきい値を超えると、CloudMonitor よりアラーム通知が送信されます。

      各モニタリング項目の詳細については、「Log Service モニタリングメトリック」をご参照ください。統計方法の詳細については、「Log Service のモニタリング」をご参照ください。

    3. alarm_typeを選択します。デフォルトでは、any alarm_typeが選択されています。
    4. ミュート時間を設定します。ミュート時間とは、アラーム通知を送信したにもかかわらず、依然として異常が検出される場合に、前回のアラーム送信からアラームが再送信されるまでの時間を指します。
    5. しきい値を超えた場合にトリガードロップダウンリストより数値を選択します。指定したしきい値を超過すると、つまり、指定回数連続してルールに適合した場合に、アラームは送信されます。
    6. モニタリングポリシーの有効期間を選択します。モニタリングアラームポリシーは、選択した期間内のみ有効です。
    図 2. アラームルールの設定


  3. 通知方法を設定します。
    1. 通知の送信先 - 送信先グループに通知を送信します。
    2. アラームレベル - 警告または情報を選択します。レベルによって通知方法は異なります。
    3. 通知対象注釈 - デフォルトでは、通知対象は製品名 + モニタリング項目名 + インスタンス ID です。
    4. HTTP コールバック - インターネットからアクセスできる URL を入力します。CloudMonitor は、ここで指定するアドレスに POST リクエストでアラーム通知をプッシュします。現時点では、HTTP プロトコルのみを使用できます。
    図 3. 通知方法


設定したら完了をクリックし、モニタリングポリシーの設定を完了します。

Logtail のログ収集状況をモニタリング

Logtail の稼働中に、ログフォーマットが一致しない、何度も収集されるログファイルがある、といった設定が不適切なために発生するエラーがあります。詳細については、Logtail のよくある質問をご参照ください。エラーを適時に検出できるよう、処理されなかった行や Logtail のエラー数といったメトリックでモニタリングします。

モニタリングルールの設定方法は、以下のとおりです。

アラームルール名を入力し、ルールの説明を設定します。処理されなかった行またはエラー数を選択します。統計期間や方法といったルールを設定します。Logtail のその他のエラーを基にアラームルールを設定することもできます。ログ収集エラーを適時に特定することができます。

下図の例では、5 分以内に 1 回以上接続に失敗するとアラームが送信されます。モニタリング時間は 24 時間です。
図 4. Logtail のログ収集ステータスのモニタリング


シャードの使用状況をモニタリング

Logstore の各シャードは、最大 5 MB/秒 (毎秒 500 回) で書き込まれ、通常は、これで十分です。上限を超えた場合、 Log Service はリクエストを拒否せずに、処理を試みますが、トラフィックピーク時に上限を超えたデータは保証されません。こういった状況を検出するには、Logstore の送信トラフィックおよび受信トラフィックに対してアラームルールを設定します。ログのデータ量が多く、シャードを増やす必要がある場合は、適当なタイミングでコンソールのシャード数を調整します。

Logstore トラフィックのアラームルールを設定する方法は、以下のとおりです。

解決策 1: トラフィックにアラームルールを設定する

アラームルール名を入力します。生データのサイズを選択します。統計期間と方法を設定します。たとえば、100 GB/5 分を超えた場合にアラームが送信されるようにするには、ルールを 5 分合計> =、および 102400 に設定します。5 分以内の合計トラフィックが 102400 MB を超えた場合にアラームは送信されます。
図 5. トラフィックアラートを設定


解決策 2: サービスステータスに関するアラームルールを設定する

アラームルール名を入力します。サービスステータスを選択します。統計期間と方法を設定します。たとえば、サービスステータス「403」が 5 分以内に 2 回以上発生した場合にアラームが送信されるようにするは、ルールを 5 分数値>= および 1 を指定し、ステータス欄に 403 と入力します。
図 6. サービスステータスアラームの設定


プロジェクトの書き込みトラフィックをモニタリング

プログラムエラーによって大量のログを生成されないよう、各プロジェクトの書き込み上限は 30 GB/分 (生データのサイズ) に設定されています。通常は、これで十分ですが、ログが大量にある場合には、書き込み上限を超える可能性があります。アップグレードする場合は、チケットを起票し、サポートセンターにお問い合わせください。

プロジェクトクォータのモニタリングポリシーの設定は、下図のとおりです。

5 分以内の書き込みトラフィックが 150 GB を超えると、アラーム通知が送信されます。
図 7. プロジェクトの書き込みトラフィックのモニタリング