サービスレイテンシ、フェイルオーバーレート、読み書き RPS メトリックスなどをモニターすることで、CloudMonitor はご利用中の StreamCompute サービスの全体的なパフォーマンスの把握に役立ち、それに応じたアラームルールを設定できます。CloudMonitor は 本プロダクトの利用を開始した時から、StreamCompute から自動的にデータを収集します。

モニタリングサービス

  • メトリックス
    メトリック ディメンション 単位 説明 最小モニタリング頻度
    サービスレイテンシ プロジェクト、ジョブ 現在のジョブのデータプロセスレイテンシ 1 分
    読み取り RPS プロジェクト、ジョブ 読み取り/秒 タスクで 1 秒あたりに読み取るデータラインの平均数 1 分
    書き込み RPS プロジェクト、ジョブ 書き込み/秒 タスクで 1 秒あたりに書き込むデータラインの平均数 1 分
    フェイルオーバーレート プロジェクト、ジョブ % 現在のジョブのフェイルオーバー頻度の合計 1 分
    • モニタリングデータは、31 日間保存されます。 連続 14 日分のモニタリングデータを表示することができます。
  • モニタリングデータの表示
    1. CloudMonitor コンソールにログインします。
    2. [クラウドサービスモニタリング] にある [StreamCompute] インスタンスリストへ移動します。
    3. インスタンス名をクリックするか、または [アクション] 列の [モニタリングチャート] をクリックして、インスタンスモニタリング詳細ページへアクセスし、さまざまなメトリックスを表示します。
    4. ページの上部メニューにある [時間範囲] クイック選択ボタンをクリックするか、または特定の選択機能を使います。 連続 14 日分のモニタリングデータを表示することができます。
    5. モニタリングチャートの右上隅にある [ズームイン] をクリックして、チャートを拡大表示します。

アラームサービス

  • パラメーター
    • メトリックス: StreamCompute から取得されるモニタリングメトリックス
    • 統計サイクル: アラームシステムがモニタリングデータがアラームしきい値を超えているかどうかをチェックする頻度を示します。 たとえば、メモリ使用量に関するアラームルールの統計周期が 1 分に設定されている場合、システムはメモリ使用量が 1 分おきにしきい値を超えたかどうかを確認します。
    • 統計方法: 計算方法とその結果値を使ってデータがアラームルールで指定されたしきい値を超えたかどうかを判断します。統計方法では、平均、最大、最小、合計を設定できます。 たとえば、15 分間の統計期間中に、メモリ使用量などのメトリックの 80% の平均を、アラームがトリガーされるしきい値として指定できます。
      • 平均値: 統計サイクル内のモニタリングデータの平均値 たとえば、15分以内に収集されたすべてのモニタリングデータの平均値が統計方法として採用されている場合、80% を超える平均値がしきい値を超えていると見なされます。
      • 最大値: 統計サイクル内のモニタリングデータの最大値 たとえば、15 分以内に収集されたすべてのモニタリングデータの最大値が統計方法として採用されている場合、80% を超える最大値がしきい値を超えると見なされます。
      • 最小値: 統計サイクル内のモニタリングデータの最小値 たとえば、15 分以内に収集されたすべてのモニタリングデータの最小値が統計方法として採用されている場合、80% を超える最小値がしきい値を超えていると見なされます。
      • 合計値: 統計サイクル内のモニタリングデータの合計 たとえば、15 分以内に収集されたすべてのモニタリングデータの合計値が統計方法として採用されている場合、80% を超える合計値がしきい値を超えていると見なされます。 この方法はトラフィックメトリックに必要です。
    • 連続回数: メトリック値が、設定された連続サイクルの間、しきい値を継続的に超えると、アラームがトリガーされます。 たとえば、連続回数が 3 に設定されている場合、アラームがトリガーされる前に、アラームルールに指定された条件が3 回連続した統計サイクルで満たされる必要があります。

      たとえば、CPU 使用率が 3 回連続して 5 分間の統計サイクルでしきい値の 80% を超えるとアラームが発生するように設定したとします。 つまり、CPU 使用率が初めて 80% を超えたことが判明してもアラームは発生しません。 5 分後の2 回目の検出で CPU 使用率が再び 80% を超えた場合も、アラームは発生しません。 3 回目の検出で CPU 使用率が再び 80% を超えると、アラームがトリガーされます。 したがって、実際のデータが最初にしきい値を超えてからアラームルールがトリガーされるまでの間に消費される最小時間は次のとおりです。統計的サイクル (連続検出数-1) 、つまり 5 (3 - 1) = 10 分です。

  • アラームルールの設定
    1. CloudMonitor コンソールにログインします。
    2. [クラウドサービスモニタリング] にある [StreamCompute] インスタンスリストへ移動します。
    3. インスタンス名をクリックするか、または [アクション] 列の [モニタリングチャート] をクリックします。
    4. モニタリングチャートの右上隅にある [ベル] アイコン、またはページ右上隅にある [新しいアラームルール] をクリックし、このインスタンスに対応するメトリックのアラームルールを設定します。
  • 複数のアラームルールの設定
    1. CloudMonitor コンソールにログインします。
    2. [クラウドサービスモニタリング] にある [StreamCompute] インスタンスリストへ移動します。
    3. インスタンスリストページで適切なインスタンスを選択します。 [アラームルールの設定] をクリックして複数のアラームルールを追加します。