ディスク使用量、IOPS 使用量、接続使用量、CPU 使用量など、リレーショナルデータベースサービス (RDS) 用の ApsaraDB の複数の測定値を監視することで、CloudMonitor は RDS の実行状態をモニターするのに役立ちます。 CloudMonitor は、RDS サービスを購入すると自動的に RDS の測定データを収集します。

  • RDS は、マスターおよび読み取り専用インスタンスに対してのみモニタリングおよびアラームサービスを提供します。
  • RDS サービスを購入すると、CloudMonitor は各マスターインスタンスと読み取り専用インスタンスに対して次の 4 つのアラームルールを自動的に作成します。CPU 使用率 > 80%、接続使用率 > 80%、IOPS 使用率 > 80%、ディスク使用率 > 80% アラーム通知は、アラームルールのしきい値を超えたときに SMS メッセージや電子メールを通じてアラーム送信先に送信されます。

モニタリングサービス

  • 測定値
    測定値 説明 ディメンション 単位 最小モニタリング頻度
    Disk Usage RDS インスタンス内のディスク使用量のパーセンテージです。 インスタンス % 5 分
    IOPS Usage RDS インスタンス内の IOPS 使用率です。 インスタンス % 5 分
    Connections Usage 全接続のうちプログラムが RDS インスタンスとのアクティブな接続を行なったパーセンテージです。 インスタンス % 5 分
    CPU Usage RDS インスタンス (CPU パフォーマンスはデータベースメモリのサイズで決定します) が消費した CPU のキャパシティのパーセンテージです。 インスタンス % 5 分
    Memory Usage RDS インスタンス内で使用されているメモリのパーセンテージです。 現状では、メモリ使用率測定値は MySQL データベースでのみサポートされます。 インスタンス % 5 分
    Read-only Instance Delay MySQL 読み取り専用インスタンスのレイテンシです。 インスタンス 5 分
    Network Inbound Traffic 毎秒のインスタンスへのインバウンドトラッフィックです。 インスタンス bit/s 5 分
    Network Outbound Traffic 毎秒のインスタンスからのアウトバウンドトラフィックです。 インスタンス bit/s 5 分
    RDS Fault アラームルールが設定できるイベントタイプの測定値です。 N/A N/A N/A
    RDS Master/Slave Instance Switch アラームルールが設定できるイベントタイプの測定値です。 N/A N/A N/A

    インバウンドとアウトバウンドのトラフィック測定は MySQL と SQLServer データベースでのみサポートされます。

  • モニタリングデータの表示
    1. CloudMonitor コンソールにログインします。
    2. 左側のナビゲーションウィンドウで、[Cloud Service モニタリング] > [ApsaraDB for RDS] を選択します。
    3. 対象となる RDS インスタンスのあるリージョンを選択し、対象のインスタンスを選びます。
    4. インスタンス名をクリックするか、 [アクション] 列から [グラフのモニタリング] を選択して [グラフのモニタリング] ページにアクセスします。
    5. 他のグラフビューに変更するには、ページの左上の [グラフ表示] ボタンをクリックします。

アラームサービス

  • アラームルールの設定
    1. CloudMonitor コンソールにログインします。
    2. 左側のナビゲーションウィンドウで、[Cloud Service モニタリング] > [ApsaraDB for RDS] を選択します。
    3. 対象となる RDS インスタンスのあるリージョンを選択し、対象のインスタンスを選びます。
    4. インスタンス名をクリックするか、 [アクション] 列から [アラームルール] をクリックして、[アラームルール] ページにアクセスします。
    5. 表示されたページの右上隅にある [アラームルールの作成] をクリックします。
    6. 次の説明に従ってパラメーターを設定し、[確認] をクリックします。
  • パラメーター
    • プロダクト: ECS、 RDS、 OSS、 その他
    • リソース範囲: アラームルールが適用される範囲 [すべてのリソース][インスタンス] が利用可能です。
      • すべてのリソース: アラームルールはユーザーのすべての RDS インスタンスに適用されることを意味します。 たとえば、リソース範囲を [すべてのリソース] に設定し、CPU 使用率 80% をアラームしきい値に設定した場合、RDS インスタンスのどれかの CPU 使用率が 80% を超えるとアラームがトリガーされます。 [すべてのリソース] を選択した場合、1000 個までのリソースのアラームをレポートできます。 リソースの数が 1000 を超えるとアラームルールでしきい値を設定していてもいくつかのリソースのアラームはレポートされません。 そのため、この問題を避けるためにアラームルールを設定する前にアプリケーショングループを使用してサービスごとのリソースの分割を行うことを推奨します。
      • インスタンス: 指定されたルールが特定のインスタンスにのみ適用されることを意味します。 たとえば、リソース範囲を [インスタンス] に設定し、CPU 使用率 80% をアラームしきい値に設定した場合、特定の RDS インスタンスの CPU 使用率が 80% を超えるとアラームがトリガーされます。
    • アラームルール: アラームルール名
    • ルールの説明: 関連測定値のアラームをトリガーする条件、しきい値を設定する主なアラームルールの内容 たとえば、アラームルールを [5 分間の平均 CPU 使用率 >=90%] と記述した場合、アラームサービスは 5 分ごとに CPU 使用率の 5 分間の平均値が 90% に達するか超えるかを確認します。

      次の例をご参照ください。 ホストモニタリングのアラームサービスでは 1 つのデータポイントは単一のサーバー測定値に対して 15 秒で報告され、5 分で 20 データポイントとなります。 これは次のアラームルールに関連します。

      • 5 分間の平均 CPU 使用率 > 90%: 5 分間の 20 データポイントで平均 CPU 使用率が 90% を超えることを示します。
      • 5 分間の常時 CPU 使用率 > 90%: 5 分間の 20 データポイントで CPU 使用率が常に 90% を超えることを示します。
      • 5 分間の一度の CPU 使用率 > 90%: 5 分間の 20 データポイントで CPU 使用率が少なくとも 1 回は 90% を超えることを示します。
      • 5 分間の合計インターネット送信トラフィック > 50 MB: 5 分間の 20 データポイントにおける合計送信トラフィックが 50MB を超えることを示します。
    • ミュート期間: アラームがミュートされ、アラーム送信先がアラーム通知を受け取らない期間 アラームルールは 24 時間 (1 日) ミュートすることができます。
    • しきい値が超えられたときにトリガー: 連続して一定の回数以上アラームルールのしきい値を超えた場合にアラーム通知を送信
    • 有効期間: アラームルールが有効な期間 この期間はアラームサービスは測定値を確認してアラームを生成するかを決定します。
    • 通知連絡先: アラーム通知を受け取るグループ
    • 通知方法:
      • メール、 DingTalk チャットボット
    • メールの件名: デフォルトでは、メールの件名はプロダクト名、測定値、関連するインスタンス ID
    • メールの備考: カスタマイズされたアラームメール用の追加情報 アラーム通知メールの本文の一部として送信されます。
    • HTTP コールバック: CloudMonitor がインターネット経由で POST 要求にてアラーム情報をプッシュできる URL を入力 現時点では HTTP にのみ対応しています。