ホストモニタリングのメトリクスは、エージェント収集メトリクスと ECS ネイティブメトリクスに分けられます。 エージェント収集メトリクスは 15 秒ごとに収集され、ECS 基本メトリクスは 1 分ごとに収集されます。

ECS 基本メトリックデータは、主に次の理由により、OS (オペレーティングシステム) メトリックデータと矛盾する可能性があります。
  • 異なる統計頻度メトリックグラフデータには、測定期間中に収集された平均値があります。 基本モニタリングの統計頻度は 1 分ですが、OS モニタリングの統計頻度は 15 秒です。 メトリックデータの変動が大きい場合、基本メトリックデータは OS メトリックデータよりも小さくなります。これは、前者のデータがピークを外れているためです。
  • さまざまな統計観点 基本モニタリングのネットワークトラフィック請求データには、ECS と Server Load Balancer 間の未請求ネットワークトラフィックは含まれません。 一方、OS モニタリングのネットワークトラフィック統計は、各ネットワークアダプターの実際のネットワークトラフィックを記録します。 したがって、OS モニタリングのネットワークデータは基本モニタリングのネットワークデータよりも大きくなります (つまり、エージェントが収集したデータは、実際に購入した帯域幅またはトラフィッククォータよりも大きくなります)。

エージェントで収集されるメトリクス

  • CPU のメトリクス

    メトリクスの意味を理解するには、Linux の top コマンドをご参照ください。

    メトリック 定義 単位 備考
    Host.cpu.idle 現在アイドル状態の CPU の割合 % 現在の CPU のアイドル割合
    Host.cpu.system CPU として使用されている現在のカーネル空間の割合 % このメトリックは、システムコンテキストの切り替えによる消費量を測定します。 値が大きい場合は、多くのプロセスまたはスレッドがサーバー上で実行されていることを示します。
    Host.cpu.user このメトリックは、ユーザープロセスの CPU 消費量を測定します。 % ユーザプロセスによる CPU 消費
    Host. CPU iowait 現在 IO 操作を待機している CPU の割合 % これは比較的高い値であり、これは頻繁に IO 操作が行われることを意味します。
    Host.cpu.other その他の CPU 使用率 % その他の消費量、(Nice + sofpratt q + IRQ +stolen) の形式で計算されます。
    Host.cpu.totalUsed 現在消費されている合計 CPU の割合 % 上記の CPU 使用量の合計。通常はアラーム用に使用されます。
  • メモリ関連モニター

    インジケーターの意味を理解するには、free コマンドをご参照ください。

    メトリクス 定義 単位 説明
    Host.mem.total 総メモリ バイト サーバーメモリ合計
    Host.mem.used 使用メモリ量 バイト ユーザプログラムが使用するメモリ+バッファ+ キャッシュ、バッファに使用されるメモリ量、およびキャッシュによって使用されるシステムキャッシュに使用されるメモリ量
    Host.mem.actualused ユーザーが実際に使用しているメモリ バイト 計算式: (使用済み - バッファー - キャッシュ済み)
    Host.mem.free メモリ残量 バイト (合計メモリ - 使用されているメモリの量) として計算
    Host.mem.freeutilization メモリ残量の割合 % (メモリ残量 / メモリ総量 × 100) として計算
    Host.mem.usedutilization メモリ使用量 % (実際の使用量/合計 × 100) として計算
  • 平均システム負荷のメトリクス

    メトリクスの意味を理解するには、Linux の top コマンドをご参照ください。 モニタリング項目の値が大きいほど、システムがよりビジーであることを示します。

    メトリクス 定義 単位
    Host.load1 過去 1 分間の平均システム負荷で、Windows オペレーティングシステムにはこのメトリックはありません なし
    Host. load5 過去 5 分間の平均システム負荷で、Windows オペレーティングシステムにはこのメトリックはありません なし
    Host. load15 過去 15 分間の平均システム負荷で、Windows オペレーティングシステムにはこのメトリックはありません なし
  • ディスク関連のメトリクス
    • ディスク使用量と i ノード使用量は、Linux の DF コマンドをご参照ください。
    • ディスク読み取り/書き込みメトリクスは、Linux の iostat コマンドをご参照ください。
    • メトリック 定義 単位
      Host.diskusage.used ディスク上の使用済み記憶域 バイト
      Host.disk.utilization ディスクの使用状況 %
      Host.diskusage.free ディスク上の残りの記憶域 バイト
      Host.diskussage.total 総ディスク容量 バイト
      Host.disk.readbytes 1 秒間にディスクによって読み取られたバイト数 バイト/秒
      Host.disk.writebytes 1 秒間にディスクに書き込まれたバイト数 バイト/秒
      Host.disk.readiops 1 秒当たりのディスクへの読み取り要求数 回/秒
      Host.disk.writeiops 1 秒当たりのディスクへの書き込み要求数 回/秒
  • ファイルシステムモニター
    メトリクス 定義 単位 説明:
    Host.fs.inode i ノード 使用率、Unix / Linux システムでは、ファイルを識別するために i ノード 番号が使用され、ディスクには空きがあります。 ただし、i ノード が割り当てられると新しいファイルをディスクに作成できなくなります。Windows オペレーティングシステムにはこのメトリックはありません。 % i ノード 番号はファイルシステムファイルの数を表し、小さなファイルが多数あると i ノード の使用量が高くなりすぎることがあります。
  • ネットワーク関連のメトリクス
    • TCP 接続の収集については、Linux の iftop コマンドと SS コマンドをご参照ください。
    • TCP 接続数はデフォルトで収集されます。 デフォルトでは、TCP_TOTAL (総接続数)、ESTABLISHED (通常は確立された接続数)、および NON_ESTABLISHED (確立された状態にない接続数) ごとに、TCP 接続数に関する統計が収集されます。 各状態の接続数を取得する場合は、次の手順を実行します。
      • Linux

        設定ファイル "cloudmonitor/config/conf.properties" の netstat.tcp.disable false に設定して、データ収集を有効にします。 設定を変更したら、エージェントを再起動してください。 設定を変更したら、エージェントを再起動してください。

      • Windows

          設定ファイル "C:\”Program\Alibaba\cloudmonitor\config" の netstat.tcp.disablefalse に設定して、データ収集を有効にします。 設定を変更したら、エージェントを再起動してください。

    メトリック 定義 単位
    Host.netin.rate 1 秒間にネットワークアダプターのアップリンク帯域幅によって受信されたビット数 ビット/秒
    Host.netout.rate 1 秒間にネットワークアダプターのダウンリンク帯域幅によって送信されたビット数 ビット/秒
    Host.netin.packages 1 秒間にネットワークアダプターが受信したパケット数 パケット/秒
    Host.netout.packages ドライブによって検出された着信エラーパケットの数 パケット/秒
    Host.netin.errorpackage ドライブによって検出された発信エラーパケットの数 パケット/秒
    Host.netout.errorpackages ドライブによって検出された発信エラーパケットの数 パケット/秒
    Host.tcpconnection LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED など、さまざまな状態の TCP 接続の数
  • プロセスのメトリクス
    • プロセス固有の CPU 使用率とメモリ使用率の詳細については、Linux の top コマンドをご参照ください。 CPU 使用率は、複数のカーネルの CPU 消費量を示します。
    • Host.process.openfile については、Linux の lsof コマンドをご参照ください。
    • Host.process.number については、Linux の ps aux | grep 'keyword' コマンドをご参照ください。
    メトリック 定義 単位
    Host.process.cpu プロセスの CPU 使用率 %
    Host.process.memory プロセスのメモリ使用量 %
    Host.process.openfile プロセスによって開かれたファイルの数 ファイル
    Host.process.number 指定されたキーワードに一致するプロセスの数 プロセス

ECS のメトリクス

ホストが ECS サーバーの場合、ECS インスタンスを購入すると、エージェントをインストールしなくても以下のメトリクスが提供されます。 収集粒度は 1 分です。

メトリック 定義 単位
ECS.CPUUtilization CPU 使用率 %
ECS.InternetInRate インターネットインバウンドトラフィックの平均レート ビット/秒
ECS.IntranetInRate イントラネットインバウンドトラフィックの平均レート ビット/秒
ECS.InternetOutRate インターネットアウトバウンドトラフィックの平均レート ビット/秒
ECS.IntranetOutRate イントラネットアウトバウンドトラフィックの平均レート ビット/秒
ECS.SystemDiskReadbps 1 秒間にシステムディスクから読み取られたバイト数 バイト/秒
ECS.SystemDiskWritebps 1 秒間にシステムディスクに書き込まれたバイト数 バイト/秒
ECS.SystemDiskReadOps 1 秒間にシステムディスクからデータが読み取られた回数 回/秒
ECS.SystemDiskWriteOps 1 秒間にデータがシステムディスクに書き込まれた回数 回/秒
ECS. internetin インターネットインバウンドトラフィック バイト
ECS.InternetOut インターネットアウトバウンドトラフィック バイト
ECS.IntranetIn イントラネットインバウンドトラフィック バイト
ECS.IntranetOut イントラネットアウトバウンドトラフィック バイト