メトリックの詳細については、Log Service のモニタリングをご参照ください。

  1. 読み込み/書き込みトラフィック
    • 説明: Logstore からの読み取り/ Logstore への書き込みのデータトラフィック量。iLogtail、SDK、および API を介して、指定された Logstore への書き込み、Logstore から読み込みデータのトラフィック量の統計情報がリアルタイムに生成されます。トラフィック量とは、転送されたデータ (または圧縮データ) 量のことです。
    • 単位: Byte/分
  2. Raw データサイズ
    • 説明: 各 Logstore に書き込まれた Raw データの量 (圧縮前)
    • 単位: Byte/分
  3. 合計 QPS
    • 説明: すべての操作の QPS
    • 単位: 件/分
  4. 操作件数
    • 説明: さまざまな操作タイプの QPS の数
    • 単位: 件/分
    • モニタリングできる操作は、以下のとおりです。
      • 書き込み
        • PostLogStoreLogs: API 0.5 以降
        • PutData: API 0.4 以前
      • キーワードクエリ
        • GetLogStoreHistogram: キーワードクエリの分布 (API 0.5 以降)
        • GetLogStoreLogs: キーワードクエリにマッチしたログ数 (API 0.5 以降)
        • GetDataMeta: GetLogStoreHistogram と同様 (API 0.4 以前)
        • GetData: GetLogStoreLogs と同様 (API 0.4 以前)
      • データの一括読み取り
        • GetCursorOrData: カーソルまたはデータを一括して読み取る
        • ListShards: Logstore のすべてのシャードを読み取る
      • リスト
        • ListCategory: ListLogStore と同様 (API 0.4 以前)
        • ListTopics: Logstore のすべてのトピックを読み取る
  5. サービスステータス
    • 説明: すべての操作の応答 HTTP ステータスコードの QPS 統計が表示されます。迅速に、応答エラーコードに基づいて例外の発生した操作を応答エラーコードに特定し、プログラムを修正することができます。
    • ステータスコード
      • 200: 正常に処理されたことを示します。
      • 400: Host、Content-length、APIVersion、RequestTimeExpired、query time range、 Reverse、AcceptEncoding、AcceptContentType、Shard、Cursor、PostBody、Parameter、ContentType のいずれかのパラメーターによって発生したエラーです。
      • 401: 認証に失敗したことを示します。AccessKey ID が存在しない、AccessKey Secret が一致しない、または認証に使用したアカウントに権限がありません。Log Service コンソールより、プロジェクトのアクセス許可リストに AccessKey が含まれているかどうかを確認します。
      • 403: 設定上限を超えていることを示します。Logstore の数、シャードの数、または、1 分あたりの読み取り/書き込み処理が上限を超えました。応答メッセージを基にエラーを特定します。
      • 404: リクエストされたリソース (プロジェクト、Logstore、トピック、またはユーザー) が存在しないことを示します。
      • 405: 指定されたメソッドが不適切であったことを示します。リクエスト URL を確認します。
      • 500: Log Service エラーを示します。 もう一度お試しください。
      • 502: Log Service エラーを示します。 もう一度お試しください。
  6. Logtail の正常に解析したたトラフィック量
    • 説明: Logtail によって正常に収集されたログのサイズ (生データ)
    • 単位: Byte
  7. Logtail の正常に解析した行数
    • 説明: Logtail によって正常に収集されたログの数
    • 単位: 行
  8. Logtail の解析に失敗した行数
    • 説明: エラーが発生したために Logtail によって収集されなかった行数
    • 単位: 行
  9. Logtail のエラー発生件数
    • 説明: Logtail のログ収集時にエラーの発生した IP アドレスの数
    • 単位: 件
  10. Logtail エラーの発生したマシンの数
    • 説明: Logtail のログ収集エラーによって送信されたアラーム数
    • 単位: 件
  11. エラーの発生した IP アドレスの数 (件/5 分)
    • 説明: サブカテゴリーに、各取得エラーが発生した IP アドレス数が記載されます
      • LOGFILE_PERMINSSION_ALARM: ログファイルへのアクセス権が Logtail エージェントにありません。
      • SENDER_BUFFER_FULL_ALARM: データ収集速度がネットワーク転送速度を超えたため、データは破棄されました。
      • INOTIFY_DIR_NUM_LIMIT_ALARM (INOTIFY_DIR_QUOTA_ALARM): モニタリング対象のディレクトリ数が 3,000 を超えています。モニタリング対象を下位ディレクトリに設定します。
      • DISCARD_DATA_ALARM: データの書き込まれた時間が、システム時間よりも 15 分も前であるため、そのデータは破棄されました。ログファイルへのデータ書き込み時間とシステム時間との差が 15 分未満になるようにします。
      • MULTI_CONFIG_MATCH_ALARM: 1 つのファイルを収集する設定が複数ある場合、Logtail はランダムにログ収集する設定を選択します。選択された設定以外の設定によってデータは収集されません。
      • REGISTER_INOTIFY_FAIL_ALARM: Inotify イベントの登録に失敗しました。詳細については、Logtail ログをご参照ください。
      • LOGDIR_PERMINSSION_ALARM: モニタリング対象のディレクトリーにアクセスする権限がエージェントにはありません。
      • REGEX_MATCH_ALARM: 正規表現の不一致エラー。正規表現を修正します。
      • ENCODING_CONVERT_ALARM: ログのエンコード形式変換時にエラーが発生しました。詳細については、Logtail ログをご参照ください。
      • PARSE_LOG_FAIL_ALARM: ログの解析エラーです。行の先頭の正規表現が不適切であるか、1 行のログのサイズが 512 KB を超えているためにログが不適切に分割されている可能性があります。詳細については、Logtail のログを確認します。正規表現が不適切な、修正します。
      • DISCARD_DATA_ALARM: Logtail がローカルのキャッシュファイルにデータを書き込むことができないため、Log Service にデータを送信できず、データは破棄されました。原因としては、ログファイルの生成に、キャッシュへのデータ書き込みが追いついていないことが考えられます。
      • SEND_DATA_FAIL_ALARM: Logtail は解析済みログの Log Service への送信に失敗しました。詳細については、Logtail ログのデータ送信失敗に関するエラーコードとメッセージを確認します。一般的には、Log Service の上限超過、または Logtail エージェント側のネットワーク例外が挙げられます。
      • PARSE_TIME_FAIL_ALARM: ログの時間フィールド解析時にエラーが発生しました。Logtail は、時間の書式設定に基づいて正規表現で時間フィールドを解析することに失敗しました。時間の書式設定を変更します。
      • OUTDATED_LOG_ALARM: Logtail は過去のデータを破棄しました。データの書き込み時間とシステム時間との差が 5 分未満になるようにします。
    • エラーを基に IP アドレスを特定します。Log Service にログインし、「/usr/logtail/ilogtail.LOG」ファイルを参照して原因を特定します。