edit-icon download-icon

CloudMetrics

最終更新日: Oct 29, 2019

CloudMetrics for Elastic High Performance Computing (E-HPC) は、 E-HPC クラスターのパフォーマンスのモニタリングと分析を行うプラットフォームを提供します。CloudMetrics を使用して、クラスターのパフォーマンスメトリックのモニタリング、クラスターのパフォーマンス履歴の表示、リソース使用率の高いプロセスの分析が可能です。

注:使用できる E-HPC クラスターがない場合、まず E-HPC クラスターの作成を行います。

CloudMetrics ページへのアクセス

E-HPC コンソールにログインし、左側のナビゲーションウィンドウで [CloudMetrics] をクリックして、[CloudMetrics] ページに移動します。

[CloudMetrics] ページには、[ダッシュボード]、[ノード性能]、[プロセス性能]、[性能解析] の 4 つのタブページがあります。

ダッシュボード

[ダッシュボード] タブページには、クラスターの基本情報やノードのパフォーマンスヒートマップなど、ユーザーのクラスター情報が表示されます。左側には、クラスター名、クラスター ID、構成済みのリソース (メモリ容量や CPU コアの数など) を含む、基本的なクラスター情報が表示されます。タブページの中央には、[ノード]、[プロセス]、[解析]、[設定] のアイコンがあります。[ノード]、[プロセス]、[解析] のアイコンをクリックすると、それぞれ [ノード性能]、[プロセス性能]、[性能解析] のタブページに移動します。[設定] アイコンをクリックすると、ダッシュボードのパフォーマンスメトリックを指定できます。メトリックは、CPU 使用率、メモリ使用率、ネットワークスループット、ディスクスループット、ディスク使用率から最大 3 つを選択できます。

ノードのパフォーマンスヒートマップは、タブページの中央に表示されます。暗い色は、指定されたメトリックの負荷が高いことを示します。ヒートマップ上でノードをクリックすると、ノードは青い境界線で表示されます。続いて、[ノード] アイコンをクリックすると、ノードのパフォーマンスが表示されます。

ノード性能

[ノード性能] タブページでは、特定のクラスターのノードのパフォーマンスメトリックのクエリが可能です。左側のペインでクラスターとノードを、右側のペインでパフォーマンスメトリックを選択できます。選択が終わると、ノードのパフォーマンス履歴がグラフで表示されます。[ジョブの選択] ドロップダウンリストから、過去に E-HPC コンソールで送信されたジョブを選択することもできます。CloudMetrics では、関連するノードとジョブの開始/終了時間が自動的にリストされるので、ジョブのパフォーマンスを簡単にクエリできます。

  • ノードベースでパフォーマンスデータが表示されている場合、サブグラフには 1 つのノードのパフォーマンスデータが表示され、曲線は 1 つのメトリックのデータを示します。
  • メトリックベースでパフォーマンスデータが表示されている場合、サブグラフには 1 つのメトリックのパフォーマンスデータが表示され、曲線は 1 つのノードのデータを示します。

プロセス性能

[プロセス性能] タブページでは、特定のノードのプロセスパフォーマンスデータのクエリと分析が可能です。左側のペインでクラスターとノードを選択することができ、一定期間内の上位 5 プロセスの CPU 使用率を示すグラフが表示されます。グラフ上でポインターを移動すると、特定の期間における上位 5 プロセスの情報がグラフの下に表示されます。[ジョブの選択] ドロップダウンリストから、過去に E-HPC コンソールで送信されたジョブを選択することもできます。CloudMetrics では、関連するノードとジョブの開始/終了時間が自動的にリストされるので、ジョブのパフォーマンスを簡単にクエリできます。

グラフをクリックすると、5 つのボタンがグラフの上に表示され、性能解析を開始できます。各ボタンのテキストは、”Profiling 37” など、”Profiling” と上位 5 つのプロセスのいずれかの ID からなります。いずれかのボタンをクリックすると、性能解析を実行できます。

性能解析を実行するには、[解析設定] ダイアログボックスで [解析時間] と [周波数] を指定する必要があります。必要なパラメーターを指定して [OK] をクリックすると、ノードのプロセスの関数実行情報が分析されます。分析結果は、[性能解析] タブページに表示されます。

性能解析

[性能解析] タブページでは、解析結果のクエリと表示が可能です。左側のドロップダウンリストでクラスターを選択することができ、クラスターの解析レコードが自動的にリストされます。各レコードの詳細情報を確認できます。[表示] をクリックして、パフォーマンスデータを示すフレームグラフを表示することもできます。このグラフでは、関数実行情報を取得し、CPU 使用率が高い関数を分析できます。この情報を使用してパフォーマンスを調整できます。