edit-icon download-icon

ノード管理

最終更新日: May 14, 2018

E-HPC クラスタがない場合は、まず E-HPC クラスター作成 を実行します。

E-HPC コンソールは、ノードクエリ、再起動、リセット、およびリリースを含む E-HPC クラスタノードの機能を提供します。

ノードコントロールページに移動

E-HPCコンソール にアクセスし、左側のナビゲーションペインで ノード をクリックします。

ノードを選択する

調整するノードを選択するには、次の手順を実行します。

1.リージョンを選択してください。

リージョンの詳細については、リージョンとゾーン を参照してください。

ノードは、ノードが属するクラスターのリージョンを継承します。リージョンを使用して、目的のノードのクラスターを見つけます。

2.クラスタを選択します。

Cluster の横にあるドロップダウンリストをクリックし、目的のノードが含まれているクラスタの名前を探します。

3.ノードタイプの選択

E-HPC クラスタは、主に以下のノードを含みます。

  • スケジューリングサーバーとドメインアカウントサーバーを含むコントロールノード
  • スケジューリングサーバー:このサーバーは、スケジューリング・ツール(PBS や SLURMなど) を実行し、ジョブの送信、スケジューリング管理などを処理するために使用されます。

  • ドメインアカウントサーバー:このサーバーは、 E-HPC クラスターのユーザーアカウントの集中管理を行います。

  • コンピューティングノード
  • このサーバーは高性能コンピューティングジョブを実行します。その構成は、 E-HPC クラスタの全体的なパフォーマンスを決定します。
  • ログインノード
  • これは、通常の E-HPC クラスタユーザーが操作できる唯一のノードです。ログインノードでソフトウェアのデバッグ、コンパイル、インストール、およびジョブの送信を実行できます。

ノード管理

ノードリージョン、クラスタ、およびノードタイプを選択した後、ノード情報テーブルで調整するノードを見つけて、このノードの 操作 カラムで必要な操作を選択します。

ノードを再起動する

:特殊な状況(障害修復など) でない限り、 実行中 ステータスのノードを再起動しないでください。

再起動 をクリックし、ポップアップウィンドウで 通常再起動 または 強制再起動 を選択します。

  • 通常再起動:ノード(CentOSなど) 上で実行されているオペレーティングシステムにリモートから再起動コマンドを送信すると、オペレーティングシステムはすべてのプロセスを終了してシステムを再起動します。これは、Ctrl + Alt + Del を使用して物理マシンを再起動するのと同じです。

  • 強制再起動:ノードで実行中のインスタンスを直接再起動します。物理マシンのリセットボタンを押すのと同じです。一般に、強制再起動メソッドは、通常再起動が無効な場合にのみ使用されます。

ノードをリセットする

:特殊な状況(障害修復など) でない限り、実行中 ステータスのノードをリセットしないでください。

その他の ドロップダウンリストから、ノードのリセット をクリックします。確認すると、ノードのリセットプロセスがトリガーされています。

手順:

  1. 現在のノードは、ECS インスタンス作成時に初期状態に復元されます。

  2. E-HPC 制御システムは、スケジューラ構成またはドメインアカウント管理構成を含めて、再インストールされ、初期化されます。

  3. E-HPC クラスタソフトウェアスタックが再インストールされます。

  4. ノードは E-HPC クラスタに追加されます。

ノードの再起動で障害を修復できない場合は、ノードをリセットしてください。

ノードを削除する

:クラスタから削除することができるのは、計算ノード だけです。制御ノード および ログインノード は削除できません。また、現在のところ、計算ノードを削除することでのみ、クラスタのサイズを変更できます。計算ノードの追加については、クラスタのサイズ変更 を参照してください。

その他 ドロップダウンリストから、ノード削除 をクリックします。確認をクリックすると、ノードは停止され、解放されます。