ジョブ実行中のGPU利用統計情報の取得方法
投稿:滝澤
ABCIの計算ノードにはNVIDIA DCGMが導入されており、それを用いてジョブ実行中のGPU利用統計を取得することができます。
詳しくは以下のGistに書いてありますので、興味ありましたらご参照ください。
https://gist.github.com/stakizawa/f3d3eccef2f61fce4efde147d52b2b41
ABCIの計算ノードにはNVIDIA DCGMが導入されており、それを用いてジョブ実行中のGPU利用統計を取得することができます。
詳しくは以下のGistに書いてありますので、興味ありましたらご参照ください。
https://gist.github.com/stakizawa/f3d3eccef2f61fce4efde147d52b2b41
コメント
本手法利用不可能 滝澤 さん: 2021-12-20 18:04:50
現在、ABCI計算ノードでは本記事で説明する手法を利用するにあたって必要なサービスが起動していないため、本手法は利用できなくなっています。
当該サービスは、以前性能問題を引き起こしたことがあるため、再起動させる可能性も低いものと思われます。
通報
コメント
コメントを削除
この操作は取り消しできません。本当に続けますか?