ジョブ実行中のGPU利用統計情報の取得方法

投稿:滝澤  
1 333 通報 ウォッチ

ABCIの計算ノードにはNVIDIA DCGMが導入されており、それを用いてジョブ実行中のGPU利用統計を取得することができます。

詳しくは以下のGistに書いてありますので、興味ありましたらご参照ください。


https://gist.github.com/stakizawa/f3d3eccef2f61fce4efde147d52b2b41

コメント

    本手法利用不可能 滝澤 さん: 2021-12-20 18:04:50

    現在、ABCI計算ノードでは本記事で説明する手法を利用するにあたって必要なサービスが起動していないため、本手法は利用できなくなっています。
    当該サービスは、以前性能問題を引き起こしたことがあるため、再起動させる可能性も低いものと思われます。

    通報

    ログインしてコメントを書く

    関連する投稿