
Connexion SSH à un nœud de calcul
Vous pouvez vous connecter en SSH aux nœuds de calcul qui ont été affectés à l'un de vos travaux afin de surveiller l'exécution de vos calculs avec des outils comme top
, htop
ou nvidia-smi
par exemple.
Lorsque l'un de vos travaux est en cours d'exécution, les nœuds de calcul qui lui ont été attribués sont visibles avec la commande squeue -j <numero_du_travail>
ou squeue -u $USER
:
$ squeue -u $USER JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 2042259 cpu_p1 mon_travail mon_login R 01:42 10 nœud[1337-1346]
Dans cet exemple, le job n° 2042259 tourne sur 10 nœuds de calcul nommés respectivement nœud1337
, nœud1338
, …, nœud1345
et nœud1346
.
Vous pouvez alors vous connecter via ssh
à l'un des nœuds de cette liste (par exemple nœud1337
) avec la commande suivante :
$ ssh nœud1337
Notez que vous serez automatiquement déconnecté du nœud lorsque votre travail se terminera.
Si vous essayez de vous connecter à un nœud sur lequel aucun de vos travaux n'est en cours d'exécution, vous obtiendrez l'erreur suivante :
Access denied by pam_slurm_adopt: you have no active jobs on this node