Ottenere Informazioni sui propri Job ed il proprio Account

Il sistema di schedulazione utilizzato in TS2 mette a disposizione numerosi comandi per avere informazioni sui propri job e sul proprio account.

Stato dei JOB

squeue

Fornisce informazioni circa lo stato di una o più code.

Esempi:

squeue -l

Riporta l’elenco dei job sottomessi a ciascuna coda del cluster

squeue -l -u <USERNAME>

Riporta l’elenco dei job sottomessi a ciascuna coda del cluster, relativamente al solo utente indicato da input

squeue -l -A <ACCOUNTNAME>

Riporta l’elenco dei job sottomessi a ciascuna coda del cluster, relativamente al solo account indicato da input. In questo caso l’utente potrebbe avere o meno visibilità dei job di altri utenti che insistono sullo stesso account a seconda che sia o meno coordinatore.

squeue -i 5 -l

(riporta l’elenco dei job sottomessi a ciascuna coda del cluster, aggiornandolo ogni 5 secondi)

sinfo

Fornisce informazioni circa il cluster e la composizione delle code che esso offre e sullo stato dei nodi

sprio

Fornisce informazioni circa la priorità attribuita a ciascun job sottomesso nonché le variabili utilizzate per determinarla

sstat

Fornisce informazioni dettagliate circa le risorse utilizzate dai propri job in esecuzione

Per ulteriori informazioni circa i comandi disponibili in slurm per la gestione dei job si rimanda alla seguente scheda o ai manuali dei vari comandi.

Stato del Disco

Lo spazio utilizzabile sui dischi da un dato utente è limitato per garantire una adeguata disponibilità per tutti. Il comando lfs permette di conoscere lo stato di utilizzo del proprio account.

lfs quota -hu NOME_UTENTE /lustre/

mostra i limiti soft e hard dello spazio occupato e del numero di file (inode)

Stato dell’account

sreport è il comando principale per avare informazioni sulla propria storia di esecuzione di job nelsistema.

Ad esempio per conoscere le risorse usate dall’account in un dato periodo di tempo si può usare

sreport cluster AccountUtilizationByUser -t Hours format=Account,Login,Used start=2021-06-01T00:00:00 end=2021-07-01T00:00:00 Tree

Questo comando produce in output

--------------------------------------------------------------------------------
Cluster/Account/User Utilization 2021-06-01T00:00:00 - 2021-06-30T23:59:59 (2592000 secs)
Usage reported in CPU Hours
--------------------------------------------------------------------------------
Account Login Used
-------------------- --------- --------
root 19533
nome_gruppo 9405
nome_account 7405
nome_account utente1 1026
nome_account utente2 2048
nome_account utente3 4331

viene quindi riportato per l'account il tempo utilizzato nel periodo indicato dagli utenti che vi fanno capo.

Altri comandi utili per avere informazioni sul proprio account o la propria utenza sono sacct e sacctmgr.

Per conoscere gli utenti nel proprio account si può ad esempio usare

sacctmgr list accounts withassoc format=Account,User