Accesso da rete wireless in Ateneo

Le reti Wi-Fi di Sapienza ed Eduroam bloccano il traffico sulle porte 2020 e 2021. Non è quindi possibile utilizzarle per accedere a TS2.

L'esperimento scritto sotto windows non funziona

Il sistema operativo Windows utilizza una codifica del testo differente da quella UNIX, in particolare nel carattere di fine riga. E' quindi possibile che quando si trasferiscono sul cluster esperimenti scritti sul proprio pc questi possano risultare non funzionanti.

 

È disponible sul cluster un comando per semplificare la conversione. Eseguendo da linea di comando sul cluster :

dos2unix <nome file>

il file verrà convertito nel formato corretto.

Installare pacchetti R

Nella gran parte dei casi è possibile procedere in autonomia all'istallazione di pacchetti R. Solo nei casi in cui il pacchetto abbia delle dipendenze da librerie di sistema non presenti è necessario rivolgersi allo staff.

Per procedere all'istallazione bisogna

  1. connettersi a TS2
  2. caricare il modulo della versione R che si intende utilizzare
  3. eseguire R
  4. eseguire
    install.packages("<nome pacchetto>")

La prima volta verrà indicato che non si può procedere all'istallazione del pacchetto nella libreria di sistema ma è sufficiente accettare di utilizzare una libreria personale ed acccettare i valori di default che vengono proposti.

Sarà inoltre necessario scegliere un repository da cui scaricare i pacchetti; si suggerische di selezionare uno dei due italiani.

R e pacchetto gsl
Questo pacchetto ha una dipendenza non presente nelle versioni 4.0.5 e 4.2.0 di R. Con queste versioni è quindi necessario caricare il modulo di gsl per istallarlo ed utilizzarlo.
R e pacchetto rJava

La procedura di installazione di questo pacchetto non è completamente compatibile con l'ambiente di TeraStat2 e lascia una variabile di ambiente non correttamente valorizzata.

Per utilizzarlo è quindi necessario seguire i seguenti passi:

  1. connettersi a TS2
  2. caricare il modulo della versione java che si intende utilizzare (module load jdk/16)
  3. caricare il modulo della versione R che si intende utilizzare (module load R/4.2.0_10gcc)
  4. allineare l'ambiente di R e java (R CMD javareconf -e)
  5. valorizzare la variabile mancante (export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$JAVA_LD_LIBRARY_PATH)
  6. avvaire R ed eseguire
    install.packages("rJava")

Tutti gli step di questa procedura, ad eccezione dell'installazione del pacchetto, devono essere eseguiti tutte le volte che si vuole utilizzare rJava; questi comandi, quindi, dovranno anche essere parte dello script di preparazione dell'esperimento.

Librerie Python

Pemesso che si fa riferimento alla versione 3 di python, è possibile istallare librerie di questo linguaggio non presenti nel sistema utilizzando pip3 eseguito sul nodo di login dopo aver caricato il modulo di python.

È chiaramente fortemente consigliato fare uso dei virtualenv.

Utilizzo del Cluster in modalità interattiva

Fermo restando che TeraStat è pensato per essere utilizzato in modalità batch, ovvero preparando degli script che vengono eseguiti senza diretto intervento umano, alle volte è utile poter utilizzare il cluster in modo piùinterattivo.

Il sistema di scheduling mette a disposizione lo strumento delle reservation a questo scopo; è possibile infatti fare richiesta di risorse ed utilizzarle interattivamente una volta disponibili.

srun --job-name "InteractiveJob" --cpus-per-task 2 --mem-per-cpu 1500 --time 24:00:00 --pty bash

Con questo comando, una volta che le risorse saranno disponibili, ci si troverà in una shell eseguita sul nodo di calcolo assegnato e che avrà accesso alle risorse richieste.

Utilizzo di un nodo specifico del Cluster

È possibile richiedere uno specifico nodo con la direttiva seguente da inserire nello script bash:

#SBATCH --nodelist=cn1a

Con questa direttiva, una volta che le risorse saranno disponibili, il job verrà eseguito dal nodo cn1a.

Per la lista completa dei nodi con l'indicazioni di quanti Threads sono allocati per ciascun nodo, lanciare il comando:

sinfo -o "%n %C"

verrà visualizzato l'elenco dei nodi con le disponibilità dei Threads nel formato (A/I/O/T), cioè Allocated/Idle/Other/Total

Ho utilizzato TeraStat 2 per i miei esperimenti, come posso citarlo?

Per poter citare l'infrastruttura di supercalcolo TeraStat 2 è possibile far riferimento al seguente paper

nel quale viene descritta l'architettura del sistema e le sue modalità di utilizzo

@INPROCEEDINGS{9251143, author={Bompiani, Edoardo and Petrillo, Umberto Ferraro and Jona Lasinio, Giovanna and Palini, Francesco}, booktitle={2020 IEEE Intl Conf on Dependable, Autonomic and Secure Computing, Intl Conf on Pervasive Intelligence and Computing, Intl Conf on Cloud and Big Data Computing, Intl Conf on Cyber Science and Technology Congress (DASC/PiCom/CBDCom/CyberSciTech)}, title={High-Performance Computing with TeraStat}, year={2020}, pages={499-506}, doi={10.1109/DASC-PICom-CBDCom-CyberSciTech49142.2020.00092}}