HPC TeraStat2

Descrizione

TeraStat2 (TS2) è il cluster di supercalcolo general-purpose del Dipartimento di Scienze Statistiche per la risoluzione di modelli matematici e statistici su Big Data. Si compone di 8 nodi di calcolo, funzionanti con Linux ed equipaggiati ognuno con 2 processori AMD Epyc 7452 e 256GB di RAM, per un totale di 1.024 core. Il cluster dispone inoltre di uno storage condiviso di 76TB e di una rete in fibra ottica InfiniBand QDR, che supporta una bandwidth di 40Gb/s tra i nodi e tra i nodi e lo storage. 

Modalità d'uso

Essendo un sistema ad alta capacità di calcolo, l'utilizzo dell’infrastruttura avviene in modalità batch attraverso l'esecuzione di job. L’utente interessato nell’esecuzione di un certo esperimento predispone una descrizione dello stesso in un particolare formato, assieme a tutto quanto sarà necessario per l’esecuzione di quell’esperimento (p.es., dati di input). Una volta pronta, tale descrizione viene inviata ad un sistema di code, in funzione su TS2, che mantiene la contabilità delle risorse di calcolo consumate da ciascun utente. Non appena ci saranno risorse sufficienti, l’esperimento richiesto dall’utente sarà automaticamente messo in esecuzione. Al termine della sua esecuzione, l’utente riceverà una notifica via mail e potrà ricollegarsi a TS2 per acquisirne i risultati.

Criteri di accesso

L'accesso a TS2 viene reso disponibile a tutto il personale di Sapienza  (professori, ricercatori, dottorandi, assegnisti) che ne ha bisogno per lo sviluppo di progetti che prevedano la presenza di una componente di calcolo scientifico ad alte prestazioni. L'accesso all'infrastruttura richiede la sottoscrizione di una quota annuale che serve per mantenere la gestione e che dà diritto a disporre in modo esclusivo di una certa quota di risorse di calcolo nel periodo considerato. L'accesso viene inoltre reso disponibile a studenti impegnati nello sviluppo della propria tesi di laurea, su richiesta del rispettivo relatore, a patto che questi disponga di un accesso all’infrastruttura.
Infine, il Dipartimento riserva una quota di ore di calcolo a beneficio di quegli utenti che, per diversi motivi, non hanno la possibilità di corrispondere la quota di accesso.

Disponibilità software

Lo staff di TS2 cura l’installazione, la manutenzione e l’aggiornamento di un insieme di pacchetti software e librerie di interesse comune per l’utenza generale.
Gli utenti che hanno bisogno di adoperare software e librerie non presenti inizialmente su TS2, possono installarli localmente alla loro utenza o richiederne l'installazione allo staff che provvederà, nel caso ritenga la richiesta di interesse generale.
In ogni caso, sarà unicamente possibile l’installazione di software open source o di cui si dispone di regolare licenza.

Finanziamenti

La principale fonte di finanziamento di TS2 è stato il progetto medie attrezzature di Ateneo dal titolo “TeraStat2: infrastruttura di supercalcolo ad alta densità per la risoluzione di problemi data-centric di elevata complessità” ( codice n. MA31916B8891453A), di cui è responsabile scientifico il Prof. Umberto Ferraro Petrillo, finanziato nel 2019 con l’importo di 55k euro. Ad esso si sono aggiunte diverse quote di cofinanziamento provenienti dal Dipartimento di Scienze Statistiche tra cui quelle erogate dal Master di II livello in Big Data. Metodi Statistici per la Società della Conoscenza e dal Master di II livello in Data Intelligence e Strategie Decisionali. 

Storia

TeraStat2 è l’evoluzione del cluster TeraStat, inizialmente realizzato dal Dipartimento di Scienze Statistiche nel 2011 e tuttora operante come backup per TS2. Ulteriori informazioni circa TeraStat sono disponibili al seguente indirizzo.