HPC TeraStat2

Descrizione

TeraStat2 (TS2) è il cluster di supercalcolo general-purpose del Dipartimento di Scienze Statistiche per la risoluzione di modelli matematici e statistici su Big Data. Si compone di 12 nodi di calcolo, funzionanti con Linux ed equipaggiati ognuno con 2 processori AMD Epyc 7452 e 256GB di RAM e di 12 nodi di calcolo dotati di due processori Intel Xeon E5-2630 a 8-Core (16 core virtuali) e 64GB di RAM. Uno di questi ultimi  è dotato di 512GB di RAM. Complessivamente il sistema dispone di  1.920 core. Il cluster dispone inoltre di uno storage condiviso di 76TB e di una rete in fibra ottica InfiniBand QDR, che supporta una bandwidth di 40Gb/s tra i nodi e tra i nodi e lo storage. 

Modalità d'uso

Essendo un sistema ad alta capacità di calcolo, l'utilizzo dell’infrastruttura avviene in modalità batch attraverso l'esecuzione di job. L’utente interessato nell’esecuzione di un certo esperimento predispone una descrizione dello stesso in un particolare formato, assieme a tutto quanto sarà necessario per l’esecuzione di quell’esperimento (p.es., dati di input). Una volta pronta, tale descrizione viene inviata ad un sistema di code, in funzione su TS2, che mantiene la contabilità delle risorse di calcolo consumate da ciascun utente. Non appena ci saranno risorse sufficienti, l’esperimento richiesto dall’utente sarà automaticamente messo in esecuzione. Al termine della sua esecuzione, l’utente riceverà una notifica via mail e potrà ricollegarsi a TS2 per acquisirne i risultati.

Criteri di accesso

L'accesso a TS2 viene reso disponibile gratuitamente a tutto il personale di Sapienza  (professori, ricercatori, dottorandi, assegnisti) che ne ha bisogno per lo sviluppo di progetti che prevedano la presenza di una componente di calcolo scientifico ad alte prestazioni. Per un uso particolarmente intensivo delle risorse di calcolo, è prevista  la sottoscrizione di una quota di valore non commerciale, che contribuirà alla copertura dei costi di manutenzione ed aggiornamento di TS2. Tale sottoscrizione permette l’accesso esclusivo ad un ammontare prestabilito di risorse di calcolo ed ha durata annuale Sono disponibili diverse tipi di sottoscrizione, differenti nella quantità di risorse allocate e nel numero di account ad esse associati.

Clicca qui per richiedere un account gratuito

Disponibilità software

Lo staff di TS2 cura l’installazione, la manutenzione e l’aggiornamento di un insieme di pacchetti software e librerie di interesse comune per l’utenza generale.
Gli utenti che hanno bisogno di adoperare software e librerie non presenti inizialmente su TS2, possono installarli localmente alla loro utenza o richiederne l'installazione allo staff che provvederà, nel caso ritenga la richiesta di interesse generale.
In ogni caso, sarà unicamente possibile l’installazione di software open source o di cui si dispone di regolare licenza.

Finanziamenti

La principale fonte di finanziamento di TS2 è stato il progetto medie attrezzature di Ateneo dal titolo “TeraStat2: infrastruttura di supercalcolo ad alta densità per la risoluzione di problemi data-centric di elevata complessità” ( codice n. MA31916B8891453A), di cui è responsabile scientifico il Prof. Umberto Ferraro Petrillo, finanziato nel 2019 con l’importo di 55k euro. Ad esso si sono aggiunte diverse quote di cofinanziamento provenienti dal Dipartimento di Scienze Statistiche tra cui quelle erogate dal Master di II livello in Big Data. Metodi Statistici per la Società della Conoscenza e dal Master di II livello in Data Intelligence e Strategie Decisionali. 

Storia

TeraStat2 è l’evoluzione del cluster TeraStat, inizialmente realizzato dal Dipartimento di Scienze Statistiche nel 2011. Ulteriori informazioni circa TeraStat sono disponibili a questo indirizzo.