2° Workshop su Supercalcolo @ Dipartimento di Scienze Statistiche

Martedì 23 Aprile, a partire dalle 9:00, si terrà il 2° Workshop su Supercalcolo, organizzato dal Dipartimento di Scienze Statistiche.

L’evento, cui sarà possibile partecipare in presenza o da remoto, avrà come scopo quello di illustrare le potenzialità e le opportunità offerte dall’uso di strumenti di supercalcolo in ambito scientifico. Prevederà inoltre la presenza di sessioni tecniche durante le quali si procederà alla risoluzione, mediante l’uso di TeraStat 2, il supercalcolatore del Dipartimento di Scienze Statistiche appartenente alla Infrastruttura di Ricerca di Ateneo, di brevi casi di studio in un ampio spettro di domini di ricerca. I materiali utilizzati per le presentazioni saranno resi preventivamente disponibili ai partecipanti, dando così la possibilità di replicare in prima persona gli esperimenti presentati.

 

Link di accesso all'evento via zoom (nota: è richiesta l'autenticazione): 

 

Luogo dell’evento


I lavori si terranno nell'Aula 1.01 al primo piano dell'Edificio D della sede Sapienza in Viale Regina Elena 295, a partire dalle ore 9:00, e proseguiranno per l'intera giornata come da programma (link Google Maps). In allegato le indicazioni per raggiungere l'aula partendo dal retro della Città Universitaria.

 

Evento organizzato con il supporto di:

Per registrarsi:

Attenzione: le registrazioni sono state prorogate sino a lunedì 22 Aprile.

https://cutt.ly/WSSC24REG

 

Programma degli interventi

  • Saluti Istituzionali (ore 9:00)
    • Alberto Marchetti Spaccamela (Prorettore alle Tecnologie digitali, Presidente di InfoSapienza)
    • Fabio Sciarrino (Prorettore alle Strategie competitive per la ricerca internazionale)
    • Giovanna Jona Lasinio (Direttrice del Dipartimento di Scienze Statistiche)

Sessione Mattutina

  • 09:20 Il progetto TeraStat 2 (Umberto Ferraro Petrillo, responsabile scientifico TeraStat 2)
  • 09:40 Nozioni di base e prima connessione a TeraStat 2 (Antonio Mastrandrea, Emanuele Corti, Dipartimento di Scienze Statistiche)
  • 10:20 Leveraging the multi-core capabilities of a super-computing cluster to train Machine Learning models in R (Pierfrancesco Alaimo Di Loro, LUMSA)
    Show Abstract

    Strumenti utilizzati: R, tidyverse, xgboost, caret
     

  • 11:00 Fast activity rhythms estimation of bears through Bayesian modeling in Stan (Aurora Donatelli, Dottorato in BIOLOGIA AMBIENTALE ED EVOLUZIONISTICA)
    Show Abstract

    Strumenti utilizzati: R, stan
     

  • 11:40 De novo diploid human genome assembly using TeraStat 2 (Emilia Volpe, Dottorato in GENETICA E BIOLOGIA MOLECOLARE)
    Show Abstract

    Strumenti utilizzati: Conda, R, Snakemake, Python, Rukki, MBG, Graphaligner, Winnowmap, Bedtools, Samtools, BWA
     

  • 12:20 Consistency of Maximum Likelihood Estimators via EM in relative survival cure models: A large-scale simulation study (Fabrizio Di Mari, Scuola di Dottorato in Scienze Statistiche)
    Show Abstract

    Strumenti utilizzati: R, parallel
     

Sessione Pomeridiana

  • 14:00 Leverage TeraStat2 to speed up MATLAB Algorithms and Applications (Alessio Conte, Mathworks)
    Show Abstract

    Strumenti utilizzati: Matlab, Parallel Computing Toolbox
     

  • 14:40 Containers: an ocean of softwares for NGS data analysis (and everything else) (Giacomo Chiappa, Dottorato in BIOLOGIA AMBIENTALE ED EVOLUZIONISTICA)
    Show Abstract

    Strumenti utilizzati: Singularity, SeqKit, BLAST
     

  • 15:20 Optimizing Computational Costs in Fluid Dynamics Simulator with Terastat: Scaling Techniques and Applications (Marta Galuppi, Dottorato in INFRASTRUTTURE E TRASPORTI)
    Show Abstract

    Strumenti utilizzati: FDS
     

  • 16:00 Study of the Protein Structural Dynamics in Solution (Alessandro Nicola Nardi, Giuseppe Chen, Dipartimento di Chimica)
    Show Abstract

    Strumenti utilizzati: Gromacs
     

  • 16:40 Benchmarking computational topology tools using interactive jobs (Riccardo Ceccaroni, Dottorato in Data Science)
    Show Abstract

    Strumenti utilizzati: gcc, conda, wget, git, ripser
     

TeraStat 2

TeraStat 2 (TS2) è il supercalcolatore general-purpose del Dipartimento di Scienze Statistiche per la risoluzione di modelli matematici e statistici su Big Data. Complessivamente il sistema dispone di 12 nodi di calcolo “fat” per un totale di 1.920 core. L'accesso a TS2 viene reso disponibile gratuitamente a tutto il personale di Sapienza che ne ha bisogno per lo sviluppo di progetti che richiedono l’uso di supercalcolo. Per un uso particolarmente intensivo delle risorse di calcolo, è prevista la sottoscrizione di una quota di valore non commerciale, che contribuirà alla copertura dei costi di manutenzione ed aggiornamento di TS2. Ulteriori informazioni su TeraStat 2 sono disponibili all’indirizzo: https://www.dss.uniroma1.it/it/HPCTerastat2