CORSO DI INTRODUZIONE AD R PER DATA SCIENCE

Date definite   per il  2023:  (20ª ed.) 6-7 e 13-14 luglio 2023
LE DOMANDE PER L'ISCRIZIONE DOVRANNO PERVENIRE  ENTRO E NON OLTRE SABATO 1° LUGLIO 2023

Quote di iscrizione

  • Quota ordinaria  € 500,00
  • Quota agevolata  € 400,00

*Sono previste n. 6 quote di iscrizione agevolata e  sono riservate a coloro che si trovano in una delle seguenti condizioni:

  • dottorando di ricerca
  • specializzando
  • assegnista di ricerca
  • studente di facoltà diversa dalla Facoltà di Ingegneria dell'Informazione Informatica e Statistica o della ex Facoltà di Scienze Statistiche della Sapienza. 

Modalità di iscrizione
Per iscriversi inviare il seguente MODULO D'ISCRIZIONE debitamente compilato.
Per ulteriori informazioni circa le quote di iscrizioni potete inviare una mail alla segreteria del corso, nella persona di Cristina Puteo
Attivazione del corso: Il corso non sarà attivato qualora non venisse raggiunto il numero minimo di 14 iscrizioni con quota ordinaria o agevolata.
Rinunce: In caso di rinuncia dopo il pagamento della quota di iscrizione non sarà riconosciuto alcun rimborso.
 
LE DOMANDE PER L'ISCRIZIONE DOVRANNO PERVENIRE  ENTRO E NON OLTRE IL 3 LUGLIO 2023

Orario lezioni

In tutte le giornate del corso si osserverà il seguente orario:

  • Mattina                    9:00 - 13:00
  • Pomeriggio            14:30 - 17:30

 
Posti disponibili
Posti max: 20
Alla data del 23 giugno 2023 i posti disponibili sono: 11 quote ordinarie e 2 quote agevolate

Requisiti

Per accedere al Corso si richiede una minima conoscenza della statistica descrittiva, multivariata e inferenziale insieme ad un’alfabetizzazione informatica sull’utilizzo del Personal Computer.

Le date

Il Corso si svolgerà nelle seguenti date:

• giovedì    06 luglio 2023

• venerdì    07 luglio 2023

• giovedì    13 luglio 2023

• venerdì    14 luglio 2023

 
Scopo ed Obiettivi 
Il Corso di Formazione “Introduzione ad R per Data Science” intende fornire un’introduzione guidata al software open source R https://www.r-project.org la cui curva di apprendimento risulta ripida proprio nella fase iniziale ed offre gli strumenti fondamentali per il conseguimento di un’operatività finale sulle principali tecniche di analisi statistica descrittiva ed inferenziale. Il software R `e al tempo stesso un ambiente per l’analisi statistica e un linguaggio di programmazione.
I suoi punti di forza sono la notevole massa di funzionalità computazionali e grafiche, garantita dalla presenza nel team di sviluppo ufficiale di un nutrito gruppo di esperti mondiali nel settore dell’informatica e della statistica, e il contributo di una numerosissima comunità di utenti e sviluppatori individuali.
Ulteriori punti di forza sono la capacità di interconnettersi con quasi tutti gli standard per le sorgenti di dati on-line e off-line e l’opportunità per l’utente di produrre i risultati in documenti interattivi e dinamici, attraverso i linguaggi per l’editoria digitale, professionale e non (LaTeX, html, MSword).

Gli obiettivi del Corso sono:

a. Far conoscere la logica del funzionamento di R basato sull’uso di funzioni attraverso la linea di comando e, soprattutto, l’ambiente di sviluppo integrato (IDE) Rstudio; far conoscere l’organizzazione della memoria attraverso la predisposizione e costruzione di oggetti dotati di opportune caratteristiche secondo il paradigma della programmazione orientata agli oggetti.

b. Introdurre le principali funzioni necessarie per l’elaborazione di numeri e vettori di dati numerici e testuali.

c. Introdurre la caratterizzazione degli oggetti attraverso struttura, attributi e classi.

d. Elaborare oggetti con strutture regolari come matrici e array.

e. Introdurre classi tipiche per il trattamento di insieme di dati come il data.frame.

f. Fornire agli iscritti gli strumenti essenziali per l’importazione di dati da qualsiasi tipo di sorgente (file di testo, file binari, file in formato proprietario di altri software, accesso a basi dati remote) e l’esportazione dei risultati.

g. Fornire gli strumenti essenziali per la verifica di congruità e di lacune nei vari insiemi di dati, per la riorganizzazione in termini di ordinamento e selezione.

h. Elaborazione più propriamente statistica di natura descrittiva (tabelle e grafici) per dati univariati e multivariati.

i. Illustrare l’estensione delle funzionalità di base del software mediante l’impiego di pacchetti aggiuntivi.

j. Introdurre alcune basi per l’uso di metodi inferenziali e modelli statistici (ANOVA e modello di regressione).
Alla fine del corso verrà rilasciato un attestato di partecipazione.

Programma dettagliato
Prima giornata - Modulo I: i primi passi con R

  • La filosofia del software R
  • Sintassi di base
  • Strutture e classi degli oggetti
  • Organizzazione dei dati e della memoria
  • Primi esempi di Importazione ed esportazione di dati già strutturati
  • Attività guidata sugli argomenti trattati nella prima giornata

Seconda giornata – Modulo II: pulizia e manipolazione dei dati

  • Importazione ed esportazione di dati: approfondimenti
  • Pulizia dei dati
  • Manipolazione, trasformazione e sintesi dei dati
  • QUARTO: introduzione alla reportistica in R
  • Attività  guidata sugli argomenti trattati nella seconda giornata

Terza giornata – Modulo III: visualizzazione dei dati

  • Visualizzazione dei dati: grafici e tabelle
  • Introduzione a pacchetti dedicati per rappresentazioni grafiche e analisi
  • Cenni a tecniche di riduzione dimensionale
  • Attività guidata sugli argomenti trattati nella terza giornata

Quarta giornata – Modulo IV: modelli e metodi statistici

  • Dal t-test all’ANOVA
  • Modello di regressione
  • Attività guidata sugli argomenti trattati nella quarta giornata

Materiale del corso

Il seguente materiale didattico sarà distribuito durante il corso:

  • Slide in formato pdf,
  • Codici commentati dei programmi,
  • Dati
  • Template per reportistica

Ogni partecipante dovrà essere munito di PC portatile personale.
Attivazione del corso: Il corso non sarà attivato qualora non venisse raggiunto il numero minimo di 14 iscrizioni con quota ordinaria o agevolata.

Team docente:

prof. Luca Tardella, prof. Pierpaolo Brutti, prof.ssa Stefania Gubbiotti, prof. Alberto Arcagni, prof.ssa Cristina Mollica