mail unicampaniaunicampania webcerca

    Antonio IRPINO

    Insegnamento di STATISTICAL PROGRAMMING

    Corso di laurea in DATA ANALYTICS

    SSD: SECS-S/01

    CFU: 6,00

    ORE PER UNITÀ DIDATTICA: 48,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    Inglese

    Contenuti

    Nella pratica statistica sono richieste analisi specifiche che non possono essere eseguite utilizzando un software statistico standard. In tali situazioni, è bene avere abilità di programmazione. Lo scopo del corso è fornire un'introduzione a tale programmazione statistica.
    Il corso si basa sul lavoro statistico e sull'ambiente di programmazione R, che è un'implementazione del linguaggio di programmazione S, e in Python. Questo ambiente è sulla buona strada per diventare uno standard de facto per gli statistici professionisti. Il programma è disponibile gratuitamente con licenza GPL e lo studente impara a scaricare e installare il programma. La prima parte del corso fornisce un'introduzione a R e Python. Lo studente impara come importare ed esportare dati, gestire diversi tipi di dati, creare e utilizzare script, memorizzare dati e risultati, creare e salvare illustrazioni grafiche e come manipolare i dati in R con operatori logici.
    Inoltre, il corso fornisce una panoramica dei metodi analitici implementati. L'ultima parte del corso riguarda le funzioni, l'ottimizzazione del codice e come creare i propri pacchetti R.

    Testi di riferimento

    A first course in statistical programming with R
    Braun John, Murdoch Duncan James
    Cambridge, N.Y. : Cambridge University Press : 2007 : 163 s. :
    ISBN: 978-0-521-87265-2

    Venables W. N., Smith D. M., the R Core Team
    An Introduction to R
    R Core Team :
    https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf

    S programming
    Venables W. N.q (William N.), Ripley Brian D.
    New York : Springer : cop. 2000 : x, 264 s. :
    ISBN: 0-387-98966-8

    Chambers John M.
    Software for data analysis : programming with R
    New York, N.Y. : Springer : cop. 2008. : 498 p. :
    ISBN: 978-0-387-75935-7

    Obiettivi formativi

    Al termine del corso lo studente dovrebbe essere in grado di:
    creare programmi semplici nel linguaggio di programmazione R utilizzando tecniche di programmazione di base come scansione e stampa di dati, allocazione e manipolazione di strutture dati, funzioni auto-prodotte, gestione dei cicli e istruzioni condizionali
    effettuare studi di simulazione e analizzare e valutare le prestazioni risultanti
    illustrare i modelli statistici ei risultati delle applicazioni statistiche.

    Prerequisiti

    Conoscenze base di statistica descrittiva e inferenziale e di programmazione.

    Metodologie didattiche

    Lezioni frontali con utilizzo di slides.

    Metodi di valutazione

    L’esame consiste nella somministrazione di circa trenta quiz a risposta chiusa e la presentazione della soluzione di alcuni esempi di programmazione statistica da commentare, scelti dallo studente o proposti dal docente.
    La valutazione è espressa in trentesimi dando uguale importanza ai quiz e alla discussione.

    Altre informazioni

    Si raccomanda una frequenza costante e partecipativa. Oltre ai testi consigliati, il docente fornirà dispense su argomenti specifici.
    Il corso utilizzerà per la maggior parte R, ma anche altri linguaggi sono ammessi (Matlab, Python).
    Laddove possibile, si consiglia di venire a lezione con un notebook.

    Programma del corso

    Introduction to statistical programming.
    Introduction to the R language and Rstudio software.
    - Basic features of R
    - Functions
    - Listing the objects in the workspace
    - Vectors and Vector arithmetic
    - Missing values and other special values
    - Character vectors
    - Factors
    - Matrices and arrays
    - Lists
    - Data frames
    - Dates and times
    - Built-in functions and online help
    - Logical vectors and relational operators
    - Data input and output

    Programming with R
    - Flow control
    - Managing complexity through functions
    - Some general programming guidelines
    - Debugging and maintenance
    - Efficient programming

    Simulations
    - Monte Carlo simulation
    - Generation of pseudorandom numbers

    English

    Teaching language

    English

    Contents

    In statistical work there is a demand for specific analyses that cannot be done using standard statistical software. In such situations, programming skills are good to have. The purpose of the course is to provide an introduction to such statistical programming.
    The course is based on the statistical work and programming environment R, which is an implementation of the programming language S, and in Python. This environment is well on its way to become a de facto standard for professional statisticians. The program is freely available under a GPL license and the student learns how to download and install the program. The first part of the course gives an introduction to R and Python. The student learns how to import and export data, to handle different datatypes, create and use scripts, store data and results, create and save graphical illustrations, and how data can be manipulated in R with logical operators.
    Furthermore, the course provides an overview of the implemented analytical methods. The latter part of the course deals with functions, optimization of code, and how to create your own R packages.

    Textbook and course materials

    A first course in statistical programming with R
    Braun John, Murdoch Duncan James
    Cambridge, N.Y. : Cambridge University Press : 2007 : 163 s. :
    ISBN: 978-0-521-87265-2

    Venables W. N., Smith D. M., the R Core Team
    An Introduction to R
    R Core Team :
    https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf

    S programming
    Venables W. N.q (William N.), Ripley Brian D.
    New York : Springer : cop. 2000 : x, 264 s. :
    ISBN: 0-387-98966-8

    Chambers John M.
    Software for data analysis : programming with R
    New York, N.Y. : Springer : cop. 2008. : 498 p. :
    ISBN: 978-0-387-75935-7

    Course objectives

    After completed course the student should be able to:
    create simple programs in the programming language R using basic programming techniques such as scanning and printing data, allocation and manipulation of data structures, self-written functions, repetition and conditional statements
    carry out simulation studies and analyze and evaluate the resulting performance
    illustrate the statistical models and the results of statistical applications.

    Prerequisites

    Basic knowledge of descriptive and inferential statistics and of programming.

    Teaching methods

    Face-to-face lessons using slides.

    Evaluation methods

    The exam consists of the administration of about thirty closed-ended quizzes and the presentation of the solution of some statistical programming examples to be commented upon, chosen by the student, or proposed by the teacher.
    The evaluation is expressed out of thirty giving equal importance to the quizzes and the discussion.

    Other information

    It is expected students to attend class and be actively engaged. In addition to the recommended textbooks, the teacher will provide notes on specific subjects.
    The course will use mostly the R language, but other languages are also allowed (Matlab, Python).
    If possible, it encouraged to follow all the lectures with a notebook.

    Course Syllabus

    Introduction to statistical programming.
    Introduction to the R language and Rstudio software.
    - Basic features of R
    - Functions
    - Listing the objects in the workspace
    - Vectors and Vector arithmetic
    - Missing values and other special values
    - Character vectors
    - Factors
    - Matrices and arrays
    - Lists
    - Data frames
    - Dates and times
    - Built-in functions and online help
    - Logical vectors and relational operators
    - Data input and output

    Programming with R
    - Flow control
    - Managing complexity through functions
    - Some general programming guidelines
    - Debugging and maintenance
    - Efficient programming

    Simulations
    - Monte Carlo simulation
    - Generation of pseudorandom numbers

    facebook logoinstagram buttonyoutube logotype