Data Warehousing e Business Intelligence

Il corso fornirà gli strumenti fondamentali per le operazioni di 1) Acquisizione dei dati; 2) Pulizia e manutenzione dei dati; 3) Preparazione dei dati per le analisi successive. Verranno quindi introdotte le necessarie nozioni di programmazione in Python:1)Creazione di un ambiente Python (linux/windows); 2)Eventuale uso di macchine virtuali per la standardizzazione dei processi; 3) Sintassi del linguaggio Python; 4) Struttura di un programma in Python a. Algoritmi b. Flussi Dati c. Gestione dell’I/O; 5)Tecniche di accesso ai dati on line e non; 6)Tecniche di acquisizione e manipolazione semplice dei dati. Al fine di fornire anche gli strumenti per la manutenzione ed immagazzinamento delle informazioni acquisite sono previsti alcuni cenni di Base Dati (SQL). Verranno infine presentati alcuni packages Python come BeautifulSoup, Selenium, mysql, ecc., al fine di introdurre alcuni interessanti case study.