Insegnamento DEEP LEARNING AND ROBOT PERCEPTION
Nome del corso | Ingegneria informatica e robotica |
---|---|
Codice insegnamento | A003170 |
Curriculum | Data science e data engineering |
Docente responsabile | Gabriele Costante |
Docenti |
|
Ore |
|
CFU | 6 |
Regolamento | Coorte 2023 |
Erogato | Erogato nel 2024/25 |
Attività | Caratterizzante |
Ambito | Ingegneria informatica |
Settore | ING-INF/04 |
Tipo insegnamento | Opzionale (Optional) |
Tipo attività | Attività formativa monodisciplinare |
Lingua insegnamento | ITALIANO |
Contenuti | Operazioni di filtraggio, estrazione di punti di interesse e di descrittori di immagine. Matching e Trasformazioni di immagine. Geometria epipolare e ricostruzione stereo. Visual odometry, graph-based SLAM e Visual SLAM. Deep Learning e reti neurali convoluzionali. Deep Reinforcement Learning. Esercitazioni guidate su Pytorch per la progettazione di reti neurali convoluzionali e di applicazioni basate su deep reinforcement learning. |
Testi di riferimento | Richard Szeliski. “Computer Vision: Algorithms and Applications”, Springer - Ian Goodfellow, Yoshua Bengio, Aaron Courville. “Deep Learning”, MIT Press - Christopher Bishop. “Pattern Recognition and Machine Learning”, Springer; Richard Hartley, Andrew Zisserman. “Multiple view geometry”, Cambridge University Press – Ramesh Jain, Rangachar Kasturi, Brian G. Schunk. “Machine Vision”, McGraw-Hill – Richard S. Sutton, Andrew G. Barto. “Reinforcement Learning: an Introduction”, MIT Press. Dispense a cura del docente disponibili su UNISTUDIUM - PIATTAFORMA DI E-LEARNING DELL'UNIVERSITÀ DEGLI STUDI DI PERUGIA (https://www.unistudium.unipg.it/unistudium/ ) |
Obiettivi formativi | - Conoscenza di base di: problematiche connesse all’estrazione di informazioni di vario livello semantico da immagini; tecniche di estrazione di features e di descrittori di immagine; tecniche per la stima della trasformazione tra coppie di immagini; strategie per la ricostruzione 3D a partire da immagini in configurazione stereo; principi alla base della Visual odometry e del Visual SLAM; caratteristiche, vantaggi e soluzioni basate su reti neurali convoluzionali; tecniche e soluzioni basate su reinforcement learning e deep reinforcement learning. - Abilità: nella scelta di tecnologie e blocchi funzionali di sistemi di analisi di immagine per varie applicazioni; nell’utilizzo di reti neurali convoluzionali e nella progettazione di architetture di deep learning e di deep reinforcement learning (in particolare con il framework Pytorch) - L'insegnamento, inoltre, contribuisce al conseguimento dei seguenti risultati di apprendimento: elaborare e/o applicare idee originali in applicazioni diverse; risolvere problemi in ambienti nuovi e/o interdisciplinari; motivare le scelte progettuali compiute evidenziando possibili criticità; integrare le conoscenze e gestire la complessità. |
Prerequisiti | Al fine di comprendere i contenuti presentati e conseguire gli obiettivi di apprendimento è utile possedere una conoscenza di base di Algebra Lineare e una buona conoscenza di Machine Learning e di programmazione. Insegnamento suggerito: “Machine Learning and Data Mining”. |
Metodi didattici | L’insegnamento è organizzato come segue: - lezioni frontali in aula; - lezioni frontali a carattere seminariale - esercitazioni guidate presso il Laboratorio di Informatica sulla progettazione di soluzioni per problem di deep learning e deep reinforcement learning con framework Pytorch. Strumenti di supporto alla didattica: lavagna e PC+proiettore, PC. |
Altre informazioni | I Semestre (maggiori dettagli vengono riportati al link http: //www.ing.unipg.it/it/didattica/studiare-nei-nostri-corsi/orario-delle-lezioni ). |
Modalità di verifica dell'apprendimento | Le conoscenze relative all’insegnamento vengono accertate attraverso una Prova orale e una prova pratica (tesina). La prova orale prevede la discussione del progetto presentato e due domande su argomenti scelti dal docente, e dura circa 45 minuti. La prova è volta ad accertare la compresione, da parte dello studente, degli strumenti teorici fondamentali forniti dall'insegnamento, nonchè le relazioni tra tali strumenti e le tematiche generali dell'ingegneria informatica. Il progetto presentato viene utilizzato per verificare le capacità di progettazione di soluzioni basate su deep learning e deep reinforcement learning per applicazioni di computer vision e robotica attraverso il framework Pytorch. La tesina deve essere inviata al docente il giorno prima della prova di esame. Le prenotazioni alle prove di esame avvengono tramite il portale SOL: https://www.segreterie.unipg.it/ Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa |
Programma esteso | Introduzione alla Computer Vision. Filtraggio di immagine. Image Features. Descrittori di Immagine e matching tra descrittori. Trasformazioni di Immagine. Geometria Stereo. Visual odometry. Graph-based SLAM e Visual SLAM. Machine learning e Computer Vision: Introduzione. Deep Learning. Reti neurali convoluzionali (CNN). Architetture per le CNN. Reti neurali ricorrenti: RNN –LSTM –GRU. Applicazioni delle CNN. Modelli generativi (Generative adversarial network (GAN)) e applicazioni non supervisionate delle CNN. Reinforcement Learning: Introduzione, concetti generali e algoritmi. Deep Reinforcement Learning. Esercitazioni di laboratorio: Framework per il deep learning, design di architetture per le CNN, esempi di applicazioni delle CNN. Esempi di soluzioni basate su Deep Reinforcement Learning. |
Obiettivi Agenda 2030 per lo sviluppo sostenibile |