Vai al contenuto principale
Oggetto:
Oggetto:

Tecnologie del Linguaggio Naturale

Oggetto:

Natural Language Technologies

Oggetto:

Anno accademico 2023/2024

Codice attività didattica
INF0094
Docenti
Alessandro Mazzei (Titolare)
Daniele Paolo Radicioni (Titolare)
Luigi Di Caro (Titolare)
Corso di studio
[008515] Laurea magistrale in informatica
Anno
1° anno, 2° anno
Periodo
Secondo semestre
Tipologia
Caratterizzante
Crediti/Valenza
9 CFU - Numero di ore - Number of hours: 64 (in aula) + 8 (in laboratorio)
SSD attività didattica
INF/01 - informatica
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Facoltativa
Tipologia esame
Orale
Prerequisiti

Si richiedono nozioni di base di Intelligenza Artificiale, in particolare relative all'area di Rappresentazione della Conoscenza, una conoscenze base di algoritmi e di logica formale.
Insegnamenti propedeutici (forniscono le competenze attese in ingresso): Sistemi Intelligenti (propedeuticità consigliata)
The student must be acquainted with the basic notions of Artificial Intelligence, with special focus on the Knowledge representation area. The student must also have basic knowledge on algorithms and formal logic.
Preparatory courses (providing the expected entry skills): The skills required to benefit fully from the course are given by Intelligent systems. .

Oggetto:

Sommario insegnamento

Oggetto:

Avvisi

DSA o Disabilità: Sostegno e Accoglienza in UniTO e supporto in sede di Esame
Oggetto:

Obiettivi formativi

Questo insegnamento concorre agli obiettivi formativi dell'ambito dei Sistemi per il Trattamento dell'Informazione del Corso di Laurea Magistrale in Informatica, fra cui formare laureati in grado di comprendere, progettare, sviluppare e gestire sistemi informatici complessi che soddisfino le crescenti esigenze della 'società della conoscenza' adattandosi a classi di utenti eterogenee e fornendo servizi e prodotti innovativi.

Il corso ha lo scopo di fornire le nozioni di base sulle moderne tecnologie di elaborazione del linguaggio naturale. Il corso sarà articolato in tre parti:

  • nella prima parte, dedicata all'introduzione e agli elementi di base dell'elaborazione automatica del linguaggio naturale, saranno offerti elementi di morfologia, sintassi, semantica formale, generazione, e traduzione automatica;
  • nella seconda parte, focalizzata sulla semantica lessicale, saranno introdotti alcuni paradigmi di rappresentazione della conoscenza, le nozioni di conceptual anchoring, e alcune risorse e approcci per la rappresentazione concettuale;
  • nella terza parte, orientata agli approcci statistici, verrà affrontato il concetto della semantica distribuzionale e le relative metodologie esistenti. Sarà approfondito il tema della similarità semantica e le basi teoriche per la costruzione del significato attraverso composizioni sintattico-semantiche, con cenni alla costruzione automatica di ontologie.

 

This course contributes to the educational objectives of the Information Processing Systems area of the Master's Degree in Computer Science, including training graduates to understand, design, develop and manage complex information systems that meet the growing needs of the society of knowledge' by adapting to heterogeneous classes of users and providing innovative services and products.

Basic elements on modern technologies for Natural Language Processing will be proposed. The class is arranged into three main components:

  • in the first part the basics of natural language processing will be given, with special focus on: morphology, syntax, formal semantics, NL generation and automatic translation;
  • the second one is mostly focussed on Lexical Semantics; several approaches for Knowledge Representation will be introduced herein, along with the notion of semantics based on conceptual anchoring. Also a detailed survey on the existing, state-of-the-art, semantic resources will be provided.
  • the third one is oriented to statistical approaches to NLP, starting from the concept of distributional semantics and the existing methodologies. Then it will focus on the notion of semantic similarity and the theoretical bases for the construction of meaning through syntactic-semantic compositions, with an emphasis on the automatic construction of ontologies.
Oggetto:

Risultati dell'apprendimento attesi


Questo insegnamento è mirato a fornire agli studenti solide conoscenze e capacità di comprensione dei temi connessi all'analisi automatica del linguaggio naturale (NLP). In particolare, l'insegnamento mira a sviluppare la capacità di applicare le conoscenze acquisite ela comprensione di problemi di natura sia applicativa sia teorica. Il corso è inoltre finalizzato a stimolare negli studenti l'autonomia di giudizio, sia nella fase di analisi dei problemi, sia nella fase di progettazione delle soluzioni. L'approccio informale e il confronto con docenti e con studentesse e studenti nella parte laboratoriale del corso sono finalizzati a stimolare le abilità comunicative e a potenziare non solo conoscenze dirette, ma anche le capacità di apprendimento della materia.


This course is aimed at providing students with solid knowledge and understanding of topics related to the natural language processing (NLP). In particular, the teaching aims to develop the ability to apply the knowledge acquired and the understanding of problems of both an applied and theoretical nature. The course is also intended to stimulate independent judgment in students, both when analyzing problems and in designing solutions. The informal approach and confrontation with teachers and students in the laboratory part of the course are aimed at stimulating communication skills and enhancing not only direct knowledge, but also the ability to directly learn the subject.

Oggetto:

Programma

Il corso è articolato in tre parti principali.

Parte I (Prof. Mazzei) Introduzione alla linguistica computazionale:

  • Linguistica Computazionale Generale
  • Introduzione allo studio formale del linguaggio
  • Morfologia, Sintassi, Semantica formale
  • Parsing e Generazione
  • Dialogo
  • Traduzione Automatica

Parte II (Prof. Radicioni) Introduzione alla semantica lessicale.

  • Introduzione alla semantica lessicale.
  • Knowledge representation e rappresentazioni strutturate
  • WordNet
  • Il sistema BabelNet
  • FrameNet
  • ConceptNet

Parte III (Prof. Di Caro) Approcci statistici alla linguistica computazionale

  • Language Model.
  • Introduzione alla semantica distribuzionale ed il suo rapporto con gli altri approcci.
  • Semantic Similarity e le sue varianti: task, potenzialità e limiti.
  • Costruzione del significato attraverso composizioni lessico-sintattiche: teorie e risorse
  • Costruzione automatica di ontologie: metodi e strumenti.
  • Cenni su Deep Learning per NLP.

The course is arranged into three main parts. Part I (Prof. Mazzei) Introduction to computational linguistics:

  • Formal approach to natural language
  • Formal morphology, sintax, semantics
  • Parsing and Generation
  • Dialogue
  • Automatic translation

Part II (Prof. Radicioni) Introduction to lexical semantics:

  • Knowledge representation and structured representation systems
  • The WordNet system
  • The BabelNet system
  • FrameNet
  • ConceptNet Such module includes programming exercises (and homework assignments, as well) to get familiar with technologies and theories.

Part III (Prof. Di Caro) Statistical approaches to computational linguistics

  • Language Model.
  • Introduction to distributional semantics and its relationship with other approaches.
  • Semantic Similarity and its variants: Tasks, power and limits.
  • Building meaning through lexical and syntactic compositions: theories and resources.
  • Automatic ontology learning: methods and tools.
  • Deep Learning for NLP. .
Oggetto:

Modalità di insegnamento

Le lezioni saranno svolte principalmente in aula con ausilio di lucidi proiettati su schermo. Il materiale utilizzato a lezione è disponibile on-line sul sito della didattica. Saranno inoltre proposte esercitazioni miranti a familiarizzare con alcuni dei concetti esposti nella parte teorica, e finalizzate ad analizzare problemi specifici.

 

The lessons will be held mainly in the classroom with the aid of transparencies projected onto the screen. The material used in class is available online on the Moodle page for this course. Furthermore, exercises will be proposed aimed at familiarizing with some of the concepts introduced in the theoretical part, and aimed at analyzing specific problems.

 

Oggetto:

Modalità di verifica dell'apprendimento

Esame orale. Le date sono fissate su appuntamento con i docenti. La discussione verterà anche sulle esercitazioni.

 

Oral examination. The dates are fixed by appointment with the teachers. The discussion will also focus on exercises.

 

Testi consigliati e bibliografia



Oggetto:
Libro
Titolo:  
Speech and Language Processing An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition
Anno pubblicazione:  
2023
Editore:  
Pearson Education
Autore:  
Daniel Jurafsky and James H Martin
Permalink:  
Obbligatorio:  
No


Oggetto:
Ultimo aggiornamento: 11/09/2023 08:45
Location: https://magistrale.informatica.unito.it/robots.html
Non cliccare qui!