Vai al contenuto principale
Oggetto:
Oggetto:

Languages, Methods and Tools for Developing NLP Applications

Oggetto:

Languages, Methods and Tools for Developing NLP Applications

Oggetto:

Academic year 2023/2024

Course ID
STU0678
Teacher
Daniele Paolo Radicioni (Lecturer)
Degree course
Language Technologies and Digital Humanities
Year
1st year
Teaching period
First semester
Type
Distinctive
Credits/Recognition
12
Course disciplinary sector (SSD)
INF/01 - informatics
Delivery
Formal authority
Language
English
Attendance
Obligatory
Type of examination
Oral
Prerequisites

No prerequisite required. Given the content of the module, a basic knowledge of the most common IT tools would be desirable.

Per la frequenza non è richiesto nessun prerequisito specifico. Dato l'argomento trattato, sono però auspicabili conoscenze di base dei più comuni strumenti informatici.

Oggetto:

Sommario del corso

Oggetto:

Course objectives

This course introduces participants to humanities programming through the use of Python for data acquisition, cleaning, and analysis with NLP tools. 

The basic elements of modern technologies for Natural Language Processing will be introduced, balancing theoretical and practical issues regarding architectures and applications.

Questo corso introduce studentesse e studenti alla programmazione in ottica umanistica attraverso l'uso di Python per l'acquisizione, la pulizia e l'analisi dei dati con strumenti NLP.

Il corso fornisce le basi sulle tecnologie per l'analisi automatica del linguaggio naturale, bilanciando aspetti teorici e pratici relativi ad architetture ed applicazioni di NLP.

Oggetto:

Results of learning outcomes

At the end of the course the students will have acquired:

  • Knowledge of the basic principles of coding
  • Knowledge and understanding of algorithms
  • Ability to write simple programs
  • Basic knowledge on modern NLP, including a complete theoretical background, along with focused notions on mainstream libraries, tools and applications. Lessons will be mostly composed of a theoretical introduction to a specific topic, and complemented by laboratory exercises and assignments.

 

Alla fine del corso le studentesse e gli studenti avranno acquisito:

  • Conoscenza dei principi base della programmazione
  • Conoscenza e comprensione degli algoritmi
  • Capacità di applicare queste conoscenze per scrivere programmi semplici
  • Conoscenza delle tecniche per l'elaborazione automatica del linguaggio naturale, contesto teorico e nozioni su librerie, tool e applicazioni principali. Le lezioni saranno costituite dalla trattazione teorica di un argomento specifico, e arricchite da esercizi e esercitazioni in laboratorio.

Oggetto:

Program

The course is divided into two parts.

Part 1: Introduction to coding in Python. The topics covered will be the following:

  • Coding principles
  • Variables
  • Conditional instructions
  • Loops
  • Functions
  • Input and output on files
  • Data structures: lists and dictionaries
  • Dataframe in pandas
  • Data visualizzation

Part 2: NLP in Python. The topics covered will be the following:

  • NLP introduction: scope of the discipline, motivations, levels of analysis
  • Machine learning basics
  • Word embeddings
  • Language models
  • Lexical semantics
  • Information Extraction and sequential labelling tasks
  • Text categorization

Il corso è diviso in due parti.

Parte 1: Introduzione alla programmazione in Python. Gli agomenti trattati saranno i seguenti:

  • Principi di programmazione
  • Variabili
  • Istruzioni condizionali
  • Cicli
  • Funzioni
  • Input e output di file
  • Strutture dati: liste e dizionari
  • Dataframe con pandas
  • Visualizzazione dati

Parte 2: NLP in Python. Gli agomenti trattati saranno i seguenti:

  • Introduzione al Natural Language Processing: ambiti della disciplina, motivazioni, livelli di analisi
  • Basi di apprendimento automatico
  • Word embeddings
  • Language models
  • Lexical semantics
  • Information Extraction e task di labelling sequenziale
  • Categorizzazione testuale

Oggetto:

Course delivery

Lessons and laboratories.

Courseware will be made available through the Moodle page of the course for each lesson, on lesson by lesson bases.

Lezioni frontali e attività di laboratorio; il materiale sarà caricato su Moodle lezione per lezione durante il corso.

Oggetto:

Learning assessment methods

Practical exercises and/or laboratory projects: final examination will be discussed and negotiated throughout the course, also considering students feedback.

On the exam

The purpose of the course is to provide the tools to master the Python language and to develop applications for natural language processing. Consistent with these objectives, the exam does not require memorizing anything (library documentation and functions are always accessible), nor does it consist of mechanically learning to solve specific types of exercises.

In the exam, students are required to think critically about the problems: mastering the subject means identifying the similarity between an exam problem and an exercise that has already been solved.

Further information is provided in the Moodle page of this course, along with a list of frequently asked questions and their answers.

 

Esame scritto e esercizi pratici e/o svolgimento di progetti di laboratorio: la forma finale dell'esame sarà definita anche sulla base del confronto con studentesse e studenti.

Oggetto:

Support activities

Coding exercises and home assignments.

For students with DSA or disabilities.

Students with SLD or disabilities are kindly requested to read the University's support and reception methods, and in particular the procedures necessary for support during the exam.

Students with DSA are also requested to inform the teacher at the beginning of the course, to negotiate a personal learning path suited to their needs, even beyond the compensatory and dispensatory measures envisaged for the exam.

 

Esercizi di programmazione, anche da svolgere a casa.

Per gli studenti e le studentesse con DSA o disabilità.

Per studentesse e studenti con DSA o disabilità, si prega di prendere visione delle modalità di supporto e di accoglienza di Ateneo, ed in particolare delle procedure necessarie per il supporto in sede d'esame.

Le studentesse e gli studenti con DSA sono inoltre pregate/i di informare il docente
all'inizio del corso, per concordare un percorso di apprendimento
personale adatto alle proprie esigenze, anche al di là delle misure
compensative e dispensative previste per l'esame.

Suggested readings and bibliography



Oggetto:
Other
Title:  
Python.org
Description:  
Workspace providing language documentation, and pointers to tutorials.
URL:  
Required:  
No


Oggetto:
Book
Title:  
Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition
Year of publication:  
2006
Publisher:  
Pearson
Author:  
Daniel Jurafsky & James H. Martin
Permalink:  
Chapters:  
1, 2, 3, 4, 6, 7, 10
Required:  
No
Oggetto:

Specific references will be provided for the covered topics, both on Python programming and Natural Language Processing.

Indicazioni bibliografiche specifiche saranno fornite per gli argomenti trattati nel corso.



Oggetto:

Notes

The course is strongly focused on the laboratory and on practical coding exercises, therefore attendance is warmly recommended.

START lesson: the course will be starting on Thursday November 16,th at 8:00 in 'AULA INFORMATICA 2' which is found in the Aldo Moro building ('Complesso Aldo Moro'). Don't miss it!

 

Il corso è fortemente improntato al laboratorio e agli esercizi pratici di programmazione, pertanto la frequenza è caldamente consigliata.

Prima lezione il 16 Novembre alle ore 8:00 nell'Aula Informatica 2 del Complesso Aldo Moro.

 

Enroll
  • Open
    Enrollment opening date
    01/09/2023 at 00:00
    Enrollment closing date
    30/06/2024 at 00:00
    Oggetto:
    Last update: 17/06/2024 10:11
    Location: https://www.digitalhumanities.unito.it/robots.html
    Non cliccare qui!