36
DIDATTICA DELLE LINGUE MODERNE
Dati Generali
Periodo di attività
Syllabus
Obiettivi Formativi
Al termine del corso, lo studente sarà in grado di:
- Comprendere il ruolo e l’impatto dei dati linguistici nelle tecnologie per la traduzione;
- Conoscere e classificare le principali risorse linguistiche digitali (corpora, dizionari elettronici, banche dati terminologiche, memorie di traduzione);
- Analizzare la struttura e i formati standard dei dati linguistici;
- Comprendere le problematiche intrinseche nei dati linguistici;
- Cercare nei repository per ri-utilizzare dati linguistici open source;
- Utilizzare strumenti per la creazione, gestione e interrogazione di corpora bilingui o multilingui;
- Valutare criticamente la qualità delle risorse e delle tecnologie adottate in ambito traduttivo;
Prerequisiti
Nessuno
Metodi didattici
Lezioni frontali con supporto di slide e dimostrazioni pratiche (30h)
Esercitazioni guidate in laboratorio su software, tools e risorse (6h)
Verifica Apprendimento
L’esame finale è volto a verificare l’acquisizione delle conoscenze teoriche, delle competenze applicative e della capacità critica in linea con i Descrittori di Dublino:
- Conoscenze e capacità di comprensione delle teorie e delle problematiche linguistiche applicate ai dati per le tecnologie di traduzione.
- Autonomia di giudizio nella valutazione di dati e strumenti tecnologici.
- Abilità comunicative nell’uso della terminologia metalinguistica e nella spiegazione dei concetti teorico-pratici.
- Capacità di apprendimento attraverso l’uso critico di strumenti e metodologie.
Prova orale sugli argomenti trattati durante il corso
Partecipazione attiva: valutazione della partecipazione alle attività seminariali (per frequentanti).
Criteri di valutazione e griglia dei voti
- 30 – 30L: Risultati eccellenti. Ottima comprensione dei contenuti, uso appropriato della terminologia metalinguistica, eccellente capacità di applicazione e autonomia di giudizio.
- 27 – 29: Risultati sopra la media, con errori marginali. Buona conoscenza dei concetti e competenza nell’applicazione.
- 24 – 26: Livello buono ma con alcune lacune. Comprensione adeguata dei contenuti, discreta applicazione delle conoscenze.
- 21 – 23: Risultati sufficienti, presenza di lacune significative. Capacità minima di collegamento tra teoria e pratica.
- 18 – 20: Conoscenza di base limitata, applicazione parziale delle competenze.
- < 18: Insufficiente. Non sono stati acquisiti i concetti fondamentali. L’esame dovrà essere ripetuto.
Testi
- Sin-Wai, C. (2023). Routledge encyclopedia of translation technology. Taylor & Francis Group. (capitoli selezionati comunicati a lezione)
- O'Hagan, M. (Ed.). (2019). The Routledge handbook of translation and technology. Taylor & Francis. (capitoli selezionati comunicati a lezione)
- Egger, Roman & Gokce, Enes. (2022). Natural Language Processing (NLP): An Introduction: Making Sense of Textual Data. 10.1007/978-3-030-88389-8_15.
- Vanmassenhove, E. (2025). Losing our Tail--Again: On (Un) Natural Selection And Multilingual Large Language Models. arXiv preprint arXiv:2507.03933.
- Vanmassenhove, E., Shterionov, D., and Gwilliam, M. (2021). Machine translationese: Effects of algorithmic bias on linguistic complexity in machine translation. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, pages 2203–2213.
- Bender, E. M., & Friedman, B. (2018). Data statements for natural language processing: Toward mitigating system bias and enabling better science. Transactions of the Association for Computational Linguistics, 6, 587-604.
- Měchura, M. (2022, July). A taxonomy of bias-causing ambiguities in machine translation. In Proceedings of the 4th Workshop on Gender Bias in Natural Language Processing (GeBNLP) (pp. 168-173).
- Haddow, B., Bawden, R., Barone, A. V. M., Helcl, J., & Birch, A. (2022). Survey of low-resource machine translation. Computational Linguistics, 48(3), 673-732.
- Moorkens, J. (2022). Ethics and machine translation. Machine translation for everyone: Empowering users in the age of artificial intelligence, 18, 121.
- Riediger, H., & Galati, G. (2023). La traduzione nell’era dell'IA: nuovi ruoli, nuove competenze, nuova formazione. mediAzioni, 39, A35-A54.
Altri materiali verranno comunicati durante le lezioni
Contenuti
Il corso si propone di fornire una comprensione approfondita dei dati linguistici digitali e del loro ruolo fondamentale nelle tecnologie della traduzione. Si analizzeranno le definizioni e le tipologie di dati linguistici, il loro ruolo e impatto sulle prestazioni dei sistemi di traduzione, e i principali problemi di qualità come rumore, disallineamento, ridondanza e bias.
Particolare attenzione sarà dedicata alla tracciabilità e ai metadati, ai repository open source per le risorse linguistiche, e alle pratiche di creazione, allineamento, annotazione, interrogazione e analisi di corpora paralleli. Verranno illustrate le metodologie per la costruzione di dizionari elettronici, glossari e banche dati terminologiche, nonché le tecniche di normalizzazione e pulizia dei dati (preprocessing) e i formati e standard di scambio dati più diffusi.
Il corso affronterà inoltre le sfide relative ai dati rari e alle lingue per le quali sono disponibili poche risorse linguistiche, le strategie per migliorare la copertura linguistica e la qualità delle traduzioni.
Non mancheranno approfondimenti su origine, affidabilità ed etica dei dati, così come sui diritti d’autore e il riuso delle risorse linguistiche.
Infine, verranno discussi i nuovi profili professionali e le competenze richieste dall’industria linguistica, fornendo agli studenti strumenti teorici e operativi per gestire, analizzare e valorizzare i dati linguistici nel contesto delle tecnologie della traduzione.
Lingua Insegnamento
Italiano
Altre informazioni
Si consiglia la frequenza al corso dove saranno illustrati esempi pratici.