Skip to Main Content (Press Enter)

Logo UNIOR
  • ×
  • Home
  • Corsi
  • Insegnamenti
  • Persone
  • Strutture

UNIFIND
Logo UNIOR

|

UNIFIND

unior.it
  • ×
  • Home
  • Corsi
  • Insegnamenti
  • Persone
  • Strutture
  1. Insegnamenti

0000878 - DATI LINGUISTICI

insegnamento
ID:
0000878
Durata (ore):
36
CFU:
6
SSD:
DIDATTICA DELLE LINGUE MODERNE
Url:
Dettaglio Insegnamento:
Traduzione specialistica/Consulenti linguistici Anno: 1
Anno:
2025
  • Dati Generali
  • Syllabus
  • Corsi
  • Persone

Dati Generali

Periodo di attività

Secondo Semestre (23/02/2026 - 29/05/2026)

Syllabus

Obiettivi Formativi

Al termine del corso, lo studente sarà in grado di:

  • Comprendere il ruolo e l’impatto dei dati linguistici nelle tecnologie per la traduzione;
  • Conoscere e classificare le principali risorse linguistiche digitali (corpora, dizionari elettronici, banche dati terminologiche, memorie di traduzione);
  • Analizzare la struttura e i formati standard dei dati linguistici;
  • Comprendere le problematiche intrinseche nei dati linguistici;
  • Cercare nei repository per ri-utilizzare dati linguistici open source;
  • Utilizzare strumenti per la creazione, gestione e interrogazione di corpora bilingui o multilingui;
  • Valutare criticamente la qualità delle risorse e delle tecnologie adottate in ambito traduttivo;




Prerequisiti

Nessuno


Metodi didattici

Lezioni frontali con supporto di slide e dimostrazioni pratiche (30h)

Esercitazioni guidate in laboratorio su software, tools e risorse (6h)



Verifica Apprendimento

L’esame finale è volto a verificare l’acquisizione delle conoscenze teoriche, delle competenze applicative e della capacità critica in linea con i Descrittori di Dublino:

  • Conoscenze e capacità di comprensione delle teorie e delle problematiche linguistiche applicate ai dati per le tecnologie di traduzione.
  • Autonomia di giudizio nella valutazione di dati e strumenti tecnologici.
  • Abilità comunicative nell’uso della terminologia metalinguistica e nella spiegazione dei concetti teorico-pratici.
  • Capacità di apprendimento attraverso l’uso critico di strumenti e metodologie.



Prova orale sugli argomenti trattati durante il corso

Partecipazione attiva: valutazione della partecipazione alle attività seminariali (per frequentanti).


Criteri di valutazione e griglia dei voti

  • 30 – 30L: Risultati eccellenti. Ottima comprensione dei contenuti, uso appropriato della terminologia metalinguistica, eccellente capacità di applicazione e autonomia di giudizio.
  • 27 – 29: Risultati sopra la media, con errori marginali. Buona conoscenza dei concetti e competenza nell’applicazione.
  • 24 – 26: Livello buono ma con alcune lacune. Comprensione adeguata dei contenuti, discreta applicazione delle conoscenze.
  • 21 – 23: Risultati sufficienti, presenza di lacune significative. Capacità minima di collegamento tra teoria e pratica.
  • 18 – 20: Conoscenza di base limitata, applicazione parziale delle competenze.
  • < 18: Insufficiente. Non sono stati acquisiti i concetti fondamentali. L’esame dovrà essere ripetuto.

Testi

  • Sin-Wai, C. (2023). Routledge encyclopedia of translation technology. Taylor & Francis Group. (capitoli selezionati comunicati a lezione)
  • O'Hagan, M. (Ed.). (2019). The Routledge handbook of translation and technology. Taylor & Francis. (capitoli selezionati comunicati a lezione)


  • Egger, Roman & Gokce, Enes. (2022). Natural Language Processing (NLP): An Introduction: Making Sense of Textual Data. 10.1007/978-3-030-88389-8_15. 
  • Vanmassenhove, E. (2025). Losing our Tail--Again: On (Un) Natural Selection And Multilingual Large Language Models. arXiv preprint arXiv:2507.03933.
  • Vanmassenhove, E., Shterionov, D., and Gwilliam, M. (2021). Machine translationese: Effects of algorithmic bias on linguistic complexity in machine translation. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, pages 2203–2213.
  • Bender, E. M., & Friedman, B. (2018). Data statements for natural language processing: Toward mitigating system bias and enabling better science. Transactions of the Association for Computational Linguistics, 6, 587-604.
  • Měchura, M. (2022, July). A taxonomy of bias-causing ambiguities in machine translation. In Proceedings of the 4th Workshop on Gender Bias in Natural Language Processing (GeBNLP) (pp. 168-173).
  • Haddow, B., Bawden, R., Barone, A. V. M., Helcl, J., & Birch, A. (2022). Survey of low-resource machine translation. Computational Linguistics, 48(3), 673-732.
  • Moorkens, J. (2022). Ethics and machine translation. Machine translation for everyone: Empowering users in the age of artificial intelligence, 18, 121.
  • Riediger, H., & Galati, G. (2023). La traduzione nell’era dell'IA: nuovi ruoli, nuove competenze, nuova formazione. mediAzioni, 39, A35-A54.


Altri materiali verranno comunicati durante le lezioni




Contenuti

Il corso si propone di fornire una comprensione approfondita dei dati linguistici digitali e del loro ruolo fondamentale nelle tecnologie della traduzione. Si analizzeranno le definizioni e le tipologie di dati linguistici, il loro ruolo e impatto sulle prestazioni dei sistemi di traduzione, e i principali problemi di qualità come rumore, disallineamento, ridondanza e bias.

Particolare attenzione sarà dedicata alla tracciabilità e ai metadati, ai repository open source per le risorse linguistiche, e alle pratiche di creazione, allineamento, annotazione, interrogazione e analisi di corpora paralleli. Verranno illustrate le metodologie per la costruzione di dizionari elettronici, glossari e banche dati terminologiche, nonché le tecniche di normalizzazione e pulizia dei dati (preprocessing) e i formati e standard di scambio dati più diffusi.

Il corso affronterà inoltre le sfide relative ai dati rari e alle lingue per le quali sono disponibili poche risorse linguistiche, le strategie per migliorare la copertura linguistica e la qualità delle traduzioni.

Non mancheranno approfondimenti su origine, affidabilità ed etica dei dati, così come sui diritti d’autore e il riuso delle risorse linguistiche.

Infine, verranno discussi i nuovi profili professionali e le competenze richieste dall’industria linguistica, fornendo agli studenti strumenti teorici e operativi per gestire, analizzare e valorizzare i dati linguistici nel contesto delle tecnologie della traduzione.


Lingua Insegnamento

Italiano


Altre informazioni

Si consiglia la frequenza al corso dove saranno illustrati esempi pratici.


Corsi

Corsi

Traduzione specialistica 
Laurea Magistrale
2 anni
No Results Found

Persone

Persone

SPERANZA GIULIA
Docenti
No Results Found
  • Utilizzo dei cookie

Realizzato con VIVO | Designed by Cineca | 25.10.0.6