Pagina iniziale
Relazioni
Pagina iniziale| Unità Locali di Ricerca | Coordinatori | Programma | Corpora e materiali creati

1. Obiettivo della ricerca

Padova
- ricerca teorica per le analisi e applicazioni alle fasi succesive, allestimento dei corpora, conferenze e pubblicazioni; tagging dei testi e sviluppo dei programmi per gli spogli e per i calcoli statistici; ulteriori approfondimenti teorici, conferenze e pubblicazioni sulla metodologia del lavoro.

Trieste
- creazione di un corpus di circa 500.000 parole e marcatura dei testi; estensione del corpus a testi multimediali (pubblicità, campagne governative, materiali turistici, filmati).

Pavia
- creazione del corpus; trattamento dei dati dei corpora.

Padova
- elaborazione dei principi di analisi, acquisizione corpora, inizio analisi automatico; individuazione della metodologia di analisi dei fenomeni.

2. Risultati della ricerca (1° anno)

2.1 Risultati (i risultati di maggior rilievo conseguiti nel corso dell'attività di ricerca)

Il primo anno ha visto l'allestimento di una serie di corpora di inglese scientifico (Pavia), giornalistico (Padova), biblico (Padova) e letterario (Padova: inglese antico, medio e moderno); corpora di testi paralleli inglese-italiano scientifico (Pavia) e medico-scientifico (Trieste); e un corpus multimodale di inglese medico-scientifico (Pavia). Altri corpora (paralleli e multilingue) sono stati acquistati (Pisa).

Di molti di questi è stato fatto il tagging lessicale e sintattico, e per i paralleli è stato curato l'allineamento; di alcuni è stato acquisito anche il copyright. Sono stati usati i programmi di spoglio OCP, Wordsmith e DBT.

È stato anche realizzato un software didattico interattivo per la traduzione di testi multimodali (Trieste); ed è stato perfezionato un software per lo studio testuale (Padova).

È stata acquisita strumentazione hardware e software di vario tipo (computer, scanner,stampanti, videoregistratori, conepresa, materiale per la registrazione, libri, programmi per gli spogli linguistici come il DBT).

In sede teorica e metodologica sono state indagate: la teoria della marcatezza/naturalezza a livello morfologico, lessicale e sintattico, e a livello di discorso (Pisa); le preposizioni spaziali e degli universali di traduzione, e le modalità di trascrizione per i corpora multimodali (Pavia); la traduzione dei testi multimodali e multimediali (Trieste); la proiezione del discorso diretto e indiretto, la densità lessicale, il concetto di genere discorsivo, la struttura informativa dei testi, i profili statistici dei testi e dei generi presenti nei corpora (Padova).

L'intero gruppo CITATAL ha presentato e confrontato le proprie ricerche in un seminario organizzato dall'unità di Padova e i cui atti sono in corso di stampa. L'unità di Pavia ha organizzato un congresso internazionale su multimodalità e multimedialità.

Le attività svolte e i risultati ottenuti rispettano i tempi previsti dal progetto (fasi 1 e 2 pienamente realizzate) e possono essere verificate secondo i criteri specificati nel progetto (esistenza, grandezza e varietà dei corpora, e loro trattamento; esistenza e qualità del materiale didattico prodotto; presenza in Internet dei materiali di cui è stato superato il problema del copyright; pubblicazioni, conferenze e seminari).

Il carattere innovativo delle ricerche svolte è in primo luogo nella grandezza e varietà dei corpora allestiti, che spaziano attraverso diverse lingue, generi e periodi; per le analisi degli aspetti pragmatici, semantici e testuali; e per lo sviluppo di una metodologia per il trattamento informatico dei testi multimodali e multimediali. È già in uso nelle varie sedi il software didattico prodotto.

2.2 Problemi

Individuazione del software adeguato per l'annotazione e analisi dei corpora (i 3 sperimentati non hanno soddisfatto completamente le esigenze del progetto). Individuazione del sistema di gestione dei corpora in rete (l'unità di Padova lavora congiuntamente con il gruppo di ricerca Bibliomedia per una soluzione comune). Individuazione del software o programma autore per la realizzazione del materiale didattico (Hypercontext, utilizzato finora, non esiste ancora in versione Web; l'unità di Padova, congiuntamente con il Centro Linguistico di Ateneo, sta collaborando con una ditta di informatica per lo sviluppo di un programma autore a base libera utilizzabile in rete, interattivo e multimediale). Difficoltà si prevedono anche nella risoluzione dei problemi di copyright per alcuni dei materiali usati (l'unità di Padova sta affrontando il problema insieme al Centro di Ateneo per le Biblioteche di Padova).


Torna su

© 2000 Università degli Studi di Padova-Dipartimento di Lingue e Letterature Anglo-Germaniche e Slave.
Project and design: Elena Nalon
Pagina iniziale| Unità Locali di Ricerca | Coordinatori | Programma | Corpora e materiali creati