| 1.
Obiettivo della ricerca
Padova
- ricerca teorica per le analisi e applicazioni alle fasi succesive, allestimento
dei corpora, conferenze e pubblicazioni; tagging dei testi e sviluppo
dei programmi per gli spogli e per i calcoli statistici; ulteriori approfondimenti
teorici, conferenze e pubblicazioni sulla metodologia del lavoro.
Trieste
- creazione di un corpus di circa 500.000 parole e marcatura dei testi;
estensione del corpus a testi multimediali (pubblicità, campagne
governative, materiali turistici, filmati).
Pavia
- creazione del corpus; trattamento dei dati dei corpora.
Padova
- elaborazione dei principi di analisi, acquisizione corpora, inizio analisi
automatico; individuazione della metodologia di analisi dei fenomeni.
2. Risultati
della ricerca (1° anno)
2.1
Risultati (i risultati di maggior rilievo conseguiti nel corso dell'attività
di ricerca)
Il primo
anno ha visto l'allestimento di una serie di corpora di inglese scientifico
(Pavia), giornalistico (Padova), biblico (Padova) e letterario (Padova:
inglese antico, medio e moderno); corpora di testi paralleli inglese-italiano
scientifico (Pavia) e medico-scientifico (Trieste); e un corpus multimodale
di inglese medico-scientifico (Pavia). Altri corpora (paralleli e multilingue)
sono stati acquistati (Pisa).
Di molti
di questi è stato fatto il tagging lessicale e sintattico, e per
i paralleli è stato curato l'allineamento; di alcuni è stato
acquisito anche il copyright. Sono stati usati i programmi di spoglio
OCP, Wordsmith e DBT.
È
stato anche realizzato un software didattico interattivo per la traduzione
di testi multimodali (Trieste); ed è stato perfezionato un software
per lo studio testuale (Padova).
È
stata acquisita strumentazione hardware e software di vario tipo (computer,
scanner,stampanti, videoregistratori, conepresa, materiale per la registrazione,
libri, programmi per gli spogli linguistici come il DBT).
In sede teorica
e metodologica sono state indagate: la teoria della marcatezza/naturalezza
a livello morfologico, lessicale e sintattico, e a livello di discorso
(Pisa); le preposizioni spaziali e degli universali di traduzione, e le
modalità di trascrizione per i corpora multimodali (Pavia); la
traduzione dei testi multimodali e multimediali (Trieste); la proiezione
del discorso diretto e indiretto, la densità lessicale, il concetto
di genere discorsivo, la struttura informativa dei testi, i profili statistici
dei testi e dei generi presenti nei corpora (Padova).
L'intero
gruppo CITATAL ha presentato e confrontato le proprie ricerche
in un seminario organizzato dall'unità di Padova e i cui atti sono
in corso di stampa. L'unità di Pavia ha organizzato un congresso
internazionale su multimodalità e multimedialità.
Le attività
svolte e i risultati ottenuti rispettano i tempi previsti dal progetto
(fasi 1 e 2 pienamente realizzate) e possono essere verificate secondo
i criteri specificati nel progetto (esistenza, grandezza e varietà
dei corpora, e loro trattamento; esistenza e qualità del materiale
didattico prodotto; presenza in Internet dei materiali di cui è
stato superato il problema del copyright; pubblicazioni, conferenze e
seminari).
Il carattere
innovativo delle ricerche svolte è in primo luogo nella grandezza
e varietà dei corpora allestiti, che spaziano attraverso diverse
lingue, generi e periodi; per le analisi degli aspetti pragmatici, semantici
e testuali; e per lo sviluppo di una metodologia per il trattamento informatico
dei testi multimodali e multimediali. È già in uso nelle
varie sedi il software didattico prodotto.
2.2
Problemi
Individuazione
del software adeguato per l'annotazione e analisi dei corpora (i 3 sperimentati
non hanno soddisfatto completamente le esigenze del progetto). Individuazione
del sistema di gestione dei corpora in rete (l'unità di Padova
lavora congiuntamente con il gruppo di ricerca Bibliomedia per una soluzione
comune). Individuazione del software o programma autore per la realizzazione
del materiale didattico (Hypercontext, utilizzato finora, non esiste ancora
in versione Web; l'unità di Padova, congiuntamente con il Centro
Linguistico di Ateneo, sta collaborando con una ditta di informatica per
lo sviluppo di un programma autore a base libera utilizzabile in rete,
interattivo e multimediale). Difficoltà si prevedono anche nella
risoluzione dei problemi di copyright per alcuni dei materiali usati (l'unità
di Padova sta affrontando il problema insieme al Centro di Ateneo per
le Biblioteche di Padova).
Torna su
|
©
2000 Università degli Studi di Padova-Dipartimento di Lingue e
Letterature Anglo-Germaniche e Slave.
Project and design: Elena Nalon |
|