Via Giovanni Paolo, Fisciano (SA) - Italy
+39 089 963019
info@theuthlinguistic.com

Dizionari elettronici

Specialisti in linguaggi naturali e intelligenze artificiali

Dizionari elettronici

I dizionari elettronici sono molto diversi dai dizionari o vocabolari di carta o consultabili on line: questi ultimi sono per uso “umano”, adoperati per chiarire dubbi ortografici, grammaticali, semantici oppure etimologici e costruiti in base all’esperienza individuale dei lessicografi. Al contrario, i dizionari elettronici per uso “artificiale”, cioè sono inseriti in software di linguistica computazionale, risultano spesso incomprensibili ad un utente umano.

Le lingue con le quali parliamo e scriviamo non sono accessibili direttamente nel cervello, per questa ragione, da secoli, i linguisti cercano di adottare strategie e tattiche per scoprire le regole nascoste che le fanno funzionare: ne sono state scoperte ancora poche, rispetto alla loro ricchezza straordinaria. Per trasferire un po’ di conoscenza linguistica umana al computer, che è uno degli obiettivi dell’Intelligenza Artificiale, la linguistica computazionale ha fatto e fa continuamente sperimentazioni. In alcuni casi, l’approccio “Machine Learning” cerca di sfruttare la straordinaria capacità di calcolo dei computer per evitare di impelagarsi nella selva di regole non ancora chiare neanche ai linguisti.

Theuth ha ereditato dalla tradizione linguistica una metodologia basata su regole, costruendo dizionari elettronici che rendono esplicite per il computer caratteristiche morfologiche e sintattiche dei discorsi umani. Esistono infatti diversi tipi di dizionari, ognuno finalizzato a uno scopo in base alle esigenze computazionali. Il problema cruciale resta il significato delle parole e delle frasi: ogni parola ha un rapporto diverso con le altre parole. Alcune parole sono in grado di selezionare e controllarne altre, ma non tutte possono farlo (per esempio i verbi possono farlo, molti aggettivi pure, i nomi solo a certe condizioni). Il significato di una parola dipende così dal rapporto che ha con le altre che la selezionano.

Theuth ha costruito dei dizionari elettronici che permettono di prevedere quali parole avranno un certo significato se sono selezionate da altre. Inoltre, sono state “scoperte” centinaia di migliaia di parole che si combinano in modo fisso e che assumono un significato particolare: sono parole quasi “concetti”, costituiscono un patrimonio lessicale (lessici di dominio) che Theuth ha organizzato in quasi 150 campi semantici, dall’archeologia alla metallurgia, dall’architettura all’economia, dal diritto ai sentimenti. Nuovi lessici possono essere elaborati in base alle esigenze. Combinando tutti questi diversi dizionari, Theuth riesce ad automatizzare in parte l’estrazione del significato di un discorso senza ricorrere alle vaghe definizioni dei vocabolari “umani” e costruendo sistemi “ontologici” più efficaci. La strategia vincente è quella che mette insieme questa metodologia con le tattiche “statistiche” del machine learning  in un modello ibrido.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *