L’obiettivo del Question Answering (QA) è implementare sistemi automatizzati in grado di fornire risposte a domande formulate in un linguaggio naturale attraverso software specifici, denominati “agenti virtuali”. Il tema delle risposte automatiche è indicato genericamente come “chatbot”.
La possibilità di offrire automaticamente una risposta ad una domanda più o meno generica di un utente, senza dover passare per un operatore umano, unita alla capacità di questi “agenti virtuali” di svolgere operazioni complesse come prenotare hotel e ristoranti, effettuare acquisti o gestire la daily-routine, ha reso il Question Answering un tema di particolare interesse nel contesto attuale: sempre più aziende mettono al servizio dei clienti questo nuovo canale di comunicazione e non solo le società più in vista (vedi Google Home, Alexa e Siri).
Già a partire dal 2017 il team di Theuth lavorava al tema del QA: il progetto, in collaborazione con Network Contacts (parte del Gruppo Activa), era finalizzato alla realizzazione di agenti virtuali per migliorare l’interazione uomo/macchina all’interno di servizi di customer-care. Applicando le tecniche del NLP ed effettuando ricerche su conversazioni e dialoghi, Theuth è riuscita ad individuare alcuni fenomeni linguistici ricorrenti e a regolamentarli in grammatiche ad automi finiti e lessici elettronici. Tali conoscenze sono state successivamente trasferite alla macchina.

Il convegno “Big Data For Multi-Agent Specialized System: Modelli Computazionali ibridi per il Question Answering” tenutosi il 22 e 23 maggio 2019 presso l’Università di Salerno si collocava nell’ambito del progetto BIG.4.M.A.S.S., una ricerca capitanata da Network Contacts e finalizzata allo sviluppo di modelli informatici destinati all’implementazione di sistemi ibridi composti da agenti virtuali e umani che cooperano al fine di trattare grandi volumi di dati eterogenei e dinamici.
La collaborazione con Newtork Contacts in questo progetto ha prodotto Chappie, un software di QA semantico in grado di interpretare le domande degli utenti e, contestualmente, di fornire in output risposte testuali o miste (a seconda se l’utente abbia dichiarato o meno la necessità di ricevere un aiuto operativo e non solo informativo). Al funzionamento di Chappie sottende una preliminare analisi semantica attraverso sistemi per l’elaborazione del linguaggio naturale utili all’estrazione del topic della richiesta dell’utente e delle relative entità. Il voicebot, con un approccio statistico inferenziale, ingloba le classi che ricerca all’interno di un’ontologia e attraverso un matching con queste restituisce una risposta. Dai un’occhiata alla DEMO di Chappie:
Le principali componenti di un software di risposta automatica a domande in linguaggio naturale sono:
- Knowledge Base: componente da cui si recuperano le informazioni
- Analisi delle Query: componente che analizza la domanda e ne rintraccia gli elementi informativi
- Recupero delle informazioni: componente che estrae e organizza le informazioni richieste dalla query
L’interesse linguistico-computazionale è volto anche alla soluzione di alcune questioni aperte. Di seguito le più frequenti:
- Gap Lessicale: indica il discostamento fra il vocabolario utilizzato nelle queries e quello della Knowledge Base
- Ambiguità: è possibile riscontrare casi di omonimia e polisemia.
- Complessità delle queries: capacità di risolvere queries linguisticamente complesse.
- Domande procedurali, temporali, spaziali: spesso i sistemi di QA hanno difficoltà a trattare questo tipo di richiesta
- Sinonimia: un chatbot deve essere in grado di riconoscere quando due parole differenti hanno lo stesso significato
Theuth continua le ricerche e ha costruito risorse lessicali e algoritmi linguistici in grado di fornire soluzioni ai problemi (in particolare alla sinonimia), consapevole che, in un contesto sociale e tecnologico sempre più interconnesso, le aziende pretendono risposte veloci ed esaustive per poter soddisfare al meglio le richieste dell’utente.