Via Giovanni Paolo, Fisciano (SA) - Italy
+39 089 963019
info@theuthlinguistic.com

Social Media Analysis

Specialisti in linguaggi naturali e intelligenze artificiali

Nella nostra quotidianità utilizziamo i social media per scrivere recensioni, tweet e caption: in questo modo, anche opinioni ed emozioni si tramutano in Big Data da poter analizzare adoperando la tecnica della Sentiment Analysis.

La Sentiment Analysis consiste nel trattamento automatico di testi non strutturati che contengono opinioni. È una tecnica di analisi che consente di capire l’orientamento dei soggetti verso un oggetto cognitivo (personaggio pubblico, brand, partito politico, ecc.) a partire da un testo.

L’oggetto di analisi della Sentiment Analysis riguarda, dunque, la sfera delle opinioni e delle emozioni espresse linguisticamente.

Il contesto che ha favorito la crescita di interesse, accademico e commerciale, attorno al fenomeno della SA può essere descritto in pochi punti:

  • l’espansione dell’e-commerce
  • la crescita dei contenuti generati dagli utenti (forum, discussion group, blog, social media, review website, aggregation site)
  • l’esplosione di algoritmi e metodi “learning”
  • il riconoscimento dell’importanza dell’ electronic word-of-mouth Word of Mouth (eWOM)
  • le difficoltà nel trattamento automatico dei Big Data

Per l’analisi delle comunicazioni sui social network (Facebook, Twitter ed Instagram in particolare), trattiamo dati strutturati (inseriti in box) e non strutturati (testi liberi). I contenuti sono processati nella loro interezza (immagini, testi, emoji ed hashtag compresi) al fine di calcolare l’Orientamento Semantico (OS), effettuare misurazioni di polarità (positiva o negativa) ed individuare macrotemi (campi semantici di interesse). L’approccio che usiamo è basato sul lessico e sull’idea che l’OS di un testo sia strettamente dipendente da quello parole occorrenti in esso.

Dall’intersezione di queste tipologie di trattamenti vengono effettuate:

  • un’analisi quantitativa del fenomeno, in cui è possibile descrivere le tematiche più trattate e più performanti
  • un’analisi qualitativa, in cui si evincono i toni di voce tradotti in emozioni e si delinea una gerarchia di quest’ultime in base ai temi individuati

Il fine della Sentiment Analysis è:

  • fotografare il risultato delle performance di chi si rende visibile sul web
  • suggerire strategie più efficaci sul piano espressivo e contenutistico, con la possibilità di adottare questo tipo di rilevazione per la progettazione di campagne data driven

Emoji

Nel nostro approccio tutte le componenti del corpus, comprese le emoji, sono state preliminarmente convertite in testo e successivamente analizzate come parole. La risorsa a nostra disposizione è un database lessicale in cui le emoji sono rappresentate da codici esadecimali riconoscibili in codifica UTF-8. Attribuendogli parole ed etichette sintattiche e semantiche, queste entità possono essere processate automaticamente attraverso le tecniche di NLP.

Hashtag

Anche gli hashtag utilizzati nelle didascalie di Instagram o nei post di Twitter contengono informazioni semantiche al loro interno. Le risorse utilizzate sono grammatiche morfo-sintattiche, nella forma di Automi a Stati Finiti.

L’output del sistema consiste in un lemma annotato automaticamente come hashtag a cui, per semplicità, viene attribuita la categoria grammaticale del costituente testa nelle forme composte, della parola che rappresenta la testa dei gruppi di parole liberi e del verbo nei casi in cui l’hashtag contiene intere frasi. Le annotazioni prodotte dalla grammatica morfologica includono informazioni sintattiche e semantiche ereditate da tutti i lemmi di cui si compone, incluse quelle di sentimento.

Dai un’occhiata alle Sentiment Analysis condotte per: