Guida per principianti alla comprensione delle analisi dei testi
3 gennaio 2022
Esperienza del clienteQuando i clienti sono entusiasti o delusi dalle interazioni e dalla customer experience (CX) di un marchio, è probabile che abbiano fornito un feedback ricco di dati. I dati di feedback - diretti, indiretti, strutturati o non strutturati - sono ovunque.
Dai sondaggi alle recensioni sui social media, un sito Azienda ha l'opportunità di cogliere i segnali dei clienti che guidano il processo decisionale e il successo complessivo dell'azienda.
Spesso, però, i brand hanno difficoltà a gestire questa mole di dati. Per gli analisti umani è eccessivo (e virtualmente impossibile) esaminare manualmente migliaia di feedback su un'ampia varietà di canali su base regolare.
Ma c'è una soluzione a questa sfida: l'analisi testuale, che consente di ricavare informazioni dai dati prendendo i commenti ricchi di sentimento e classificandoli in categorie rilevanti per l'azienda.
Che cos'è l'analisi del testo nei Big Data?
Nell'ecosistema omnichannel, i punti di contatto tra un marchio e i suoi clienti sono innumerevoli. Ogni giorno vengono generate enormi quantità di dati, spesso definiti big data.
L'analisi del testo è uno dei metodi utilizzati per ottenere informazioni dai big data convertendo il testo non strutturato in dati strutturati.
Per analizzare e comprendere i dati testuali non strutturati sono necessarie diverse procedure. L'analisi del testo comprende processi come la pulizia dei dati, la pre-elaborazione, l'estrazione di caratteristiche e l'apprendimento automatico (ML).
Differenza tra analisi del testo e text mining
L'analisi del testo e il text mining vengono comunemente confusi, e non c'è dubbio che i due argomenti siano diversi. L'analisi del testo utilizza metodi statistici e di apprendimento automatico per valutare i dati testuali e ricavarne informazioni, mentre il text mining estrae informazioni da dati non strutturati.
Vantaggi dell'analisi del testo
L'analisi del testo sta diventando sempre più popolare. I marchi leader in molti settori stanno investendo in piattaforme software dicustomer experience management (CEM) che offrono l'analisi del testo come una delle principali funzionalità.
Ecco una panoramica dei vantaggi dell'analisi dei testi che migliorano un programma di feedback:
- Aumentare gli approfondimenti con meno domande: I sondaggi lunghi e prolungati possono indurre i clienti a non fornire un feedback, ma l'analisi dei testi scava più a fondo nelle parole delle risposte, anche se brevi, per rivelare il significato che si cela dietro le loro parole.
- Arrivare alla causa principale: I punteggi numerici non sempre spiegano il "perché" del feedback. L'analisi testuale, invece, fornisce dettagli che permettono di identificare cosa funziona e qual è la causa principale di un problema che i clienti incontrano di frequente.
- Ottenere approfondimenti tempestivi: I dipendenti hanno già un elenco di compiti che richiedono molto tempo, e chiedere loro di sondare ogni parola del feedback dei clienti non è realistico. L'analisi testuale gestisce l'intero passaggio e lo fa con un'affidabilità molto maggiore.
- Identificare le tendenze emergenti: Gli esseri umani hanno bisogno di dati per prendere decisioni informate e intelligenti. Grazie alle parole e alle frasi utilizzate dai clienti, l'analisi dei testi mette in luce le tendenze che un'azienda non può permettersi di ignorare e di cui deve approfittare.
- Comprendere le esigenze dei clienti: I clienti vi diranno cosa vogliono, di cosa hanno bisogno e cosa si aspettano. Basta ascoltarli e l'analisi dei testi porta in primo piano parole chiave, temi e sentimenti.
- Prendete decisioni basate sui dati: Per servire meglio i clienti, lasciate che le intuizioni derivate dall'analisi del testo offrano un percorso da seguire per la strategia dicustomer experience .
- Migliorare i clienti e employee experience: come per la CX, l'analisi testuale migliora anche employee experience (EX). L'analisi testuale analizza i dati dei dipendenti, come il punteggio di impegno, il coinvolgimento, la soddisfazione e il sentiment.
Con l'aumento del volume di feedback raccolti dalle organizzazioni, l'analisi dei testi è l'unica opzione per tenere il passo.
Analisi del testo di base
L'analisi del testo varia da quella di base a quella avanzata. Il tipo di comprensione che si ottiene dipende dal tipo di analisi utilizzato.
A livello di base, l'analisi del testo comporta quanto segue.
Analisi della frequenza delle parole
L'analisi della frequenza delle parole conta le parole presenti nel testo. Questo approccio consente di individuare i termini e gli argomenti più popolari del testo.
Rilevamento delle frasi
Oltre all'uso di parole specifiche, ci sono frasi che il pubblico può usare e che hanno un'influenza significativa sul sentiment e su altri elementi chiave. Il rilevamento delle frasi permette di trovare frasi frequenti nel testo, consentendo di identificare i temi.
Analisi del sentimento
A livello superficiale, le parole possono essere fuorvianti se non si ha un contesto. Un modo per ottenere la giusta prospettiva è determinare le emozioni associate. È qui che entra in gioco la sentiment analysis. Essa aiuta a determinare l'emozione di un testo, consentendo di identificare le aree di sviluppo.
Modellazione degli argomenti
Quando parole, frasi e sentimenti sono ripetitivi, significa che c'è un tema di fondo. La modellazione tematica identifica i temi del testo e aiuta a individuare le idee principali di un testo.
Analisi testuale avanzata
A seconda delle dimensioni e della natura dell'azienda, l'analisi testuale di base potrebbe non offrire una visione sufficiente. Potrebbe essere necessario ricorrere ad analisi testuali avanzate.
Riconoscimento di entità denominate
Il riconoscimento di entità denominate (NER) identifica e categorizza persone, organizzazioni e luoghi nel testo. Inoltre, questo metodo aiuta a identificare le connessioni tra entità testuali.
Classificazione del testo
La categorizzazione del testo prevede la classificazione del testo in diverse categorie. Oltre ad aiutare a organizzare i dati di un testo massiccio, questo metodo individua i modelli.
Raggruppamento
Un altro modo per identificare i modelli nei dati non strutturati è il clustering. Questo metodo raggruppa il testo in base al contenuto, rendendo più facile l'identificazione dei modelli.
Estrazione della relazione
Anche se non accade spesso, alcuni dei vostri consumatori potrebbero avere relazioni strette. Grazie all'estrazione delle relazioni, è possibile determinare le relazioni testuali tra persone, organizzazioni e luoghi. Questa conoscenza aggiunge un contesto alle loro conversazioni, consentendovi di agire di conseguenza.
Analisi della rete
Andando oltre le relazioni, vi renderete conto che esistono gruppi specifici con un legame comune. L'analisi di rete esamina i collegamenti testuali per trovare modelli e tendenze che aiutano a spiegare come le cose interagiscono.
Tecniche e applicazioni di analisi del testo
L'analisi testuale comprende varie tecniche di analisi dei dati non strutturati e basati sul testo. Oltre all'analisi dei temi e all'analisi del sentiment, esistono diverse altre tecniche che le aziende possono utilizzare per ottenere informazioni dai loro dati testuali.
Passiamo in rassegna le tecniche e le applicazioni dell'analisi del testo.
Analisi degli argomenti
L'analisi tematica categorizza le frasi dei feedback dei clienti in argomenti rilevanti per l'azienda. Ad esempio, "l'addetto alle vendite era gentile" verrebbe categorizzato in "cordialità del personale". In genere esistono due modi per ottenere questo risultato: un'impostazione manuale, un approccio basato su regole e tecniche di apprendimento automatico.
Analisti e linguisti costruiscono manualmente le regole per il metodo basato sulle regole. Ad esempio, una clausola contenente due parole come "amichevole" e "dipendente" potrebbe essere inserita nell'argomento "Cordialità del personale".
Tali regole possono anche valutare l'ordine delle parole e le relazioni grammaticali tra parole importanti. La procedura di impostazione richiede molto tempo, ma i commenti classificati sono precisi perché ogni regola è costruita individualmente.
Anche l'apprendimento automatico, che utilizza la classificazione e il clustering supervisionati, è una componente chiave dell'analisi degli argomenti. Pertanto, un analista assegna manualmente i soggetti a un campione di commenti per la categorizzazione supervisionata. Da qui, il set di dati annotati addestra il classificatore a etichettare automaticamente i nuovi commenti.
Sebbene l'annotazione dei dati sia più semplice dello sviluppo di regole, i classificatori funzionano solo con meno di dieci soggetti.
Analisi del sentimento
L'analisi del sentimento etichetta le frasi come positive o negative. "L'addetto alle vendite è stato molto gentile" verrebbe etichettato come positivo.
L'analisi del sentiment basata sui dizionari è semplice da impostare. È simile all'estrazione di tutte le parole da un dizionario e all'assegnazione di un sentiment positivo o negativo a ciascuna parola. Il sentiment delle parole cambia, tuttavia, a seconda del contesto.
Di solito si pensa che le parolacce trasmettano un sentimento negativo, ma nella comunità dei videogiochi, ad esempio, le cose possono essere più confuse. Le parole positive sono spesso usate in modo ironico e le parole negative hanno in realtà sentimenti positivi se inserite nel contesto.
Per tenere conto del contesto, le tecniche di apprendimento automatico supervisionato offrono un modo migliore di assegnare il sentiment. Simile alla classificazione supervisionata descritta per l'analisi degli argomenti, l'apprendimento automatico supervisionato per l'analisi del sentiment comporta il prelievo di un campione di clausole per il contesto a cui si è interessati e l'assegnazione manuale a ciascuna clausola di un sentiment positivo o negativo. Da questo insieme di dati annotati, l'algoritmo può quindi assegnare nuove clausole con un sentiment basato su ciò che ha appreso dal campione di commenti.
Riconoscimento di entità denominate
Il riconoscimento di entità denominate (NER) estrae persone, organizzazioni e luoghi da dati testuali non strutturati. Il NER è in grado di individuare persone e organizzazioni influenti nei feedback dei consumatori e nei dati dei social media. Inoltre, il NER può anche riconoscere temi e argomenti del testo.
Etichettatura part-of-speech
L'analisi del testo utilizza il part-of-speech (POS) tagging per classificare ogni parola di una frase. Questo metodo aiuta ad analizzare la grammatica delle frasi e a comprendere la letteratura.
Parsing delle dipendenze
Il Dependency Parsing nell'analisi dei testi aiuta le aziende a scoprire le connessioni grammaticali e di frase. Inoltre, questo metodo aiuta ad analizzare la struttura delle frasi e a comprendere i contenuti.
Classificazione del testo
La classificazione del testo utilizza i contenuti per classificare il testo in categorie predeterminate. Questo metodo aiuta a identificare gli argomenti più popolari nei feedback dei consumatori e nei social media. Inoltre, la classificazione del testo può anche rivelare le idee chiave.
Come condurre un'analisi del testo
L'analisi del testo comprende la raccolta dei dati, l'elaborazione dei dati, l'analisi del testo e la visualizzazione.
Ecco qualche informazione in più sul funzionamento di ciascuna fase.
#1. Raccolta dati
L'analisi del testo inizia con i dati provenienti dai social media, dai moduli di feedback dei consumatori e dalle recensioni online. Assicuratevi che i dati siano pertinenti alla vostra sfida aziendale.
#2. Elaborazione dei dati
Dopo la raccolta dei dati si passa all'elaborazione, alla pulizia e alla preparazione dei dati per l'analisi. L'elaborazione dei dati comporta l'eliminazione del materiale estraneo, la formattazione e la strutturazione dei dati non strutturati per l'analisi.
#3. Analisi del testo
Dopo aver elaborato i dati, è necessario analizzarli per trarne conclusioni. Ciò comporta l'analisi del sentiment, la modellazione degli argomenti e l'identificazione delle entità nominate.
#4. La visualizzazione
Infine, dovrete mostrare ai vostri interlocutori i risultati dell'analisi del testo. A questo scopo si possono utilizzare nuvole di parole, grafici a barre e mappe di calore.
Come preparare i dati di testo per l'analisi
La preparazione dei dati per l'analisi del testo garantisce risultati affidabili e comprensibili.
Ecco come preparare i dati di testo per l'analisi.
#1. Dati puliti
I dati di testo vengono puliti eliminando elementi HTML, URL e caratteri speciali. In questo modo i dati vengono puliti e organizzati per l'analisi.
#2. Pre-elaborazione del testo
La pre-elaborazione del testo converte i dati di testo in un formato pronto per l'analisi. Si tratta di rimuovere i numeri, la punteggiatura e il testo minuscolo.
#3. Tokenizzare il testo
La tokenizzazione divide il testo in parole e frasi. In questo modo, l'analisi dei dati testuali diventa più semplice.
#4. Rimuovere le stop words
La rimozione delle stop word rimuove dal testo parole frequenti come "e", "il" e "è". Questi termini possono distorcere le analisi.
#5. Semplificare i dati con lo stemming e la lemmatizzazione
La stemmatizzazione e la lemmatizzazione comportano il radicamento delle parole. In questo modo è possibile semplificare e analizzare i dati del testo. Lo stemming consiste nel rimuovere i suffissi dalle parole, mentre la lemmatizzazione li riduce.
Un approccio più intelligente all'analisi del testo
L'analisi del testo è un concetto complesso ed estraneo quando si esplorano per la prima volta le sue capacità e i suoi vantaggi. Ma ora dovreste conoscere le basi dell'analisi testuale e il prossimo passo sarà quello di collaborare con un fornitore di software che apporti competenze specialistiche.
MedalliaL' analisi del testo in tempo reale e incentrata sull'uomo garantisce la scoperta di intuizioni di grande impatto e l'avvio di azioni. Utilizza l'intelligenza artificiale (AI) e l'elaborazione del linguaggio naturale (NLP) per identificare rapidamente le tendenze emergenti e le intuizioni chiave su scala. Poiché abbiamo iniziato a costruire la nostra analisi testuale nativa più di dieci anni fa, si tratta dell'analisi testuale più completa, connessa e accessibile disponibile sul mercato.