Guia para iniciantes em análise de texto

Guia para iniciantes em análise de texto

Por Medallia

Quando os clientes estão extasiados ou decepcionados com as interações e com a experiência do cliente (CX) de uma marca, é provável que eles tenham fornecido um feedback do cliente repleto de insights ricos em dados. Os dados de feedback - sejam eles diretos, indiretos, estruturados ou não estruturados - estão em toda parte.

De pesquisas a avaliações em mídias sociais, uma organização tem a oportunidade de aproveitar os sinais dos clientes que impulsionam a tomada de decisões e o sucesso geral dos negócios.

No entanto, as marcas costumam ter dificuldades com essa riqueza de dados. É esmagador (e praticamente impossível) para os analistas humanos examinarem manualmente milhares de feedbacks em uma ampla variedade de canais regularmente.

Mas há uma solução para esse desafio: a análise de texto, que extrai insights dos dados ao pegar comentários ricos em sentimentos e classificá-los em categorias relevantes para os negócios.

O que é a análise de texto em Big Data?

No ecossistema omnichannel, há inúmeros pontos de contato entre uma marca e seus clientes. Grandes quantidades de dados são geradas todos os dias, muitas vezes chamadas de big data.

A análise de texto é um dos métodos usados para obter insights de big data por meio da conversão de texto não estruturado em dados estruturados.

São necessários vários procedimentos para analisar e entender dados de texto não estruturados. Dessa forma, a análise de texto inclui processos como limpeza de dados, pré-processamento, extração de recursos e aprendizado de máquina (ML).

Diferença entre análise de texto e mineração de texto

A análise de texto e a mineração de texto são comumente confundidas, e não há dúvida de que os dois tópicos são diferentes. A análise de texto usa métodos estatísticos e de aprendizado de máquina para avaliar dados de texto e obter insights, enquanto a mineração de texto extrai informações de dados não estruturados.

Benefícios da análise de texto

A análise de texto está crescendo em popularidade. Marcas líderes em muitos setores estão investindo em plataformas de software de gerenciamento da experiência do cliente (CEM) que oferecem a análise de texto como um dos vários recursos principais.

Aqui está uma visão geral dos benefícios da análise de texto que aprimoram um programa de feedback:

  • Aumente os insights com menos perguntas: Pesquisas longas e demoradas podem fazer com que os clientes evitem fornecer feedback, mas a análise de texto se aprofunda nas palavras até mesmo de respostas curtas para revelar o significado por trás das palavras.
  • Chegar à causa principal: As pontuações numéricas nem sempre informam o "porquê" por trás do feedback. A análise de texto, no entanto, faz isso fornecendo detalhes - isso identifica o que está funcionando e qual é a causa principal de um problema que os clientes enfrentam com frequência.
  • Obtenha percepções oportunas: Os funcionários já têm uma lista de tarefas que consomem muito tempo, e pedir a eles que examinem cada palavra do feedback do cliente não é realista. A análise de texto dá conta de todo o processo, e o faz com muito mais confiabilidade.
  • Identificar tendências emergentes: Os seres humanos precisam de dados para tomar decisões informadas e inteligentes. Ao explorar as palavras e frases que os clientes estão usando, a análise de texto destaca as tendências que uma empresa não pode ignorar e das quais precisa tirar proveito.
  • Entenda as necessidades dos clientes: Os clientes lhe dirão o que querem, precisam e esperam. Você só precisa ouvi-los, e a análise de texto traz palavras-chave, temas e sentimentos para o primeiro plano.
  • Tome decisões orientadas por dados: Para atender melhor aos clientes, deixe que os insights derivados da análise de texto ofereçam um caminho para a estratégia de experiência do cliente.
  • Melhorar a experiência do cliente e do funcionário: Assim como acontece com a experiência do cliente, a análise de texto também melhora a experiência do funcionário (EX). A análise de texto analisa os dados dos funcionários, como a pontuação de esforço do funcionário, o envolvimento, a satisfação e o sentimento.

À medida que o volume de feedback coletado pelas organizações aumenta, a análise de texto é a única opção para acompanhar o ritmo.

Análise básica de texto

A análise de texto varia de básica a avançada. O tipo de percepção que você obtém depende do tipo que você usa.

No nível básico, a análise de texto envolve o seguinte.

Análise de frequência de palavras

A análise de frequência de palavras conta as palavras no texto. Essa abordagem o ajuda a encontrar os termos e tópicos mais populares do texto.

Detecção de frases

Além de usar palavras específicas, há frases que seu público pode usar e que têm uma influência significativa sobre o sentimento e outros elementos-chave. A detecção de frases permite que você encontre frases frequentes no texto, possibilitando a identificação de temas.

Análise de sentimento

Em um nível superficial, as palavras podem ser enganosas se você não tiver um contexto. Uma maneira de obter a perspectiva correta é determinar as emoções associadas. É nesse ponto que a análise de sentimentos entra em ação. Ela ajuda a determinar a emoção de um texto, permitindo que você identifique áreas de desenvolvimento.

Modelagem de tópicos

Quando palavras, frases e sentimentos são repetitivos, há um tema subjacente contribuindo. A modelagem de tópicos identifica os temas do texto, o que ajuda a identificar as ideias principais de um texto.

Análise avançada de texto

Dependendo do tamanho e da natureza de sua empresa, a análise básica de texto pode não oferecer insights suficientes. Pode ser necessária uma análise avançada de texto.

Reconhecimento de entidades nomeadas

O reconhecimento de entidades nomeadas (NER) identifica e categoriza pessoas, organizações e lugares no texto. Além disso, esse método ajuda a identificar conexões de entidades de texto.

Classificação de texto

A categorização de texto inclui a classificação do texto em diferentes categorias. Além de ajudá-lo a organizar dados de texto em massa, esse método encontra padrões.

Agrupamento

Outra maneira de identificar padrões em dados não estruturados é por meio de clustering. Esse método agrupa o texto de acordo com o conteúdo, facilitando a identificação de padrões.

Extração de relacionamento

Embora não seja frequente, alguns de seus consumidores podem ter relacionamentos próximos. Você pode determinar como as pessoas, as organizações e os locais estão relacionados textualmente por meio da extração de relacionamentos. Esse insight acrescenta contexto às conversas deles, permitindo que você aja de acordo.

Análise de rede

Indo além dos relacionamentos, você perceberá que há grupos específicos com um vínculo comum. A análise de rede examina os links textuais para encontrar padrões e tendências que ajudam a explicar como as coisas interagem.

Técnicas e aplicativos de análise de texto

A análise de texto envolve várias técnicas para analisar dados não estruturados e baseados em texto. Além da análise de tópicos e da análise de sentimentos, há várias outras técnicas que as empresas podem usar para obter insights de seus dados de texto.

Vamos revisar as técnicas e os aplicativos da análise de texto.

Análise de tópicos

A análise de tópicos categoriza as frases do feedback do cliente em tópicos relevantes para os negócios. Por exemplo, "o vendedor foi simpático" seria categorizado em "Simpatia da equipe". Geralmente, há duas maneiras de fazer isso: uma configuração manual, uma abordagem baseada em regras e técnicas de aprendizado de máquina.

Os analistas e linguistas criam manualmente regras para o método baseado em regras. Por exemplo, uma cláusula que contenha duas palavras como "friendly" (amigável) e "employee" (funcionário) pode ser colocada em um assunto do tipo "Staff Friendliness" (simpatia da equipe).

Essas regras também podem avaliar a ordem das palavras e as relações gramaticais de palavras importantes. O procedimento de configuração é demorado, mas os comentários classificados são exatos, pois cada regra é construída individualmente.

O aprendizado de máquina, que usa classificação e agrupamento supervisionados, também é um componente essencial da análise de tópicos. Portanto, um analista atribui manualmente assuntos a uma amostra de comentários para categorização supervisionada. A partir daí, o conjunto de dados anotados treina o classificador para marcar automaticamente novos comentários.

Embora anotar dados seja mais fácil do que desenvolver regras, os classificadores só funcionam com menos de dez assuntos.

Análise de sentimento

A análise de sentimento marca as frases como tendo sentimentos positivos ou negativos. "O vendedor foi muito simpático" seria classificado como positivo.

A análise de sentimento baseada em dicionário é simples de configurar. É semelhante a extrair todas as palavras de um dicionário e atribuir um sentimento positivo ou negativo a cada palavra. O sentimento das palavras muda, entretanto, dependendo do contexto.

Normalmente, pensa-se que os palavrões transmitem sentimentos negativos, mas na comunidade de jogos, por exemplo, as coisas podem ser mais confusas. As palavras positivas costumam ser usadas de forma irônica, e as palavras negativas têm, na verdade, sentimentos positivos quando colocadas em contexto.

Para permitir o contexto, as técnicas de aprendizado de máquina supervisionado oferecem uma maneira muito melhor de atribuir sentimentos. Semelhante à classificação supervisionada descrita para a análise de tópicos, o aprendizado de máquina supervisionado para a análise de sentimentos envolve a obtenção de um conjunto de amostras de cláusulas para o contexto em que você está interessado e a atribuição manual de um sentimento positivo ou negativo a cada cláusula. A partir desse conjunto de dados anotados, o algoritmo pode então atribuir novas cláusulas com sentimento com base no que aprendeu com a amostra de comentários.

Reconhecimento de entidades nomeadas

O reconhecimento de entidades nomeadas (NER) extrai pessoas, organizações e locais de dados de texto não estruturados. O NER pode detectar pessoas e organizações influentes no feedback do consumidor e nos dados de mídia social. Além disso, o NER também pode reconhecer temas e tópicos de texto.

Marcação de parte da fala

A análise de texto usa a marcação de parte da fala (POS) para classificar cada palavra em uma frase. Esse método ajuda a analisar a gramática das frases e a compreender a literatura.

Análise de dependência

A análise de dependência na análise de texto ajuda as empresas a descobrir conexões gramaticais e de frases. Além disso, esse método ajuda a analisar a estrutura das frases e a compreender o conteúdo.

Classificação de texto

A classificação de texto usa o conteúdo para classificar o texto em categorias predeterminadas. Esse método ajuda a identificar assuntos populares no feedback do consumidor e nas mídias sociais. Além disso, a classificação de texto também pode revelar ideias-chave.

Como conduzir uma análise de texto

A análise de texto é composta de coleta de dados, processamento de dados, análise de texto e visualização.

Veja a seguir um pouco mais de informações sobre como cada etapa funciona.

#1. Coleta de dados

A análise de texto começa com dados de mídia social, formulários de feedback do consumidor e avaliações on-line. Certifique-se de que seus dados sejam relevantes para seu desafio comercial.

#2. Processamento de dados

Após a coleta de dados, vem o processamento, a limpeza e a preparação dos dados para análise. O processamento de dados envolve a exclusão de materiais estranhos, a formatação e a estruturação de dados não estruturados para análise.

#3. Análise de texto

Depois de processar os dados, você precisará analisá-los para obter insights. Isso envolve análise de sentimentos, modelagem de tópicos e identificação de entidades nomeadas.

#4. Visualização

Por fim, você precisará mostrar às partes interessadas os resultados da análise de texto. Você pode fazer isso por meio de nuvens de palavras, gráficos de barras e mapas de calor.

Como preparar dados de texto para análise

A preparação de dados para análise de texto garante resultados confiáveis e compreensíveis.

Veja a seguir como preparar dados de texto para análise.

#1. Dados limpos

Os dados de texto são limpos com a eliminação de elementos HTML, URLs e caracteres especiais. Isso limpa e organiza os dados para análise.

#2. Pré-processamento de texto

O pré-processamento de texto converte os dados de texto em um formato pronto para análise. Ele envolve a remoção de numerais, pontuação e texto em letras minúsculas.

#3. Tokenizar texto

A tokenização divide o texto em palavras e frases. Com isso, a análise de dados de texto fica mais fácil.

#4. Remover palavras de parada

A remoção de palavras de parada remove palavras frequentes como "e", "o" e "é" do texto. Esses termos podem distorcer as análises.

#5. Simplifique os dados com stemming e lematização

O stemming e a lematização envolvem o enraizamento de palavras. Isso pode simplificar e analisar dados de texto. O stemming envolve a remoção de sufixos das palavras, enquanto a lematização os reduz.

Uma abordagem mais inteligente para a análise de texto

Em geral, a análise de texto parece um conceito estranho e complexo quando se começa a explorar seus recursos e benefícios. Mas agora você já deve conhecer os conceitos básicos da análise de texto e sua próxima etapa é fazer uma parceria com um fornecedor de software que ofereça conhecimento especializado.

MedalliaA análise de texto em tempo real, centrada no ser humano, garante que você descubra insights de alto impacto e impulsione a ação. Ele usa inteligência artificial (IA) e processamento de linguagem natural (PNL) para identificar rapidamente tendências emergentes e insights importantes em escala. E como começamos a desenvolver nossa análise de texto nativa há mais de uma década, ela é a análise de texto mais abrangente, conectada e acessível disponível.


Autor

POSTAGENS RELACIONADAS