テキストアナリティクス入門ガイド

テキストアナリティクス入門ガイド

による Medallia

顧客がブランドとの接点やカスタマー・エクスペリエンス CX)に感激したり、失望したりしたとき、データに裏打ちされたインサイト満ちたフィードバックを提供している可能性が高い。フィードバックデータは、直接的か間接的か構造化されているか非構造化されているかを問わず、至る所に存在する。

アンケート調査からソーシャルメディア上のレビューまで、組織は意思決定とビジネス全体の成功を促進する顧客のシグナルを利用する機会がある。

しかし、ブランドはしばしばこの豊富なデータに苦慮する。人間のアナリストが、多種多様なチャネルにわたる何千ものフィードバックを定期的に手作業で調査することは、圧倒的である(そして事実上不可能である)。

しかし、この課題には解決策があります。それはテキスト分析です。これは、感情が込められたコメントを抽出し、ビジネスに関連するカテゴリーに分類することで、インサイト を引き出すものです。

ビッグデータにおけるテキスト分析とは?

オムニチャネルのエコシステムの中では、ブランドと顧客の間には無数のタッチポイントが存在する。毎日膨大な量のデータが生成され、しばしばビッグデータと呼ばれる。

テキスト分析は、非構造化テキストを構造化データに変換することで、ビッグインサイト を得るための手法の一つです。

非構造化テキストデータを分析し理解するためには、いくつかの手順が必要である。そのため、テキスト分析には、データクレンジング、前処理、特徴抽出、機械学習(ML)などのプロセスが含まれる。

テキスト分析とテキストマイニングの違い

テキスト分析とテキストマイニングはよく混同されますが、この2つは間違いなく異なる概念です。テキスト分析は、統計的手法や機械学習を用いてテキストデータを評価し、インサイトを引き出すのに対し、テキストマイニングは非構造化データから情報を抽出するものです。

テキスト分析の利点

テキスト分析の人気が高まっています。多くの業界の主要企業が、テキスト分析を主要機能の一つとして提供する エクスペリエンス・マネジメント CEM)ソフトウェア・プラットフォームに投資しています。

ここでは、フィードバックプログラムを強化するテキスト分析の利点の概要を説明します:

  • インサイト 深める:長くて退屈なアンケートは、顧客がフィードバックをためらう原因になりかねませんが、テキスト分析なら、短い回答であってもその言葉の奥にある真意を掘り下げて明らかにすることができます。
  • 根本原因を突き止める:数値的なスコアでは、フィードバックの背後にある「理由」がわからないことがあります。しかし、テキスト分析では、詳細な情報を提供することで、何がうまくいっているのか、顧客が頻繁に直面する問題の根本的な原因は何なのかを特定することができます。
  • タイムリーなインサイトを入手:従業員はすでに処理すべき時間のかかる業務を抱えており、顧客からのフィードバックを一つひとつ精査するよう求めるのは非現実的です。テキスト分析がすべての作業を代行し、しかもはるかに高い信頼性で処理を行います。
  • 新たなトレンドを見極める人間は、情報に基づいた賢明な意思決定を行うためにデータを必要とします。テキスト分析は、顧客が使用する単語やフレーズを利用することで、ビジネスが無視できず、活用すべきトレンドにスポットライトを当てます。
  • 顧客のニーズを理解する:顧客は、彼らが何を望み、何を必要とし、何を期待しているかを教えてくれる。テキスト分析は、キーワード、テーマ、センチメントを最前線に引き出します。
  • データに基づいた意思決定を行う:顧客により良いサービスを提供するため、テキスト分析からインサイト 、カスタマー・エクスペリエンス の指針として活用しましょう。
  • 従業員エクスペリエンス向上:CXと同様に、テキスト分析は従業員エクスペリエンス EX)従業員エクスペリエンス 向上にも寄与します。テキスト分析は、従業員の努力度スコアエンゲージメント満足度感情などのデータを詳細に分析します。

組織が収集するフィードバックの量が増えるにつれ、テキスト分析はそれに対応する唯一の選択肢となる。

基本的なテキスト分析

テキスト分析は、基本的なものから高度なものまで様々である。あなたが得る洞察のタイプは、あなたが使用するタイプによって異なります。

基本的なレベルでは、テキスト分析には以下のことが含まれる。

単語頻度分析

単語頻度分析では、テキスト中の単語を数えます。このアプローチを使用すると、テキストの最も人気のある用語やトピックを見つけることができます。

フレーズ検出

特定の単語を使用することはもちろん、センチメントやその他の重要な要素に大きく影響する、オーディエンスが使用するフレーズがあります。フレーズ検出を使えば、テキスト中の頻出フレーズを見つけ、テーマを特定することができます。

センチメント分析

表面的なレベルでは、文脈がわからなければ言葉は誤解を招きかねない。正しい視点を得る一つの方法は、関連する感情を判断することである。そこでセンチメント分析が活躍する。テキストの感情を判断することで、発展分野を特定することができます。

トピックモデリング

単語、フレーズ、感情が繰り返される場合、そこには根底にあるテーマが寄与している。トピック・モデリングは、文章のテーマを特定し、文章の主要なアイデアを特定するのに役立ちます。

高度なテキスト分析

企業の規模や性質によっては、基本的なテキスト分析では十分な洞察が得られない場合があります。高度なテキスト分析が必要になるかもしれません。

名前付きエンティティ認識

名前付きエンティティ認識(NER)は、テキスト中の人物、組織、場所を識別し、分類する。さらに、この方法は、テキストのエンティティのつながりを識別するのに役立つ。

テキストの分類

テキストの分類には、テキストをさまざまなカテゴリーに分類することが含まれる。膨大なテキストデータの整理を助けるとともに、この方法はパターンを見つける。

クラスタリング

非構造化データのパターンを特定するもう一つの方法は、クラスタリングである。この方法は、内容に応じてテキストをグループ化し、パターンの特定を容易にする。

関係抽出

あまりないケースですが、消費者の中には親密な関係を持っている人もいるかもしれません。リレーションシップの抽出により、人、組織、場所がテキスト上でどのように関連しているかを判断することができます。このような洞察は、彼らの会話にコンテキストを追加し、それに応じて行動できるようにします。

ネットワーク分析

関係を超えて、共通のリンクを持つ特定のグループがあることに気づくだろう。ネットワーク分析では、テキストのリンクを調べ、物事の相互作用を説明するのに役立つパターンや傾向を見つけます。

テキスト分析のテクニックと応用

テキスト分析とは、非構造化テキストデータを分析するためのさまざまな手法を指します。トピック分析や感情分析に加え、企業がテキストインサイト を得るために活用できる手法は他にもいくつかあります。

テキスト分析のテクニックとアプリケーションをおさらいしよう。

トピック分析

トピック分析は、顧客のフィードバック内のフレーズをビジネスに関連するトピックに分類する。例えば、"the sales associate was nice "は、"Staff Friendliness . "の下に分類される。これを達成するには、一般的に2つの方法がある:手動設定、ルールベースのアプローチ、機械学習技術。

アナリストや言語学者は、ルールベース手法のルールを手作業で構築する。例えば、"friendly "と "employee "のような2つの単語を含む節は、"Staff Friendliness "の主題の下に置かれるかもしれない。

このようなルールは語順や重要な単語の文法的関係も評価することができる。設定手順には時間がかかるが、各ルールが個別に構築されるため、分類されたコメントは正確である。

教師あり分類とクラスタリングを使用する機械学習も、トピック分析の重要な要素である。そのため、アナリストは教師あり分類のためにコメントのサンプルに手作業で主題を割り当てる。そこから、注釈付きデータセットが分類器を訓練し、新鮮なコメントに自動的にタグ付けする。

データにアノテーションを付けるのはルールを開発するよりも簡単だが、分類器は10個以下の被写体でしか動作しない。

センチメント分析

センチメント分析では、フレーズを肯定的または否定的な感情としてタグ付けする。「販売員がとても親切だった」は肯定的とタグ付けされる。

辞書ベースのセンチメント分析はセットアップが簡単です。辞書からすべての単語を抜き出し、各単語に肯定的または否定的なセンチメントを割り当てるのと似ている。しかし、単語のセンチメントは文脈によって変化する。

普通、汚い言葉というのはネガティブな感情を伝えるものだと思うだろうが、例えばゲームコミュニティでは、もっとファジーかもしれない。肯定的な言葉は皮肉を込めて使われることが多いし、否定的な言葉も文脈を考えれば実は肯定的な感情を持っている。

コンテキストを可能にするために、教師あり機械学習テクニックは、センチメントを割り当てるより良い方法を提供します。トピック分析のために説明された教師あり分類と同様に、センチメント分析のための教師あり機械学習は、あなたが興味を持っているコンテキストの句のサンプルセットを取り、手動で各句に肯定的または否定的なセンチメントを割り当てることを含みます。この注釈付きデータセットから、アルゴリズムはコメントのサンプルから学習した内容に基づいて、新しい文節にセンチメントを割り当てることができます。

名前付きエンティティ認識

名前付きエンティティ認識(NER)は、非構造化テキストデータから人物、組織、場所を抽出する。NERは消費者のフィードバックやソーシャルメディアデータから影響力のある人物や組織を検出することができる。さらに、NERはテキストのテーマやトピックも認識できる。

品詞タグ付け

テキスト分析では、品詞(POS)タグ付けを使ってフレーズ内の各単語を分類する。この方法は、文法の分析や文献の理解に役立つ。

依存関係の解析

テキスト分析における係り受け解析は、企業が文章や文法的なつながりを発見するのに役立ちます。さらに、この方法は文の構造を分析し、内容を理解するのに役立ちます。

テキストの分類

テキスト分類は、コンテンツを使ってテキストをあらかじめ決められたカテゴリーに分類する。この方法は、消費者の声やソーシャルメディアで人気のあるテーマを特定するのに役立つ。さらに、テキスト分類は重要なアイデアを明らかにすることもできる。

テキスト分析の方法

テキスト分析は、データ収集、データ処理、テキスト分析、視覚化で構成される。

各ステップがどのように機能するか、もう少し詳しく説明しよう。

#1.データ収集

テキスト分析は、ソーシャルメディア、消費者のフィードバックフォーム、オンラインレビューからのデータから始まります。データが貴社のビジネス課題に関連していることを確認してください。

#2.データ処理

データ収集に続いて行われるのが、データの処理、クリーニング、分析のための準備である。データ処理では、余計なものを削除し、フォーマットし、分析のために非構造化データを構造化する。

#3.テキスト分析

データを処理した後は、それを分析して洞察を引き出す必要があります。これには、センチメント分析、トピック・モデリング、名前付きエンティティ識別が含まれる。

#4.視覚化

最後に、テキスト分析から得られた知見をステークホルダーに示す必要がある。これは、ワードクラウド、棒グラフ、ヒートマップで実現できる。

テキストデータを分析用に準備する方法

テキスト分析用にデータを準備することで、信頼性が高く、理解しやすい結果が得られます。

ここでは、分析のためにテキストデータを準備する方法を説明する。

#1.クリーンデータ

テキストデータは、HTML要素、URL、特殊文字を除去することでクリーニングされる。これにより、分析用のデータがきれいに整理されます。

#2.テキストの前処理

テキストの前処理は、テキストデータを分析可能な形式に変換する。数字、句読点、小文字のテキストを削除する。

#3.テキストをトークン化する

トークン化はテキストを単語やフレーズに分割する。そうすることで、テキストデータの分析が容易になる。

#4.ストップワードを取り除く

ストップワード除去は、"and"、"the"、"is "のような頻出語をテキストから除去する。これらの単語は分析を歪める可能性がある。

#5.ステミングとレマタイゼーションでデータを簡素化する

ステミングとレマタイゼーションは、単語の語根形成を伴う。これにより、テキストデータを簡素化し、分析することができる。ステミングは単語から接尾辞を取り除くことであり、レマタイゼーションは接尾辞を減らすことである。

テキスト分析のよりスマートなアプローチ

テキスト分析は、その機能と利点を初めて探るとき、通常、外国の複雑な概念のように感じられます。しかし、テキスト分析の基本はご理解いただけたはずです。次のステップは、専門知識を備えたソフトウェアプロバイダーと提携することです。

Medalliaリアルタイムで人間中心のテキスト分析機能により、大きな影響力を持つインサイト を発見しインサイト 具体的な行動につなげることができます。人工知能(AI)自然言語処理(NLP)を活用し、新たなトレンドや重要なインサイト 迅速に特定します。また、10年以上前から独自のテキスト分析機能の開発に取り組んできたため、現在利用可能なテキスト分析ソリューションの中で最も包括的で、連携性が高く、使いやすいものとなっています。


著者

関連記事