エクセルを活用したテキストマイニングの方法とは? 目的・分析方法・手順を解説
-
- カテゴリ
-
- 公開日
- 2024.09.05
「自社商品やサービスにおける顧客の潜在的なニーズが知りたい」「アンケートをとってもニーズを言語化できない」などの悩みを抱えている企業の担当者や、マーケターの方もいるでしょう。
その際はテキストマイニングを行えば、膨大なデータから顧客の心理や感情、ニーズのヒントを得られます。
また、テキストマイニングはエクセルを活用して分析することも可能です。
今回は、テキストマイニングの内容や目的、エクセルを活用したテキストマイニングの方法を解説します。
目次
エクセルでテキストマイニングを行う前に知っておくこと
テキストマイニングは、企業における経営や業務、サービスなどのさまざまな点で役に立つ分析法です。
エクセルを活用すれば、手軽にテキストマイニングを実施できます。
まずテキストマイニングの特徴や目的などを理解した上で、エクセルでの活用法を確認していきましょう。
テキストマイニングとは?
テキストマイニングとは直訳すると「文書を採掘する」という意味であり、大量にあるテキストデータから有益な情報を抽出する分析方法です。
テキストマイニングと似た言葉でデータマイニングという言葉がありますが、こちらは画像や動画などのデータから情報を得る方法となります。
テキストマイニングもデータマイニングの一つですが、テキストマイニングは文章に特化している点が異なります。
これまで分析が難しかった文章も、自然言語解析などの方法を通じて処理が可能となりました。
例えば、以下のようなテキストの分析に適しているといわれています。
- アンケート調査
- 商品やサービスのレビューや口コミ
- コールセンターのお問い合わせ内容
- SNSの投稿に対するコメント
これらのデータからは、顧客の深層心理や本当に必要とされているニーズを探れます。
テキストマイニングで得られる効果
テキストマイニングを取り入れると、企業の課題の把握や商品、サービスのマーケティングなどにも役立てられる可能性があります。
次でテキストマイニングの重要性や得られる効果なども理解しておきましょう。
膨大なデータから顧客のニーズを効率的に把握できる
テキストマイニングを行うと、膨大なテキストデータからユーザーの意見を見つけ出せます。
例えば、自社で展開している商品やサービスに関してのアンケート調査結果やコールセンターへのお問い合わせ内容などは、そのまま一つひとつ確認したり客観視したりすることが難しく、手間や時間がかかります。
しかしテキストマイニングを活用すれば、主観的な考え方は原則排除され、ユーザーの心理やニーズを客観的かつスピーディーに把握することが可能です。
抽出したデータから現状の課題がどこにあり、どう改善すれば良いかのヒントを提示してくれるため、課題に対して迅速に対応できるようになるでしょう。
トレンドを予測できる
テキストマイニングを活用すると、トレンドを探ったり予測したりすることもできます。
例えば、InstagramやX(旧Twitter)などのSNSに投稿された内容やコメントのやりとり、ニュース記事などをテキストマイニングすると、現在のトレンドの傾向やこれから新しくトレンドになる可能性のあるものを探し出せるでしょう。
特に、SNS媒体によるユーザー同士のコメントは、本音が反映されているため、よりリアルな意見や情報が得られるきっかけになります。
業務課題を改善できる
テキストマイニングは、対顧客だけではなく企業の業務課題の把握や改善にも役立ちます。
例えば報告書や日報、レポートなどをテキストマイニングすることで、業務上で起こっているまたは起こり得る問題を把握することが可能です。
またテキストマイニングにより、業務の属人化を防ぐこともできます業務の属人化が進んでしまうと、業務効率にムラが生じてしまう可能性もあります。
しかし、現在の担当者のテキストマイニングで抽出したデータをマニュアル化して、ノウハウや有用な情報を関係者に共有すれば、一定の高い水準で業務を続けられるでしょう。
ネガティブワードを抽出できる
テキストマイニングを行えば、ネガティブワードの抽出も可能です。
SNSでの口コミや問い合わせなどにはポジティブな意見だけではなく、ネガティブな意見やワードも少なからず存在します。
ネガティブワードをそのまま放置しておくと、炎上のリスクを伴うため、注意が必要です。
しかし、ネガティブワードを抽出してそのワードに付随する課題の改善に取り組んだり、適切な処理や対策を行ったりすれば、炎上のリスクやイメージの低下などを防止できるでしょう。
また、ネガティブな意見を基に消費者の要望を分析できれば、自社商品やサービスにおける今後の開発や戦略に生かすことも可能です。
テキストマイニングの分析方法
テキストマイニングを行う際の具体的な分析方法としては、以下のようなものが存在します。
- センチメント分析
- 主成分分析
- 対応分析
- 共起分析
これらの他にもテキストマイニングを行う際の分析方法はありますが、ここでは上記の代表的な4つの分析方法を紹介します。
センチメント分析
センチメント分析とはネガポジ分析とも呼ばれ、テキストに含まれるユーザーの心理や感情を分析する方法です。
センチメント分析を行うことで、自社の商品やサービスに対するユーザーの率直な意見が把握できます。
主に、前述したようなInstagramやX(旧Twitter)などのSNS媒体でやりとりされているコメントや、ブログに記載してあるテキストから情報を抽出します。
抽出した情報は、ネガティブ・ポジティブ・中間の3つのカテゴリに分類します。
主成分分析
主成分分析とは、大きなデータを小さくして分かりやすいデータに要約する分析方法です。
対象のデータが多過ぎるとそのままでは理解しにくいため、あえてデータを少なくたり違う変数と組み合わせて理解しやすくします。
主に、ブランドイメージや顧客満足度の企業アンケートを分析して、ポジショニングマップなどで可視化する目的で使われています。
ただし、主成分分析の注意点としては、一部のデータが反映されない可能性もあり、その反映されていないデータに重要な情報が隠れている場合もあることです。
そのため、主成分分析を行う際は、分析する項目の選択は注意して行う必要があるでしょう。
対応分析
対応分析とは、収集したデータを行と列からなる散布図などに落とし込んで分析する方法です。
主に、ある分野や業界などの相関関係を知りたいときに活用できます。
例えば、アンケート結果を集計して、クロス集計表にまとめたものは目にすることもあるでしょう。
しかし、項目が多かったりするとそれだけ表が長くなったり、情報量が多くなったりするため、分かりにくくなってしまいます。
そのような場合に、対応分析によってその結果を散布図に落とし込むことで、視覚的に情報を把握することが可能です。
業界内の自社と競合他社の相関関係を知りたいときに対応分析を行えば、自分以外にも競合他社のポジショニングも同時に把握できるため、他社と自社が業界内でどのポジションにいるのかが簡単に把握できます。
共起分析
共起分析とは、ある単語と同時に出現しやすい単語は何かを分析する方法です。
共起分析を行うことで、商品やサービス名に関連する単語からユーザーが連想するものや関心のあるものを把握できるため、その結果を基に改善やマーケティング施策につなげられるでしょう。
エクセルを活用してテキストマイニングを行う手順
ここからは、実際にエクセルを活用したテキストマイニングを行う手順を解説します。
主に以下のような手順で行われます。
- データを集める
- 文章を単語に分解する
- エクセルで頻出単語をカウントする
- カウントした単語をワードクラウドにする
それぞれ順番に確認していきましょう。
STEP1:データを集める
まずはテキストマイニングを行うためのデータを集めます。
エクセルにはデータを集める機能は備わっていないため、手作業でデータを集めるか、専用のツールを使用するなどして対象データを集めましょう。
主に数値などでは表せない非構造化されているデータや、定性のデータが対象となります。
具体的には、以下のようなものが対象データとなるケースが多いです。
- アンケート結果
- SNS媒体の書き込みやコメント
- コールセンターの記録
- お問い合わせ内容
- 報告書 など
注意点としては、テキストマイニングを行う目的に合ったデータを集めることです。
大元のデータが本来の目的からずれると、誤った結果が出てしまうため、データ選びは慎重に行いましょう。
STEP2:文章を単語に分解する
データが用意できたら、テキストマイニングを行いやすいように文章を単語に分解します。
これを形態素解析といいます。
英語などの場合は、文章でも一つひとつの単語が独立しているため、単語の分解作業は必要ありません。
しかし、日本語の場合は文章の区切りが分かりにくい点や、文章の中にひらがな・カタカナ・漢字・英語などの複数の要素が含まれている可能性があるため、単語をある程度分解しないと正確なテキストマイニングを行えないのです。
例えば、以下のようなイメージで分解を行います。
- 元の文章:私は今おにぎりを食べています
- 分解後の文章:私 は 今 おにぎり を 食べて います
上記の場合は、1つの文章の中から7つの単語に分解できます。
このようにテキストマイニングを行うに当たって、データの中にある複数の文章をそれぞれ分解していく必要があるのです。
また、形態素解析を完璧に行うにはエクセルのみでは対応が難しいため、関数を用いるか、形態素解析ができる他のツールを使用する必要があります。
なお「コンピューター」「コンピュータ」のような表記揺れがあると正しく集計できないため、この時点で修正しておきます。
STEP3:エクセルで頻出単語をカウントする
形態素解析が完了したら、エクセルを使用して単語のカウントを行います。
エクセル関数のCOUNTIF関数を使用すれば、効率的にカウントが可能です。
また、ピボットテーブルでも集計し、それを表にして降順や昇順などの並び替えもできます。
ただし、単語数が多い場合や単語の表記揺れなどがあると、正確にカウントできなかったり、カウントそのものができなかったりする可能性もあります。
もしカウントが難しい場合は、エクセルと連動して使用できる集計ソフトもあるため、活用すると良いでしょう。
STEP4:カウントした単語をワードクラウドにする
エクセルで単語の出現数をカウントできたら、その単語をワードクラウドにして確認してみましょう。
ワードクラウドとは、単語の頻出数によって文字の大きさや色などを変えて表す図表のことです。
例えば、頻出数が多い単語ほど文字が大きく表示され、視覚的にどの単語が重要か分かりやすくなります。
ワードクラウドはエクセルで作成するのはあまり向かないため、専用のツールを使用するか外部ツールと連携させて作成してみましょう。
テキストマイニングで活用できる便利なエクセルの関数
ここからはテキストマイニングをエクセルで行う場合に、覚えておくと便利なエクセルの関数を紹介します。
主に、以下の3つの関数を覚えておくと良いでしょう。
- COUNTIF関数
- SUM関数
- INDEX関数
それぞれの関数の特徴と具体的な活用シーンを確認していきましょう。
COUNTIF関数
COUNTIF関数は、条件を設定してデータをカウントできる関数です。
COUNTIF関数を使用する際は、数えたいデータの範囲と検索条件を指定する必要があります。
指定する際は「=COUNTIF(範囲,検索条件)」で条件を指定します。
例えば、エクセルのA1からA5までのセルの範囲を指定して、ある単語をカウントしたい場合は「=COUNTIF($A$1:$A$5,(“カウントしたい単語”))」のように関数と数字を入力するとカウント可能です。
セルの文字にカーソルを当ててF4キーを押し、$を入力することで、COUNTIF関数が反映されているセルをコピーして別のセルに貼り付けたときに、カウント範囲がずれないよう固定できます。
SUM関数
SUM関数は、エクセル内の指定したセルの合計値を出せる関数です。
カウントする際は「=SUM(引数)」で条件を指定します。
例えば、A1からA5までのセルの合計値を調べたいときは「=SUM(A1:A5)」と入力します。
主にCOUNTIF関数である単語をカウントした上で、その単語の合計値を求め出すときに使用されるケースが多いです。
INDEX関数
INDEX関数は、指定した範囲のセルの値を求める関数です。
INDEX関数を使用すれば、異なる範囲のセル同士の合計値を簡単に求められます。
主に以下の2つの式で求めることが可能です。
配列形式:「=INDEX(配列,行番号,列番号)」
参照形式:「=INDEX(配列,行番号,列番号,領域番号)」
配列形式は単体の表からデータを抽出したいときに使用され、参照形式は2つ以上の複数の表からデータを抽出したいときに使用します。
また、INDEX関数は単独で使用するケースがあまりなく、主にSUM関数と一緒に使われる場合が多いです。
そのため、配列形式ではなく参照形式を主に使用します。
SUM関数と併用して使用する際は、「=SUM(セル:INDEX:(配列,行番号,列番号,領域番号))」のように入力すると、違う範囲の合計値を出せます。
その他の便利な関数
エクセルでテキストマイニングを行う際に便利な関数には、上記以外にもたくさんあります。
例えば、以下のような関数が挙げられます。
関数 | 特徴 |
SUBSTITUTE関数 | 記号を別の文字に置き換える関数 |
UPPER関数 | 英小文字を大文字に変換する関数 |
LOWER関数 | 英大文字を小文字に変換する関数 |
ASC関数 | 全角文字(2バイト)を半角文字(1バイト)に変更する関数(2バイトセットの場合) |
JIS関数 | 半角文字(1バイト)を全角文字(2バイト)に変換する関数(関数名および変換する文字は、言語によって異なる) |
PHONETIC関数 | 文字列からふりがなを抽出する関数 |
テキストマイニングを行う上で、表記揺れがあると正確なデータを反映できません。
しかし、上記の関数を使用すると、表記揺れを防いでより正確なテキストマイニングを行うのに役立つでしょう。
エクセルでテキストマイニングを効率的に行うコツ
エクセルでテキストマイニングを行う上で便利な機能を把握しておくと、より効率的にテキストマイニングを行えます。
ここでは、エクセルのマクロ機能とアドインの利用について紹介します。
エクセルのマクロ機能を活用する
エクセルのマクロ機能を活用すると、テキストデータが膨大であっても効率的にテキストマイニングを行えます。
具体的には以下のような手順で、エクセルのマクロ機能を開発可能です。
- エクセル画面の上部にある「開発」タブを有効化する
- 「マクロの記録」を選択して、必要に応じてマクロ名を変更し「OK」ボタンを押す
- エクセル内で行いたい処理を指定する
- マクロの記録が終了したら「記録終了」のタブをクリックする
- 記録したマクロの実行を行う
一度作成したマクロはもう一度利用できるため、必要なときに同じ手順を自動的に行ってくれます。
エクセルのアドインを利用する
エクセルだけでテキストマイニングにおけるデータ分析ができない場合は、エクセルのアドインも利用すると良いでしょう。
アドインとは、エクセルと互換性のあるツールを追加して各種機能を向上させるものです。
テキストマイニングを行う上で、外部ツールも含めいくつか有効なアドインがあるため、目的に合ったアドインを選択して使用してみましょう。
例えば、マイクロソフト社のSQL Server Analysis Servicesと呼ばれるアドインは、エクセルだけではできないテキストマイニングを行う際に必要なデータ処理や分析を行ってくれます。
エクセルでアドインを追加する場合は、以下の手順で行えます。
- 「ファイル」の中にある「アドイン取得」をクリックする、または、ページにアドインを直接インストールするか「その他のアドイン」をクリックして調べる
- 「Officeアドイン」で「マイアドイン」をクリックする、または「ストア」タブを選択し、検索ボックスから目的のアドインを参照する
- アドインをクリックし、利用したいアドインを追加する
基本的には無料で使用できるものが多いですが、一部有料となっているものもあるため注意が必要です。
まずは無料で活用できるアドインを使用してから必要性に応じて有料のものも検討してみると良いでしょう。
エクセルでテキストマイニングを行うメリット・デメリット
エクセルでテキストマイニングを行う前に、メリットとデメリットを整理しておきましょう。
メリットとデメリットを把握すれば、エクセルを使用したテキストマイニングが向いているかどうかの判断材料の一つとなります。
エクセルでテキストマイニングを行うメリット
エクセルでテキストマイニングを行うメリットには、以下のようなものが挙げられます。
- 会社ですでにエクセルを導入している場合はコストをかけずに利用できる
- エクセルの知識やスキルがあれば比較的簡単に導入できる
普段から仕事でエクセルを利用している会社であれば、追加費用はかかりません。
エクセルだけではできない部分もありますが、エクセルの機能の範囲内で十分という場合は、わざわざ専用のツールを購入する必要性はないでしょう。
また、エクセルに使い慣れている方であれば、導入は難しくないと考えられます。
普段のスキルをそのまま生かせるため、習得時間もかからずにスムーズにテキストマイニングを行えるでしょう。
エクセルでテキストマイニングを行うデメリット
エクセルでテキストマイニングを行うデメリットには、以下のようなものが挙げられます。
- エクセル関数の知識やスキルがない場合は、習得まで時間がかかる可能性がある
- 専用のツールと比べると、分析精度は高くはない可能性がある
メリットの場合と逆で、あまりエクセルを使用したことのない場合は、始めにエクセルの使い方や関数を覚えなくてはなりません。
さらに、エクセル関数を手作業で入力していくため、手間もかかります。
使い方に慣れていないと、慣れるまでに時間がかかるでしょう。
また、エクセルは誰でも簡単に利用できる点はメリットですが、エクセルでテキストマイニングを行うには限界がある場合もあります。
例えば、エクセルでできることは主にデータの集計の部分になるため、テキストマイニングを行う上で必要なデータ収集や形態素解析、ワードクラウドの作成などは行えません。
さらに、小規模のデータ分析はエクセルでも問題なく対応できるケースもありますが、分析するデータが大きいケースでは、エクセルだと精度に問題が出る可能性があります。
エクセル以外でテキストマイニングできるツール
エクセル以外にもテキストマイニングを行えるツールはあります。
ここでは、AIのテキストマイニングツールとプログラミング言語の一つである、Pythonについて紹介します。
AIテキストマイニング
AIテキストマイニングは、分析した文章を入力するとAI技術により短時間でテキストマイニングを行えます。
AIテキストマイニングツールでは、主に以下のようなことができます。
- 単語の出現頻度を分析する
- 単語同士の関連性を図示する
- ワードクラウドを作成する
ツールによって異なりますが、無料と有料のプランに分かれている場合、無料だと文字数制限があったり、利用できない機能があったりして使いにくい可能性があります。
しかし、比較的文字数が少ない文章であれば手軽にテキストマイニングを行える点や、エクセルの操作が苦手な方でも利用しやすい点ではおすすめです。
Python
Python(パイソン)とはプログラミング言語の一つで、無料でテキストマイニングが行えます。
Pythonにはテキストマイニングに関連するライブラリや関数があるため、エクセルよりも多くのデータを正確に分析することが可能です。
また、Pythonはエクセルと連携もでき、さらに効率的なテキストマイニングを実施できるでしょう。
しかし、Pythonを使用する場合は自分でテキストマイニング用のプログラムを設計して構築しなければいけないため、プログラミングの知識やスキルがないと難しい可能性があります。
テキストマイニングはエクセルでも実施できる! 効率化を図るには外部ツールも活用しよう
エクセルを活用すれば、比較的簡単にテキストマイニングを実施できます。
テキストマイニングを行うと、自社の商品やサービスに対する顧客の心理やニーズが把握できるため、それを基に顧客満足度の向上につなげられるでしょう。
また、企業側も課題を簡単に分析できれば、業務効率の向上につながります。
SNSやブログなどのテキストデータから、効率的にテキストマイニングを行いたい場合は、KAIZODEがおすすめです。
例えば、ユーザーを状態別に分類して購買行動につながる戦略のヒントを得られたり、ユーザーの心理や感情を6段階評価して、インサイトにつながる内容を抽出したりできます。
「膨大なデータの分析が困難で時間がない」「SNSの分析ツールを使用しているがうまく使いこなせない」などの悩みを抱えている企業の担当者やマーケターの方は、まずはKAIZODEの無料トライアルをご利用ください。
もっとKAIZODEを
知りたい方へ
詳しい機能や価格を知りたい方は、右のこの
フォームからお問い合わせください。
サポート内容に関しましても
お気軽に問い合わせください。