COLUMN
テキストマイニングの基礎知識|3つの方法、ツール選びのポイントを解説
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
「いまさら人には聞きづらいけれど、テキストマイニングとはどんなもの?」
「テキストマイニングで何ができる? Excelやツールを使って無料でできると聞いたけれど、どうすればいい?」
このような疑問をお持ちではないでしょうか。
「テキストマイニング」とは、「膨大な文章データの中から必要な情報を抽出して分析する手法」を指す言葉です。
ビジネスでは、企業が持っている多種多様な文章データ、たとえば以下のようなものの中から、顧客ニーズや自社の抱える課題など貴重な情報を得るために用いられます。
- コールセンターでの顧客との電話のやりとり
- 公式サイトの問い合わせフォームへの問い合わせ
- メールの内容
- チャットボットとのやりとり
- 顧客アンケート
- インターネット掲示板の書き込み
- SNSの書き込み(Twitter、Instagram、Facebookなど)
- ブログ記事
- レビューサイトへの評価、書き込み
- 営業日誌、日報
- 論文などの記述、引用 など
その具体的な方法は、文章を文節や単語に分けて、それぞれの出現頻度や相関関係などを集計・分析するというもので、Excelを使って簡易的に、また多くの企業ではテキストマイニング専用のツールを導入しています。
これにより、
- 顧客ニーズを把握する
- 機会損失の原因、課題を把握する
- 製品やブランドのイメージが毀損(きそん)されるのを未然に防ぐ
- 社内の業務を改善する
- 将来を予測する
など、企業のマーケティング戦略には欠かせないものとなっています。
そこでこの記事では、テキストマイニングについて知っておきたいことをわかりやすく解説します。
◎テキストマイニングとは?
◎テキストマイニングで分析できるデータソース
◎テキストマイニングでできること
◎テキストマイニングの方法
◎テキストマイニングの方法別メリット・デメリット
◎テキストマイニングの手順
◎テキストマイニングの注意点
◎テキストマイニングツール選びのポイント
目次:
- 1. テキストマイニングとは何か
- 1-1. 「テキストマイニング」とは?
- 1-2. テキストマイニングで分析できるデータソース
- 2. テキストマイニングでできること
- 2-1. 顧客ニーズを把握する
- 2-2. 機会損失の原因、課題を把握する
- 2-3. 製品やブランドのイメージが毀損(きそん)されるのを未然に防ぐ
- 2-4. 社内の業務を改善する
- 2-5. 将来を予測する
- 3. テキストマイニングの方法
- 3-1. Excelを利用する
- 3-2. Pythonなどでプログラミングする
- 3-3. 既存のテキストマイニングツールを利用する
- 4. テキストマイニングの方法別メリット・デメリット
- 4-1. Excelを利用する場合のメリット
- 4-2. Excelを利用する場合のデメリット
- 4-3. テキストマイニングツールを利用する場合のメリット
- 4-4. テキストマイニングツールを利用する場合のデメリット
- 5. Excelでのテキストマイニングの手順
- 5-1. データを収集する
- 5-2. 形態素解析をする
- 5-3. 集計する
- 5-4. ワードクラウドを作成する
- 6. テキストマイニングツール選びのポイント
- 6-1. 用途を明確にする
- 6-2. どのデータソースに対応しているか確認する
- 6-3. 辞書機能が充実していてカスタマイズ可能なものを選ぶ
- 6-4. 分析結果が活用しやすいものを選ぶ
- 7. テキストマイニングの注意点
- 7-1. 分析結果は見える化して共有する
- 7-2. PDCAサイクルに組み込む
- 8. テキストマイニングのデータ管理に適したクラウド環境を構築しよう
- 8-1. ストレスと手間を軽減、最適なクラウド化の実現をゼロからワンストップで支援
- 8-2. 見えづらい隠れコストまで可視化、コスト効率・業務効率の改善をご提案
- 8-3. NTT東日本だから実現できた安心の24時間365日の対応・保守サポート
- 8-4. AWS・Microsoft Azureの認定を受けるプロが、中立的に提案・徹底サポート
- 8-5. クラウドを活用したビジネス機会の創出に貢献
- 8-6. NTT東日本の豊富なアセットの組み合わせであなたのさまざまなニーズに対応
- 9. まとめ
1. テキストマイニングとは何か
そもそも、「テキストマイニング」とはどんなものでしょうか?
あらためてその意味や意義について確認しておきましょう。
1-1. 「テキストマイニング」とは?
「テキストマイニング」とは、「text=文章」+「mining=採掘」というふたつの単語からなる言葉で、「膨大な文章データの中から必要な情報を抽出して分析する手法」を意味します。
具体的には、文章を文節や単語に分けて、それぞれの出現頻度や相関関係などを集計・分析するという方法です。
企業には、さまざまな文章データが蓄積されています。
たとえば、カスタマーセンターに集まってくる顧客の声、WEBページの問い合わせフォームからの連絡、アンケート調査に記載された自由回答の内容、営業や店舗スタッフが対面で顧客から聞き取って日誌に記入した意見などです。
また、TwitterやInstagramをはじめとするSNSや、各種口コミサイトなど、インターネット上にもその企業に関する文章データはあふれています。
これらは企業にとって、非常に重要かつ貴重なデータです。
正しく分析すれば、顧客ニーズを把握し、的確なマーケティング施策を打ち出し、製品やサービスの質向上、業務改善に役立てることができるからです。
が、文章データはそのデータ形式や表現が自由で統一されていないため、集計・分析しづらいのが弱みです。
そのためこれまでは、せっかく貴重なデータを大量に保持していながら、十分に活用しきれていない企業も多々ありました。
そこで、これらのデータを正しく分析できる「テキストマイニング」に注目が集まっているのです。
【テキストマイニングの分析結果として出力されるワードクラウドの例】
1-2. テキストマイニングで分析できるデータソース
では、テキストマイニングではどんなデータを分析することができるでしょうか?
大きく2つに分けられます。
◎構造化・定量データ:数値化できるデータ→人数、割合、売り上げ、KPIなど
◎非構造化・定性データ:数値化しづらいデータ→感情、理由など
中でも特に、「非構造化・定性データ」こそがテキストマイニングの得意とするデータで、さまざまな文章に含まれる数値化できない感情などを抽出します。
そのもととなるデータソースは、主に以下のようなものです。
- コールセンターでの顧客との電話のやりとり
- 公式サイトの問い合わせフォームへの問い合わせ
- メールの内容
- チャットボットとのやりとり
- 顧客アンケート
- インターネット掲示板の書き込み
- SNSの書き込み(Twitter、Instagram、Facebookなど)
- ブログ記事
- レビューサイトへの評価、書き込み
- 営業日誌、日報
- 論文などの記述、引用 など
音声通話の内容なども、自動音声認識の技術によって自動的にテキスト化することが可能になったため、テキストマイニングの分析対象になりえます。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
2. テキストマイニングでできること
ところで、テキストマイニングでデータを分析することが、一体何の役に立つのでしょうか?
その目的、効果としては、主に以下の5つが挙げられます。
- 顧客ニーズを把握する
- 機会損失の原因、課題を把握する
- 製品やブランドのイメージが毀損(きそん)されるのを未然に防ぐ
- 社内の業務を改善する
- 将来を予測する
2-1. 顧客ニーズを把握する
第一に、「顧客ニーズの把握」です。
コールセンターや公式サイト、実店舗など顧客とのタッチポイントに集まってくるテキストデータには、企業の製品やサービスに対する顧客の意見、要望、クレームなどが多種多様な形で含まれています。
これを掘り起こし、分析することで顧客が何を望んでいるのか、ニーズを浮き彫りにすることが可能です。
以下のグラフを見てください。
中小企業庁による「中小企業・小規模事業者の成長に向けた事業戦略等に関する調査」(2016年、野村総合研究所調査)から、「貴社の製品・サービスにおける市場ニーズの把握に向けた取組みとして回答した選択肢の中で、最も効果が高かった取組みとして、当てはまるもの1つをお知らせ下さい」という質問への回答結果です。(グラフは当サイトで作成、加工)
水色の回答は、情報源に文書データが含まれている可能性があるものです。
【市場ニーズの把握に向けた取り組みで、もっとも効果が高かったもの】
出典:中小企業庁「中小企業・小規模事業者の成長に向けた事業戦略等に関する調査」
(2016年、野村総合研究所調査)
※グラフ化・加工は当サイトによる
顧客とのやりとりやアンケート調査、インターネットといった顧客とのさまざまなタッチポイントで、ニーズ把握に役立つ情報が得られていることがわかります。
これらの情報の中から、ときには新たな製品、サービス開発のヒントや、既存製品の思いがけない利用法のアイディアなどが発見されることもあり、テキストマイニングによってより顧客ニーズに沿ったマーケティング施策を打ち出すことにつながるでしょう。
2-2. 機会損失の原因、課題を把握する
また、前項と同様の分析の結果、「機会損失の原因、課題の把握」も可能です。
特に、顧客の要望やクレームには、「自社の製品、サービスの欠点は何か」「なぜ売れないのか」といった改善点の気づきがあるはずです。
というのも、「もっとこうして欲しい」「ここが不満」という顧客の意見は、そのまま自社製品・サービスに足りないもの、欠けている要素を示しているからです。
これらを明確化できれば、具体的な改善策を立案することもできるでしょう。
2-3. 製品やブランドのイメージが毀損(きそん)されるのを未然に防ぐ
スマートフォンの所有率が9割を超えた(※)と言われる昨今、インターネットやSNSによって情報が拡散するスピードは加速しています。(※NTTドコモ モバイル社会研究所「スマートフォン比率94%に:2010年は約4% ここ10年でいっきに普及」参照)
このことは、企業にとっては製品情報やそれに対する高評価が周知されやすいというメリットがある反面、ネガティブな情報も一瞬にして拡散してしまう、いわゆる「炎上」のリスクをもはらんでいます。
これを未然に防ぐ、あるいは早期に鎮火するためには、発信される情報をなるべく早く把握し、適切な対策を講じる必要があります。
そこで役立つのがテキストマイニングです。
TwitterやInstagramなどのSNS、ブログなどのソーシャルメディアから定期的に自社製品やサービスに関するキーワードを抽出すれば、その中に炎上につながる危険なワードが含まれていた場合、企業が早期に発見することができます。
リスクがまだ小さい火種のうちに対策をとることができれば、大きな炎上を未然に防げるでしょう。
実際に、テキストマイニングの技術を用いて炎上対策をとる企業も増えているようです。
SNSなどから情報収集する「ソーシャルリスニングツール」の中にも、特定のワードで炎上しそうな状況を察知すると、アラートメールを送信して知らせてくれる「リスク対応機能」を持ったものもあります。
それだけテキストマイニング技術が、炎上対策に有効だと言えるでしょう。
2-4. 社内の業務を改善する
営業日誌をはじめ、各部署の日報などをテキストマイニングすれば、社内の業務の問題点を見つけ出すこともできます。
日誌や日報には、顧客とのやりとりなどニーズの把握につながる内容が記載されている一方で、業務に関して各従業員が気づいたことや課題、それを改善するアイディアなどもテキストデータとして残されている可能性があります。
これらはそのままにしておくと、本人と上司が知るのみですが、テキストマイニングでデータ抽出して分析、結果をまとめることで、部内で共有できるようになります。
実際に、営業日報をAIがテキストマイニングするサービスなども提供されています。
日報に書かれた内容から、営業それぞれがどんな営業活動にどれくらいの時間を割いたかなど、活動内容を数値化することができます。
これにより、ハイパフォーマーとその他との違いが明確になり、たとえば「成績がいい営業は、フォローアップが手厚い」など勝ちパターンを知ることができるわけです。
それを他のメンバーも学ぶことで、部署全体の業務が改善されます。
このように、日誌や日報のテキストマイニングは、日々の業務の課題を改善することにつながるでしょう。
2-5. 将来を予測する
マーケティング視点からもうひとつ重要なのが、「将来予測」です。
SNSの書き込みやマスコミが発信する記事などのビッグデータをテキストマイニングすることによって、市場の動向や消費者トレンド、競合他社の動向などを把握し、それをもとに将来を予測することができるのです。
たとえば「SDGs」について、マスコミ報道の内容やSNSの書き込みなどを分析すれば、これからその分野で期待されている新技術や、消費者の関心がどこにあるかなどが見えてきます。
それを踏まえて将来を予測した上で、自社の製品開発や営業施策を立案することもできるでしょう。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
3. テキストマイニングの方法
このように、企業にとってさまざまな活用が考えられるテキストマイニングですが、では実際の分析はどのような方法で行われるのでしょうか?
大きく分けて次の3つです。
- Excelを利用する方法
- Pythonなどでプログラミングする方法
- 既存のテキストマイニングツールを利用する方法
それぞれ解説していきましょう。
3-1. Excelを利用する
まず、簡単なテキストマイニングであれば、Excelを利用して行うことが可能です。
その手順を簡単に解説すると、以下の4ステップで行います。
ステップ1:データを収集する
ステップ2:文章を単語化する=形態素解析
ステップ3:単語を集計する
ステップ4:ワードクラウドを作る
関数を用いる必要がありますし、複雑な分析には向きませんが、もっとも手軽に実施できる方法と言えます。
くわしい手順は、「5.Excelでのテキストマイニングの手順」の「5-1.データを収集する」で解説しますので、参照してください。
3-2. Pythonなどでプログラミングする
また、プログラミングによってテキストマイニングする方法もあります。
その場合、プログラミング言語はPythonが用いられることが多く、「MeCab」などの外部ツールを利用して行います。
この方法は、プログラミングの知識が必要であり専門的になるため、この記事ではくわしい手順は割愛しますが、「自分でプログラミングして実施することもできる」ことだけ知っておいてください。
3-3. 既存のテキストマイニングツールを利用する
3つめの方法は、「既存のテキストマイニングツールを利用する」ことです。
「テキストマイニングツール」とは、テキストマイニングに特化したITツールです。
カスタマーセンターでのやりとりや顧客アンケート、SNSやレビューサイトなどさまざまなテキストデータの収集、集計、分析を自動化し、その結果をわかりやすい形で見える化してくれます。
Excelよりも高度な分析が可能で、プログラミングの専門知識のない人でもビジネスに活用できる分析結果を得られるため、多くの企業で活用されています。
中には無料で利用できるツールもあるので、最初はまずそこから始めてみるのもいいでしょう。
ツールについては、「6. テキストマイニングツール選びのポイント」で選び方の解説をしていますので、そちらも参照してください。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
4. テキストマイニングの方法別メリット・デメリット
さて、ここからはテキストマイニングについて、専門知識がなくても取り組みやすい「Excelを利用する方法」と「既存のテキストマイニングツールを利用する方法」にフォーカスして解説していきましょう。
まず、「どちらの方法で実施しようか」と迷っている方のために、2つの手法それぞれのメリットとデメリットを紹介します。
メリット | デメリット | 向いているケース | |
---|---|---|---|
Excel |
|
|
|
テキストマイニングツール |
|
|
|
4-1. Excelを利用する場合のメリット
まず、Excelを利用する場合のメリットは以下です。
- 低コストで利用できる
4-1-1. 低コストで利用できる
Excelは、多くの企業がさまざまなビジネスシーンで活用している表計算ソフトウェアです。
そのため、新たにツールなどを導入する費用が必要なく、すでに使い慣れたソフトを用いて手軽に行えるのが強みでしょう。
テキストマイニングツールの中にも無料のものはありますが、導入時や運用時のサポートがないものが多いため、継続的に利用したいならあまり向かないでしょう。
「テキストマイニングをしてみたいが、そんな予算は割けない」という場合でも、Excelでならすぐに取り組むことが可能です。
4-2. Excelを利用する場合のデメリット
一方で、Excel利用には以下のようなデメリットもあります。
- 関数の知識が必要
- 手間がかかる
- 精度が低め
4-2-1. 関数の知識が必要
第一のデメリットは、ある程度の関数の知識が必要になることでしょう。
たとえば以下のような関数を用います。
- COUNTIF関数:検出したいキーワードなどを指定して、その出現個数を数える
- SUM関数:COUNTIF関数で数えた個数などを集計する
- INDEX関数:指定したセルの数値や文字列を表示する など
分析する際には、どの関数を使えば何が求められるかを理解して実施する必要があるため、主な関数を覚えておかなければなりません。
4-2-2. 手間がかかる
また、Excelではテキストデータの収集はできません。
人力で収集するか、別のツールが必要になります。
さらに、集めたデータを集計する際には、関数など手動で入力する作業が発生するため、自動化されたテキストマイニングツールよりも手間がかかるのも難点です。
特に、大量のデータを分析したい場合や、複雑な分析を行いたい場合には、Excelはあまり向かないと言えるでしょう。
4-2-3. 精度が低め
さらに、Excelでできるのは、あくまで「単語の抽出・集計」までです。
そのため、細かい分析には適さず、分析精度が高いとは言えません。
分析結果をワードクラウドなどの形で見える化したい場合は、そのためのツールを用意しなければならないでしょう。
4-3. テキストマイニングツールを利用する場合のメリット
では一方で、テキストマイニングツールを利用するメリットとは何でしょうか?
それは主に以下の3つです。
- VOCを簡単に分析できる
- ナレッジを抽出、共有できる
- ビッグデータによる将来予測も可能
4-3-1. VOCを簡単に分析できる
第一に、「VOC=顧客の声を簡単に分析できる」ことが挙げられます。
「1-2. テキストマイニングで分析できるデータソース」で解説したように、企業にはさまざまなチャネルから多種多様なテキストデータが集まってきます。
コールセンターには顧客からの電話による通話内容が、公式WEBサイトには問い合わせや意見のメールが、顧客アンケートには自由回答欄のバラバラな記入内容が、そしてインターネット上にはSNSやレビューサイトなどへの率直な書き込みが膨大にあります。
中でも顧客からの声は、ニーズや課題を把握するために非常に重要なもので、テキストマイニングを行う最大の目的のひとつです。
これらを統合して集計、横断的に分析すれば、より精度の高い分析結果が得られますし、顧客の性別や年齢などの属性ごとにセグメントした細かいニーズをつかむことも可能になります。
このような大量なVOCのデータ処理、複雑な分析は、Excelや人力では手間と時間がかかりすぎて難しいですが、テキストマイニングツールを用いれば、素早く高精度で簡単に実行することができるのです。
4-3-2. ナレッジを抽出、共有できる
次に、「ナレッジを見える化、共有できる」のもメリットです。
前述したように、テキストマイニングの対象となるデータソースはさまざまです。
中でも顧客ニーズの把握につながるVOC=顧客の声に注目されることが多いですが、社内の声も見落とせません。
「2-4. 社内の業務を改善する」でも触れましたが、従業員がつけている日誌や日報もまた、テキストマイニングによって貴重なナレッジを抽出、共有できる形に見える化が可能です。
たとえば、商談が成立した際の記録から勝ちパターンを発見したり、顧客に訴求するトークを構築したりといったこともできるでしょう。
これは、Excelでのテキストマイニングではできない、テキストマイニングツールならではの機能です。
4-3-3. ビッグデータによる将来予測も可能
テキストマイニングツールがExcelより優れているのは、膨大なデータを自動的に即時に処理できる点です。
そのため、ビッグデータをもとに市場やトレンドの将来予測をすることもできます。
さらに、人力では分析・予測が難しい株価の変動、製品の需要量の変動なども予測可能です。
このように、多彩な活用ができるのも、テキストマイニングツールの利点と言えるでしょう。
4-4. テキストマイニングツールを利用する場合のデメリット
テキストマイニングツールのデメリットは以下です。
- 類似語や表記の揺れ、誤字脱字などを判別しにくい
4-4-1. 類似語や表記の揺れ、誤字脱字などを判別しにくい
テキストマイニングツールの弱点は、以下のようなケースで正確に言葉を判別するのが苦手であることです。
- 類似語:「正月」と「元日」のように、似たような言葉の判別
- 同音異義語:「かう」が「買う」か「飼う」かなど、同じ音の言葉の区別
- 表記の揺れ:「コンピュータ」と「コンピューター」、「ひとつ」と「一つ」など同じ言葉の表記が異なる場合の判別
- 誤字脱字:文章中に誤字や脱字があった場合、それが間違いであることや正しい言葉が何かの判断
など
これらは、人間の目で確認すれば判断がつきますが、テキストマイニングツールの場合、そのままでは難しいものです。
そこで、「辞書機能」という機能を利用して対応します。
上記のような判別しにくい言葉を辞書に登録することで、判別を可能にするのです。
辞書機能については、「6-3. 辞書機能が充実していてカスタマイズ可能なものを選ぶ」でも解説していますので、そちらも参照してみてください。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
5. Excelでのテキストマイニングの手順
このように、Excelとテキストマイニングツールのメリット・デメリットを比較すると、より高度な分析に適しているのはテキストマイニングツールだと言えます。
が、「わが社が保持しているテキストデータは量が少なく、簡単な分析ができればいいのでExcelで十分だと思う」「予算がないので、ひとまずExcelでやってみたい」といったケースもあるでしょう。
そこでこの章では、Excelでテキストマイニングする手順を、具体的に解説しておきます。
手順は、以下の4ステップです。
5-1. データを収集する
まず、分析したいテキストデータを収集します。
SNS上での自社製品の評判が知りたければ、TwitterやInstagram、Facebookなどの書き込みを集めます。
手書きのアンケートなどであれば、テキストをデータ化する必要がありますが、これには手書き文書をテキストデータ化する「OCRツール」が便利です。
無料のものから有料の精度の高いものまで、さまざまなものがあります。
5-2. 形態素解析をする
次に、「形態素解析」をします。
形態素解析とは、集めたテキストデータを単語ごとに分割する作業です。
たとえば、ひとつの文章を以下のように切り分けることと考えてください。
この作業は、テキストマイニングツールであれば自動で行うことができますが、Excelの機能では行えません。
かといって、手動で行うと膨大な作業になってしまいますので、形態素解析ツールを用いるといいでしょう。
日本語解析ができるツールとしては、以下のようなものが無料で利用できます。
- MeCab:京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトによるオープンソース形態素解析エンジン
- JUMAN:京都大学 黒橋・褚・村脇研究室が開発した日本語形態素解析システム
など
5-3. 集計する
ここまではテキストマイニングのための準備です。
形態素解析ができれば、いよいよExcelによる集計に入ります。
主に使用する関数は以下のとおりです。
関数 | 数式 | 集計でわかること |
---|---|---|
COUNTIF関数 | =COUNTIF (範囲, 検索条件) | キーワードなど条件を指定すると、テキスト中にそれが出現した個数・回数がわかる |
SUM関数 | =SUM(引数) | COUNTIF関数でわかった数値に関して、セルの範囲を指定することで合計する |
INDEX関数 | =INDEX(範囲, 行番号, 列番号, 領域番号) | 指定したセルの数値や文字列を表示する |
ただ、Excelでは複雑な集計は難しいでしょう。
単純に「この製品と関連してよく使われる言葉は何か」「製品AとB、どちらに関してより多く話題にのぼっているか」など、数を集計することは可能です。
5-4. ワードクラウドを作成する
Excelでのテキストマイニングは、前項のデータ集計までで終了です。
が、これだけでは分析結果を活用しづらいため、できれば結果を見える化したいところです。
そこで、ワードクラウドを作成しましょう。
「ワードクラウド」とは、テキストデータの中の単語を出現頻度に合わせて大小をつけて視覚化する手法です。
ワードクラウドを見れば、テキストマイニングしたデータソースの中で何が注目されているのか、重要なのかをひと目で把握できます。
ワードクラウドの作成も、以下のような無料ツールで簡単にできますので、利用してみてください。
このように、Excelによるテキストマイニングは、集計以外のプロセスで他のツールを使いますが、それらはすべて無料で利用できるものもありますので、予算に限りがある場合は活用してみるといいでしょう。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
6. テキストマイニングツール選びのポイント
「5. Excelでのテキストマイニングの手順」で、テキストマイニングはExcelでも可能なことがわかりました。
ただ、手動で行う作業が多かったり、膨大なデータの処理は難しかったりという難点もあるため、「わが社の場合には適さない、専用のテキストマイニングツールを使いたい」という企業も多いでしょう。
ただ、テキストマイニングツールは多くのベンダーから提供されていて、どれを選べばいいのか迷いがちです。
そこでこの章では、テキストマイニングツールを選ぶ際に留意したいポイントを4つご紹介します。
- 用途を明確にする
- どのデータソースに対応しているか確認する
- 辞書機能が充実していてカスタマイズ可能なものを選ぶ
- 分析結果が活用しやすいものを選ぶ
6-1. 用途を明確にする
テキストマイニングツールを選ぶ前に、まず「何のために導入するのか」という用途を明確にしてください。
たとえば、「カスタマーセンターに集まる電話、メール、チャットなどさまざまなチャネルからの問い合わせ、意見、クレームなどを横断的に分析し、顧客ニーズを深掘り、製品やサービスの改善施策を立案したい」「TwitterやInstagramなどのSNSを含めたビッグデータから、消費者ニーズやトレンド、市場の動向、競合他社の動向を把握し、新製品を開発したい」などです。
用途を明確化した上で、「それが実現しやすいかどうか」という視点で各ツールの機能や使いやすさなどを検討してみましょう。
6-2. どのデータソースに対応しているか確認する
テキストマイニングツールの中には、分析できるデータソースに制限があるものもあります。
そのため、「ツールがどのデータソースに対応しているか」も見落とせないポイントです。
SNSを分析したいのであればSNSに強いツールを選ぶとよいでしょう。
また、コールセンターでの通話を分析する場合は、話し言葉の分析精度が高いものが適しています。
「今後、分析したいデータソースが増える可能性がある」などという場合には、すべてのデータソースに対応するツールがおすすめです。
6-3. 辞書機能が充実していてカスタマイズ可能なものを選ぶ
「4-4-1. 類似語や表記の揺れ、誤字脱字などを判別しにくい」で解説したように、テキストマイニングツールには識別を苦手とする単語や表現があります。
これをなるべく克服し、精度の高い分析をするには、辞書機能が充実したツールを選ぶ必要があるでしょう。
「辞書機能」とは、単語を辞書に登録することで、ツールがその単語を検知、識別できるようになる機能です。
テキストマイニングツールは、この辞書に従って形態素解析を実行します。
そのため、辞書登録の機能があれば、固有名詞や専門用語、間違えやすい単語などを登録し、判別精度を高めることができるのです。
ツールによっては、以下のような辞書機能を搭載したものもあります。
- 辞書に登録したほうがいいと思われる単語を、テキストから自動的に抽出する
- テキストに含まれる単語のうち、「好き/嫌い」など感情に関わるものをリスト化、その意見がポジティブなのかネガティブなのかなどを数値化して分析できる など
このように辞書機能が充実していて、なおかつ自社で使いやすいようカスタマイズできるものを選ぶことで、より高い分析精度が期待できるでしょう。
6-4. 分析結果が活用しやすいものを選ぶ
最後に見るべきポイントは、「分析結果が活用しやすいかどうか」です。
前出のワードクラウドのように、結果がひと目で理解できる形で出力されれば、実際の施策立案に役立てやすいでしょう。
反対に、たとえば数値データの表だけ提示されたり、データ分析の専門知識がなければ読み解けないような結果だったりすると、社内で共有しづらいはずです。
そこで、ツールごとに分析結果がどのような形で出力できるかを確認し、よりわかりやすく活用しやすいものを選びましょう。
中には、ワードクラウドやマッピングなど何種類もの出力形式で結果を可視化できるテキストマイニングツールもありますので、比較してみてください。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
7. テキストマイニングの注意点
さて、ここまでテキストマイニングの具体的な方法を解説してきましたので、いよいよ実際に取り組もうという方も多いでしょう。
が、その前に、注意しておきたいことが2つあります。
- 分析結果は見える化して共有する
- PDCAサイクルに組み込む
7-1. 分析結果は見える化して共有する
まず、「5-4. ワードクラウドを作成する」などで何度か触れたように、テキストマイニングの分析結果はわかりやすい形で見える化した上で、社内に共有してこそ価値を発揮します。
主な見える化の方法としては、以下のようなものがあります。
数値化されたデータよりも、ひと目で何が重要かわかるため、これをもとに改善策やマーケティング施策などを立てやすくなるでしょう。
【ワードクラウド】
単語の頻出度によって大小をつけて、重要なものほど大きく表示する
【ネットワーク】
テキストデータに登場する単語同士のつながりを図示する
また、特定の単語に対してどのような単語が関連して多く使われるかを示すこともできる
【パースペクティブ】
単語を属性によってマッピングし、そこからパターンを見出す
7-2. PDCAサイクルに組み込む
また、テキストマイニングは一度実施しただけでは劇的な効果が得られるとは限りません。
それよりも、PDCAサイクルに組み込んで繰り返すことが重要です。
まず、テキストマイニングによって課題や改善点などを把握したら、それに対する施策を立てます。
そして、その施策を実施したのちに、あらためてテキストマイニングを行い、VOCがどのように変化したか、目標通りの改善がなされたかをチェックします。
結果がはかばかしくなければ、施策は成功ではなかったと思われますし、改善が成功していても、新たな課題が見つかることもあるでしょう。
それを踏まえて、また次の施策を打ち出し、その結果をテキストマイニングで分析する ─── というサイクルを回していくことで、確実に改善が進んでいくはずです。
【これ一冊で分かる!】NTT東日本がおすすめするクラウド導入を成功させるためのお役立ちマニュアルのダウンロードはこちら!
8. テキストマイニングのデータ管理に適したクラウド環境を構築しよう
ここまで、テキストマイニングの方法についてくわしく解説してきました。
が、もうひとつ注意しなければならないことがあります。
それは、テキストマイニングで扱う膨大なデータの管理です。
テキストマイニングで扱うデータは多種多様です。
中には顧客とのやりとり、アンケートなど個人情報が含まれるものもあるため、情報漏えいなどがないよう高いレベルのセキュリティが求められます。
また、SNSなどインターネットからも大量のテキストデータを取得するため、安定した通信環境も必要でしょう。
この「セキュリティ」と「通信の安定性」をともに満たすには、クラウド(AWS、Microsoft Azure)の導入が最適です。
そして、これからクラウド環境を導入しようという方には、NTT東日本の「クラウド導入・運用 for AWS / Microsoft Azure」をおすすめします。
「自社に適したクラウドを導入したい」
「セキュリティが高く、通信環境も安定したクラウドを導入したい」
そんな希望を持っている方に最適なソリューションだと言えるでしょう。
そのメリットは、以下の6つです。
それぞれくわしく解説します。
8-1. ストレスと手間を軽減、最適なクラウド化の実現をゼロからワンストップで支援
クラウド化を自社で行おうとすると、検討すべきことや実行しなければならないことがあまりに多いことに驚くでしょう。
あるいは、導入支援を行うところに委託した場合も、実際は一部の工程をサポートしてくれるのみで、結局情シス担当者が多くの工数を負担した、というケースもままあります。
その点、NTT東日本の「クラウド導入・運用 for AWS / Microsoft Azure」なら、ワンストップでサポートします。
◎情シス担当者の負担・会社のコスト(時間・労力)最小化に向けて、クラウドのプロが本気で向き合い実現をサポートします
◎企画〜構築・運用までのトータルで支援可能
中立的な視点・アドバイスで自社にベストな環境構築を実現
◎ライセンス調達やインフラ構築の面倒を回避、軽減へ
このように、「クラウド移行前→移行作業→移行後のクラウド導入から運用」の”全領域”で効率化の実現をサポートします。
8-2. 見えづらい隠れコストまで可視化、コスト効率・業務効率の改善をご提案
クラウド化を検討する際は、つい導入時の”初期コスト”に気を取られがちです。
が、実は「普段の運用にかかる人的コスト」や「障害やトラブルによってビジネス機会損失が生じるリスク」なども考慮した上で、”トータルコスト”で費用対効果を検討することが重要なのです。
その点NTT東日本なら、設計から構築、運用まで一元サポートすることで、一見見落としがちな部分も含めたトータルコストを見える化します。
クラウド導入後の業務の効率化・コスト効率の改善も踏まえた全体最適化に向けて、全力でコミットします。
8-3. NTT東日本だから実現できた安心の24時間365日の対応・保守サポート
クラウド支援を提供する企業が、最も重視しなければいけないのは、お客さま目線の”安心”です。
となると、欠かせないのは24時間・365日の対応でしょう。
NTT東日本では、疎通の確認や障害対応など、24時間365日の監視・保守を実現します。
夜中や早朝のトラブル、休日出勤の保守作業などに悩まされることはもうありません。
8-4. AWS・Microsoft Azureの認定を受けるプロが、中立的に提案・徹底サポート
はじめてクラウドを導入する方は、このような悩み、疑問を抱きがちです。
「そもそもうちの場合、オンプレミスとクラウド、どちらがコストパフォーマンスがいい?」
「コストや業務稼働、部門連携などを踏まえたら、どの社内システムからクラウド化するべき?」
「必要なのはAWS?Microsoft Azure? 目的を達成するためにベストなサービスはどれ?」
クラウドにくわしい人でも迷ってしまうようなこんな疑問こそ、NTT東日本におまかせください。
AWS・Microsoft Azureの認定資格を持つプロフェッショナルが、あなたの組織のクラウド導入目的、コストパフォーマンス、希望要件を踏まえて、最適なサービス選定、最適な移計画を作成します。
8-5. クラウドを活用したビジネス機会の創出に貢献
また、NTT東日本はクラウドを熟知し、150社を超える導入実績を持っています。
その経験から、AWS、Microsoft Azureの活用シナリオも200以上をご用意していますので、あなたの組織に最適なクラウド活用がきっと見つかるはずです。
コストや手間を効率化するだけの「守り」のクラウドではなく、新たなビジネス機会を創出し、売り上げ向上にも貢献する「攻め」のクラウド活用を実現します。
8-6. NTT東日本の豊富なアセットの組み合わせであなたのさまざまなニーズに対応
そして、テキストマイニングに重要な「セキュリティレベルの高い接続環境」「通信速度の確保」をはじめ、手間のかかる作業の代行など、お客さまそれぞれのニーズに対して、低コスト・高水準で応えるアセットを豊富にご用意しているのも、好評の理由です。
クラウドのプロが最適な組み合わせをプランニングして、費用対効果を高めるためのプラン・設計をご提案します。
NTT東日本のクラウド環境に興味を持った方は、ぜひこちらからくわしいご案内をチェックしてみてください。
- Amazon Web Services(AWS)は、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。
- Microsoft Azureは、Microsoft Corporationの米国及びその他の国における登録商標または商標です。
9. まとめ
いかがでしたか?
ではあらためて、記事のポイントをまとめましょう。
◎「テキストマイニング」とは、「膨大な文章データの中から必要な情報を抽出して分析する手法」
ビジネスでは、企業が持っている多種多様な文章データ、たとえば以下のようなものの中から、顧客ニーズや自社の抱える課題など貴重な情報を得るために用いられます。
◎テキストマイニングで分析できるデータソースは、
- コールセンターでの顧客との電話のやりとり
- 公式サイトの問い合わせフォームへの問い合わせ
- メールの内容
- チャットボットとのやりとり
- 顧客アンケート
- インターネット掲示板の書き込み
- SNSの書き込み(Twitter、Instagram、Facebookなど)
- ブログ記事
- レビューサイトへの評価、書き込み
- 営業日誌、日報
- 論文などの記述、引用 など
◎テキストマイニングでできることは、
- 顧客ニーズを把握する
- 機会損失の原因、課題を把握する
- 製品やブランドのイメージが毀損(きそん)されるのを未然に防ぐ
- 社内の業務を改善する
- 将来を予測する
◎テキストマイニングの方法は、
- Excelを利用する
- Pythonなどでプログラミングする
- 既存のテキストマイニングツールを利用する
◎テキストマイニングツール選びのポイントは、
- 用途を明確にする
- どのデータソースに対応しているか確認する
- 辞書機能が充実していてカスタマイズ可能なものを選ぶ
- 分析結果が活用しやすいものを選ぶ
◎テキストマイニングの注意点は、
- 分析結果は見える化して共有する
- PDCAサイクルに組み込む
本記事が、テキストマイニングについて興味を持っている方々にとってお役に立てば幸いです。
データの管理にクラウド環境をご検討の方は、NTT東日本へお気軽にご相談ください。
無料ダウンロード
自社のクラウド導入に必要な知識、ポイントを
この1冊に総まとめ!
あなたはクラウド化の
何の情報を知りたいですか?
- そもそも自社は本当にクラウド化すべき?オンプレとクラウドの違いは?
- 【AWS・Azure・Google Cloud】
どれが自社に最もマッチするの? - 情シス担当者の負荷を減らしてコストを軽減するクラウド化のポイントは?
- 自社のクラウド導入を実現するまでの具体的な流れ・検討する順番は?
初めての自社クラウド導入、
わからないことが多く困ってしまいますよね。
NTT東日本では
そんなあなたにクラウド導入に必要な情報を
1冊の冊子にまとめました!
クラウド化のポイントを知らずに導入を進めると、以下のような事になってしまうことも・・・
- システムインフラの維持にかかるトータルコストがあまり変わらない。。
- 情シス担当者の負担が減らない。。
- セキュリティ性・速度など、クラウド期待する効果を十分に享受できない。。
理想的なクラウド環境を実現するためにも、
最低限の4つのポイントを
抑えておきたいところです。
-
そもそも”クラウド化”とは?
その本質的なメリット・デメリット - 自社にとって
最適なクラウド環境構築のポイント - コストを抑えるための
具体的なコツ - 既存環境からスムーズにクラウド化を
実現するためのロードマップ
など、この1冊だけで自社のクラウド化のポイントが簡単に理解できます。
またNTT東日本でクラウド化を実現し
問題を解決した事例や、
導入サポートサービスも掲載しているので、
ぜひダウンロードして読んでみてください。
面倒でお困りのあなたへ
クラウドのご相談できます!
無料オンライン相談窓口
NTT東日本なら貴社のクラウド導入設計から
ネットワーク環境構築・セキュリティ・運用まで
”ワンストップ支援”が可能です!
NTT東日本が選ばれる5つの理由
- クラウド導入を
0からワンストップでサポート可能! - 全体最適におけるコスト効率・業務効率の改善を
中立的にご提案 - クラウド環境に問題がないか、
第3者目線でチェック
してもらいたい - 安心の24時間・365日の対応・保守
- NTT東日本が保有する豊富なサービスの組み合わせで
”課題解決”と”コスト軽減”を両立
特に以下に当てはまる方はお気軽に
ご相談ください。
- さまざまな種類やクラウド提供事業者があってどれが自社に適切かわからない
- オンプレミスのままがよいのか、クラウド移行すべきなのか、迷っている
- オンプレミスとクラウド移行した際のコスト比較を行いたい
- AWSとAzure、どちらのクラウドが自社に適切かわからない
- クラウド環境に問題がないか、第3者目線でチェックしてもらいたい
- クラウド利用中、ネットワークの速度が遅くて業務に支障がでている
クラウドを熟知するプロが、クラウド導入におけるお客さまのLAN 環境や接続ネットワーク、
クラウドサービスまでトータルにお客さまのお悩みや課題の解決をサポートします。
相談無料!プロが中立的にアドバイスいたします
クラウド・AWS・Azureでお困りの方はお気軽にご相談ください。