クラスター分析とは?マーケティング分析で利用できる考えと方法を紹介

2022/04/08
クラスター分析 クラスター分析とは?マーケティング分析で利用できる考えと方法を紹介

クラスター分析によって、Z世代を4タイプに分類」「あなたはどのタイプ?キャリジョクラスター分析」「日本人の遺伝的集団構造をクラスター分析」など、身近な話題からアカデミック領域まで幅広く活用されているクラスター分析。

マーケティング領域でも顧客セグメンテーション、新たなペルソナの発見、市場調査などにすでに活用している人も多いでしょう。マーケティング担当者はデータをいかに読み取り、分析し、活用するかも能力のひとつです。できるだけ有用な幅広い分析手法を知って使いこなす必要があります。

本記事では、マーケターが知っておくべきクラスター分析の基本、特徴、クラスター分析の活用例を紹介します。

クラスター分析とは?

クラスター分析とは、さまざまな特徴を持つ混在したデータを、客観的な数値基準、類型性によっていくつかの集団(クラスター)に分ける機械学習・データマイニング手法のひとつです。

簡単にいえば、大量のデータから似たもの同士を複数のグループに分ける手法です。

特徴

クラスター分析は科学的な分析手法であり、人の思い込み、バイアスに影響されない結果が出るところが特徴です。「教師なし学習」といって明らかな分類基準を指定せず、データから近似性を見つけ出して分類します。

たとえば、男性、30代など明確な基準をもとにデータをセグメントするような一般的な方法と異なり、何万件とあるデータからまったく参照指標なしに似た特徴を持つ類似データを抽出するため、思いもよらない結果が出てくることがあります。

クラスター分析を活用すると、購買履歴が近似している、行動パターンが似ている、アンケートの発言内容(アンケート等)が近似しているなど、さまざまな角度から対象をグルーピングできます。マーケティング領域での主な活用例は以下のとおりです。

マーケティング領域活用例:

  • 買い手の特性ごとにグループ分けが可能
  • 買い手の生活エリア(商圏)の特性分析
  • 新しいペルソナグループの発見
  • ブランドのポジショニング分析
  • ダイレクトメールの配信先のカスタマイズ
  • リターゲティング広告配信先のカスタマイズ
  • プロモーションやその他のマーケティングメッセージの調整
  • さまざまなペルソナのニーズに合わせて、製品をより良くカスタマイズする
  • アンケートや市場調査などのデータ分析を行う
  • 投稿時間のクラスター分析によるTwitterユーザの年齢層推定

また、クラスター分析の分析対象は人だけでなく、生物、商品、地域、企業、イメージなども対象にできるため、幅広い領域で活用されています。

マーケティング領域以外での活用例:

  • 疾患の分類
  • 市町村の分類
  • 文化圏の分類
  • 考古学で発掘された人骨や遺物の分類
  • ヒトの祖先の推定
  • 政府統計

クラスター分析の2分類

クラスター分析には大きく分けて「階層クラスター分析」と「非階層クラスター分析」、2つの手法があります。

階層クラスター分析

階層クラスター分析は、すべてのデータ間の類似度を算出した後で、一定の基準に従って自動的にクラスターを形成していく方法です。

データの類似度を出す計算・分析手法には「ウォード法」「群平均法」「最短距離法」「最長距離法」などの手法があります。一般に計算量が多くて精度が高い「ウォード法」「群平均法」が活用されます。いずれの計算方法でも、分類の過程で下記のような階層構造(樹形図)ができるため「階層クラスター分析」と呼ばれています。

樹形図と呼ばれるトーナメント表のような図は、視覚的にわかりやすく、クラスター同士の距離、クラスターの数などが一目瞭然なところが特徴です。

クラスター分析結果の例

階層クラスター分析の樹形図
                                          (出典:政府統計局        

非階層クラスター分析

非階層クラスター分析は、事前にクラスター数をいくつに設定するかを決めてグループ分けします。代表的手法に各クラスターに含まれる「超体積法」「k平均法(k-means法)」があります。

非階層クラスタリング図

非階層クラスター分析の図

(出典:政府統計局

階層クラスター分析と非階層クラスター分析の違い

階層クラスター分析と非階層クラスター分析はそれぞれ長所・短所があります。

マーケティングの人たちが知りたいことは、雑多な情報からまとまりを見つけたい場合が多いので、多くの場合、非階層クラスター分析が適していますが、階層クラスター分析の長所も理解し、目的によって使い分けましょう。

階層クラスター分析のメリット・デメリット

類似度が高いものから低いものへ自動的にクラスターが形成されていきます。階層構造図によってクラスター同士の近さがわかりやすく、全データの階層構造を俯瞰して理解できるメリットがあります。また、クラスターを任意に分割して活用できます。

階層クラスター分析の分割

ただし、分類対象のデータが膨大だと計算に時間がかかり、階層の構造がいくつもできるため視覚的にもわかりづらくなります。階層クラスター分析は膨大なビッグデータの解析やマーケティングオートメーションでの分析には向いていません。

階層クラスター分析のメリット・デメリット

(出典:総務省

非階層クラスター分析のメリット・デメリット

非階層クラスター分析は、計算量が少ないためビッグデータのような膨大なデータ数を扱えるところがメリットです。データ数が増えてもクラスター構造に問題が生じにくく、信頼性の高い分析結果を得られます。

ただし、分析者が最初にクラスター数を設定する必要があり、階層分析のように後から任意のクラスター数に分割できません。そのため、最初のクラスタ設定数によって分析結果が規程してされてしまうところが難点です。

とはいえ、クラスター分析にはさまざまな分類方法があるものの、一般的なクラスター分析手法は「k-meansクラスター分析」のことを指すと言われるほど活用されています。

非階層クラスター分析のメリット、デメリット

(出典:総務省

長短を比較すると以下のとおりです。

比較表

マーケティングでクラスター分析を活用するには?

マーケティングにおけるクラスター分析の目的は、一般に顧客を正しくクラスターに分けて、それぞれのニーズ、嗜好に合わせたマーケティング施策を提供することです。

顧客をどう定義するかは、実は単純ではなく、自分の想像のおよばない共通項で一つの顧客グループがある可能性はあります。そのような新しい顧客層を見つけるのに、クラスター分析は有効です。

具体例1:顧客の行動パターンをクラスター分析

オンライン上では顧客の顔は見えませんが、閲覧回数や頻度、購入している製品・サービス、閲覧するページなどさまざまなデータがあります。そして、類似した行動をとる人たちが存在します。

たとえば、非階層クラスター分析のK-means手法を活用すれば、以下のような顧客の行動パターンで顧客をクラスタリングすることができます。年齢や性別などの属性バイアスに捕らわれない新たな顧客層を発見できる分析手法です。

  • 顧客の閲覧行動
  • 顧客の出現頻度、頻度、金銭的価値
  • 顧客が購入した商品
  • オフラインでの顧客行動
  • 製品の使用例
  • キーワードの順位
  • 難易度スコア

K means分析

(出典:improvado.io/blog

具体例2:アンケートを因子分析とクラスター分析

クラスター分析は、他の分析手法と組みあわせることでよりマーケティングに役立つ結果を得られます。

たとえば顧客アンケートでは、取得データの変数の背後に共通する原因を見出す「因子分析」を行い、抽出された因子によるクラスター分析を行うことで、価値観、嗜好などによるグループ分けも可能になります。自社の顧客の新しいグループの発見、なぜ、自社製品・サービスが購入されているかなどの理解につながります。

以下は性格タイプとSDGsへの関心についてのアンケート調査をした例です。

SDGsと性格特性のアンケート

(出典:政府統計局

結果、アンケートに回答した人を 4 つのクラスターに部類でき、外向性や開放性の高いクラスター」に属する人はSDGs の認知も高く興味関心度合い、協調性の低い クラスターではSDGsへの認知度も興味関心度合いも低い結果となりました。

こちらはシンプルな例ですが、SDGsは今後、企業が国からも顧客からも厳しくチェックされていくポイントのひとつです。

自社の顧客の価値感を捉えるためにSDGsについてのアンケートを実施することで、自社顧客の方針を理解し、それをもとに現在のサービスを改善したり、新たな製品・サービス、たとえば資源をむだにしない商品開発などに生かしたりすることができるでしょう。

具体例3:クラスター分析で市場をセグメント

セグメンテーションマップ

(出典:clusteranalysis4marketing.com/

米国のマーケティング関連サイトClusteranalysis4marketing.では、無料のクラスター分析Excelテンプレートを用いてサンプルデータで分析する手法を公開しています。

サンプルデータのマーケティング変数は以下の4つです。

  • 顧客のロイヤルティ
  • 広告認知度
  • 製品使用のレベル(ヘビー)
  • 製品の使用レベル(ライト)

結論として、以下のセグメントが導きだされています。

  • セグメント1:平均以上のロイヤルティを持つ。販売促進には敏感なものの広告はほぼ認識していない層。
  • セグメント2:製品・サービスの使用率が低い。販売促進によって購入の動機付けが高まるようなロイヤルティがほとんどない層。
  • セグメント3:ロイヤルティと製品・サービスの使用レベルは平均以上。広告認知度や販売促進策への反応は平均以下。長期的なロイヤルティが期待できない層。
  • セグメント4:ロイヤルティと製品・サービスの使用レベルは平均程度。広告を認識している。広告によって使用量が影響を受ける可能性がある層

このマーケティング変数を変えることで、さまざまな分析結果が得られます。

こちらをダウンロードで試してみると、クラスター分析の感覚がつかめるでしょう。

まとめ

マーケティング担当者が扱うデータは大抵の場合雑多であり、つかみどころがなく膨大です。

クラスター分析は、大量のデータから似た特徴を持つデータをグループとしてまとめてくれるため、マーケティング担当者にとって大変役立つ分析手法です。まるで、見ることができない海の中の魚類をグループ分けしてくれるような有能さです。

膨大なデータから何かの共通項を読み取ってペルソナを特定する作業は、個人の脳の力だけでは不可能。データが少数であっても思い込みや決めつけが発生するリスクがあります。
直感、経験値ももちろん大切ですが、クラスター分析をはじめ複数の分析手法を活用することがマーケティングの精度を高めます。

フラットにデータから顧客グループを浮かび上がらせたり、階層的に顧客クラスタを整理したりしてみましょう。新しい顧客グループに出会えるかもしれません。

戸栗 頌平(とぐりしょうへい)

著者情報 戸栗 頌平(とぐりしょうへい)

株式会社LEAPT(レプト)の代表。BtoB専業のマーケティング支援会社でのコンサルティング業務、自社マーケティング業務、営業業務などを経て、HubSpot日本法人の立ち上げを一人で行い、後に日本法人第1号社員マーケティング責任者として創業期を牽引。B2Bの中小規模企業のマーケティングに精通。趣味で国外のマーケティングイベント、スポーツイベント、ボランティアなどに参加している。

サービスを詳しく知りたい方はこちら

資料請求