【卒業研究の紹介】 three.jsを使った情報可視化手法の提案

以前のこちらの投稿に続いて、昨年度の本ゼミの卒業研究を紹介します。

今回、ご紹介するのは「情報可視化」に関する研究です。この研究は、消費者の属性と広告媒体(雑誌、TV、Web)との関係を分析し、特定の商品を宣伝しようとする場合に、広告媒体やターゲットユーザを選ぶというマーケティング活動を支援することを目標としています。

今回、研究に用いた分析データは、企業の広告や販売促進などの「マーケティング活動」と、消費者が購入に至るまでのステップである「消費行動のプロセス」とを、同一のモニタで調査したシングルソースデータ((出所)株式会社野村総合研究所 インサイトシグナル(2013年3~4月期)データ)を使用しました。今回はこのデータセット含まれる、3,000人のモニタに対するWebアンケートやWebアクセスログ等によって取得した、テレビ視聴履歴、Web閲覧履歴、雑誌閲覧履歴と、職業と趣味などのデモグラフィック属性データ、そしてビールやジュース等の飲み物の購入頻度データを分析しました。

この研究では、このデータを、ノードとエッジに属性を持つ「属性付きグラフ」としてモデル化し、その属性付きグラフを3Dモデルとして可視化するという手法を提案しています。本システムの実装には、three.jsと呼ぶ3Dモデルを表示するためのJavaScriptライブラリを使い、ユーザの操作により可視化対象の属性を自由に選べるようにしました。選択された属性は瞬時に可視化に反映させることで、選択した属性による関連性の相違点を把握できるようにしています。我々はこのアプローチを「レスポンシブ可視化」と呼んでいます。

それでは実際の分析結果をご覧下さい。ただし、本エントリでご紹介するのは、その分析結果すべてではなく、分かりやすい結果が出た、(1)雑誌と趣味、(2)雑誌と飲料品、(3)雑誌と職業との関係のみです。WebサイトやTV番組の分析結果は省略します。

それぞれ、以下の画像をクリックすると別のタブで可視化結果が表示されます。ご覧いただく場合には、必ずHTML5対応のChrome,Firefox,IE11以降等のブラウザでご覧下さい(スマホはWebGLに対応していないのでご覧いただけません)。マウスの左ボタンのドラッグ、右ボタンのドラッグ、マウスホイールにより、自由自在に視点を移動させることができ、これにより、グラフの全体の中から特徴的なクラスタの発見を可能にしています。

(1)雑誌とその読者の趣味(以下の画像をクリックすると可視化結果が別タブで表示されます)
購読雑誌と趣味

(2)雑誌とその読者の飲料品(以下の画像をクリックすると可視化結果が別タブで表示されます)
購読雑誌とドリンク

(3)雑誌とその読者の職業(以下の画像をクリックすると可視化結果が別タブで表示されます)
購読雑誌と趣味

3D空間の床面には、雑誌間の購読ベクトルの類似度に基づくグラフが配置され、購読者が類似する雑誌が近くに配置されています(x座標とy座標の値には意味はありません)。ノードは雑誌を表し、エッジは雑誌と雑誌との読者の類似度を表します。ノードとエッジの色は、クラスタリング分析によって自動的に付与されたクラスタを表し、類似したクラスタに含まれる雑誌には同じ色が着色されています。ノードには3D棒グラフが表示されていますが、この棒グラフは、ユーザによって選択されたノード属性の割合を示すものであり、画面の下部に表示されている職業や飲み物のボタンをクリックすることで、インタラクティブに表示する棒グラフの種類が変えることができます。さらに、画面左下には、カイ二乗検定を適用するかどうかを指定するチェックボックスが備えられており、これにより、統計的に有意な属性をもつノードのみを棒グラフで表示することができます。例えば、「学生」という職業属性が選択されていた場合、学生が視聴する割合が他の職業よりも有意に高い場合のみ、棒グラフを表示します。

今回は分析手法としては、単純なクロス集計とクラスタリングしか使っていませんが、クラスタリングとクロス集計の結果を同時に把握できるインタフェースにより、様々な発見ができることが、ご理解いただけたと思います。当ゼミでは今後も新しい情報可視化方法を提案していく予定です。

尚、この成果は今年3月に沖縄で開催された電子情報通信学会のLOIS研究会で発表しておりますので、詳しい内容は、その研究会の発表原稿をご覧いただければ幸いです。研究会で発表したプレゼンテーション資料はこちらに公開しております。

P.S. マーケティング分析コンテストを開催し、このような素晴しいデータを提供していた野村総合研究所に心より感謝致します。