2020年12月25日

サービス紹介ページはお問い合わせに効いているのか？

執筆者木田和廣・チーフ・エバンジェリスト

Googleアナリティクス

この記事は、WEBやデータ分析に関する投稿をみんなでしてみよう Advent Calendar 2020の22日目の記事です。

多分、ブログを書くのも年内最後になります。何を書こうかなぁ？と考えたのですが、やはり自分的には今年は機械学習の年だったので、Exploratoryで締めたいと思います。

お題と解き方

お題は、このブログ記事のタイトルにもしました「サービス紹介ページはお問い合わせに効いているのか？」です。よく、お客様からもご質問を受けますね。

このお題への解の出し方はたくさんあると思うのですが、この記事では「ロジスティック回帰」を利用してみたいと思います。

データラングリング

Exploratoryでは分析の種類として「ロジスティック回帰」を選んで「実行」をポチっとするとあっという間に結果が出ます。ですので、その部分に掛かる労力は、右手の人差し指を1mm程度動かしてトラックボールの左ボタンを押すだけです。

が、手間がかかるのはデータラングリングと呼ばれるデータの整形です。そしてデータラングリングはExploratoryの得意技です。

今回ロジスティック回帰分析を動かす上で、必要となるデータの要件は以下です。

１行が1ユーザー（※）となっている
サービスページを見たかどうか？というブール型のカラムがある
お問い合わせをしたかどうか？というブール型のカラムがある

（※）「サービスページを見たユーザーがお問い合わせをしやすいのか？がお題の場合は1行が1ユーザーとしますが、もし、お題が「サービスページを見たセッションがお問い合わせに繋がりやすいのか？」であれば、1行を1セッションとします。このように、関心のあるものについて1行にするというのが機械学習を利用するときのデータラングリングの大原則ですので、覚えておくと良いかな。と思います。

こんな感じですね。

cidはユーザーを一意に特定するID
has_browsed_servicedpage_maxは、サービスページを見たかどうか？
has_converted_maxは、お問い合わせをしたかどうか？

です。

肝となるラングリングのステップ

Googleアナリティクスから取得したデータは普通、最初はこのような形をしています。赤枠のユーザーさんは複数ページを見てくれていますが、このユーザーさんはサービスページを見ていないので、このユーザー1レコードにまとめると、「サービスページを閲覧したか？」の列は、FALSEとなるようにラングリングしなければなりません。ですよね？

一方、こちらのユーザーさんは、「サービス紹介をページを閲覧したか？」の列はTRUEとなるようにしなければなりません。

そのラングリングを可能にするのは、以下の3ステップで行います。

第一ステップ = 行単位で「サービスページを閲覧したら1」のフラグを立てる

Exploratory内で以下の計算式を書きます。見慣れない読者の方もいらっしゃるかもしれませんが、やっていることは単純で、行単位で見ていったときに（どのユーザーかは全く問わず）pageが "/service/"で始まっていたら1を、そうでなければ0フラグとして立て、カラム名（これは任意の名前でOK）は、has_browsed_serivcepageとしなさい。という命令となっています。