皆さまは、GA4のデータはどのような手段で確認していますか?

Universal Analytics(以下、「UA」)と違って、GA4では標準レポートでは基本的にサンプリングがかからないので実数を把握するのに便利ですよね。ただ、ディメンションと指標の組み合わせやフィルタ等に制限があり、データの深掘りには向いていません。

そうなると、次に挙がるのが探索レポートでしょうか。ですが、こちらは自由度が高い分析ができるかわりに、サンプリングがかかる確率が高く正確なデータを見ることが難しいです。

弊社で推奨しているのはBigQueryです。BigQueryは、無料ではないですしSQLの知識も必要であるため導入ハードルは高いですが、その分、正しく扱うことができればサービス改善に最短で近づけるツールです。

弊社のブログでは、いくつかの記事にわたって、具体的なSQLやBigQueryを利用するかどうかの判断ポイント等をご紹介しております。

では、実際に導入する時にはどのようなことに気を付ける必要があるのでしょうか。本記事では、GA4とBigQueryの連携~活用を行う際に覚えておきたいポイント5つをご紹介いたします。

1. エクスポート条件の設定

あらかじめGoogle Cloud Platform(以下、「GCP」)でプロジェクトの作成を行っておき、GA4管理メニューにある、[プロパティ設定] > [サービス間のリンク設定] > [BigQuery のリンク] 連携を行いましょう。

連携を行うにはGA4の編集権限とBigQueryの所有者権限が必要ですので、連携作業を行うユーザーアカウントに必要な権限が付与されているかもご確認ください。

連携作業自体は非常にシンプルで、画面に沿って設定していけば問題ありません。この時迷う可能性があるのが、イベントデータとユーザーデータの設定欄にあるチェックボックスです。

1: エクスポート頻度

BigQuery上のGA4のテーブルは、イベントデータとユーザーデータそれぞれわかれていて、且つGA4からBigQueryにデータを保存する頻度を決めることが可能です。

ユーザーデータは2024年3月時点では日別のみ選択できますが、イベントデータはいわゆるリアルタイムなエクスポートを可能とするストリーミングも選択できます。データを見る際、リアルタイムデータも確認する必要がある場合は日別と併用するのが良いかと思います。

2: モバイルアプリ ストリーム用の広告識別子の扱い

こちらは、GA4でデータ収集しているアプリでデバイスのユニークIDをBigQueryにエクスポートするかどうかを設定することができる項目です。

昨今ではプライバシーの観点からIDの収集を行うか同意をとっている状況ですので、もしもエクスポートする際は社内の法務担当者等にご確認ください。WEBサイトのデータのみ収集している場合は未設定で問題ありません。

2. バックフィル機能はなし!連携するなら早めの判断が必要

UAの頃のGA360をご利用されている企業ほど気になると思いますが、GA4では無償版プロパティでもBigQueryに連携できるようになった一方、バックフィル機能はありません。

GA4のサービス開始当初ではバックフィルするデータがないので当然といえますが、このような機能がない状態でリリースされています。今後アップデートとして追加される可能性はありますが、今の時点でGA4を新規導入する場合はBigQueryの利用も見据えてデータ設計をしていただくことを推奨いたします。

3. プロパティの設定によってはユーザーIDのエクスポートが行われない

BigQueryを使ってユーザー分析しようと考えた時、GA4管理メニューの[プロパティ] > [データの収集と修正] > [データの収集] にて、ユーザー提供のデータ収集を有効化にしているとユーザーIDがBigQueryにエクスポートされません。

ユーザー提供データの収集を有効にすると、BigQuery からエクスポートされるイベントレベルおよびユーザーレベルのデータでユーザー ID を使用できなくなります。ユーザー提供データの収集を有効にしてエクスポートした場合の User-ID は、今後オープンベータ版でサポートされる予定です。

[GA4] ユーザー提供データの収集 – アナリティクス ヘルプ より

こちらの機能はベータ版で、現時点では一度オンにしてしまうとオフにすることができません。今後のアップデート内容で解決策が見つかるまではオフの状態でご利用いただくことを推奨いたします。

4. BigQueryのエクスポート制限オーバー!どう対策する?

BigQueryのエクスポートには、無償版プロパティの場合1,000,000件/日の上限設定がされています。ECサイトをはじめ回遊率が高いWEBサイトの場合、上限に抵触しやすいといえます。

連携メニューにある [データストリームとイベントの設定] より、エクスポートするイベントを絞り込むことはできます。しかしpage_viewイベント等、分析に必要かつ発火しやすい条件のイベントを除外するのは困難だと思いますので、この機能のみで解決することはあまり期待できません。

また、仮に一時的にエクスポート量を抑えられたとしても、基本的にデータは年月が経過すればするほど毎月の発火量も増えるものですので、有償版をご契約いただくことが良いと思います。

有償版では1日のエクスポート上限も数十億まで緩和されるだけでなく、作成できるカスタムディメンション・カスタム指標、パラメータの値の長さ、サンプリング条件等、BigQueryに限らずさまざまな面での向上が期待できます。

UAの頃と違ってGA4の有償版は最低価格が下がっていますので以前よりお気軽に検討してみても良いのではと思います。その他の無償版と有償版の違いは、以下のヘルプドキュメントをご覧ください。

[GA4] Google アナリティクス 360(Google アナリティクス 4 プロパティ) – アナリティクス ヘルプ

5. BigQueryに格納したデータ分析をするならどのような権限を付与すべき?

GCPの利用経験が浅い状態でBigQueryの運用を始めようと考えた時、少々難しいのがBigQueryの利用権限の設定です。

GCPでは「IAM」と呼ばれる権限の管理メニューで権限付与を行いますが、GA4のように単一または複合的な権限を持ったロールがリソース毎に何種類も存在しており、且つカスタマイズも可能なため、初心者の方ほどどれを使えば良いか迷うことになると思います。

例として、BigQueryの場合、事前定期済みのものだけでも17種あります。

BigQuery の IAM 事前定義ロール

  • BigQuery Admin
  • BigQuery Connection Admin
  • BigQuery Connection User
  • BigQuery Data Editor
  • BigQuery Data Owner
  • BigQuery Data Viewer
  • BigQuery Filtered Data Viewer
  • BigQuery Job User
  • BigQuery Metadata Viewer
  • BigQuery Read Session User
  • BigQuery Resource Admin
  • BigQuery Resource Editor
  • BigQuery Resource Viewer
  • BigQuery User
  • Masked Reader
  • BigQuery Studio Admin (Beta)
  • BigQuery Studio User (Beta)

BigQuery の IAM の概要 | Google Cloud より

おおまかにいうと、管理者はすべての権限を、データ関連はデータセットまたはテーブルのデータの読み取り等を、ジョブ関連はBigQueryジョブの実行許可を、リソース関連はリソースの読み取り等です。機能が複雑である分、権限も複雑になっています。

たとえば弊社にSQLとBIダッシュボードの開発をご依頼いただく場合、クエリが実行できる権限が必要となるためBigQuery AdminやBigQuery User等を付与いただければ基本的には問題なく対応可能です。

ですが、権限の付与方法とGCPの利用状況によっては、個人情報はじめ外部や関係者には閲覧させることができないデータへアクセスできてしまったり、誤ってテーブルを削除してしまう等が発生する可能性もあるため、慎重に対応する必要があります。

まとめ

いかがでしたでしょうか。今回ご紹介した以外にもBigQueryを活用していく上で考慮しなければならないポイントはまだまだございます。

GA4の実装も落ち着いてきて、最近はBigQueryのサポートをさせていただく機会が非常に多いため、これからBigQueryを活用したいという方のサポート体制もできております。ご興味がある方は、ぜひお気軽にお問い合わせください。

お気軽にご質問、ご相談ください

関連タグ

Ray

2017年にDMM.comに入社し、Google アナリティクスをはじめとしたGoogle製品の社内統括と設計に従事。元Google アナリティクス公式エキスパート。

関連ブログ