Google アナリティクス 4 プロパティにおける「サンプリング・(other)・しきい値」

こんにちは、神崎です。最近はゲーム・オブ・スローンズという海外ドラマをイッキ見しています。本記事では、Google アナリティクス 4(GA4)プロパティにおける「サンプリング・(other)・しきい値」について解説します。

サンプリング

サンプリングは、一部のデータから全体のデータを拡大推計して表示する仕組みです。「推計」と記載しているとおり、サンプリングが適用されると実態とは乖離したデータが表示される場合があります。 従来のユニバーサル アナリティクス(UA)プロパティでは、下記のしきい値をもとにレポートにサンプリングが適用されるようになっていました。

  • 無償版:選択した期間でプロパティ単位のセッション数が 50 万件以上
  • 有償版(360):選択した期間でビュー単位のセッション数が 1 億件以上

※ご参考:https://support.google.com/analytics/answer/2637192?hl=ja

一方、GA4 プロパティの「集客」「維持率」「エンゲージメント」「収益化」などの標準レポートでは、サンプリングは適用されないようになっています。 ただし「分析」機能で作成したレポートには、下記のしきい値をもとにサンプリングが適用されることがあります。

  • 無償版:クエリごとに 1,000 万件のイベント
  • 有償版(360):クエリごとに 10 億件のイベント

※ご参考:https://support.google.com/analytics/answer/9826983?hl=ja

「分析」機能で作成したレポートにサンプリングが適用された場合、下図のようにデータ インジケーターの色が変化し、「このレポートは、使用可能なデータの 〇.〇% に基づいています。」というメッセージが表示されます。

f:id:k-kanzaki:20210616142101p:plain

※ご参考:https://support.google.com/analytics/answer/9371379?hl=ja

サンプリングを回避したい場合は、「分析期間を短くする」や「分析に必要のないイベントの計測を止めてイベント数を減らす」といった対応が考えられます。 また、BigQuery Export を利用すれば、サンプリングが適用されていない状態のデータを確認することも可能です。

※ご参考:https://support.google.com/analytics/answer/9358801?hl=ja

なお、有償版の Google アナリティクス 360 を利用している場合、UA プロパティでは「非サンプリング レポート」や「カスタム表」といったサンプリングが適用されていない状態のデータを確認するための機能も提供されていますが、現時点では GA4 プロパティにはそれらの機能はありません。今後の機能拡張に期待しましょう。

※ご参考:https://support.google.com/analytics/answer/2601061?hl=ja

レポートの (other) 項目

Google アナリティクスには、集計対象のデータが一定の行数を超えた場合に、一部のデータを「(other)」という項目に集約する仕様があります。 UA プロパティでは、例えばレポートに表示される行数が 100 万行を超えた場合に超過分を「(other)」に集約するようになっていました。

※ご参考:https://support.google.com/analytics/answer/1009671?hl=ja

一方、GA4 プロパティでは、原則標準レポートにおいて 5 万行を超過した場合に超過分が「(other)」に集約されるようになっています。「分析」機能で作成したレポートには「(other)」は発生しません。

※ご参考:https://support.google.com/analytics/answer/10702008?hl=ja

「(other)」は下図のような形で表示されます。

f:id:k-kanzaki:20210616142652p:plain

ただし、5 万行を超過していないと思われるにもかかわらず、「(other)」が表示されているケースも何件か確認しています。 もしこのようなケースに遭遇し、かつ Google アナリティクス 360 を利用している場合は、必要に応じて貴社担当のリセラーに問い合わせてみてください。

データのしきい値

GA4 プロパティでは、個別ユーザーの身元を推測できないようにするために、下記のような場合にデータのしきい値が適用されることがあります。

  • レポートにユーザー属性情報(年齢、性別、インタレスト カテゴリなど)が含まれており、かつ「レポート ID」が「デバイス ID」にもとづいている場合
  • 「管理>データ設定>データ収集」において、「Google シグナルのデータ収集を有効にする」がオンになっている場合

※ご参考:https://support.google.com/analytics/answer/9383630?hl=ja

UA プロパティでも一部のレポートでデータのしきい値が適用されることがありますが、データのしきい値が適用されると、いくつかのデータが抜け落ちることになるため、計測されているはずのデータがレポート上で確認できないといった事象が発生します。

「分析」機能で作成したレポートにデータのしきい値が適用されている場合は、下図のようにデータ インジケーターの色が変化し、「このレポートの一部のデータは、しきい値の適用時に削除された可能性があります。」というメッセージが表示されます。

f:id:k-kanzaki:20210616142802p:plain

一方で、標準レポートではデータのしきい値が適用されているにもかかわらず、データ インジケーターの色が変わらず、上図のようなメッセージも表示されないという事象も確認しており、今後の改善が期待されます。

なお「Google シグナルのデータ収集を有効にする」をオンにしており、かつ「管理>デフォルトのレポート ID」が「User ID、Google シグナル別、次にデバイス別」となっている場合は、「デフォルトのレポート ID」を「デバイス別のみ」に変更することで、データのしきい値の適用を回避できる場合があります。 ただし、(「デフォルトのレポート ID」の変更はデータに恒久的な影響を与えるものではありませんが)レポート上に表示される数値が変動する可能性があるため、ご注意ください。

※ご参考:https://support.google.com/analytics/answer/9213390?hl=ja

まとめ

レポートに表示されている数値が実際の値なのか、それとも推計値/一部の値なのかは常に意識しておくとよいでしょう。 もし違和感を覚えたら、前述のような「サンプリング・(other)・しきい値」が発生・適用されていないか、確認してみてください。

執筆者神崎健太

Google マーケティング プラットフォーム(GMP)」の利活用コンサルティングと、テクニカルサポートを担当しています。


Amazon 著者ページ:神崎 健太:作品一覧、著者略歴 - Amazon.co.jp