SEOコンサルタントの外山です。
生成AIの発展はめざましく、きっと今この瞬間にも、世界のどこかで何かのサービスが画期的なアップデートを行い、世界を驚かせていることと思います。
そんな発展を背景にして、SEO界隈では、GEO(Generative Engine Optimization:生成エンジン最適化)やAIO(AI Optimizaiton:AI最適化)、LLMO(Large Language Model Optimization:大規模言語モデル最適化)といった言葉を、最近よく耳にするようになりました。時には「SEOは死んだ」というメッセージとともに、戦略の転換を迫るサービス記事や広告を目にすることもあるほどです。
生成AIは確かに素晴らしく、私も日々の業務で活用していますが、一方で「正しく怖れる」ことが重要であると考えます。生成AIの登場によってSEOの方法論は変わってゆくと思いますが、「ユーザーの検索行動に寄り添う」というSEOの本質は、変わることはありません。「正しく怖れる」ためには、まずは生成AIの影響を数値化して、可視化して、正しく「測定する」ことが第一歩になります。デジタルマーケティングの特徴は、ユーザーの様々な動きを「数値化」し「可視化」できることです。それは生成AIが登場しても、変わることはありません。
本稿では、生成AIとユーザー、ウェブサイトの関係をあらためて整理した上で、生成AIの影響を正しく測定する方法を、クロール・露出・流入の3つの観点から紹介します。皆様が生成AIを正しく「怖れ」、そして「活用する」ための一助となれば幸いです。
1. 生成AIサービスとユーザー、ウェブサイトの関係
生成AIの影響を正しく測定するために、まずは生成AIサービス(ChatGPT、perplexity、Geminiなど)と、ユーザー、ウェブサイトの関係を整理しました。
ユーザーは、自分が調べたい、解決したいことがらを、生成AIサービスに質問します。今までは、Googleなどの検索エンジンが主に利用されていましたが、この手段は多様化していると思います。そしてChatGPTなどの生成AIサービスは、ユーザーの質問(プロンプト)に対して、自社のLLM(大規模言語モデル)を駆使して、回答をユーザーに提示します。
一方で、ChatGPTなどの生成AIサービスは、LLMの訓練データの収集のために、一般公開されているウェブサイトを日々クロールしています。ウェブサイトは、クローラーのリクエストに応じて情報(コンテンツ)を生成AIサービスに提供しています。
また最近ではDeepResearchのように、ユーザーからの質問に対して、リアルタイムにウェブサイトを検索して情報を収集し、回答を生成することも増えてきました。この場合も、生成AIサービスはウェブサイトをクロールします。生成AIのサービスによっては、訓練データ収集用のクローラーと、リアルタイムで情報を収集する用のクローラーとを、分けている場合もあります。
生成AIからユーザーに提示される回答には、LLMが参照したウェブサイト(参照元/引用元)が表示される場合もあれば、表示されない場合もあります。表示される場合、そのURLをクリックすれば、ウェブサイトへの流入につながります。GA4などの計測ツールを利用していれば、サイトへの流入は何らかの方法(セッションの参照元など)で識別可能です。参照したウェブサイトが表示されない場合でも、ユーザーは回答文中の会社名やサービス名を、普通にGoogleなどで検索して、ウェブサイトに流入することがあります。最近とあるお客さんから、ChatGPTで提示された社名をGoogleで検索して、CVしたユーザーがいたという話を聞きました。
上記の、生成AIサービスとユーザー、ウェブサイトの関係の中で、みなさんはどのような数値を見てみたいと思いますか? 例えばですが、以下の様な数値に関心があるのではと思います。
【一般的データ】
1. ユーザーがどれくらい生成AIサービスを使用しているのか
→ 最近ですと日本リサーチセンターが調査結果をまとめています。
【NRC デイリートラッキング】生成AIの利用経験 2025年3月調査 | 市場調査・日本リサーチセンター(NRC)
2. どの生成AIサービスが使用されているのか
→ 日本におけるシェアは、下記ページが参考になるかと思います。
AI Chatbot Market Share Japan | Statcounter Global Stats
【クロールデータ】
3. 自社ウェブサイトに、生成AIサービスのクローラーがどれくらい来ているのか。また、どのページをクロールしているのか
→ 後述するサーバーのアクセスログを分析することで集計可能です。
【露出データ】
4. 生成AIサービスからユーザーに提示される回答において、自社サイトがどれくらい表示(露出)されているか。また、どのようなページが表示されているか。
→ ChatGPTからの回答文や、Googleの「AIによる概要(AI Overview)」などで、自社サイトのページがどれくらいユーザーに対して表示、露出されているかは、現在ではSEM RushやAhrefsなどのサードパーティーツールが測定を試みています。
【流入データ】
5. 生成AIから、自社サイトにどれくらい流入したか。また、どのランディングページへ流入したのか。
→ 後述しますが、生成AIサービスによっては、GA4のセッションの参照元で識別可能なものもあります。
6. 生成AIによる回答に露出した結果として、通常検索でどれくらい流入が増加したか
→ こちらを直接計測する方法は現時点ではありませんが、GoogleのキーワードプランナーやGoogleトレンドなどで、特定キーワードの検索ボリュームや増減などを調べることはできます。
以降、3, 4, 5について詳細に解説していきます。
2. クロール状況を可視化する
生成AI系サービスのクロール状況を可視化するには、サーバーのアクセスログを活用するのが一番です。アクセスログは、過去にも何回かブログで紹介していますので、「アクセスログがそもそも何なのか」という概要については、下記記事を参照ください。
参考記事:
アクセスログから各クローラーを識別するにあたっては、UserAgentからクローラーの種類を特定する必要があります。今回は下記URLを参考にして、UserAgentを分類しました。
GooglebotのUserAgent
https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers?hl=ja
BingbotのUserAgent
https://www.bing.com/webmasters/help/which-crawlers-does-bing-use-8c184ec0
生成AI系サービスのUserAgentをまとめているサイト
https://momenticmarketing.com/blog/ai-search-crawlers-bots
https://www.principle-c.com/ のクローラー別クロール割合
上図は、弊社のコーポレートサイトにおけるクローラーのクロール割合を、2月と4月で比較したものです。今回は、画像やcss、jsなどのクロールはのぞいています。この図を見ると、OpenAIやCalude、Perplexityからのクロールの割合が、サイト全体のクロールの20%近くを占めていることが分かります。
特にOpenAIの割合は、4月ではサイト全体のクロールの10%以上を占めており、Chromeブラウザに次いで割合が大きくなっています。また2月から4月にかけて、各サービスのクローラーの割合が、大きく増加していることも分かります。今後生成AI系クローラーの割合は更に増加していき、実ユーザーの訪問よりも多くなっていくことが予想されます(生成AIによるウェブサイトの「代読」が促進される)
またアクセスログを見ると、どのページにクロールが集中しているのかもわかります。下図は、4月30日における、Googlebot、OpenAIのクローラー、perplexityのクローラーが、どのディレクトリをクロールしていたかの割合を集計したものです。この図をみると、Googlebotに比べてOpenAIとperplexityのクローラーは、コラムやブログに集中していることが分かります。このような形で、クローラごとの傾向をアクセスログを通じて把握することができれば、対策を構築する上で有用な示唆が得られると思われます。
各クローラーの、ディレクトリ別のクロール割合(2025年4月30日)
3. 露出状況を可視化する
生成AIサービスからユーザーに提示される回答において、自社サイトがどれくらい表示(露出)されているか、また、どのようなページが表示されているかを知りたい方は多いと思います。現状、ChatGPTからの回答文やGoogleの「AIによる概要(AI Overview)」などで、自社サイトのページがどれくらいユーザーに対して表示/露出されているかは、SEM RushやAhrefsなどのサードパーティーツールが集計を試みています。
下記はSEM Rushを用いて、弊社のコーポレートサイト(https://www.principle-c.com/)が、GoogleのAIによる概要(AI Overview)にどれくらい表示されたかを、時系列で集計したものとなります。これを見ますと、2025年3月から一気に表示回数が増えたことが分かります。
SEM Rushによる、GoogleのAI概要(AI Overview)の表示頻度の集計結果
またSEM Rushでは、具体的にどのようなキーワードで自社サイトが表示されているかも分析することができます。例えば弊社のサイトは、「JSとは」「ハッシュタグ検索とは」で「AIによる概要」で表示されていますが、これはSEM Rushのデータを通して判明したことです。
ちなみにGoogle Search Console(GSC)では、これらの「AIによる概要」で表示されたリンクには、すべて同じ順位が付与されます。つまり「AIによる概要」が1番目の位置に表示された場合は「1位」が、AI による概要内のすべてのリンクに付与されます。そのため、例えばあるキーワードで掲載順位が1位だったとしても、
- 「AIによる概要」内にページが表示されて1位だった場合
- 「AIによる概要」が表示されずに、通常の検索結果画面で1位だった場合
のどちらかであるかは、区別はつきません。そのうち区別がつくようにGSCのアップデートがあるのではと推測しますが、しばらくは、AIによる概要で表示されたかどうかの判別は、サードバーティーツールを活用することになりそうです。
なお、「AIによる概要」に表示されたクエリが、GSC上でどのようなパフォーマンスだったか(表示回数、クリック数が増えたかなど)を分析することも、有用であると考えます。
4. 流入状況を可視化する
生成AIから、自社サイトにどれくらい流入したか。また、どのランディングページへ流入したのかを調べたい時は、GA4のセッションの参照元で識別可能なものもあります。
生成AIサービスからの流入を集計したLooker Studioダッシュボード
上図は、弊社で作成した、生成AIサービスからの流入を集計したLooker Studioのダッシュボードです。こちらをみると、直近で流入が大きく増加していることが分かります。特にPerplexityからの流入が増えていて、次いでChatGPT、Geminiとなっています。先程のアクセスログのクロール割合では、ChatGPTが多かったのに対し、流入割合はまた違った結果を示しているのは、興味深いと思います。
また、生成AIサービスからの流入が多かったランディングページも識別可能です。こちらも、通常のOrganicSearchにおける流入上位ページや、クロールが集中していたページと比較してみることで、興味深い分析ができるのではと思います。
5. まとめ
以上、本稿では、生成AIとユーザー、ウェブサイトの関係をあらためて整理した上で、生成AIの影響を正しく測定する方法を、クロール、露出、流入の3つの観点から紹介しました。皆様が生成AIを正しく「怖れ」、そして「活用する」ための一助となれば幸いです。
プリンシプルでは、アクセスログの分析やGA4の分析を通じて、生成AIのウェブサイトに対する影響を「正しく」測定するためのサポートもしています。ご興味があれば、是非お問い合わせください。
(了)
Liner Notes(あとがき)
今回のブログ記事を書こうとおもったきかっけは、SEOの関連各社が、GEO/AIO/LLMOについてのプレスリリースを立て続けに出していることを目の当たりにしたからでした。
デジタルアイデンティティ(5/14)
https://prtimes.jp/main/html/rd/p/000000096.000025965.html
Faber Company(5/13)
https://prtimes.jp/main/html/rd/p/000000256.000031263.html
LANY(5/13)
https://prtimes.jp/main/html/rd/p/000000282.000071062.html
ちなみにHakuhodo DY ONEは、3月の時点でAIOについてのプレスリリースを出しています。
https://www.hakuhodody-one.co.jp/news/news-release_202503051695/
このような動きに対してプリンシプルでも何かできることがないかを考えた時、まずは生成AIの影響を「正しく測定する」基盤を固めることが、プリンシプルらしいのではないかと思い至り、弊社の山田の力も借りて今回のブログを書き上げました。アクセスログの分析にも言及することで、プリンシプルらしい内容に仕上がったのではないかと思います。
生成AIの計測も新しい試みであるため、今回まとめた情報は、あくまで現時点(2025年5月時点)のものとなります。今後アップデートがあれば、随時情報発信できればと思います。
(本当の了)