DeNAのキュレーションメディア問題の波紋が大きくなり、WEBだけにとどまらず一般メディアも巻き込んだ議論になっています。DeNA社のポリシーや対応など、社会問題としての観点は他のメディアや専門家に任せるとして、今回の問題について、google/SEOの観点から読み解いてみたいと思います。

問題の背景:急増したキュレーションメディア

今回の問題の背景は、「コンテンツを量産」する形で自然検索トラフィックを獲得し、広告収益中心とした事業展開をするビジネスモデルが、一定の成功を収めるということが広まり、なりふり構わず同じビジネスモデルに多くの事業者が参入した結果といえます。
ビジネスモデル自体は、googleという市場ルールの変化を捉え、収益化を実現するスキームを多分野へ水平展開したという意味で、短期収益観点では悪くないものだったのだと思います。しかし、コストを極端に抑えたなりふり構わない手法と、著作権という法律のラインを超えてしまった(是非はこれから問われるのでしょうが)ことで、このような問題となってしまいました。

googleの著作権やコピーコンテンツへの対応について

まず、そもそもgoogleの著作権に対するフィルタは2種類あります。

1. 法律上の「著作権侵害」への対策

こちらについては、ちょうど2016年9月に日本語版についてもまとめられ、リリースされています
googleは直接的な著作権侵害について、報告窓口を設けており…
・直接的な侵害コンテンツに対するgoogleインデックスの削除
・著作権侵害を意図的に行っているサイトについては、サイト単位での検索結果への非表示
などの対応を行っています。
著作権侵害に対する申請については詳細が公開されており、過去、welqの場合39件meryの場合は38件の著作権侵害の報告と削除申請が行われています。ここから約半数が実際にgoogleの検索結果からの削除が行われているようです。

2. 検索エンジンとして「コピーコンテンツ」がweb上に氾濫することに対する対策

直接的な著作権侵害という法的な問題以外にも、googleはコピーコンテンツに対する対応を行っています。
例えば「同じ記者会見の情報を文字起こししたページ」がたくさん存在したとして、検索結果の1位から10位までが、サイトは異なれどほぼおなじ内容を指している場合などをイメージしていただけると、このgoogle検索結果が、ユーザーの満足に結びつかないということは理解いただけるかと思います。
このような事象を避けるために、googleは「コピーコンテンツ」については、検索結果の上位表示をしないようにしています。こちらは、「著作権法」の問題ではなく、「ユーザーの満足」という観点での措置です。
大昔、コピー&ペーストによるコンテンツの量産がSEO上有効だった時代があり、そのようなブラックハットな手法が横行した時代がありました。現在、googleは「コピーコンテンツ」が検索結果に表示されないようなアルゴリズム(パンダアルゴリズムと呼ばれます)を整え、他社サイトと全く同じ文言で構成されるページやそのようなページ大量に含むサイトは、検索結果に表示されないようになっています。

どういうサイトがgoogleで上位表示されるか

2016年現在、googleは検索サイトとしてアルゴリズム改善とインフラに膨大な投資をしています。これらは「ユーザーがより満足する検索結果(=ウェブの世界)」を実現し、より多くのユーザーが「WEB上で経済活動を行い」「googleで検索する」ことを実現することを目的としています。
では、「ユーザーが満足する検索結果」とはなんでしょうか。googleは多くの要素からこれを判断していますが、もっとも重視される要素の1つとして、「あるテーマに対する豊富なコンテンツを持っていること」が挙げられます。
特に、「何か情報を知りたい」という検索(インフォメーショナルクエリと呼ばれます)については、この傾向が顕著です。これは、何かをある知識について知りたいときに、その分野についてなるべくたくさんの知識を持っている人に聞きたいと思うのと同じです。これらの隙間をついたのが昨今のキュレーションメディアの乱立です。
googleで上位表示される(=多くのトラフィックを集め、広告収益を得る)ために「コピーコンテンツではない形」で、「類似テーマで大量のコンテンツを所持する」ことが有効となっているため、「とにかくたくさんのコンテンツを、ライターが書く」というスキームのもと、収益化を実現するメディアが現れる様になってきました。
各企業が「オウンドメディア」というマーケティング戦略で、多くのコンテンツサイトを持つようになったのもの同じ文脈です。

メディア運営者とユーザーはどう取り組むべきか

googleからすると、google.comやgoogle.co.jp は「自社メディア」で、その収益性やユーザー満足度を上げるために、様々な分析を行い、それをアルゴリズムに反映しています。そのランキングアルゴリズムには、例えば以下のようなものが含まれると言われています。

検索結果でのそれぞれのリンク先のクリック率

同じ検索をした際に、検索結果に表示されたテキストをみてユーザーはクリックするものを決めているので、そのクリック率が高いものは、よりユーザーの意図を満たすものである可能性が高いと判断できるため、クリック率が高いサイトはより上位表示される。

クリック後、google検索結果に再度戻ってきて、次のリンクがクリックされたかどうかや、その「クリックとクリックとの間の時間」

1回の検索で、googleの検索結果のリンクが1つしかクリックされなかった場合、そのクリック先でユーザーの欲しかった情報が得られた可能性が高い。また、2回クリックがあった場合でも、1つ目のクリックと2つ目のクリックの間が長かったということは、そのサイトに「長時間滞在した」=「ユーザーにとって滞在する価値があった」ということ。逆に、1つ目のと2つ目のクリックの間隔が10秒しかなければ、そのサイトに行きはしたものの、パット見て「不満足」を感じたということ。
これらのシグナルを踏まえ、検索順位は決定される。

ユーザーとメディアと検索エンジンの健全なwin-win-winの関係の広がり

残念ながら、現状2016年現在のgoogleのアルゴリズムでは、「実のない空虚なコンテンツを量産すること」がSEO上有効です。しかし、これはユーザーのためにならずgoogleの目指すべき姿でもないため、この状況を是正するために、googleは過去の「コピーコンテンツへの対応」と同様、何らかのアルゴリズム変更(改善の方向性の指示出し)を行う可能性はあるでしょう。
一方、現状2016年現在の「実のない空虚なコンテンツ」であっても、それを読む側のユーザーはそれを信じ満足し、googleは「良いサイト」としてのシグナルを受け取ってしまっています。
炎上マーケティングと呼ばれるような手法が「集客」という観点では有効であるのも同様の問題です。googleが「良い検索結果」を実現するためのアルゴリズムもまだまだ十分ではありません。
「騙される人がいなくなればその分野で詐欺を働く人がいなくなる」のと同様、我々が「正しいサービスに対して収益を提示し、悪いサービスに対しては収益貢献しない」ような行動をすることが、良い情報社会につながります。
googleの機械学習が本当に賢くなり、文章が本当に意味することまで理解できるようになる時代も将来間違いなく来るとは思いますが、それはまだ当分先のことでしょう。(注:2019年のBERTアップデート等により、現在は複雑なクエリも理解できるようになりました。)その中でユーザーにできることは、「良いと思ったサイト」を使い、「良いと思ったコンテンツ」をシェアすることです。これが実現すると、google は「良いサイト」と「悪いサイト」を適切に判断でき、検索結果は良いものになり、webの世界全体により良いコンテンツに溢れるようになってきています。

参考
・Understanding searches better than ever before

* * *
何かを欺くような手法は長くは続かない、というのは商売や人間社会の原理原則として昔から言われていることだと思います。
SEOの業界も、ユーザーとメディア、メディアとgoogle、ユーザーとgoogle 、それぞれの間で理想の情報伝達がなされるための技術的・マーケティング的なサポートの部分にもっとフォーカスすることができれば、市場としての価値も上がっていくと思いますし、そうであり続けられるよう、当社でもサービスを提供していきます。

お気軽にご質問、ご相談ください

関連タグ

中村研太

京都大学理学部卒。Webマーケティングスペシャリストとして、SEOや広告などのマーケティング施策の最適化による実績多数。

関連ブログ