重複コンテンツとは?

2015年10月6日

ドメイン内外に重複するコンテンツを公開してしまうケースは良くあると思います。誤ったSEOというよりは、知らずに結果的に重複してしまうケースが多いと思います。
ウェブ上の商慣習として、カタログページを作りパートナーのウェブ上で類似するページが乱立するケースなどもこのケースに含まれます。
また、リスティングやアフィリエイト用のランディングページも結果的にこのようになってしまう場合が多いのではないでしょうか。




重複するコンテンツとは

コンテンツがどの程度まで重複していると、Googleに重複コンテンツとして認識されるかは定かではありません。少なくとも一部文面が違うだけでは、重複するコンテンツとしてみなされる場合は多いのではないかと推測します。

重複するコンテンツの問題

本来上位に来て欲しいメインの商品ページが、重複コンテンツが原因となり省略されてしまう場合があります。このような場合はURLの正規化を行う事で本来検索結果に表示させたいページを指定する事ができます。
ただ、100%解決するわけではありません。
また、正規化を行っても結果が出るまで一か月以上かかるケースもあります。以下は具体的な対処方法です。


httpやhttpsの違い、/(スラッシュ)の有り無し、index.htmlの有り無し、www有り無しなどサイト内のリンクに整合性が無い場合にも同様の問題が発生します。
例えばGoogleでは、www.allegro-inc.comもwww.allegro-inc.com/index.phpも異なるURLの為、同じページであっても重複コンテンツとして認識してしまう可能性があります。


重複コンテンツが大量にある場合のデメリットはもう一つあります。
Googleのクローラーはウェブサイトの全てのページを常に巡回しているわけではなく、クロールバジェットと呼ばれるリソース配分が行われています。


重複コンテンツの大量にあると、そのクロールバジェットを無駄に消費してしまう為、効率的にウェブサイトを巡回できなくなります。
つまり新しく作成したページや、既存ページの更新を行っても、ページを見つけてもらうまでに時間がかかってしまうかもしれません。


重複コンテンツを確認するには?

次のような方法が一般的です。

  • 検索結果に表示されているURLは正しいものか?
  • Search Consoleを活用して、HTMLの改善から「タイトルタグの重複」、「重複するメタデータ」が無いか確認する。
    HTMLの改善 Search Console解説をご参照ください。
  • Search Consoleのクロールの統計情報を確認し、ウェブサイトのページ数以上のページをクロールしていないか。

重複コンテンツの対処方法

URLの正規化

canonical属性に重複ページから本来メインとなるページのURLを指定します。


内部リンクの整合性を確認

リンクのURLは、必ず統一させて整合性を保つように設定します。
httpsとhttpが混在する場合は、出来ればhttpsに統一し相対パスでリンクが設定されているかを確認します。
2014年8月7日のGoogleのアナウンスでは、httpsを順位決定要素の一つに加えた事を発表していますので、この機会にhttpsへ統一する事をおすすめします。
詳しくは「HTTPSが検索順位指標のシグナルの一つに」をご確認ください。


301リダイレクト

301リダイレクトを使用して、wwwの有無、http(s)の統一、index.html(php)の有無を統一する為に、一つのURLへリダイレクトさせます。
クローラーもこの設定を見て、正しいURLを認識します。


www有り無しを指定

ウェブマスターツールでwwwの有無を指定します。




重複コンテンツの誤った対処方法

重複コンテンツがあっても複数のページの評価を一つのURLにまとめるようにGoogleは処理します。
以下の方法では、各ページの評価をまとめると言うよりは薄めてしまう結果となります。

  • 重複コンテンツに対してrobots.txtでブロックしないようにしましょう。
    robots.txtでブロックしてしまうと、実際にクロールができない為、分散した評価をまとめる事ができないようです。その為この方法を取るのであれば、重複コンテンツのままにしておいた方が良いでしょう。
  • 重複とみなされないようにコンテンツを書き換える事はスパムのようになりますのでやめましょう。
    また、1.と同様に分散した評価をまとめるというよりは、薄めてしまうかもしれません。
  • 古いコンテンツの削除ツールで重複コンテンツを削除しないようにしましょう。



外部サイト用のカタログページ(メーカー側の立場のSEO)

カタログページからのリンクをオリジナルのサイトに張る事や、可能であればnoindexを埋め込みましょう。
それが難しい場合は、独自のコンテンツを外部サイト向けに制作するなど重複とならないように注意しましょう。
提供された側もそのまま1ページ掲載するのではなく、購入者の声や価格比較情報などの差別化できるコンテンツを付け加えてページを構成すると、訪問者にとっても価値のあるページとなります。




複数のウェブサイトで同一コンテンツを公開するとスパム?(販売側の立場のSEO)

ECサイトで販売する際に、SEO目的で複数ドメインで同じ商品を販売した場合、Googleはどのように評価するのでしょうか。
ページがまったく同じであれば重複コンテンツとなりますが、そうでない場合、例えばレイアウトや販売手法、価格構造、ターゲットが異なり、各ドメインで付加価値がそれぞれ違う場合などはどのようにGoogleから見られているのでしょうか。
Matt Cutts氏が発言してましたので、そちらをもとに解説します。



各ドメインで個性があるかどうかが重要?

もしそのドメインが根本的に異なるレイアウトで、異なる販売方法で、異なる構造であったりといった本質的に異なるようであれば、3つのドメインぐらいであればそんなに悪くないと発言しています。
ただ、悪くはないというだけで良くもなさそうですね。続きがあります。


大量のドメインで同じ製品を販売した場合

もし300ドメインや3000ドメインであった場合などかなりの数量のドメインですぐに検索結果を埋め尽くすような影響があった場合、検索ユーザーの満足度を下げます。
この場合Googleは、おそらくアルゴリズムか手動による方法で、検索結果が占有されないように対処しているようです。


まったく同じ製品を異なるドメインで販売するという事自体は「weird」、「strange」という表現をしているので不自然ととらえているようです。基本的には、ドメインが3つあれば、一つは男性用セーター、二つ目のドメインは女性用セーター、三つ目のドメインは靴の販売サイトというように普通にドメインを分ける理由があれば複数のドメインを持つ事自体問題ないようです。


単一のドメインでも時間をかけて評価を高める事ができる

Matt Cutts氏の経験上では、50や100のドメインのサイト運営者は、各ドメインに時間をかける事ができずに、愛情を注ぐこともできない。
そのようなつもりがなくても、しばらくすると形として現れてきます。
自動生成コンテンツの誘惑にかられたり、多くのフィードを活用しようとするケースも良く見かけるそうです。
また、各ドメインに個性がない為、どのドメインが何なのか、どれが重要なのか判断が難しくなります。




他のサイトで販売している商品を扱う場合

他のサイトの同一商材を販売していた場合なら、例えば食品系の場合は原材料を詳しく書いてみる事ができます。
Matt Cutts氏が以下のように回答しています。



コピペは問題になる

もしアフィリエイトフィードの文言をそのまま転用し、それがどこのウェブサイトにも同様のものがあれば、問題が発生するかもしれません。
先ほどの例の場合、原材料を記載したとしても相対的に質の高いコンテンツ量が少ない場合、他のウェブサイトと異なるウェブサイトにしたり、オリジナルコンテンツを含める事で質を高め、信頼の低いサイトと区別されるようにする対処する事が望ましいでしょう。


部分的な重複はそれ程問題ではない

必要な文章であり、あなたのウェブサイトのあるページの一部で使用される場合はそれ程問題ではありません。
(だからといって、複数のウェブサイトのコンテンツから部分的に文章をコピーしたりする事はスパムです。)
あなたのウェブサイトのコンテンツの大部分がどこでも見かけるコンテンツで、価値を判別できないといった事は避けるべきです。




重複コンテンツはペナルティになるか?

重複コンテンツを持つページは、検索クエリにより急に検索順位が落ちてしまう事があります。
ペナルティだと思ってしまいがちですが、実際は違うようです。



ウェブ上の25~30%は重複コンテンツに該当する

Matt Cutts氏の話では、世の中のウェブ上のコンテンツの25%~30%は重複コンテンツとみなされているようです。
その中のほとんどは、一般的に起こりうるものです。
(例:ブログの一部をリンクを張って引用する場合なども含まれます。)


Googleが行う処理

全ての重複コンテンツがスパムとみなされるわけではありません。
Googleは重複コンテンツを探し、見つけた場合はそれらをグルーピングし、あたかも一つのコンテンツのように扱います。
もし二つの一致するページがあった場合は、両方を検索結果に表示させるよりは、1つのページを表示し、それ以外は表示させません。
重複コンテンツ自体はほとんどの場合はスパムとしてみなされません。


重複コンテンツがスパムに該当するケース

スパムとして該当するケースがあるとすれば、重複コンテンツ作成しか行っていなかったり、乱用したり、騙したり、悪意があったり、ページランクを操作している場合で、この場合はペナルティを与えます。
RSSで自動生成したコンテンツに関しても注意が必要で、RSS以外何も自身で価値を加えないで自動生成したコンテンツは、スパムとしてみなされ易いそうです。


2015/10/6のJohn Muellerの発言では、以下のようなものはスパムに該当するのでペナルティの対象となります。

  • スクレイピングサイト
  • 他のサイトのコンテンツを流用し、一部を変えたり、自動翻訳などを行う事。
  • ドアウェイページ

通常のウェブサイトの場合では、古い版と新しい版の2つの利用規約が存在したりする事で重複コンテンツとなりますが、このようなものは多くのサイトで起こりうるもので、あまり気にする必要はありません。




トップページに最新投稿一覧を載せると重複?

ブログでは頻繁に見かけますが、トップページと記事ページに同じコンテンツが表示される事はあります。
もちろんどこのサイトも最新の記事一覧はありますので、重複コンテンツが存在するケースは多いと思います。その中でGoogleのMatt Cutts氏がいくつかポイントを述べています。



抜粋してオリジナル記事へリンク

投稿記事をまるまるトップページに表示させないようにすれば良いそうです。
例えばパラグラフを作って、記事の抜粋をティーザーのように小出しにして実際のブログ記事へリンク誘導します。
どのサイトも見出しのみを表示したり、記事の一部を抜粋するなどして本体のブログへリンクを張っていますので、当然といえば当然かもしれません。


またはトップページに最新のブログ記事をフルテキストで載せる場合もあるが、これも問題ないです。


問題となるケース

フルテキスト同じコンテンツが複数ページある場合は、重複となる可能性があります。例えばアーカイブページで、投稿を全て掲載して一覧表示している場合や、トップページとブログ投稿ページのコンテンツが同じであった場合も重複となります。


上記のように自分のウェブサイト内でトップと記事ページで重複するコンテンツがあったからといって、それがSEOにとってマイナスになるかというと、そういう事ではありません。


Googleは重複するコンテンツを発見した場合、一つのコンテンツとしてグルーピングし、両方を検索結果に表示させるよりは、1つのページを表示し、それ以外は表示させません。




コンテンツの翻訳ページは、重複コンテンツに該当するか?

海外のコンテンツを翻訳して載せる場合は重複コンテンツになるのでしょうか。
日本語の商品のページをもとに、海外販売用に英語やドイツ語などを別のサイトを用意して日本語コンテンツを翻訳した場合、重複コンテンツになってしまうか心配になる方も一部いるのではないかと思います。
翻訳といっても人による翻訳やツールによる自動翻訳もあります。
Matt Cutts氏は以下のように回答しています。



コンテンツの翻訳ページは重複にならない

回答の中で、英語とフランス語でコンテンツそのものが異なるからとしています。もし英語のコンテンツで、全く同じ英語のコンテンツを作った場合、重複コンテンツとなります。


コンテンツを翻訳する際の注意点

人の手による手間をかけた翻訳と編集を行う場合は問題ないのですが、Google翻訳などを使って多くの言語で自動翻訳を行っただけの場合は、自動生成コンテンツといったスパムに該当する可能性があります。Google翻訳やその他の翻訳ツールは以前と比べて大きく進歩しているようですが、優れたネイティブに近い翻訳家が行う作業と比べると、まだ大きな質の違いがあります。




企業ウェブ担当者向けのSEOチェックリスト

SEOでは重複コンテンツの対処方法以外にも考慮すべき要素がたくさんあります。
SEO要素チェックリスト | 企業のウェブ・SEO・ブログマーケティング業務担当者向け」で解説しています。



このエントリーをはてなブックマークに追加


野澤洋介

この記事を書いた人

アレグロマーケティング代表取締役 野澤洋介

SEOは考え方はシンプルですが、いざ実践するとなかなか思うようにいきません。
当ブログでは、読者の方に成功も失敗も合わせて情報を共有し、同じような悩みを解決できればという思いで運営しています。


著書:「最強の効果を生みだす 新しいSEOの教科書」(技術評論社)

follow us in feedly


関連記事


SEO管理ツール Spresseo(エスプレッセオ)

コンテンツが増えてきたらランキングの管理をツールで効率化しましょう。
ページごとの内部最適化や、キーワードの順位取得や競合比較、獲得した被リンクのレポートを自動化できます。



▲ ページトップ ▲
自動XMLサイトマップ管理ツールトライアル版配布中