インデックス数とは?

Search Times

インデックス数とは?

インデックス数とは、Google等の検索エンジンのクローラーがサイトにアクセスし、検索結果に表示する為に検索データベースに登録されたURL数を意味します。Googleの検索ロボットがウェブサイトをクロールしインデックス処理を行わない限り、検索結果に表示されることはありません。Search Consoleのカバレッジでインデックス数を確認できます。

有効なインデックス数
インデックス数をSearch Consoleで確認

GoogleはHTMLはもちろん、PDFファイルもスプレッドシートもWordドキュメントももインデックスします。インデックス数は多い程SEOに有利と言われていた事もありますが、単純にページ数が多ければ検査順位で優遇されるというわけではありません。

現在ではGoogleは内容の薄いコンテンツ、専門性の高いコンテンツをアルゴリズムで見分ける事ができるようになっている為、内容の薄いページをいくら増やしても検索エンジンからも訪問者からも評価されません。

Googleは世界中にある全てのページをインデックス出来るほどのリソースはありませんので、ページの品質によっては、インデックスすらされない事もあります。
訪問者にとって有益な情報を提供し、正しくSEOを行う事が重要です。

ページのインデックス確認方法

なかなかインデックスされない場合

Googleは、常に世界中のウェブサイトを巡回(クロール)、収集しているため、特別にインデックス申請を行わなくても、次のような状況であれば、インデックスに追加されます。

  • Googleが認識している外部ウェブページのリンクをたどってクロールしてきた場合
  • 新規ドメインを取得してウェブサイトを公開した場合

ウェブサイト立ち上げ直後や、しばらく放置していた場合などはなかなかインデックスされません。
このような場合は、Search ConsoleにXMLサイトマップを登録すると効果的です。

詳しくは「Google Search Consoleの設定とサイトマップの作成・登録・送信確認方法」をご参照ください。

インデックス数と検索順位の関係

質の高いコンテンツの割合や数は検索順位に影響します。 

詳しくはSEO対策でサイトの更新頻度(ページ追加)の影響と有効性で説明しています。

品質の高いページが10ページのみのサイトと100ページ以上あるサイトでは、検索エンジンの評価や集客に影響します。また、品質の高いページが10ページあっても、低品質なページが100ページあれば、品質の高いページに対しても悪影響を及ぼす事があります。

SEOは一度実施したら放置してしまうのではなく、コツコツとコンテンツ(内容)を追加(更新)し、質を改善する事が重要です。結果的に検索エンジン評価が高くなり、訪問者にも喜ばれるウェブサイトになります。

以下のグラフはページをコツコツと増やしていき、SEOとコンテンツの質の改善を1ページずつ行った結果、オーガニック検索の訪問者数が着実に伸びた事例です。

ロングテール施策の成果

サイト全体のインデックス数を確認する方法

簡単にインデックス数を確認するには、Googleの検索ボックスに「site:ドメイン」と検索すれば、Google(Yahoo!JAPAN)が認識しているドメイン内のページ数を調べておおまかに確認することができますので目安にはなります。正確に調べるのであればSearch Consoleを使用しましょう。
※おおまかにと言うのは、増えたり減ったり、一日の間で増減がある為正確ではないという事です。

サイト全体のインデックス数を確認する方法

Search Consoleのインデックスステータスでページ追加を確認

Search Consoleでは、検索エンジン側からお持ちのウェブサイトがどのように認識されているかを確認する事ができます。
Search Consoleにログインし、「左メニュー」の「カバレッジ」をクリックします。「有効」のタブをクリックすると、現在のインデックス数と、インデックス数の推移を確認できます。

インデックス数の増加傾向をチェック

ページを増やしてもなかなかインデックス数が増えない場合

ウェブサイトをしばらく放置していた場合は、クローラーがなかなか来ない場合があります。
また、検索エンジンのクローラーにとって巡回効率の悪いウェブサイトの場合は、なかなか新しいページまでクローラーが辿りつかないかもしれません。
このような場合はXMLサイトマップを作成して、クローラーにウェブページの存在を伝える事が重要です。

XMLサイトマップの効果や、作成方法については、「XMLサイトマップとは?検索エンジンロボットに効率よくページを巡回してもらう」で解説しています。

高品質コンテンツで技術的な問題がないにも関わらずインデックスされない

インデックスの可能性は工夫することで高めることはできますが、一方でGoogleは100%インデックスを保証しているわけではありません。何も問題がない場合には、待つしか選択肢がないこともあります。

A page can be of high quality and still not be indexed – it’s not guaranteed.

John Muller氏のコメント

インデックスが不安定な場合

Search Consoleのインデックス推移を時系列で見た際に、インデックスが登録された後に、一転してインデックスがなくなり、再び前回より少ない数のインデックスが一気に示されることがあるようです。

That can happen, and probably isn’t particularly uncommon. Things can pop into the index for a bit, and then pop out again. When things are on the edge and the system has to make a yes/no decision, sometimes it goes one way for a while, and then the other way again. The web is noisy, I think that’s fine.

John Muller氏の発言

これはシステム側でインデックス登録するかどうか、Yes、Noのギリギリにラインにある場合に発生するそうです。このような場合は言うまでもなく、インデックスが安定するようにコンテンツの品質を改善した方が良いでしょう。

インデックス数が少ない場合 XMLサイトマップ作成のメリット

Search Consoleにウェブサイトを登録し、XMLサイトマップを登録しましょう。

XMLサイトマップの作成 手書きよりもツールがおすすめ

Googleのインデックス数が実際のページ数よりも大幅に少ない場合にはXMLサイトマップを作成し、Search Consoleでサイトマップ登録を行います。
XMLサイトマップのは、手書きで記述する事もできますが、ページ数が多くなると管理も作業も大変になります。
XMLサイトマップの記述は若干専門的なので、Sitemap.orgの仕様に準拠した形式で作成できる専用ツールがおすすめです。

Googleのインデックス処理でよくある質問

#(ハッシュ)を含むURLはインデックスされる?

Googleのインデックス処理では#を含む以降文字列は取り除かれてインデックスされます。つまり、#でコンテンツが切り替わる仕組みのウェブサイトの場合には、#を含むURLは全て無視され、インデックスすらされません。

一方で検索結果内で表示されるページ内リンクについては、例外として#を含むURLが掲載されます。

ページ内リンク
Googleはページを部分的にインデックスするようになったか?

Passage Indexing が日本語検索結果で今後適用される予定ですが、インデックスに関しては従来通り1ページごとの単位でインデックスします。コンテンツの一部をインデックスする事は無いようです。

サイトが停止した影響でインデックスから消えてしまった。どの程度で復旧する?

一般的にはサイトが利用不可の状態になって検索結果に表示されなくなるよりも短い期間で復旧するようです。

すでにインデックスされているページがインデックスから除外されることはあるか?

John Mueller氏のTwitterコメントによるとどのようなURLでも時間とともにインデックスから除外されてしまうことはあり得るようです。これは重要なページであっても同様です。

SE Rankingの競合&キーワード調査ツール

この記事を書いた人

SEOは考え方はシンプルですが、いざ実践するとなかなか思うようにいきません。
当ブログでは、読者の方に成功も失敗も合わせて情報を共有し、同じような悩みを解決できればという思いで運営しています。
【著書】
分析が導く 最新SEOプラクティカルガイド」(2022年5月27日発売 技術評論社)
最強の効果を生みだす 新しいSEOの教科書」(2017年9月20日発売 技術評論社)

>>著者情報の詳細

Search Times
閉じる