Googleのインデックス登録・更新を促進 サイトマップ送信方法

google インデックス

それぞれの検索エンジンのロボットが通知されたURLをクロールし、インデックスされます。

クロールとは?

クロールとは検索エンジンのロボットがページの情報を巡回して取得する処理を意味します。

インデックスとは?

インデックスとは検索されやすいように取得した情報に索引を付けてデータベースに格納する処理を指します。

新規にウェブサイトを立ち上げた際や、しばらく放置したページを更新した際など、素早く検索結果に表示させたいページが中々検索結果に反映されない場合があります。

ここでは検索エンジンのクローラーを呼び込むいくつかの方法について解説します。Googleの説明では、100%すぐにクロールされる保証はありませんが、ただ待つよりは効果的な方法です。

目次

検索エンジンにサイトマップを送信しインデックス登録

XMLサイトマップを作成して、Search Consoleに登録した上でリクエストを送信する事で、ウェブサイトの更新状況や公開中のページをGoogleに伝える事ができます。

XMLサイトマップ

XMLサイトマップはサイト内に存在するURLを記述したもので、GoogleやBingのような検索エンジンに対してインデックスを促す機能を持っています。
XMLサイトマップの作成については以下のパターンがあります。

  1. システムでXMLサイトマップを自動的に生成している
  2. テキストエディタで手書きで作成する
  3. XMLサイトマップ生成ソフトで作成する

①のようにWordPressやサービスを利用している場合は、既にXMLサイトマップが自動的に生成されているかもしれませんので、システムのマニュアルをご確認ください。

それ以外の場合では、xmlファイルをテキストエディタで一から手書きで作るという方法の他に当社の製品とはなりますがXMLサイトマップ自動作成ソフトもありますので、それらを活用すると効率的に管理できます

XMLサイトマップについては、「XMLサイトマップとは?」で解説しています。

インデックスを促すには以下の手順に沿って操作を行います。

  1. XMLサイトマップファイル(sitemap.xml)を作成する。
  2. サーバーのトップページと同じディレクトリにアップロード。
  3. 各検索エンジンの管理ツールのアカウントを作成する。
  4. 各検索エンジンの管理ツールにサイトマップファイルを登録して送信する。

Search Consoleの設定

STEP
サイトマップを選択

Search Consoleにログインして左メニューの「サイトマップ」をクリックします。

サイトマップを選択
STEP
アップロード先URLを記入して送信

アップロードしたsitemap.xmlのURLを入力して送信します。

アップロード先URLを記入して送信

WordPressなどのCMSでウェブサイトを管理されているのであれば、XMLサイトマップに加えてRSS/AtomフィードのURLの登録も行いましょう。
XMLサイトマップとRSS/Atomフィード登録についてはGoogleも推奨している方法です。

XMLサイトマップ自体はウェブサイトの更新と合わせて更新しておいた方が良いですが、Search Consoleへのサイトマップの登録は一度行っておけば良いでしょう。(毎回登録する必要はありません。)

インデックスされないページはURL検査ツールでチェック

まだインデックスされていないページがある場合や、変更したページのインデックスをリクエストしたい場合は、Search ConsoleのURL検査ツールで状態を確認する事ができます。

Search Console インデックス登録手順

  1. Search Consoleにログインします
  2. 左メニューの「URL検査」をクリック
  3. URLの検査が開始されるのでしばらく待ちます
  4. インデックスされていないURLを入力
  5. 「インデックス登録をリクエスト」をクリック
  6. インデックス登録のリクエストが行われるのでしばらく待ちます
  7. インデックスのリクエストが完了したと表示されます

具体的には以下の手順をご覧ください。

STEP
URL検査ツールを選択

Search Consoleの左メニュー内のURL検査ツールをクリックします。

URL検査ツールを選択
STEP
インデックスされていないURLを入力

対象のページのURLを入力してEnterキーを押下します。

インデックスされていないURLを入力
STEP
インデックス登録をリクエスト

「インデックス登録をリクエスト」をクリックします。

インデックス登録をリクエスト

以上の操作でエラーが無ければ、インデックスに向けた処理が行われます。

robots.txtでブロックされたファイルは取得できない

Googlebotは、ファイルを取得する際にrobots.txtの記述に従います。例えばサーバー上のcssやjavascript専用のディレクトリをこのrobots.txtで検索エンジンのクローラーを拒否していると、レンダリングできません。(外部サーバーの埋め込みファイルも同様です。)

また、サーバー側でエラーが返された場合もレンダリングできません。(Search Console上のクロールエラーで確認できます。)

robots.txtは、クローラーの動作を制御する為のファイルです。特定のファイルやページの巡回をブロックする事ができます。

ウェブサイトの目に見えるコンテンツやレイアウトの重要な埋め込み構成要素には、Googlebotにアクセスできるようにする事をおすすめします。
こうする事で、「URL検査」の機能を簡単に利用でき、更に、Googlebotがそれらのコンテンツも同様に探し出し、インデックスできるようになります。

インデックスの状況を簡単に確認する方法

Fetch as Googleの操作を行ったとしても、リアルタイムでインデックスされるわけではありません。更新後のインデックス状況は、Google検索上で簡易に確認することができます。

新規作成したページがGoogleにインデックスされているか確認

ページがGoogleにインデックス登録されているかを確認するには、Google検索窓で確認したいURLを入力すればわかります。何も表示されていなければ、Googleのインデックス登録をリクエストします。

インデックスされていない場合
インデックスされていない場合
インデックス済みの場合
インデックス済みの場合

既存のページでコンテンツ追加後に、再クロールされたか確認する方法

Googleはインデックスしたページのキャッシュを持ちます。既存のページをメンテナンスしたり、コンテンツを追加した場合に、Googleにきちんとキャッシュされているかを確認するには、検索結果画面でURLが記述されている箇所の右横にある下向きの三角をクリックし、キャッシュをクリックします。

ページのキャッシュ
キャッシュ情報

キャッシュされたページの情報が表示されます。ここで記述されている日付が、ウェブページ更新、またはコンテンツの一部追加日時より最近であれば、再クロールされたと見てよいでしょう。

キャッシュされた日付
キャッシュされた日付
お役に立ちましたか?シェアして頂けると嬉しいです!
目次
閉じる