Rank Reporter

Sitemap Creator 除外ページ

ウェブサイト上の一部のページやファイルをクロール対象から除外します。Sitemap Creatorでは、特定のURLやURLグループを定義する事でクロールから除外する事ができます。設定画面を開くには、画面上部の「プロジェクト」メニューをクリックし、「除外ページの編集」をクリックします。


「除外されたページ」画面は、クロールから除外させるURLを設定します。


掲示板や記事ページ等で、別途印刷用のページを生成するスクリプトやページを大量に持つウェブサイトの場合(重複するコンテンツのクロールを避けたい場合)は、この除外ページを活用します。「除外されたページ」のリストに新しくURLを追加するには、絶対パス、または相対パスを「相対URL」フィールドに入力します。(入力すると、「実際のURL」フィールドにプロジェクトで設定したルートURLの後ろに追加されて表示されます。)


「URLの追加」ボタンをクリックすると、リストに新しくURLが保存されます。


削除するには、リストからURLを選択し、アクションの「URLの削除」をクリックするか、キーボードの「Del」キーを押します。



画面左側のアクションメニューに表示される「アドバンスビューに切り替え」をクリックする事で、特定のページやセクションを含める事ができます。(includeを選択します。)


このリストは上位のリストが優先されます。例えば"www.example.com/content/"以下の全てのページのうち"www.example.com/content/important"以外を除外したい場合は、"/content/important"を「include」に含み、そのリストの下に除外する"/content"の順に追加します。リストのアイテムはアドバンスビュー画面右の上下矢印マークをクリックする事で並べ替えができます。


ディレクトリ(例:"/blog")を除外ページとして設定した場合、そのディレクトリ直下の全てのファイルやサブディレクトリが除外されます。(例:www.example.com/blog/index.htmlやwww.example.com/blog/archives/january2005.htmlは除外されます。)


ワイルドカードは"*"(アスタリスク)を使用する事で設定できます。 "*"は0文字以上の文字列に置き換えられ、相対URL上ではいくつでも使用できます。


inventory/warehouse*index 以下のページが除外されます。
inventory/warehouse1index
inventory/warehouse125index
inventory/warehouseindex

userreports/*.txt "userreports/"ディレクトリ直下の".txt"の拡張子の全てのファイルが除外されます。

特定のパラメータを持つURLを除外する事もできます。


例えば、URLパラメータに、"format=print"が含まれる全てのURLを除外するには、以下のように入力します。


*?*format=print*

このようにすれば、URLパラメータ内(”?”の後)に、'format=print'を含むURLは全て除外されます。


※(上級者向け) *は”/”も含めて全ての文字列を含めます。パスセパレータ("/")以外のあらゆるテキストを含める場合は、*の前に!を使用します。


"!*"

特殊なケースですが、この設定でパスセパレータを除いた全ての文字列を含める事ができます。


"$"は、URLの最後に配置し、以下のような意味を持ちます。


inventory/index.php$ 除外します。
inventory/index.php
除外しません。
inventory/index.php?product=xyz

ルートURLに対して内部URLは相対パスとなります。URLが”/”で始まる場合は、ドメインルートからの相対URLとなり、”/”で始まらない場合は、プロジェクトで設定したルートURLに対して相対URLとなります。


例えば、プロジェクトに次のルートURLを設定した場合は、


"www.example.com/somepage/":

"apage.html" と入力すると、"www.example.com/somepage/apage.html"
"/apage.html" と入力すると "www.example.com/apage.html" を意味します。

http://から始まるURLは絶対パスとして扱われ、外部サイトへのリンクを除外します。


"http://www.anothersite.com" はそのまま"http://www.anothersite.com" を意味します。

この他クロール結果画面上のURLを右クリックし、そのページを除外リストに追加する方法もあります。



その他SEO支援ツール


検索順位チェックツール
Rank Reporter

検索順位を毎日自動で取得できる!


内部SEO支援ツール

SEO Composer

ドメイン・ページ無制限で内部SEOチェック!




SEOツールはどう使う?

おすすめ無料・有料SEOツール