sitemap.xmlとRSS/Atomフィードの組み合わせ

2015年4月22日

Googleに効率よくウェブサイトをクロールしてもらう為には、XMLサイトマップを作成する事が一つ上げられます。
Google本国のWebmaster Central Blogで、このXMLサイトマップとRSS/Atomフィードを組み合わせたベストプラクティスがアナウンスされていましたので、ご紹介します。


Best practices for XML sitemaps & RSS/Atom feeds


XMLサイトマップとRSS/Atomフィードを使用したベストプラクティス

サイトマップの送信はウェブサイト最適化の一つの重要な要素です。
サイトマップは検索エンジンにウェブサイト上の全てのページを見つけさせ、ページが更新された際に素早くダウンロードさせる事ができます。
ここではサイトマップで重要な部分や、XMLサイトマップとRSS/Atomフィードを使用するケースや、Googleへ最適化する方法を解説します。


サイトマップとフィード

サイトマップはXMLサイトマップ、RSS、またはAtom形式があります。
これらの形式の重要な違いとして、XMLサイトマップはサイト内の全てのURLを記述し、一方でRSS/Atomフィードは最近の変更を記述します。
これは重要な意味を持ちます。


  • XMLサイトマップは通常大きい。一方でRSS/Atomフィードは小さく、あなたのウェブサイトの最も最近更新したものだけを含める。
  • XMLサイトマップは、RSS/Atomフィードよりもダウンロードされる頻度は少ない。

クロールの最適化を行うには、XMLサイトマップとRSS/Atomフィード両方を使用する事をおすすめします。
XMLサイトマップはGoogleにウェブサイト上の全てのページに関する情報を提供します。
RSS/Atomフィードはあなたのウェブサイトの全ての更新情報を伝える事ができ、Googleのインデックスにおいて、あなたのコンテンツを最新の情報に保つ事ができます。
ただし、サイトマップとフィードの送信はそれらのURLのインデックスを確約するものではありません。


XMLサイトマップの例

<?xml version=”1.0″ encoding=”utf-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <loc>http://example.com/mypage</loc> <lastmod>2011-06-27T19:34:00+01:00</lastmod> <!– optional additional tags –> </url> <url> … </url> </urlset>

RSSフィードの例

<?xml version=”1.0″ encoding=”utf-8″?> <rss> <channel> <!– other tags –> <item> <!– other tags –> <link>http://example.com/mypage</link> <pubDate>Mon, 27 Jun 2011 19:34:00 +0100</pubDate> </item> <item> … </item> </channel> </rss>

Atomフィードの例

<?xml version=”1.0″ encoding=”utf-8″?> <feed xmlns=”http://www.w3.org/2005/Atom”> <!– other tags –> <entry> <link href=”http://example.com/mypage” /> <updated>2011-06-27T19:34:00+01:00</updated> <!– other tags –> </entry> <entry> … </entry> </feed>

“other tags”は、任意にそれぞれ標準とされるタグを参照します。
Googleは、Atom/RssにGoogle検索に加えてこれらのフィードを使用する他のサービスにも表示されるように、必要とされるタグを定義することをおすすめします。


ベストプラクティス

重要な項目

XMLサイトマップとRSS/Atomフィードの内部は、URLに付随するメタデータとともにURLのリストが含まれます。
Googleにとって2つの最も重要な情報部分は、URLそれ自身とLast Modification Time(最終更新日)です。


URL

XMLサイトマップとRSS/AtomフィードのURLは以下のガイドラインに従って記述します。


Googlebotに取得されたいURLのみを含めます。
よくある失敗として、robots.txtで制限をしているURLを含めてしまったり(この場合はGooglebotは取得できません。)、存在しないページのURLを含めてしまっている事があります。


canonical URLのみを含めます。
良くある失敗として、複製ページ(重複)のURLを含めてしまっている事があります。
この場合はインデックス促進ではなく、サーバー負荷が増えます。
※canonical(URLの正規化)については以下のページをご参照ください。
canonical属性 URLの正規化とは


Last modification time(最終更新日)

XMLサイトマップとRSS/Atomフィード内の各URLに最終更新日を明記する。
最終更新日は、ページコンテンツが実際に更新された最新の時刻になります。更新が検索結果に目に見える事である場合、最終更新日は更新の日付を含めます。


  • XMLサイトマップで使用 <lastmod>
  • RSSで使用 <pubDate>
  • Atomで使用 <updated>

最終更新日の時刻は正確に記述してください。


  • 正しいフォーマットに日付時刻を明記します。
    XMLサイトマップは、W3C Datetime / Atomは、RFC3339 / RSSはRFC822
  • 意味のあるコンテンツ更新の場合のみ最終更新日をアップデート
  • サイトマップやフィードに関して常に現在の日付・時刻を最終更新日に設定してはならない。

XMLサイトマップ

XMLサイトマップはあなたのウェブサイトの全てのページを含めます。
大きなファイルになり、頻繁にはアップデートしません。
以下のガイドラインに従ってください。


  • 一つのXMLサイトマップ : 少なくとも1日1回更新(ウェブサイトが定期的に更新される場合)し、更新後にGoogleにPing送信。

  • 複数のXMLサイトマップ : 各XMLサイトマップのURLの数を最大化する。
    制限として50,000 URL、または、非圧縮で10MBのファイルサイズがあり、どちらかが始めに読み込まれるようにします。

  • XMLサイトマップが更新される度に、GoogleへPing送信。
    良くある失敗として、各XMLサイトマップファイル内に少量のURLのみを置いた場合、GoogleはこれらのXMLサイトマップの全てを一定の期間でダウンロードする事が難しくなります。

RSS/Atom

RSS/Atomフィードはあなたのウェブサイトの最新の更新を伝えます。
これらは大抵小さく、更新が頻繁です。これらのフィードは以下をおすすめします。


  • 新規ページが追加、または既存のページの意味のある更新があった際に、URLと最終更新日をフィードに追加します。

  • Googleに更新情報を見過ごされないようにするには、RSS/Atomフィードは少なくとも前回Googleにダウンロードされた最終時刻以降の全ての更新日をその中に含める必要があります。
    これを実現する最も良い方法は、PubSubHubbubを使用する事です。あなたのフィードのコンテンツをRSSリーダー、検索エンジン等に最も早く、効率よく伝える事を可能にします。

XMLサイトマップとAtom/RSSフィードの両方を生成する事は、Googleや他の検索エンジンにとってあなたのサイトへのクロールを最適化する良い方法です。




当サイトでも早速RSSフィードをSearch Console(旧ウェブマスターツール)のサイトマップに登録してみました。


RSSをサイトマップ登録

XMLサイトマップの定期更新については、Sitemap Creatorを使用して自動で行っております。
検索エンジンにウェブサイトの最新の更新情報を細かく伝えるにはRSS/Atomフィード、サイト内の全ページの状態を伝えるにはXMLサイトマップを活用していきましょう。


XMLサイトマップを簡単に作成でき、自動管理まで行う

XMLサイトマップ作成ソフト Sitemap Creator

Sitemap CreatorはXMLサイトマップ作成ツールです。
ウェブサイトを巡回し、自動でXMLサイトマップを作成し、更に検索エンジンへの通知まで行います。




このエントリーをはてなブックマークに追加


野澤洋介

この記事を書いた人

アレグロマーケティング代表取締役 野澤洋介

SEOは考え方はシンプルですが、いざ実践するとなかなか思うようにいきません。
当ブログでは、読者の方に成功も失敗も合わせて情報を共有し、同じような悩みを解決できればという思いで運営しています。


著書:「最強の効果を生みだす 新しいSEOの教科書」(技術評論社)

follow us in feedly


関連記事


SEO管理ツール Spresseo(エスプレッセオ)

コンテンツが増えてきたらランキングの管理をツールで効率化しましょう。
ページごとの内部最適化や、キーワードの順位取得や競合比較、獲得した被リンクのレポートを自動化できます。



▲ ページトップ ▲
自動XMLサイトマップ管理ツールトライアル版配布中