XMLサイトマップ(sitemap.xml)とは?必要性と作り方を解説

XMLサイトマップ(sitemap.xml)とは?必要性と作り方を解説

XMLサイトマップとは?

XMLサイトマップとは、検索エンジンのクローラーが効率よくページをクロールするためのファイルのことである。その名の通り、XML形式のファイルであり、sitemap.xmlというファイル名で生成されることが一般的だ。

サイトマップとは、サイト上のページや動画などのファイルについての情報や、各ファイルの関係を伝えるファイルです。Google などの検索エンジンは、このファイルを読み込んで、より効率的にクロールを行います。サイトマップはサイト内の重要なページとファイルを Google に伝えるだけでなく、重要なファイルについての貴重な情報(ページの最終更新日やすべての代替言語ページなど)も提供します。

サイトマップを使用して、動画、画像、ニュースのコンテンツなど、ページ上の特定のタイプのコンテンツに関する情報を提供できます。次に例を示します。

サイトマップについて

XMLサイトマップの必要性

XMLサイトマップ(sitemap.xml)を設置することで、クローラビリティ向上の効果がありSEO対策としてもメリットがある。

特に下記のようなサイトは必ず設置したほうがよいだろう。

大規模なサイト

新しいページが頻繁に作成されるサイトや、複数のページにおいて情報がこまめに更新がされるサイトなど、ページ数が多いほど、それだけクローラーがページを見落とす可能性が高くなる。そのため、大規模なサイトの場合はXMLサイトマップを設置することをおすすめする。

リンク階層の深いサイト

大規模なサイトと類似しているが、リンク階層が深いほど、それだけクローラーはページを辿りにくくなりクロールされない可能性が高くなる。そのため、リンク階層が深いサイトの場合もXMLサイトマップを設置することをおすすめする。

リンクがないページがあるサイト

クローラーは内部リンクや外部リンクから辿ることでクロールされる。そのため、リンクがないページをクロールさせたい場合はXMLサイトマップを設置しよう。

画像・動画・ニュースの情報があるサイト

画像・動画・ニュースの情報があるサイトは、積極的にXMLサイトマップを設置することをおすすめする。それぞれに対して追加情報を付与することができるため、Googleの画像検索・動画検索・ニュース検索などの検索結果で表示される可能性が高くなるからだ。

XMLサイトマップの作り方

サイトマップ形式

まずはXML形式のサイトマップファイルを作成しよう。ファイル名はsitemap.xmlが一般的である。

XML以外にもRSS、mRSS、Atom 1.0、テキストファイルの形式でも作成することが可能だ。

XMLサイトマップの書き方

下記がsitemap.xmlの基本形の記述だ。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
  <url>
    <loc>http://www.example.com/bar.html</loc>
    <lastmod>2018-06-05</lastmod>
  </url>
</urlset>

下記の4つの構成からなる。

タグ必須有無説明
urlset必須複数のurlタグを囲む要素である。また、ネームスペース(プロトコル規格)を指定する。
url必須各URLのエントリの親要素である。locタグやlastmodタグなどが子要素として内包される。
loc必須ページのURLを記述する要素である。
lastmodオプションファイルの最終更新日を記述する要素。この日付はW3C Datetime形式で記述する必要がある。時刻の部分を省略してYYYY-MM-DDの形式で記述することも可能。

なお、changefreqやpriorityのタグもオプションとして存在するが、Googleのクローラーはこれ利用しないため指定不要である。

XMLサイトマップの複数分割

XMLサイトマップのファイルには下記の上限が設けられている。

  • ファイルサイズ:圧縮していない状態で50MBが上限
  • URLの件数:50,000件が上限

そのため、ファイルサイズがこれより大きい場合、またはURLの件数がこれより多い場合は、XMLサイトマップを複数に分割する必要がある。ファイル名はsitemap1.xml、sitemap2.xmlとナンバリングし管理することが一般的だが、この限りではない。

サイトインデックスファイルの必要性

サイトマップインデックスファイルは、複数のXMLサイトマップを束ねるファイルのことだ。

XMLサイトマップが複数あると管理が煩雑になり、検索エンジンも認識することが困難になる。サイトマップインデックスファイルはこれを解消するためのファイルだ。

下記のようなディレクトリ構成をイメージするとわかりやすいだろう。

  • sitemap_index.xml
  • └sitemap1.xml
  • └sitemap2.xml

サイトマップインデックスファイルの書き方

下記がサイトマップインデックスファイルの基本形の記述だ。

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.example.com/sitemap1.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.example.com/sitemap2.xml</loc>
  </sitemap>
</sitemapindex>

下記の4つの構成からなる。

タグ必須有無説明
sitemapindex必須複数のsitemapタグを囲む要素である。また、ネームスペース(プロトコル規格)を指定する。
sitemap必須各XMLサイトマップURLのエントリの親要素である。locタグやlastmodタグなどが子要素として内包される。
loc必須XMLサイトマップURLを記述する要素である。
lastmodオプションファイルの最終更新日を記述する要素。この日付はW3C Datetime形式で記述する必要がある。時刻の部分を省略してYYYY-MM-DDの形式で記述することも可能。

自動化を推奨

上記、XMLサイトマップの作り方について解説したが、常に最新の情報を記述するとなると手動で運用するのは現実的ではない。そのため、XMLサイトマップの生成や更新については自動化することをおすすめする。

前述のタグの仕様さえ理解してしまえば、技術的には難しい内容ではないだろう。もし、あなたがWordpressのようなCMSを利用しているのであれば、デフォルトあるいはプラグインにより簡単に導入できるため活用するとよいだろう。

検索エンジンに認識してもらう方法

XMLサイトマップはGoogleなどの検索エンジンに認識されてこそ、SEO効果が発揮される。

やり方としては2つ存在する。ひとつは検索エンジンに直接送信する方法と、もうひとつはrobots.txtへ記述する方法である。

検索エンジンに直接送信

Googleであれば、Google Search Consoleの「インデックス作成」→「サイトマップ」→「新しいサイトマップの追加」からXMLサイトマップのURLを入力し「送信」すれば完了だ。これにより、GoogleはXMLサイトマップを認識するため、以降はXMLサイトマップ経由でもクローラーがクロールすることになる。

また、日本ではシェア5%ほどしかないが、Bingにも送信しておくとよいだろう。やり方はBing Web マスターツールの「サイトマップ」→「サイトマップを送信」からXMLサイトマップのURLを入力し「送信」すれば完了だ。

robots.txtへの記述

robots.txtへ下記のように記述することで、検索エンジンに認識させることができる。

User-agent:
Disallow:
Allow:
Sitemap: http://www.example.com/sitemap.xml
robots.txtとは?メリットと書き方を解説

まとめ

  • XMLサイトマップは、検索エンジンのクローラーが効率よくページをクロールするためのファイル
  • クローラビリティ向上の効果がありSEO対策としてもメリットがある
  • XMLサイトマップの生成や更新は自動化することをおすすめする
  • 検索エンジンに認識させるには直接送信するか、robots.txtへ記述する方法がある

記事の著者

HIRILUK

HIRILUK編集長

HIRILUKの創設者。十数年に渡り一貫してSEO業務に携わる。年間12億PVのECサイトのSEO戦略室にてSEO対策を推進。その後もオウンドメディアの立ち上げ、SEOコンサルティング、SEOセミナーなどを多数経験。
HTML5プロフェッショナル認定試験取得、GAIQ(Googleアナリティクス個人認定資格)取得。

内部対策SEO・テクニカルSEOのおすすめ記事

あわせて読みたい記事