クローラーとは？ロボット巡回する流れを解説

クローラーは、インターネット上でWebサイトを巡回して、ページの情報を収集します。検索エンジンは、その収集した情報を元に検索順位を表示します。

つまりSEO対策の基本として、検索エンジンのクローラーが正しく巡回してもらうことは必須です。

この記事では、クローラーについてと巡回する流れを解説します。

クローラーとは

クローラーは、インターネット上にあるWebサイトを探しまわり、コンテンツを収集するシステムのことです。googleやBingなどの検索エンジンは、それぞれのクローラーを持っていて取得したコンテンツを整理した上で検索結果に表示します。

サイト内を回遊しやすいように、サイト内の構造を適切に整えることを「クローラビリティ」といいます。
クローラビリティを向上させることでSEO効果になります。

クローラーは、外部リンクを辿って巡回してきます。Googleのクローラーは、インターネット上にあるWebサイトやSNSのリンクから、さらにSNSのリンクを辿り別のWebサイトの存在を把握して、情報を取得します。

内部リンクや外部リンクなどが多い記事ほど、クローラーの入り口が増えるということです。

新しく作ったサイトには巡回がすぐに来てはくれないので、自ら申請を出す必要があります。

その申請を出す方法を紹介します。

すでにインデックス登録している既存のページだけでなく、まだ、インデックスしていない新規のページも同様にインデックスを促すことができます。

XMLサイトマップのURLをGoogleサーチコンソールに送信することで、Googleのクローラーに伝えることが可能です。

※XMLサイトマップを作成していないと、ファイルを送信することが出来ません。

クローラーが実際にWebサイトをどのように巡回しているか、仕組みについて見ていきます。

クローラーは、次のようなファイルを取得して巡回します。

HTMLのテキストはもちろん、画像や動画などの情報も取得します。

HTMLに画像の記述が下記のようにあった場合、クローラーはalt属性を理解してくれるので、この画像を「web制作会社」というテキストと等価であると解析処理を行います。

<img src="http://” alt=”web制作会社”>

titleタグでも同じようにtitleタグに囲まれている部分は、そのページのタイトルと解析処理します。

HTMLのみではなく、各種メディアファイルも取得していますので、画像ファイルは画像検索、動画ファイルは動画検索に表示されます。WordファイルやPDFファイルも検索結果に表示されます。

Web上のリンクを辿って巡回してきます。Webサイトにはいくつものページが連なっていますが、そのすべてのリンクを自動で巡回していきます。具体的にはaタグに記載されたリンク先ページを次々と巡回します。

なので、パンくずリストのような内部リンクは、評価を上げる施策となります。

なお、クローラーが辿れるのはリンクのみで、ログインが必要なページは巡回することができません。

クローラーからいい評価をを受けれるように、良いコンテンツを作れることを心がけましょう。