ブログ運営やSEO対策でGoogle Search Console(サーチコンソール)を見ていると、「設定」の中に「クロールの統計情報」という項目を見つけることがありますよね。「これっていつから始まったの?」「どんな意図があって存在するの?」「どうやって活用すればいいの?」と疑問に思う方も多いのではないでしょうか。
この記事では、クロールの統計情報の歴史や存在する目的、そして初心者でもできる具体的な活用方法をわかりやすく解説します。
クロールの統計情報はいつからスタートした?
実は「クロールの統計情報」という機能自体は、Search Consoleの前身である「Googleウェブマスターツール」の時代(2010年代前半)から存在していました。
しかし、現在私たちが目にする、様々な切り口で詳細なデータが確認できる「新しいクロールの統計情報レポート」は、2020年11月に大幅なアップデートとしてリリースされたものです。
このアップデートにより、ただクロール(巡回)された回数を見るだけでなく、エラーの原因やファイルの種類まで、より深く詳細に分析できるようになりました。
この統計情報の意図は?なぜ存在するの?
クロールの統計情報が存在する最大の意図は、「Googleのクローラー(Googlebot)が、あなたのサイトをスムーズに巡回できているか」をサイト管理者が正確に把握できるようにするためです。
Googleの検索結果に記事を載せるためには、まずGooglebotと呼ばれるロボットがサイトを訪問し、ページの内容を読み取る必要があります。しかし、サイトのサーバーが重かったり、エラーが起きていたりすると、Googlebotは途中で巡回を諦めてしまいます。
このレポートは、そうした「見えないエラー」や「サーバーの健康状態」を可視化し、サイト運営者がクロールに関する問題を早期に発見して解決(トラブルシューティング)できるようにする目的で用意されています。
クロールの統計情報の具体的な活用方法
専門知識がなくても、以下の3つのポイントを定期的にチェックするだけで、サイトの健康状態を保つためのツールとして十分に活用できます。
1. クロールリクエストの推移(グラフ)を確認する
レポートを開くと表示される時系列グラフで、「合計クロール リクエスト数」の推移を確認します。
- 急激な減少:サーバーがダウンしていたり、誤ってGooglebotのアクセスをブロックしてしまっている可能性があります。
- 急激な増加:サイトの評価が上がって頻繁に巡回されている良いケースもありますが、不要なページを無限に巡回してしまっているケースもあるため注意が必要です。
2. 「ホストのステータス」で可用性をチェックする
レポート内にある「ホストのステータス」は、サイトが常に正常にアクセスできる状態(可用性)だったかを示します。DNS(ドメインのシステム)やサーバー接続にエラーが出ている場合、読者だけでなくGooglebotもサイトにアクセスできていない時間があったことを意味します。この項目で、過去90日間のサイトの安定性をチェックしましょう。
3. レスポンスコードによるエラーの確認
レポートの下部にある「クロール リクエストの分類」から「レスポンス」を確認します。
「OK (200)」が多ければ正常です。しかし、「Not found (404)」や「サーバーエラー (5xx)」が異常に増えている場合は、リンク切れが多数発生していたり、サーバーの負荷が高すぎたりするサインです。エラーになっている具体的なURLを特定し、修正するヒントとして活用できます。
まとめ
Google Search Consoleの「クロールの統計情報」は、2020年11月に現在の詳細な形へと進化しました。この機能は、Googlebotがあなたのサイトをどれくらいスムーズに巡回できているかを確認するための「健康診断のカルテ」のような存在です。
毎日チェックする必要はありませんが、「最近、記事が検索結果に載るのが遅いな」と感じたときや、月に1回の定期メンテナンスとして、急なグラフの低下やエラー表示がないかを確認してみてください。
