Googlebot



Googlebot(グーグルボット)

Googlebotとは、Googleが使用するクローラーの名称です。

Googlebotには複数の種類がありますが、主要なHTTP_USER_AGENTは以下です。

  Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

 
○Googlebotのアクセス拒否またはアクセス間隔制御の方法

☆.htaccessによる方法

  • サイトのトップディレクトリに保管する.htaccessファイルをウェブサーバーが読み取ってアクセス制御する方法です。
  • ウェブサーバーの種類や設定状況によっては、使用できないことがあります。
  • サイトのトップディレクトリに.htaccessファイルを保管できる権限が必要です。
  • この方法が使用可能な場合、アクセス制御として一番確実な方法です。

★全アクセスを拒否(クローラー名称を指定する方法)
┌────────────────────────
│SetEnvIf User-Agent "Googlebot" deny_ua
│Order allow,deny
│Allow from all
│Deny from env=deny_ua
└────────────────────────
※ "Googlebot"は、Googlebotを識別可能なHTTP_USER_AGENT中の一部の文字列です。
HTTP_USER_AGENTが変更された場合などは、必要に応じて変更が必要です。

★全アクセスを拒否(IPアドレスを指定する方法)
┌────────────────────────
│Order allow,deny
│Allow from all
│Deny from IPアドレス1
│Deny from IPアドレス2
│ :
└────────────────────────
IPアドレスは、クローラーIPアドレスを、「12.345.6.789」のように指定します。
※ 複数のIPアドレスを指定する場合、複数行を指定します。

☆robots.txtによる方法

  • サイトのトップディレクトリに保管するrobots.txtファイルをクローラーが読み取ってアクセス制御する方法です。
  • Googlebotの場合、対応していることが、下方のURLに明記されています。(最短アクセス間隔には対応せず)
  • サイトのトップディレクトリにrobots.txtファイルを保管できる権限が必要です。

★全アクセスを拒否
┌────────────────────────
│User-agent: Googlebot
│Disallow: /
└────────────────────────

★最短アクセス間隔を指定

※ Googlebotは、robots.txtファイルによるアクセス間隔指定に対応していません。
※ ただし、Googleウェブマスターツールの「クロール率」で「少ない」を指定できます。(下方参照)

☆メタ・ロボットによる方法

  • HTMLのHEADセクション内に以下の行を追加できることが必要です。
  • アクセス制御の対象とする全HTMLファイルに追加が必要です。
  • Googlebotの場合、対応していることが、下方のURLに明記されています。

★当該HTMLファイル(URL)のアクセスを拒否
┌────────────────────────
│<META NAME="GOOGLEBOT" CONTENT="NOINDEX,NOFOLLOW">
└────────────────────────

☆Googleウェブマスターツールによる方法

★アクセス間隔(クロール率)を指定


・サイト

├ 診断
│ ├ 概要
│ ├ クロール エラー
│ │ ├ ウェブ クロール
│ │ └ 携帯サイト
│ └ 運用ツール
│   ├ robots.txt 解析
│   ├ サイト確認の管理
│   ├ クロール率        ← ★ここ
│   ├ 使用するドメイン
│   └ イメージ検索の機能強化

***

★Googlebotのrobots.txtとメタ・タロボットの説明
http://www.google.com/support/webmasters/bin/answer.py?answer=35303

★Googlebotのアクセス制御用名称の説明
http://www.google.com/support/webmasters/bin/answer.py?answer=40364

★Googlebotのrobots.txtファイル仕様の説明
http://www.google.com/support/webmasters/bin/answer.py?answer=40362

★Googlebotのrobots.txtファイル仕様の説明(ワイルドカード文字)
http://www.google.com/support/webmasters/bin/answer.py?answer=40367

★Googlebotを説明するページの目次
http://www.google.com/support/webmasters/bin/topic.py?topic=8843

関連ページ(用語):
  Googleウェブマスターツール
  Google
  クローラー
  Yahoo Slurp
  msnbot
  Baiduspider
  NaverBot
  .htaccess
  robots.txt
  メタ・ロボット



   
関連サイト