.htaccess



.htaccess(ドット・エイチ・ティー・アクセス)

.htaccessとは、ウェブサイトのアクセス制御を設定するファイルの名称です。

.htaccessは、巡回頻度が多すぎるクローラーのアクセス制御に使用することがしばしばであり、本項はその点に絞って解説しています。

.htaccessは、ウェブサイトのトップディレクトリに保管します。

.htaccessの記述例:

 ・特定IPアドレスからのアクセスを拒否

  ┌────────────────────────
  │Order allow,deny
  │Allow from all
  │Deny from IPアドレス1
  │Deny from IPアドレス2
  │ :
  └────────────────────────

   ※ IPアドレスは、「12.345.6.789」のように指定します。
   ※ 複数のIPアドレスを指定する場合、複数行を指定します。

 ・特定HTTP_USER_AGENTのアクセスを拒否

  ┌────────────────────────
  │SetEnvIf User-Agent "ユーザーエージェント1" deny_ua
  │SetEnvIf User-Agent "ユーザーエージェント2" deny_ua
  │ :
  │Order allow,deny
  │Allow from all
  │Deny from env=deny_ua
  └────────────────────────

   ※ “deny_ua”は変数名ですので、上記のような任意の名称を使用できます。
   ※ 複数の「ユーザーエージェント」を指定する場合、複数行を指定します。
   ※ 「ユーザーエージェント」には、以下等を指定します。

    ・Slurp … Yahooのロボット
    ・Googlebot … Googleのロボット
    ・msnbot … MSNWindows Live Searchのロボット
    ・Baiduspider … 百度のロボット
    ・NaverBot … NAVERのロボット
    ・Yeti … NAVERのロボット
    ・YodaoBot … 有道のロボット
    ・Teoma … Askのロボット
    ・BecomeJPBot … Becomeのロボット
    ・ichiro … gooのロボット

    上記は、クローラーを識別可能な、HTTP_USER_AGENT中の一部の文字列です。
    したがって、robots.txtの指定と同じとは限らないことに注意してください。

    HTTP_USER_AGENTが変更された場合などは、必要に応じて変更が必要です。

関連ページ(施策):
  クローラーの巡回を拒否する指定
  クローラーの巡回を希望する指定

関連ページ(施策):
  クローラー
  robots.txt
  メタ・ロボット
  Yahoo Slurp
  Googlebot
  msnbot
  Baiduspider
  NaverBot


※ 本資料(「SEOの施策(方法)とSEOツールの紹介」または「SEOの用語集」)の最終更新は2009年の夏です。 そのため一部にリンク切れや古い情報を含むことをご承知おきください。