|
|
.htaccess.htaccess(ドット・エイチ・ティー・アクセス) .htaccessとは、ウェブサイトのアクセス制御を設定するファイルの名称です。 .htaccessは、巡回頻度が多すぎるクローラーのアクセス制御に使用することがしばしばであり、本項はその点に絞って解説しています。 .htaccessは、ウェブサイトのトップディレクトリに保管します。 .htaccessの記述例: ・特定IPアドレスからのアクセスを拒否 ┌──────────────────────── │Order allow,deny │Allow from all │Deny from IPアドレス1 │Deny from IPアドレス2 │ : └──────────────────────── ※ IPアドレスは、「12.345.6.789」のように指定します。 ※ 複数のIPアドレスを指定する場合、複数行を指定します。 ・特定HTTP_USER_AGENTのアクセスを拒否 ┌──────────────────────── │SetEnvIf User-Agent "ユーザーエージェント1" deny_ua │SetEnvIf User-Agent "ユーザーエージェント2" deny_ua │ : │Order allow,deny │Allow from all │Deny from env=deny_ua └──────────────────────── ※ “deny_ua”は変数名ですので、上記のような任意の名称を使用できます。 ※ 複数の「ユーザーエージェント」を指定する場合、複数行を指定します。 ※ 「ユーザーエージェント」には、以下等を指定します。 ・Slurp … Yahooのロボット ・Googlebot … Googleのロボット ・msnbot … MSN、Windows Live Searchのロボット ・Baiduspider … 百度のロボット ・NaverBot … NAVERのロボット ・Yeti … NAVERのロボット ・YodaoBot … 有道のロボット ・Teoma … Askのロボット ・BecomeJPBot … Becomeのロボット ・ichiro … gooのロボット 上記は、クローラーを識別可能な、HTTP_USER_AGENT中の一部の文字列です。 したがって、robots.txtの指定と同じとは限らないことに注意してください。 HTTP_USER_AGENTが変更された場合などは、必要に応じて変更が必要です。 関連ページ(施策): クローラーの巡回を拒否する指定 クローラーの巡回を希望する指定 関連ページ(施策): クローラー robots.txt メタ・ロボット Yahoo Slurp Googlebot msnbot Baiduspider NaverBot |