|
|
クローラーの巡回を拒否する指定クローラーの巡回可否は、robots.txt、メタ・ロボット、.htaccess、等で指定できます。 クローラーは指定がなければ巡回しますので、巡回を希望する場合、特に指定する必要はありません。しかし、何らかの理由、たとえば、テスト用のページのため巡回して欲しくない場合、robots.txt、メタ・ロボット、.htaccess、等で指定することで、巡回を拒否できます。 ○トップディレクトリ直下のrobots.txt
┌──────────────────────── │User-agent: * │Disallow: /test/ │Disallow: /otameshi.html └────────────────────────
○ページのHEADセクション内に以下を記述(メタ・ロボット)
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
*** robots.txtまたはメタ・ロボットの指定は、すべてのクローラーが守ってくれるわけではありません。 大手検索エンジンのクローラーはだいたい問題ないですが、行儀の悪いクローラーもいますので、巡回されたくないページは、他ページからリンクを張らない、そのページに記載されている外部リンクをクリックしない(リンク先で記録され自動でバックリンクを張られることがしばしばあるため)という注意も必要です。 なお、間違いなく巡回を拒否したい場合は、.htaccessによる拒否を行うか、Basic認証やCGIによる認証の対応が必要です。 *** クローラーによる巡回は、JavaScriptを使うアクセス解析ツールでは記録されません。CGIまたはSSIを使うアクセス解析ツールか、ウェブサーバーの生ログの参照で確認できます。 |