特定ページのインデックスやキャッシュを削除する方法 [LINK]



既にインデックスされているページのインデックスキャッシュを何らかの理由で早期に削除したい場合がありますが、サイトの実ページを削除しただけではインデックスキャッシュはしばらく(半年以上)そのままになってしまいます。そのため、それらを早期に削除したい場合、以下のいずれかの方法を適用する必要があります。


○トップディレクトリ直下のrobots.txt

  ┌────────────────────────
  │User-agent: *
  │Disallow: /test/
  │Disallow: /otameshi.html
  └────────────────────────

  • 上記は、/test/ ディレクトリのすべてと /otameshi.html の巡回を拒否する指定です。
  • サイトすべての巡回拒否を行う場合は Disallow: / を指定します。
  • User-agentは、特定のクローラー巡回を拒否する場合に、クローラーによって決まっている名称を記入して指定するものです。  GoogleのGooglebotクローラーは「Googlebot」、YahooのYahoo Slurpクローラーは「Slurp」がその名称です。
  • robots.txtファイルは、必ずサイトのトップディレクトリに配置する必要があります。

○ページのHEADセクション内に以下を記述(メタ・ロボット)

  <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

  • この方法は、ページ単位に有効です。
  • CONTENT="NOARCHIVE"を指定すれば、キャッシュのみ削除できます。

***

★Yahoo − 特定のページ、キャッシュを検索結果から削除したい
http://help.yahoo.co.jp/help/jp/search/indexing/indexing-12.html

★Google − 検索結果からのコンテンツの削除
http://www.google.co.jp/intl/ja/remove.html

***

Yahooは、以下URLにて「削除」を申請できます。

★Yahooサイトエクスプローラー(英語)
http://siteexplorer.search.yahoo.com/

上記でログイン(Sign In:米国Yahooのアカウントが必要)
 │
 ├ My Sites(登録URLの一覧)
 │ │
 │ └(一覧上の各個別サイトのメニュー)
 │  │
 │  ├ Exploler(ページの一覧)
 │  │ │
 │  │ └(Exploler機能の一覧上の各個別ページのメニュー)
 │  │  │
 │  │  └ Delete URL or Path(そのURLかPath配下をインデックスから削除)

***

Googleは、以下URLにて「削除」を申請できます。

申請の前提として、事前に「robots.txt」または「メタ・ロボット」の設定、または「実ページの削除」が実施済みであることが必要です。

★Google − ウェブページ削除リクエスト ツール
http://services.google.com/urlconsole/controller

***

2007年4月、Googleは、Googleウェブマスターツールの「診断」の「削除の申請」で削除を受け付けるようになりました。

申請の前提として、事前に「robots.txt」または「メタ・ロボット」の設定、または「実ページの削除」が実施済みであることが必要です。

★Googleウェブマスターツール
https://www.google.com/webmasters/tools/siteoverview