あいまい検索



あいまい検索(fuzzy search)、曖昧検索

あいまい検索とは、指定したキーワードを柔軟に解釈して検索精度を向上させる技術です。柔軟に解釈するとは、同じ事や物に複数の表現がある「表記のゆれ」や「表記の違い(同義語)」などに対応して、指定されたキーワードと完全に一致していなくても、検索対象の中から類似したデータを探し出すことのできる機能のことです。

「表記のゆれ」とは、送りがなが付いたり付かなかったりする言葉を指し、「引越」「引っ越し」「引越し」などがその例です。「表記の違い(同義語)」とは、同じ意味で異なる表記をする言葉を指し、「はがき」と「ハガキ」と「葉書」、「バイオリン」と「ヴァイオリン」、「鮨」と「寿司」、「米国」と「アメリカ」、「フランス」と「France」などがその例です。それ以外にも、「データ」と「データー」といった長音の有無による違い、「にっぽん」と「にほん」といった発音の違いによる表記の違い、「っ」と「つ」の違い、英語の大文字と小文字の違い、全角文字と半角文字の違い、などの多様な違いがあります。

欧米語において適用されるあいまい検索の一種に「ステミング(stemming)」と呼ばれる機能があります。ステミングとは、キーワードの単語の最後の「ed」や「ing」、「ies」などを除去して語幹を取り出し、それを基にさまざまな変化形の単語を検索する技術です。例えば、work を入力するだけで、works や working も検索します。

あいまい検索は、日本の大手検索エンジンでは、まだ十分ではありませんが、段階的に適用を拡大していますので、「表記のゆれ」や「表記の違い(同義語)」のある単語は、個別の単語を実際に検索してみて、各検索エンジンの振る舞いを確かめてみる必要があります。

ページやサイトのキーワードが「表記のゆれ」や「表記の違い(同義語)」のある単語の場合、ページ中の一部のキーワードを異なる表記にしておくと、より広く検索結果に表示される可能性があります。

関連ページ(施策):
  キーワード選定の考慮点(キーワード特性による選定)