形態素解析



形態素解析とは、日本語の文章を単語単位に分解することです。「単語単位に分解」という表現は、「分かち書き」という表現の方が分かりやすいかもしれません。

検索エンジンは、ページをインデックスする際、形態素解析を行い、ページ内の単語の出現頻度などを調査し、重要な語句を抽出し、それらの情報をデータベースに記録します。

検索エンジンは、画面で検索された際、検索語を形態素解析して単語に分解して検索するため、それぞれの単語が離れた場所に記述されていても、適切なページを見つけ出し、検索結果として表示します。

そのように、形態素解析の技術は、日本語の検索エンジンにとって、重要な技術の一つです。

ちなみに、単語をスペースで区切る言語の場合(英語など)、形態素解析は重要な技術ではありません。



   
関連サイト