「あいまい検索」とは、
キーワードが完全に一致していなくとも類似のキーワードの検索結果を表示する検索手法です。
(参照:ネット王子)
インターネットで検索をするとき、検索語が完全に一致していなくても、
類似のデータを検索できるように検索エンジン側で設定されています。
そのように「キーワードがあいまいであっても検索できる」ということから
「あいまい検索」という名前が付きました。
通常、正規化されていない対象を検索する場合、
表記揺れや同義語の違い、別名での表現、主テーマと検索語のずれ、誤植など
さまざまなノイズが混入します。
検索システムでは、これらに対して多様な方法を適用しています。
例えば、データベースの検索言語であるSQLでは、
検索対象文字列が部分一致するようなレコードを抽出することができます。
また、テキストの処理に柔軟な機能を提供するPerl言語においては、
正規表現を用いたパターンマッチにより、さらに複雑なパターンによる検索処理ができます。
これによって、アルファベットの大文字小文字、
全角と半角、「っ」と「つ」などを区別せずに検索したり、
「米国」というキーワードで「アメリカ」「USA」などの同義語や、
「にほん」と検索した時に「二本」と「日本」、更には「三本」といった
類似するキーワードを検索することができるようになります。
この時の結果の表示範囲については、検索エンジン側の設定によって異なります。
このようなあいまい検索を実現することで、
データベース検索などにおいて、正確な名前を記入できないケースが多いと
予測されるような場合に近しいものから検索対象を探し出すことが出来るようになりました。