○阿部 仁志 (長岡技術科学大学), 亀井 剛次 (NTTコミュニケーション科学基礎研究所 社会情報研究部)、 湯川 高志 (長岡技術科学大学)
概念ベースを用いた情報検索モデルに対し、 実データによる性能評価を行って適用領域を明確化するとともに、 その検索性能改善法を考察して効果を示した。 日本語情報検索テストコレクションNTCIR-1を用いて、Booleanモデル、確率モデルと比較を行い、 検索要求単語数が場合には本検索モデルが高い検索性能を示すことを明らかにした。 しかし、検索要求単語数が中程度以下の場合に対しては検索性能の低下が認められたため、 単語間の距離に着目して概念ベースを作成する性能改善手法とDFを考慮した概念ベース作成する性能改善法を提案した。 これらの組み合わせにより、単語数が中程度以上の検索要求に対しても確率モデルと同等以上の検索性能が得られた。