○佐藤 浩史, 藤本 和則 (NTTコミュニケーション科学基礎研究所)
テキストからの知識獲得には、単語を表記ではなく意味で照合する 技術が必要である。我々は既に日常語約4万語の概念知識データ ベースを国語辞書より自動構築したが、これは類似性の相対判別を 目的としたものであった。そこで単語間類似度の統計的分布に着目し、 その標準化により疑似的な絶対判別を可能とした。 その結果、判別精度が大きく向上した。