田中 匡、ジェプカ・ラファウ、荒木 健治 (北海道大学大学院情報科学研究科)
裁判の判決文の類似性を判定するシステムを提案する。 裁判の判決文は長文化する傾向があり、構文解析を行うことは容易ではない。 そのため単語間の関係性を保持した状態で類似性を判定するには、 膨大な辞書を人手により作成する必要性がある。 しかしながら辞書作成には多大なコストがかかり、 網羅性の面でも十分とは言えない。そこで本稿では、 語彙チャンクを用いることで、 単語間の関係性を保持した状態で類似性の判定を行う手法を新たに提案し、 得られた情報を用いて判決文の類似性を考慮し、量刑の推定を行った。 結果として、相対誤差の減少が見られ、 語彙チャンクを用いた裁判の判決文の類似性を考慮した量刑推定システムの有効性が確認された。