【講演概要】

書籍の文章の多様性をとらえる観点付与の設計
―『現代日本語書き言葉均衡コーパス』の収録文章を対象に―

柏野 和佳子
国立国語研究所



大規模コーパスのより有効な活用のためには,収録される大量の種々の文章を, さまざまな観点から分類できることが望ましい。あらかじめ付与されているNDC や著者情報,電子化される際に付与される文章構造を表すタグや, 形態論情報などを利用して,半自動的に分類することもある程度可能である。 しかし,それだけでは不十分であると考え,現在人手による観点付与の設計を行っている。 文章の形式,文体,評価に関わる観点設計について議論する。