保田 祥 (国立国語研究所)、 柏野 和佳子 (国立国語研究所・東京工業大学)、 立花 幸子 (国立国語研究所)
現在,『現代日本語書き言葉均衡コーパス』(BCCWJ) に収録されている図書館サブコーパスの書籍サンプルに, 人手で文書分類の観点から情報を付与する作業を進めている. 本稿は,「語りかけ性」と呼ぶ観点に着目する. 書きことばではあるが,語りかける印象を与える表現がある. しかし,直観的に語りかけているとされたテキスト (「語りかけ性」があると判断されたサンプル) に高頻度で現れる要素の抽出を試みても, それらが積極的に作業者判断に関わっているとも言い難い. そこで,本稿はアノテーションの完了した約4,000例の観点付与結果における, アノテーターのコメント分析を試みる.作業者の記述から, 「語りかけ性」に関する判断の根拠として多様な要素が得られた (作業者は平均4%ほどのサンプルにコメントを残している). 個別の表現の出現頻度は低くとも,総体的に「語りかけ性」 があるという判断をする可能性が考えられる.たとえば, いわゆるハウツー書のようなスタイルなど, ある種の表現がまとまって見られる場合に「語りかけ性」があるとの判断がなされるのである.