ニュース

小屋 多恵子 教授 : コーパス分析

2011年8月10日に行われたオープンキャンパスには、大勢の高校生とご両親が参加して下さいました。真夏の暑い日でしたが、小金井キャンパスはこれからしっかり自分のやりたいこと、やりたいことができる学部・学科を見極めようと集まった参加者の熱意のためでしょうか、発表された気温(34.6度)よりも暑い感じがしました。夏休みも、もう後半。受験生のみなさんには頑張ってほしいと思います。

さて、来週27日のオープンキャンパスでは、模擬授業で「ことばの話」をします。言語分析には様々な手法がありますが、今回はコーパスを使った分析を紹介したいと思います。「コーパス」ということばは、最近いろいろなところで目にしたり耳にしたりするようになりました。オックスフォード新英英辞典でcorpusを引いてみると、 “a collection of written or spoken material in machine-readable form, assembled for the purpose of linguistic research”とあります。言語分析に用いられるコーパスの定義は、オックスフォードの定義に「バランスよく、系統的に集めた」を加え、「言語研究のために自然な言語データをバランスよく、系統的に集めた、機械可読テキスト形式データの集積」です。

この定義の中の「機械可読テキスト形式」に一役買っているのがコンピュータです。コンピュータの登場により、言語分析の手法がガラッと変わりました。それまでは、実際に会話や書物からこれはと思う表現を、紙片やカードに記録する収集方法が取られてきました。これには膨大な時間が必要であり、作業を行う人たちの主観で集められるため言語使用の実態を正確に反映することができないという問題点がありました。しかし、コンピュータのおかげで、データの集積時間が短縮され、バランス良く、系統的に集められたデータから客観的に言語表現の実態を知ることができるようになりました。このように、コンピュータは言語研究にも貢献しているのです。

現在、コーパス分析からどのような結果をみなさんにご紹介しようか?検討中です。よかったら模擬授業をのぞきに来て下さい。データや分析結果以外に、その手法や分析ソフトにも興味を持ってもらえるかもしれません。お待ちしています。

ただいま分析中