「実践コーパス言語学」(1988)と「英語コーパス言語学」(1988)を購入した

 「実践コーパス言語学 英語教師のインターネット活用」(1998) と「英語コーパス言語学 基礎と実践」(1998) を購入した。

 コーパスもしくは電子コーパスとは、「言語研究に使用されることを想定して、実際に書かれたり話されたりした言語をコンピュータ上で利用可能にしたテキストの集合体のこと」であると「英語コーパス言語学」にある(p.17)。

実践コーパス言語学 (1998)

英語コーパス言語学 (1998)

 英語コーパス言語学の歴史が「英語コーパス言語学 基礎と実践」の「第1章 英語コーパス言語学とは何か」に素描されている。

 その冒頭を少しだけなぞると、最初の大規模なコーパスは、Brown Corpus とほぼ同時期に、1959年のイギリスはロンドンで始まったらしいが*1、「コーパスの機械可読化(電子化)が行われなかったことから、現代のコーパス言語学の始まりというより、むしろ前駆的なものと見るべきであろう」と考えられているようだ。世界最初の電子コーパスといえば、Brown Corpus。「1961年に開始し1964年に完成した」という。その後、チョムスキーによるコーパス批判の影響が大きかったらしく、コーパス言語学は閉塞し、「その復活は1980年代後半を待たなければならなかった」という。コーパス言語学は、誕生の地であるアメリカ合州国を離れ、ヨーロッパに根づくことになった。1977年の ICAME (International Computer Archive of Modern English)と1976年以降の OTA (Oxford Text Archive)は、忘れてはならない動きであり、コーパス言語学のとりわけ1980年代以降の発展はめざましいものがある…。

 自分はコーパス言語学のど素人だから、そのまとめなどあてにならないが、冒頭だけなぞると、こんな感じになる。

 ことばは、そのとき、そのときで、創造的な営みとなる。確かにそうなのだが、たとえば、ビッグデータという膨大なコーパスをつかって、KWIC*2コンコーダンサー*3による検索によって、頻度や具体的使用例が瞬時にわかることは、演繹的な学習から帰納的な学習への転換を考える試みとなり、母語話者でないものにとって、外国語学習の一助になることは確かなことだろう。

 というのも、「実践コーパス言語学」の第1章冒頭に、次のようにある。

 英語教師の一番の悩みは何かと問われたら、「本当のところ英語がよくわからないこと」と答える人が多いのではないでしょうか。(p.1)

 気になる表現が、「英語という言語体系の中でどのような位置づけにあるのかという気の遠くなるような疑問に正確に答えてくれる者はそう身近にいるわけではなく、せいぜいALTに尋ねてみても、彼/彼女の狭い言語体験からの個人的な印象しか手にすること」(「実践コーパス言語学」)ができないのだから。

 「パソコンにコーパスとコンコーダンサーを入れておくと、授業の中でおかしな表現に出合ったときにすぐ、それが本当に使われているかを検証することができます」(「実践コーパス言語学」)。

 なるほど。

 少しずつでも、コーパス言語学に触れていこうと思う。

 

 

*1:  Crystal (1996)によれば"the first large corpus of English-language data"と呼ばれたものが、University College London の Randolph Quirk の The Survey of English Usage (SEU)計画であるらしい。(「英語コーパス言語学」p.5)

*2:KWICとは、Key Word In Contextの略。「検索した語をその前後の文脈の中で表示したもの」

*3:コンコーダンサーとは、検索ソフトの一種。コンコーダンサーの機能としては、KWIC表示機能、元のテキストファイルを見ることが可能、頻度など統計的機能のあるものが基本。