COCA (Corpus of Contemporary American English)

Download Report

Transcript COCA (Corpus of Contemporary American English)

COCA
(CORPUS OF CONTEMPORARY
AMERICAN ENGLISH)
北尾 謙治
http://kkitao.e-learningserver.com/kitao/
COCAとは?

4億語のアメリカ英語




1990~2009年までの各年2000万語
BNCの4倍
現在も更新中であるため、最近の言語変
化を研究するのに最適
spoken , fiction , popular magazines ,
newspapers , academic journalsの5ジャ
ンルから各年、同じ分量を収録。1ジャンル
当たり約400万語

詳細リストをダウンロードできる




http://www.americancorpus.org/help/COC
ASources_2009_08_21.zip
各ジャンルは更に詳細に分かれており、特
定分野に絞って検索することも可能
タグ付け
文章の情報付き
特徴
現代のアメリカ英語
1990年から 歴史的な変化を見られる
一般的なもの
Spokenは原稿で、実際に話されたものでは
ない
弱点

1990年以後の英語


アメリカ英語



イギリス英語、他の英語は分からない
4億語


それ以前は見られない
十分な大きさか
均衡コーパスの保証が不明確
話し言葉は実際のものでない
COCA

登録




右上の log in
登録済みのe-メール
メールアドレスとパスワードで利用
http://www.americancorpus.org/
簡単な検索方法


タイプすることを避ける
テンプレートを使用する



Introduction
exact word or phrase, wildcard or part
of speech, or combinations of these.
基本的にBNCの検索と同じ

http://kkitao.e-learningserver.com/kitao/COCA.pdf


小橋川さんの解説
練習問題付き
プロジェクト

Terrorism


2001年以後急激に増加
Spokenとnewspaperに多い

japan|japanese



BNCとCOCA1990-1994を比較する
どのジャンルで多いかを見る
COCAでは年代の変化も見る

flat.[n*]

BNCとCOCA1990-1994を比較
The End
http://kkitao.e-learning-server.com/kitao/