COCA (Corpus of Contemporary American English)
Download
Report
Transcript COCA (Corpus of Contemporary American English)
COCA
(CORPUS OF CONTEMPORARY
AMERICAN ENGLISH)
北尾 謙治
http://kkitao.e-learningserver.com/kitao/
COCAとは?
4億語のアメリカ英語
1990~2009年までの各年2000万語
BNCの4倍
現在も更新中であるため、最近の言語変
化を研究するのに最適
spoken , fiction , popular magazines ,
newspapers , academic journalsの5ジャ
ンルから各年、同じ分量を収録。1ジャンル
当たり約400万語
詳細リストをダウンロードできる
http://www.americancorpus.org/help/COC
ASources_2009_08_21.zip
各ジャンルは更に詳細に分かれており、特
定分野に絞って検索することも可能
タグ付け
文章の情報付き
特徴
現代のアメリカ英語
1990年から 歴史的な変化を見られる
一般的なもの
Spokenは原稿で、実際に話されたものでは
ない
弱点
1990年以後の英語
アメリカ英語
イギリス英語、他の英語は分からない
4億語
それ以前は見られない
十分な大きさか
均衡コーパスの保証が不明確
話し言葉は実際のものでない
COCA
登録
右上の log in
登録済みのe-メール
メールアドレスとパスワードで利用
http://www.americancorpus.org/
簡単な検索方法
タイプすることを避ける
テンプレートを使用する
Introduction
exact word or phrase, wildcard or part
of speech, or combinations of these.
基本的にBNCの検索と同じ
http://kkitao.e-learningserver.com/kitao/COCA.pdf
小橋川さんの解説
練習問題付き
プロジェクト
Terrorism
2001年以後急激に増加
Spokenとnewspaperに多い
japan|japanese
BNCとCOCA1990-1994を比較する
どのジャンルで多いかを見る
COCAでは年代の変化も見る
flat.[n*]
BNCとCOCA1990-1994を比較
The End
http://kkitao.e-learning-server.com/kitao/