学習者コーパスを使用した研究

Download Report

Transcript 学習者コーパスを使用した研究

学習者コーパスを使用した研究
学習者の誤りとは?
• Cambridge Learners Corpus
• 文法、語彙、パンクチュエーション、スペル
• 語の脱落・余剰・置換、変化形、派生形、加
算性、コロケーション、イデオム、語順、時制
など80種類ほど
•
•
•
•
•
•
•
スペル
発音
イントネーション
ストレス
文体
文語・口語
方言・職業語
• ルーベンカトリック大学
• 主に7つ
– 文法
– 語彙
– 語順
– 脱落
– 追加
– 表現の丁寧さ
The NICT JLE Corpus に見る‘英語学
習者の発表語彙の使用状況’
• 投野由紀夫
• SSTレベル別の語彙リスト比較
– 各レベルでどのような語彙が使用されているか
– 各レベルで語彙サイズはどのように変化するか
– 英語力が異なると使用語彙にどのような違いが
見られるか
• SSTレベル別文構造・コロケーション比較
– 文の長さ、複雑さはどのように変化するか
– レベル別にどのような文構造を使用しているか
– 単語同士の結びつき(コロケーション)の知識はど
のように発達しているか
• SSTの9レベル
– 被験者数
– 総語数
– 平均発話語数
– 異なり語数
– TTR
– 文の平均長
• レベル別語彙リストを統計的に比較
• レベル別n-gramを調べて、使用されている連
語の異なり
• レベルが上がると発話量が増える
– 338-1632語
• レベルが上がると語彙が豊富になる
– 200語ごとの標準TTR
– 36.67%—50%弱
• レベルが上がるとより複雑な文を使えるよう
になる
– 3--9語
• レベル間の語彙リストの比較
– レベル別特徴語の比較
• 下位レベル
つなぎ言葉
• 下位、中位レベル 基本動詞による短文の羅列
• 中位レベル以上 強調の副詞の多用
that節の多用
接続詞の多用
冠詞の使用
• 上位レベル
代名詞youの多用
• レベル別の単語連鎖比較
– 決まり文句表現の使用
– 過去形の使用
– 従属節・関係節の出現
• 結論
– 発話全体に関する特徴
•
•
•
•
•
平均発話語数は増加
標準TTRも増加
語彙も豊富
平均発話長は長くなる
構造も複雑になる
• 語彙リストの相対頻度比較
– 下位レベル
– 中位レベル
– 中位れべるから
– 上位レベル
つなぎ言葉
基本動詞中心の短文
that節、接続詞、冠詞
強調の副詞の多用
youの効果的な使用
• 単語のn-gram分析
– 下位
– 上位に行くにしたがって
– 中位以上
決まり文句表現
構造中心の連鎖
過去形を含む連鎖
従属節、関係節
• 今後の課題
– 形態素解析、構文解析、エラー分析
– 特定の構文に特化した分析
• 発達段階により使用方法が異なる
• 今日の第二言語習得研究の理論や知見と組み合わ
せて分析
• 自動習得レベル判定、自動エラー判定、エラーを含む
コーパスの自動分析
日本人英語学習者の
要求の発話の発達
• 金子朝子
• 以下の3つが学習者の要求の発話に影響す
る重要な要素
– 間接性の程度
– ストラテジーの使用頻度
– 修正の使用
• 上記を英語母語者と比較
• 学習者は全般的に母語話者より直接的な要
求を行う
– 中級レベルが最も直接的
• 英語運用能力が低いほど、ストラテジーの使
用頻度が低かった
• 母語話者は仮定法などの構文をよく使用した
が、学習者は疑問文やpleaseを修正の方法と
して使用
– レベルが上がっても同様
– 高いレベルでは、母語話者との同様の間接性が
用いられた
日本人英語学習者の
英語冠詞習得傾向の分析
• 和泉 絵美 & 伊佐原 均
• 内容語に比べて、冠詞のような機能語は具
体性を欠いており、実態がかなりとらえにくい
ため
• 冠詞という機能が母語である日本語にないた
め
• 47種類のエラータグの最も多いのが冠詞
• 学習者の習熟度により出現傾向に違いがあ
る
•
•
•
•
•
•
脱落
余剰
置換
上記と習熟度の関係を明らかにする
エラーは、初級、中級、上級と減る
脱落タイプは3エラーの中で最も多いが、上
記同様、上のレベルほど減る
• 余剰と置換タイプはレベルが上がるほど増え
る
• 余剰タイプは初級で最も少なく、置換タイプは
上級では最も少ない
• パタン比較
–1
–2
–3
–4
–5
a,anがthe
theがa,an
anがa
aがan
a,an,theがthis、that,oneなど
– パタン4はほぼなし
• パタン1が3レベルとも最も多く(ほぼ半数か
それ以上)、初、中、上級と減る
• 余剰タイプのパタンはすべて定冠詞
– 上級ほど不定冠詞
– しかし、大きな差はない
• 脱落タイプのパタンはすべて不定冠詞
• 結論
– エラーで最も多いのが冠詞
– 3レベルすべてで脱落タイプのエラーが最も多い
– レベルが上がるにつれてエラータイプが分散する
– 置換、余剰タイプのエラーでは、定冠詞を過剰使
用する傾向がある
– 脱落タイプでは、府定冠詞の方がより頻繁に起こ
る
– その原因は日本語の影響と考えられる
The End