1 - Index of
Download
Report
Transcript 1 - Index of
日本語 WWW 情報を用いた
COCET3300
英単語学習支援に関する研究
情報・知能工学専攻 博士前期課程2年
093750 渡邉 雄大
指導教員 河合 和久
研究背景
• 高等専門学校(高専)
五年間の一貫教育によって専門的知識、技術を習
得させることを目的とした高等教育機関
高専教育の成果は企業側から高く評価されている
• 高専の学生は大学生と比べ英語力が低い
学年が上がるたびに専門科目の授業や実験が多
くなり、英語科目の授業が減少
大学受験がないため、英語を学習する意欲が湧き
づらい
COCET3300英単語リスト
• 出現頻度の高い順に並ぶ
• 意味の内容は簡潔に記載
COCET3300学習用アプリケーション
• メディア教育開発セ
ンターが開発
• インターネット経由で
アクセスでき、誰でも
使用が可能
• e-ラーニングによる
学習機能、学習進度
の自己管理機能等
先行研究(1)
• 「Webページを用いたCOCET3300英単語学習支
援システムの開発」 (石川 哲郎,2011)
• Webページ閲覧中に英単語
にハイライトを表示
• COCET3300英単語を出現
頻度ごとにハイライトで強調
• マウスカーソルを乗せること
で意味をポップアップ表示
英語
日本語
先行研究(2)
• 「日本語WWW情報におけるCOCET3300英単語
の出現頻度に関する研究」(林 佑樹,2011)
– COCET3300英単語日本語訳のWebページ中での出
現傾向
研究目的
• ブラウザFirefoxを用いたアドオンの開発
インターネットの閲覧は英語学習の好き嫌いに
左右されない
わざわざ学習時間を取る必要がない
英単語が目に触れる機会を増やす
• 日本語文から英単語の表示
英語に苦手意識を持つ人も抵抗が少なく学習で
きる
• 登録する英単語はCOCET3300から
システムの概要
• Webページの日本語からポップアップで英
単語を表示
苦手意識を持つ人も継続して学習
• COCET3300英単語の日本語訳に類語を関
連付け
出現単語数、種類の増加を期待
• 英単語学習に役立つ機能
学習の復習、確認
大まかな処理の流れ
類語の登録
• 類語は日本語WordNetより登録
– (独)情報通信研究機構が開発
–例
• 形―型、形式、像、形態
– 英語の類語辞書をもとに開発
ポップアップ実行例
ポップアップ実行例(2)
学習支援機能
• ページジャンプ機能
– 任意の英単語が出現した最後のページを開く
• 確認テスト機能
– 現在のWebページ内に出現する英単語のテスト
• COCET3300英単語辞書機能
– COCET3300英単語に特化した辞書機能
ページジャンプ機能
確認テスト機能
COCET3300英単語辞書
①
①
検索された日本
語訳に対応する
英単語を表示
②
英単語と日本語
訳
③
選択されている
日本語の類語
④
英単語の出現回
数、確認テストの
結果
⑤
英単語に対する
簡単な解説
④
②
③
⑤
評価と検討
• 類語の追加によって得られる効果の検討
• 評価に利用するWebページ
– 初心者のためのポイント学習C言語
– 豊橋技術科学大学
– 日本生命保険相互会社
• 評価システム
– 類語ありシステム(システムA)
– 類語なしシステム(システムB)
– 2011年度調査に用いたシステム(システムC)
結果(1)
• 初心者のためのポイント学習C言語
– 総単語数37499
総出現COCET3300
英単語数
Webページにおける
COCET3300単語の割合
英単語種類
システムA
22786
12.64%
934
システムB
5563
12.64%
457
システムC
2747
7.67%
227
system
sure
mean
council
prove
modulate
analysis
promise
function
pair
electrical
balance
neuron
meanwhile
vast
insist
character
array
cash
Mars
arrangement
dye
objective
illness
airport
rail
urge
submit
overseas
bulk
witness
divert
reckon
gift
oven
bet
breakdown
rainbow
corridor
numerical
pyramid
calorie
quartz
spontaneous
torch
confer
blunt
slash
wedge
結果(2)
出現回数
450
400
350
300
250
200
150
100
50
0
英単語
結果(3)
• 豊橋技術科学大学
– 総単語数11629
総出現COCET3300
英単語数
Webページにおける
COCET3300単語の割合
システムA
15686
20.49%
731
システムB
3184
20.49%
348
システムC
1995
16.55%
189
英単語種類
system
sure
mean
council
prove
modulate
analysis
promise
function
pair
electrical
balance
neuron
meanwhile
vast
insist
character
array
cash
Mars
arrangement
dye
objective
illness
airport
rail
urge
submit
overseas
bulk
witness
divert
reckon
gift
oven
bet
breakdown
rainbow
corridor
numerical
pyramid
calorie
quartz
spontaneous
torch
confer
blunt
slash
wedge
結果(4)
出現回数
350
300
250
200
150
100
50
0
英単語
結果(5)
• 日本生命保険相互会社
– 総単語数8447
総出現COCET3300
英単語数
Webページにおける
COCET3300単語の割合
英単語種類
システムA
8232
18.73%
688
システムB
2152
18.73%
304
システムC
1125
9.97%
167
system
sure
mean
council
prove
modulate
analysis
promise
function
pair
electrical
balance
neuron
meanwhile
vast
insist
character
array
cash
Mars
arrangement
dye
objective
illness
airport
rail
urge
submit
overseas
bulk
witness
divert
reckon
gift
oven
bet
breakdown
rainbow
corridor
numerical
pyramid
calorie
quartz
spontaneous
torch
confer
blunt
slash
wedge
結果(6)
出現回数
450
400
350
300
250
200
150
100
50
0
英単語
システムBとシステムCの比較
• システムBとシステムCの出現英単語の数
– 3つのWebページ合わせて1.54倍
• システムBとシステムCの出現英単語の種類
– 3つのWebページ合わせて1.90倍
増加する割合が低い
システムAとシステムBの比較(1)
• 出現単語数の比較
– 初心者のためのポイント学習C言語:4.10倍
– 豊橋技術科学大学:4.93倍
– 日本生命保険相互会社:3.82倍
• 出現単語の種類の比較
– 初心者のためのポイント学習C言語:2.04倍
– 豊橋技術科学大学:2.10倍
– 日本生命保険相互会社:2.26倍
システムAとシステムBの比較(2)
• 1つの英単語が出現する回数の比較
– 初心者のためのポイント学習C言語:約2倍
– 豊橋技術科学大学:約2.35倍
– 日本生命保険相互会社:約1.69倍
類語による英単語再出現
• Webページ中から表示される英単語が類語
で表示される割合
– 初心者のためのポイント学習C言語:52.3%
– 豊橋技術科学大学:66.95%
– 日本生命保険相互会社:48.68%
考察
• 1つの英単語が出現する回数
• Webページ中から表示される英単語が類語
で表示される割合
繰り返し出現による継続学習の効果
まとめ
• Webの閲覧中に学習するシステムの開発
• 各種機能で英単語学習の支援
• 類語を追加で継続的な学習効果を期待
• 今後の課題は効果の検証
エビングハウスの忘却曲線
ジップの法則について
• 出現頻度がk番目の要素は全体に占める割
合が1/kに比例するという経験則
– 英単語の使用頻度のほかにも、都市の人口や
Webページのアクセス頻度などにおいて成立
1.2
1
• 出現頻度上位の要素の全体
に占める割合が他の個々と
比べ圧倒的に高くなる
0.8
0.6
1/k
0.4
0.2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
ジップの法則について(2)
• COCET3300は出現頻度ごとに並べられているが、個々
の出現頻度がどの程度であるかという情報はない
• 英単語の出現頻度を表すジップの法則を用いて算出
• COCET3300英単語はたった3300種しかない理工系英単
語群であるため、一般的に使われる全ての英単語と比
べ圧倒的に種類が少なく内容も偏りがあるため、ジップ
の法則をそのまま適応できるわけではない
• レベル分けを行う際の一つの目安として使用し、感覚
的に均等となるようあのようにレベル分けを行った