キーワードの概念と

Download Report

Transcript キーワードの概念と

2回目
キーワードの概念と課題設定(R1)
• 達成目標
目標1
○
検索課題をキーワードで表現できる
目標2
_
Web情報を利用できる
目標3
_
情報源の特性を理解し情報を利用できる
目標4
個人的達成目標の設定
?
1
達成目標
+
キーワードは名詞であることを認識できる
こと
+
課題の設定には基礎知識が必要なことを
認識できること
2
情報は文字で伝達される
• 情報検索は文字 (テキスト)で行う
– 情報は文字(テキスト) で発信されるので情報検
索も文字(テキスト)で行う
– ワープロの文章から改行やフォントなどのフォー
マットを取り除いた文字列がテキスト .txt
• キーワード
– 情報検索に使用する原文中の文字(テキスト)を
キーワードという
– 地図検索、イメージ検索、映像検索など情報の形
態にかかわらずキーワードには文字を使用
3
1.キーワード
• キー
– 車の車軸から車輪に動力を伝えるために打ち込まれたく
さびを意味する(自動車のタイヤ交換のボルトに相当)
• キーワード
車軸:情報検索者 車輪:原文情報
– キーワードは検索者と情報を結びつけるキーとなる文字
– 概念で絞り込むには3語以上必要
4
文字による情報の伝達
• 情報は文字 (テキスト)で伝達される
– 情報が複雑・専門的になるほど文字が使用され
る
– 情報検索も文字 (キーワード)で検索する
• 情報の媒介物
– 文字、音声、画像、映像
– 画像や映像の内容も文字で説明される
– 図・表・写真は文字情報を伝達する補助情報とし
て有効
5
情報検索とキーワード
• Information retrieval
– 情報を検索すること
– 情報検索とは原文(1次情報)の存在する場所
を見つけること
– 情報収集とは原文(1次情報)を探し出し入手
すること
• Information search
– 情報を単に探すこと
6
1-4情報と情報検索
情報検索の英訳
意味
information
retrieval
情報を検索(回収)すること。原
文(一次情報)の所在を明らか
にし原文を入手すること。
information
search
情報がどこにあるか探し出すこ
と(探る、調べる、たどる)
7
キーワードB
キーワードA
原文
8
アバウトネス
• キーワード A
– 検索者のキーワード
– 検索者の意味
• キーワード B
– 著者のキーワード
– 著者の意味
• 検索者の意味は、著者の意味と一致しない
9
2.キーワードは名詞
• 情報の内容は複数の概念を含む
– 情報検索は複数の概念を表現するキーワードでデータ
ベースを検索する
• 概念は名詞で表現される
– 名詞
事物の名称を表す語
• 普通名詞<固有名詞
– 動詞 事物の動作・作用・状態・存在を表す語
– 形容詞 物事の性質や状態を表す語
• キーワード A
– 検索者が入手したい情報の持つ概念(アバウトネス)を表
現する
10
キーワードの種類
• 数字
– 「4月18 日」も 「4月」「18 日」もキーワードとして有効
• 見出し
– 見出し、副見出し、表題、 図表の説明文なども対象
• 固有名詞
– キーワードとして最も有効
• 人名>団体名、会社名>地名>普通名詞の順に有効
– 人名がキーワードとして最も有効
– 情報は人によって創造され発信される
• 形容詞
– 名詞の概念を限定するキーワードとして使用できる
11
複合名詞
• 複合名詞
– 複数の名詞が連結して一般的な意味をもつ名詞
– 狭い意味概念を持つことからキーワードとして有効
複合名詞
1 世界地図
複合名詞を構成する単語
世界
地図
2 児童扶養手当 児童 扶養 手当 扶養手当
3 水質悪化懸念 水質
悪化
懸念
12
• 動詞
– 概念を表現しないためは基本的に使用しない
– 「管理する」「説明する」などのように、「(名詞)と(する)」
で構成される動詞では名詞部分がキーワードとして有効
• 例: 管理する → 管理
•
歓迎する → 歓迎
•
開通する → 開通
• 英文
–
–
–
–
全ての単語がスペースで区切られている
全ての単語をキーワードとして扱うことが可能
全ての言葉がキーワードとして使用可能
英語でも名詞がキーワードの基本
• 情報の概念は名詞で表現される
13
課題1 キーワードの概念と課題設定
―A 新聞記事からキーワードの切り出し-
• 達成目標1
– 検索課題をキーワードで表現できる
• キーワードの概念の理解
– ①情報は文字(テキスト)で流通している
– ②概念を表現するキーワードは名詞であることを
理解する
– ③重要なキーワードは見出しや最初の段落に含
まれる
• 提出画面で課題の内容を確認する
14
新聞記事の処理
• 新聞記事の選択
– 最近の新聞から興味のある1記事を選択する
– 500 字以上の記事を使用する
– インターネット上の新聞記事は使用しない
• 範囲の確認
•
•
•
•
「見出し(表題)」
「副見出し」
「本文」と
「写真/図/表の説明」
15
切り出しの確認
• 切り出し
– 全ての文字列がキーワードになる
– 最少単位の単語に分解する
– 名詞がキーワードになる
• 数字もキーワードになる
– 新聞紙名、発行年月日、(著者)、発行者もキー
ワードになる(書誌事項)
• 重要なキーワード
– 重複する文字列は有効キーワード
– 見出しには有効なキーワードが含まれる
– 動詞と形容詞の重要性は低い
16
記事の例
見出:チリ北部でM8.2の地震 日本への津波「調査中」
日付:2014年4月2日(朝日新聞)
写真:南米チリ沖で1日に発生した地震直後、津波警報でスタ
ジアムに避難した、震源地に近いチリ北部イキケの人たち
本文:南米チリ北部で現地時間1日午後8時46分(日本時間2
日午前8時46分)ごろ、大きな地震があった。米地質調査所に
よると、地震の規模を示すマグニチュード(M)は8・2。震源地
は、北部の都市イキケ沖の北西約95キロで、深さは約10キロ
と比較的浅い。
17
切り出しの例:
• 南米チリ北部で現地時間1日午後8時46分(
日本時間2日午前8時46分)ごろ、大きな地
震があった。
• 南米/チリ/北部/で/現地時間/1日/午後/8時/4
6分/(/日本時間/2日/午前/8時/46分/)/ごろ
、/大きな/地震/があった。
– 午後/8時/46分⇔午後8時46分 (使いやすい形)
– 名詞を意識する
18
切り出しの例
• 米地質調査所によると、地震の規模を示すマ
グニチュード(M)は8・2。震源地は、北部の
都市イキケ沖の北西約95キロで、深さは約1
0キロと比較的浅い。
• 米/地質調査所/によると、/地震/の/規模/を/示
す/マグニチュード/(M)は/8・2/。/震源地/は、
/北部/の/都市/イキケ/沖/の/北西/約/ 95キロ
/で、/深さ/は/約/ 10キロ/と/比較的/浅い/。
19
作成するキーワードリスト P95
• 5)記事内容順
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
情報活用
目的
重要性
場合
情報
価値
統治
戦争
商業活動
他者
有利
立場
競争
勝つ
目的
場合
情報
6)あいうえお(ソート)順
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
ビジネス
意思決定
意味
価値
価値
活用
競争
主体
重要性
勝つ
商業活動
場合
情報
情報活用
戦争
相手
他者
達成
20
7.100文字あたりのKW数
• 7-1:
– 表題を含めた全文字数A
• 7-2:
– 重複を除いたキーワード数B
• 7-3:
– 100 字あたりキーワード数=B÷A×100
• 新聞記事は10程度以上
21
100文字あたりのキーワード数(8以下の例)
学籍番号
12011146
12012150
12012004
12012031
12012122
12012094
12012053
12012021
12011111
12011086
12012090
12012140
12012141
12012014
12012069
12012107
12012073
kw/100字
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
学籍番号
12011144
12012007
12012059
12012119
12011021
12012019
12012121
12012165
12012160
12012128
12012064
12012024
12012043
12012080
12012157
12012057
12012078
kw/100字
4
4
4
4
5
5
5
5
6
6
7
7
7
7
7
7
7
学籍番号
12012102
12012109
12012116
12012058
12012030
12012156
12012171
12012114
12012120
12012166
12012066
12012093
12012048
12012123
kw/100字
8
8
8
8
8
8
8
8
8
8
9
9
9
9
22
スキャン記事と網掛
けテキスト文
(次回までに作成)
• 新聞記事原文
• 網かけ処理 P95
– キーワード(名詞)に
「網かけ」
– 連続したキーワード
は「 / 」で区切る
– 重複キーワードは
「アンダーライン」
新聞記事をスキャンした画像
をここに貼り付ける
• レポートUP後に
高木BOXへ提出
23
新聞記事をスキャンする方法
•
•
•
•
•
•
•
•
•
•
•
256教室のスキャナーを使用します
1.節電モードを解除
2.USBを差し込む
3.ファイル名入力(漢字変換不可)
4.基本スキャンを設定
フルカラーあるいはグレーを選択
5.出力形式をJPEGにする
出力→他の形式→JPEG→閉じる
6.原稿をガラス面に置く
7.スタート
8.USBを抜く
24
来週の準備
• 情報検索課題の設定
– Web情報検索の課題の設定
– 日本でも海外でも共通する話題
– 収集した情報の目的・目標の明示
• スキャン記事と網掛けテキスト文の完成
• 情報検索課題の設定用紙
– ページ23参照
25
まとめ 2回目
1. 文字による情報の伝達
–
文字(テキスト)で表現/伝達される
2. キーワードは原文中の文字列
–
情報の内容を適切に表現するキーワードは原文
章に含まれる文字列
3. キーワードは名詞
–
名詞(固有名詞>普通名詞の順に有効)
4. キーワードは検索者が選択
–
–
–
検索者が必要な概念(アバウトネス)を表現する
原文中の文字列と検索者のキーワードは一般に
一致しない
基礎知識・予備調査の必要性
26
27
3回目
課題1 キーワードの概念と課題設定
―B 新聞記事検索課題の設定-
• 情報検索課題の設定用紙
28
情報検索課題の設定用紙 P23
情報検索課題の設定用紙
1.情報検索対象分野: 次の分野から興味のある1分野を選択する。
哲学、歴史、社会科学、自然科学、技術、工学、工業、産業、ビジネス、経済、政治、芸術、言語、文学、コン
ピューター、教育、娯楽、旅行、スポーツ、健康、ニュース、地域、環境、ファッション、大学、企業の動向、ビジネ
ス
2.情報検索課題(題名):検索内容を20-30字程度で表現する。
________________________________________________________________________
3.情報検索内容
情報収集したい情報の内容を200~400字程度の文章で表現する。内容を良く表現できていれば検索に使用
するキーワードはこの文章の中から選択できる。自己の知識が不十分で文章を作成できない場合は事前調査
を行ってから作成する。
___________________________________________________________________________________
_____________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
4. 情報検索 (情報収集)の目的と目標
情報検索で対象とする情報を収集する理由を200~400字程度の文章で表現する
できる限り目的と目標に区別して記入すること。
目的(最終目標):何をするために情報収集をするか、収集した情報を使って最終的に何を実現したいのかを記
述する。
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
目標(実現可能性のある具体的な目標):実現可能な到達レベルを数値などで具体化したもの。収集する情報
29
の利用方法を記述しても良い。
________________________________________________________________________
情報検索課題の設定の練習
• 練習問題
– スキャン記事と網掛けテキスト文。
– 重要と思われる5キーワードを使用した場合の、
情報検索内容(3)、情報収取の目的(4)、目標(
5)を完成しなさい。
– 同じ記事を使って別の情報検索内容(3)、情報
収取の目的(4)、目標(5)を設定し、その場合に
想定される、キーワードを選択しなさい。
• 同じ情報が含まれていても、目的によって、
使用するキーワードが異なる。
30
例1
• 目的1
– 日本原電が活断層の調査のために作成したデー
タが信頼できるか検討する
– 日本原電 and 活断層 and 音波探査
• 目的2
– 敦賀原発付近の活断層に関連する情報を収集し
、敦賀原発の安全性について考える。
– 敦賀原発 and 活断層 and 調査
• 目的によりキーワードが異なることを理解する
31
例2
「ダイオキシンの魚類に対するホルモン作用」
• 目的
– 1) 河川の魚類の保護
– 2)ホルモン撹乱作用のメカニズムの解明
– 3)人類への女性ホルモン様活性を持つ化合物の除去
• 目標
– 到達可能な目標例:1)
– 対策を考えるために1年間で実態調査をする
– 発生源を特定する。
– 除去方法を開発する
32
情報検索課題の設定用紙の意義
– 情報検索の前に検索内容をできる限り明確にす
る努力が良い結果につながる
1. 情報検索課題
2. 情報検索内容
3.情報収集の目的 P22
4.情報収集の目標 P22
5. 日本語キーワードの決定 P24
6. 英語キーワードの決定 P24
7. 検索式の決定(次回)
33
1.情報検索課題(題名) P22
– 情報検索内容を20-30字で簡潔に表現する
• 新聞の見出しや図書の題名に相当
• 主たるキーワードを含むように作成
– 一般的な基礎知識を得る課題は不適当
• 広範囲にわたる情報収集が必要
• 図書の方が効率的で高い信頼性
– 容易に理解可能な内容も不適当
• 例)スポーツ選手の成績など
34
2.情報検索内容 P23
• 情報検索の内容を200字~400字で表現する
– 抽象的な表現や一般的な表現を避ける
– 具体的な内容を含む文章を作成する
– 検索に使用するキーワードは作成した文章の中
に含まれる
35
3.情報収集の目的 P22
• 目的により必要な情報が決まる
– 情報検索内容からキーワードや検索式を確定で
きるが、必要な情報は決まらない
– 例:対象期間、対象地域、対象分野、専門性など
• 目的は意志を実現する最終到達点(ゴール)
– 最終到達点(レベルや状態)のイメージ
– 「何をするために情報収集を行なうのか」を記述
する
36
4.情報収集の目標 P22
• 目標には目的をより具体化したもの
• 目標は実現可能性のある目的
– 目標が達成できれば、実現可能性のある到達レ
ベルが次の目標となり、最終目標が目的となる
– 到達レベルを数値示したり、利用方法を記述して
も良い
37
あいまいな目的・目標と検索内容
• あいまいな検索内容
– 広範囲の情報収集が必要となる
– 情報検索内容から的確なキーワードが選定でき
ない
• あいまいな目的・目標
– 多くの情報を収集しても、評価基準があいまいで
情報の選択や必要な情報の特定が困難になる
– 情報収集の過程で目的と目標の修正が必要とな
り、情報検索をやり直すことになる
38
5.日本語キーワードの選択 P24
• キーワード数
• 概念をキーワードで表現するには3~5ワ
ードが必要
• キーワード数の選択
– 情報検索課題に重要な概念(アバウトネス)を示
す文字列を、原文中の文字列と一致させる
– 情報検索内容(200~400 字)から、重要な概念を
表現すると思われる名詞を5ワードを切り出す
– 原文(著者)が重要としている概念ではない
39
6.英語キーワードの決定 P24
• 日本語キーワードに相当する英語キーワード
を記述する
– 日本語のキーワード数と英語キーワード数は異
なる
– 辞書の最初に記述されている単語を選択するこ
とが多いが、適切な英語キーワード選択のため
には、複数の意味を把握したうえで選択する
• 微妙な意味の違いを把握するのは難しい
40
和製英語
• 日本人による英語情報しか得られない
– 表10 日本語でしか通用しない和製英語の例
日本語
キーワード
和製英語
英語
Food Habit
食文化
Food Culture
Food Manner
環日本海
Japan Sea Rim Far East Sea
41
7. 検索式の決定(次回)
• AND
– 全てのキーワードを含む
• OR
– いずれかのキーワードを含む
• NOT
– キーワードを含まない
• 次回
42
レポートの提出
• Webの画面からの提出
• 提出時間はサーバ側で表示
• 評価
– 遅れると-10%/日,
– 1週間以上は-50%で評価
• 他人の内容をコピーして提出した場合
– 原則、後で提出されたレポートは評価しない
43
レポート1 (R1)
• 提出期限
– 4月14~26日(土)
– サンプル参照
– 5月11日(土)
2weeks
• 予備調査により基礎知識を得る
• 指示事項
– 指示内容の数値などが、教科書と提出画面で異
なる場合は、提出画面の数値などを優先してくだ
さい。
44
調査結果
45
6.インターネットのメディア別利用割合は
どの程度ですか?(2013:n=136)
46
6.インターネットのメディア別利用割合
はどの程度ですか?(2012:n=148)
47
8.インターネットを使って情報を検
索したことがありますか?
• (n=136)
• ある
– 92%
• 平均キーワード数
– 2.29 (回答n=65)
– 検索式は不要
48
1章の確認
49
1.情報収集のための情報検索
•
•
•
•
•
•
•
•
•
1-1知識を深めるための情報収集
1-2目的を達成するための情報収集
1-3 情報収集の意義
1-4 情報と情報検索
1-5 情報検索とデータベース
1-6 情報検索システム
1-7 情報検索と原文情報
1-8 書誌事項
1-9遡及情報検索
50
1章1~2
情報収集の目的
1. 知識を得る(知識を深める)
– 知らないことを知る(自己学習に必要)
– 他人と同じレベルで考えることができる
2. 目的を達成する
– 目的に早く到達する
– 情報を利用して問題を解決する
3. 新しい価値や概念を創造する
– 情報を組み合わせて新しい価値を創造する
• 情報を基に自分で考える態度が重要
51
1-1知識を深めるための情報収集
• 知識を深めるための情報収集の目的
• 1: 知らないことを知る
– 他人と同じレベルで考えることができる
– 不利益を受けない
• 2: 知識構造を深め自分で考える
– 偏りのない基礎知識を習得する
– 自分の考えを持ち他人と対等に対話する
• 3: 新しい概念や視点を創造する
– 情報を組み合わせて新しい価値を創造する
52
1-2目的を達成するための情報収集
• 目的を達成するための情報収集の目的
– 目的は相手に勝つこと
– 目的が明確なので情報を最も効果的に利用できる
•
•
•
•
– 相手に対する働きかけが存在する
1: 戦争や戦いに勝利する
2: 競争に勝つ
3: 具体的な目的や目標を達成する
4: 個人の意志を実現する
53
+新しい
1-3 情報収集の意義
目的・目標の明確化
55
スタートレベルの向上
56
情報収集の効果
• ①多くの必要な情報を収集し、多くの目的解決手
段を検討することにより、より正確な判断を行う
• ②判断をして行動を起こす前に過去の事例や知
見などを収集し、スタートレベルを引き上げること
により、目的に早く到達する
• ③関連する情報を入手し、自己の知識に取り入
れ、自己の知識レベルを向上させる
• ④参考となる最新データを得ることにより競争を
有利にする
1-4情報と情報検索
情報検索の英訳
意味
information
retrieval
情報を検索(回収)すること。原
文(一次情報)の所在を明らか
にし原文を入手すること。
information
search
情報がどこにあるか探し出すこ
と(探る、調べる、たどる)
58
1-5 情報検索とデータベース
59
1-6 情報検索システム
• データベースは本来個々のデータベースファイル
• 情報検索システムをデータベースと呼ぶことも多い
• 単一の情報源からなる情報検索システム
– 朝日新聞記事データベース
– 雑誌記事索引など
• 複数の情報源からなる情報検索システム
– 100を超えるデータベースファイルを検索
– EBSCOhost,ProQuest,Dialogなど
60
情報検索システム
• 検索エンジン
– Gogool、Yahoo
• 日経テレコン
– 日経四紙
• 朝日DNA
– 朝日新聞
• 日外Web
– 雑誌記事索引
• NDL-OPAC 国立国会図書館蔵書検索
– 日本で発行された図書・雑誌記事
• ProQuest
– 主要な世界の専門誌・学会誌 原文情報を含む
61
講義で使用する主な情報
– Web情報
– 図書情報
– 新聞記事情報
– 雑誌/専門誌記事情報
– 「日本語」と「英語」の情報
62
1-7情報検索と原文情報
• 情報検索における情報とは原文(1次情報)
– 著者が自ら作成したオリジナル情報
– 著作権法の著作物が代表的な情報
• 1次情報が必要な時
– 論文の論拠/新しい価値の創造
– 意思決定の判断材料
• Web情報には原文情報だけでない
– 伝聞に基づいて作成された二次情報も多い
63
1-8書誌事項
• 検索対象とする書誌事項は原文情報の所
在と内容を表現する項目からなる。
書誌事項
内容
1
著者
情報発信者の氏名
2
所属
著者の所属
3
表題(内容情報) 情報や論文のタイトル
4
抄録(内容情報) 情報の概要、アブストラクツとも呼ばれる
5
出版年月日
情報が公開された年月日
6
雑誌名
論文が掲載された雑誌名
7
巻・号・ページ
論文が掲載された雑誌の巻・号・ページ
8
出版社
雑誌や図書の出版社
9
分類
情報のデータベース内の分類
64
情報の信頼性
•
•
•
•
•
•
情報は人によって創られることから
信頼性の高い情報
①情報発信者である著者名
②著者の所属する団体などの固有名詞
③情報の発信日時
④出版社,新聞社のような情報発信責任者
が明示されている
65
1-9遡及情報検索
• 情報検索では過去30年程度の情報を検
索可能
• 特定の話題に関する一定期間の複数の記
事を時系列で並べることにより、過去から
現在に至るまでの変遷を理解できる
– 現在の状況をより深く分析することが可能
• 過去に遡って情報収集を行う検索を遡及
情報検索と呼ぶ
– 遡及情報検索では過去の情報も情報としての
価値を有している。
66