Transcript キーワードの概念と
2回目 キーワードの概念と課題設定(R1) • 達成目標 目標1 ○ 検索課題をキーワードで表現できる 目標2 _ Web情報を利用できる 目標3 _ 情報源の特性を理解し情報を利用できる 目標4 個人的達成目標の設定 ? 1 達成目標 + キーワードは名詞であることを認識できる こと + 課題の設定には基礎知識が必要なことを 認識できること 2 情報は文字で伝達される • 情報検索は文字 (テキスト)で行う – 情報は文字(テキスト) で発信されるので情報検 索も文字(テキスト)で行う – ワープロの文章から改行やフォントなどのフォー マットを取り除いた文字列がテキスト .txt • キーワード – 情報検索に使用する原文中の文字(テキスト)を キーワードという – 地図検索、イメージ検索、映像検索など情報の形 態にかかわらずキーワードには文字を使用 3 1.キーワード • キー – 車の車軸から車輪に動力を伝えるために打ち込まれたく さびを意味する(自動車のタイヤ交換のボルトに相当) • キーワード 車軸:情報検索者 車輪:原文情報 – キーワードは検索者と情報を結びつけるキーとなる文字 – 概念で絞り込むには3語以上必要 4 文字による情報の伝達 • 情報は文字 (テキスト)で伝達される – 情報が複雑・専門的になるほど文字が使用され る – 情報検索も文字 (キーワード)で検索する • 情報の媒介物 – 文字、音声、画像、映像 – 画像や映像の内容も文字で説明される – 図・表・写真は文字情報を伝達する補助情報とし て有効 5 情報検索とキーワード • Information retrieval – 情報を検索すること – 情報検索とは原文(1次情報)の存在する場所 を見つけること – 情報収集とは原文(1次情報)を探し出し入手 すること • Information search – 情報を単に探すこと 6 1-4情報と情報検索 情報検索の英訳 意味 information retrieval 情報を検索(回収)すること。原 文(一次情報)の所在を明らか にし原文を入手すること。 information search 情報がどこにあるか探し出すこ と(探る、調べる、たどる) 7 キーワードB キーワードA 原文 8 アバウトネス • キーワード A – 検索者のキーワード – 検索者の意味 • キーワード B – 著者のキーワード – 著者の意味 • 検索者の意味は、著者の意味と一致しない 9 2.キーワードは名詞 • 情報の内容は複数の概念を含む – 情報検索は複数の概念を表現するキーワードでデータ ベースを検索する • 概念は名詞で表現される – 名詞 事物の名称を表す語 • 普通名詞<固有名詞 – 動詞 事物の動作・作用・状態・存在を表す語 – 形容詞 物事の性質や状態を表す語 • キーワード A – 検索者が入手したい情報の持つ概念(アバウトネス)を表 現する 10 キーワードの種類 • 数字 – 「4月18 日」も 「4月」「18 日」もキーワードとして有効 • 見出し – 見出し、副見出し、表題、 図表の説明文なども対象 • 固有名詞 – キーワードとして最も有効 • 人名>団体名、会社名>地名>普通名詞の順に有効 – 人名がキーワードとして最も有効 – 情報は人によって創造され発信される • 形容詞 – 名詞の概念を限定するキーワードとして使用できる 11 複合名詞 • 複合名詞 – 複数の名詞が連結して一般的な意味をもつ名詞 – 狭い意味概念を持つことからキーワードとして有効 複合名詞 1 世界地図 複合名詞を構成する単語 世界 地図 2 児童扶養手当 児童 扶養 手当 扶養手当 3 水質悪化懸念 水質 悪化 懸念 12 • 動詞 – 概念を表現しないためは基本的に使用しない – 「管理する」「説明する」などのように、「(名詞)と(する)」 で構成される動詞では名詞部分がキーワードとして有効 • 例: 管理する → 管理 • 歓迎する → 歓迎 • 開通する → 開通 • 英文 – – – – 全ての単語がスペースで区切られている 全ての単語をキーワードとして扱うことが可能 全ての言葉がキーワードとして使用可能 英語でも名詞がキーワードの基本 • 情報の概念は名詞で表現される 13 課題1 キーワードの概念と課題設定 ―A 新聞記事からキーワードの切り出し- • 達成目標1 – 検索課題をキーワードで表現できる • キーワードの概念の理解 – ①情報は文字(テキスト)で流通している – ②概念を表現するキーワードは名詞であることを 理解する – ③重要なキーワードは見出しや最初の段落に含 まれる • 提出画面で課題の内容を確認する 14 新聞記事の処理 • 新聞記事の選択 – 最近の新聞から興味のある1記事を選択する – 500 字以上の記事を使用する – インターネット上の新聞記事は使用しない • 範囲の確認 • • • • 「見出し(表題)」 「副見出し」 「本文」と 「写真/図/表の説明」 15 切り出しの確認 • 切り出し – 全ての文字列がキーワードになる – 最少単位の単語に分解する – 名詞がキーワードになる • 数字もキーワードになる – 新聞紙名、発行年月日、(著者)、発行者もキー ワードになる(書誌事項) • 重要なキーワード – 重複する文字列は有効キーワード – 見出しには有効なキーワードが含まれる – 動詞と形容詞の重要性は低い 16 記事の例 見出:チリ北部でM8.2の地震 日本への津波「調査中」 日付:2014年4月2日(朝日新聞) 写真:南米チリ沖で1日に発生した地震直後、津波警報でスタ ジアムに避難した、震源地に近いチリ北部イキケの人たち 本文:南米チリ北部で現地時間1日午後8時46分(日本時間2 日午前8時46分)ごろ、大きな地震があった。米地質調査所に よると、地震の規模を示すマグニチュード(M)は8・2。震源地 は、北部の都市イキケ沖の北西約95キロで、深さは約10キロ と比較的浅い。 17 切り出しの例: • 南米チリ北部で現地時間1日午後8時46分( 日本時間2日午前8時46分)ごろ、大きな地 震があった。 • 南米/チリ/北部/で/現地時間/1日/午後/8時/4 6分/(/日本時間/2日/午前/8時/46分/)/ごろ 、/大きな/地震/があった。 – 午後/8時/46分⇔午後8時46分 (使いやすい形) – 名詞を意識する 18 切り出しの例 • 米地質調査所によると、地震の規模を示すマ グニチュード(M)は8・2。震源地は、北部の 都市イキケ沖の北西約95キロで、深さは約1 0キロと比較的浅い。 • 米/地質調査所/によると、/地震/の/規模/を/示 す/マグニチュード/(M)は/8・2/。/震源地/は、 /北部/の/都市/イキケ/沖/の/北西/約/ 95キロ /で、/深さ/は/約/ 10キロ/と/比較的/浅い/。 19 作成するキーワードリスト P95 • 5)記事内容順 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 情報活用 目的 重要性 場合 情報 価値 統治 戦争 商業活動 他者 有利 立場 競争 勝つ 目的 場合 情報 6)あいうえお(ソート)順 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ビジネス 意思決定 意味 価値 価値 活用 競争 主体 重要性 勝つ 商業活動 場合 情報 情報活用 戦争 相手 他者 達成 20 7.100文字あたりのKW数 • 7-1: – 表題を含めた全文字数A • 7-2: – 重複を除いたキーワード数B • 7-3: – 100 字あたりキーワード数=B÷A×100 • 新聞記事は10程度以上 21 100文字あたりのキーワード数(8以下の例) 学籍番号 12011146 12012150 12012004 12012031 12012122 12012094 12012053 12012021 12011111 12011086 12012090 12012140 12012141 12012014 12012069 12012107 12012073 kw/100字 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 学籍番号 12011144 12012007 12012059 12012119 12011021 12012019 12012121 12012165 12012160 12012128 12012064 12012024 12012043 12012080 12012157 12012057 12012078 kw/100字 4 4 4 4 5 5 5 5 6 6 7 7 7 7 7 7 7 学籍番号 12012102 12012109 12012116 12012058 12012030 12012156 12012171 12012114 12012120 12012166 12012066 12012093 12012048 12012123 kw/100字 8 8 8 8 8 8 8 8 8 8 9 9 9 9 22 スキャン記事と網掛 けテキスト文 (次回までに作成) • 新聞記事原文 • 網かけ処理 P95 – キーワード(名詞)に 「網かけ」 – 連続したキーワード は「 / 」で区切る – 重複キーワードは 「アンダーライン」 新聞記事をスキャンした画像 をここに貼り付ける • レポートUP後に 高木BOXへ提出 23 新聞記事をスキャンする方法 • • • • • • • • • • • 256教室のスキャナーを使用します 1.節電モードを解除 2.USBを差し込む 3.ファイル名入力(漢字変換不可) 4.基本スキャンを設定 フルカラーあるいはグレーを選択 5.出力形式をJPEGにする 出力→他の形式→JPEG→閉じる 6.原稿をガラス面に置く 7.スタート 8.USBを抜く 24 来週の準備 • 情報検索課題の設定 – Web情報検索の課題の設定 – 日本でも海外でも共通する話題 – 収集した情報の目的・目標の明示 • スキャン記事と網掛けテキスト文の完成 • 情報検索課題の設定用紙 – ページ23参照 25 まとめ 2回目 1. 文字による情報の伝達 – 文字(テキスト)で表現/伝達される 2. キーワードは原文中の文字列 – 情報の内容を適切に表現するキーワードは原文 章に含まれる文字列 3. キーワードは名詞 – 名詞(固有名詞>普通名詞の順に有効) 4. キーワードは検索者が選択 – – – 検索者が必要な概念(アバウトネス)を表現する 原文中の文字列と検索者のキーワードは一般に 一致しない 基礎知識・予備調査の必要性 26 27 3回目 課題1 キーワードの概念と課題設定 ―B 新聞記事検索課題の設定- • 情報検索課題の設定用紙 28 情報検索課題の設定用紙 P23 情報検索課題の設定用紙 1.情報検索対象分野: 次の分野から興味のある1分野を選択する。 哲学、歴史、社会科学、自然科学、技術、工学、工業、産業、ビジネス、経済、政治、芸術、言語、文学、コン ピューター、教育、娯楽、旅行、スポーツ、健康、ニュース、地域、環境、ファッション、大学、企業の動向、ビジネ ス 2.情報検索課題(題名):検索内容を20-30字程度で表現する。 ________________________________________________________________________ 3.情報検索内容 情報収集したい情報の内容を200~400字程度の文章で表現する。内容を良く表現できていれば検索に使用 するキーワードはこの文章の中から選択できる。自己の知識が不十分で文章を作成できない場合は事前調査 を行ってから作成する。 ___________________________________________________________________________________ _____________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ 4. 情報検索 (情報収集)の目的と目標 情報検索で対象とする情報を収集する理由を200~400字程度の文章で表現する できる限り目的と目標に区別して記入すること。 目的(最終目標):何をするために情報収集をするか、収集した情報を使って最終的に何を実現したいのかを記 述する。 ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ 目標(実現可能性のある具体的な目標):実現可能な到達レベルを数値などで具体化したもの。収集する情報 29 の利用方法を記述しても良い。 ________________________________________________________________________ 情報検索課題の設定の練習 • 練習問題 – スキャン記事と網掛けテキスト文。 – 重要と思われる5キーワードを使用した場合の、 情報検索内容(3)、情報収取の目的(4)、目標( 5)を完成しなさい。 – 同じ記事を使って別の情報検索内容(3)、情報 収取の目的(4)、目標(5)を設定し、その場合に 想定される、キーワードを選択しなさい。 • 同じ情報が含まれていても、目的によって、 使用するキーワードが異なる。 30 例1 • 目的1 – 日本原電が活断層の調査のために作成したデー タが信頼できるか検討する – 日本原電 and 活断層 and 音波探査 • 目的2 – 敦賀原発付近の活断層に関連する情報を収集し 、敦賀原発の安全性について考える。 – 敦賀原発 and 活断層 and 調査 • 目的によりキーワードが異なることを理解する 31 例2 「ダイオキシンの魚類に対するホルモン作用」 • 目的 – 1) 河川の魚類の保護 – 2)ホルモン撹乱作用のメカニズムの解明 – 3)人類への女性ホルモン様活性を持つ化合物の除去 • 目標 – 到達可能な目標例:1) – 対策を考えるために1年間で実態調査をする – 発生源を特定する。 – 除去方法を開発する 32 情報検索課題の設定用紙の意義 – 情報検索の前に検索内容をできる限り明確にす る努力が良い結果につながる 1. 情報検索課題 2. 情報検索内容 3.情報収集の目的 P22 4.情報収集の目標 P22 5. 日本語キーワードの決定 P24 6. 英語キーワードの決定 P24 7. 検索式の決定(次回) 33 1.情報検索課題(題名) P22 – 情報検索内容を20-30字で簡潔に表現する • 新聞の見出しや図書の題名に相当 • 主たるキーワードを含むように作成 – 一般的な基礎知識を得る課題は不適当 • 広範囲にわたる情報収集が必要 • 図書の方が効率的で高い信頼性 – 容易に理解可能な内容も不適当 • 例)スポーツ選手の成績など 34 2.情報検索内容 P23 • 情報検索の内容を200字~400字で表現する – 抽象的な表現や一般的な表現を避ける – 具体的な内容を含む文章を作成する – 検索に使用するキーワードは作成した文章の中 に含まれる 35 3.情報収集の目的 P22 • 目的により必要な情報が決まる – 情報検索内容からキーワードや検索式を確定で きるが、必要な情報は決まらない – 例:対象期間、対象地域、対象分野、専門性など • 目的は意志を実現する最終到達点(ゴール) – 最終到達点(レベルや状態)のイメージ – 「何をするために情報収集を行なうのか」を記述 する 36 4.情報収集の目標 P22 • 目標には目的をより具体化したもの • 目標は実現可能性のある目的 – 目標が達成できれば、実現可能性のある到達レ ベルが次の目標となり、最終目標が目的となる – 到達レベルを数値示したり、利用方法を記述して も良い 37 あいまいな目的・目標と検索内容 • あいまいな検索内容 – 広範囲の情報収集が必要となる – 情報検索内容から的確なキーワードが選定でき ない • あいまいな目的・目標 – 多くの情報を収集しても、評価基準があいまいで 情報の選択や必要な情報の特定が困難になる – 情報収集の過程で目的と目標の修正が必要とな り、情報検索をやり直すことになる 38 5.日本語キーワードの選択 P24 • キーワード数 • 概念をキーワードで表現するには3~5ワ ードが必要 • キーワード数の選択 – 情報検索課題に重要な概念(アバウトネス)を示 す文字列を、原文中の文字列と一致させる – 情報検索内容(200~400 字)から、重要な概念を 表現すると思われる名詞を5ワードを切り出す – 原文(著者)が重要としている概念ではない 39 6.英語キーワードの決定 P24 • 日本語キーワードに相当する英語キーワード を記述する – 日本語のキーワード数と英語キーワード数は異 なる – 辞書の最初に記述されている単語を選択するこ とが多いが、適切な英語キーワード選択のため には、複数の意味を把握したうえで選択する • 微妙な意味の違いを把握するのは難しい 40 和製英語 • 日本人による英語情報しか得られない – 表10 日本語でしか通用しない和製英語の例 日本語 キーワード 和製英語 英語 Food Habit 食文化 Food Culture Food Manner 環日本海 Japan Sea Rim Far East Sea 41 7. 検索式の決定(次回) • AND – 全てのキーワードを含む • OR – いずれかのキーワードを含む • NOT – キーワードを含まない • 次回 42 レポートの提出 • Webの画面からの提出 • 提出時間はサーバ側で表示 • 評価 – 遅れると-10%/日, – 1週間以上は-50%で評価 • 他人の内容をコピーして提出した場合 – 原則、後で提出されたレポートは評価しない 43 レポート1 (R1) • 提出期限 – 4月14~26日(土) – サンプル参照 – 5月11日(土) 2weeks • 予備調査により基礎知識を得る • 指示事項 – 指示内容の数値などが、教科書と提出画面で異 なる場合は、提出画面の数値などを優先してくだ さい。 44 調査結果 45 6.インターネットのメディア別利用割合は どの程度ですか?(2013:n=136) 46 6.インターネットのメディア別利用割合 はどの程度ですか?(2012:n=148) 47 8.インターネットを使って情報を検 索したことがありますか? • (n=136) • ある – 92% • 平均キーワード数 – 2.29 (回答n=65) – 検索式は不要 48 1章の確認 49 1.情報収集のための情報検索 • • • • • • • • • 1-1知識を深めるための情報収集 1-2目的を達成するための情報収集 1-3 情報収集の意義 1-4 情報と情報検索 1-5 情報検索とデータベース 1-6 情報検索システム 1-7 情報検索と原文情報 1-8 書誌事項 1-9遡及情報検索 50 1章1~2 情報収集の目的 1. 知識を得る(知識を深める) – 知らないことを知る(自己学習に必要) – 他人と同じレベルで考えることができる 2. 目的を達成する – 目的に早く到達する – 情報を利用して問題を解決する 3. 新しい価値や概念を創造する – 情報を組み合わせて新しい価値を創造する • 情報を基に自分で考える態度が重要 51 1-1知識を深めるための情報収集 • 知識を深めるための情報収集の目的 • 1: 知らないことを知る – 他人と同じレベルで考えることができる – 不利益を受けない • 2: 知識構造を深め自分で考える – 偏りのない基礎知識を習得する – 自分の考えを持ち他人と対等に対話する • 3: 新しい概念や視点を創造する – 情報を組み合わせて新しい価値を創造する 52 1-2目的を達成するための情報収集 • 目的を達成するための情報収集の目的 – 目的は相手に勝つこと – 目的が明確なので情報を最も効果的に利用できる • • • • – 相手に対する働きかけが存在する 1: 戦争や戦いに勝利する 2: 競争に勝つ 3: 具体的な目的や目標を達成する 4: 個人の意志を実現する 53 +新しい 1-3 情報収集の意義 目的・目標の明確化 55 スタートレベルの向上 56 情報収集の効果 • ①多くの必要な情報を収集し、多くの目的解決手 段を検討することにより、より正確な判断を行う • ②判断をして行動を起こす前に過去の事例や知 見などを収集し、スタートレベルを引き上げること により、目的に早く到達する • ③関連する情報を入手し、自己の知識に取り入 れ、自己の知識レベルを向上させる • ④参考となる最新データを得ることにより競争を 有利にする 1-4情報と情報検索 情報検索の英訳 意味 information retrieval 情報を検索(回収)すること。原 文(一次情報)の所在を明らか にし原文を入手すること。 information search 情報がどこにあるか探し出すこ と(探る、調べる、たどる) 58 1-5 情報検索とデータベース 59 1-6 情報検索システム • データベースは本来個々のデータベースファイル • 情報検索システムをデータベースと呼ぶことも多い • 単一の情報源からなる情報検索システム – 朝日新聞記事データベース – 雑誌記事索引など • 複数の情報源からなる情報検索システム – 100を超えるデータベースファイルを検索 – EBSCOhost,ProQuest,Dialogなど 60 情報検索システム • 検索エンジン – Gogool、Yahoo • 日経テレコン – 日経四紙 • 朝日DNA – 朝日新聞 • 日外Web – 雑誌記事索引 • NDL-OPAC 国立国会図書館蔵書検索 – 日本で発行された図書・雑誌記事 • ProQuest – 主要な世界の専門誌・学会誌 原文情報を含む 61 講義で使用する主な情報 – Web情報 – 図書情報 – 新聞記事情報 – 雑誌/専門誌記事情報 – 「日本語」と「英語」の情報 62 1-7情報検索と原文情報 • 情報検索における情報とは原文(1次情報) – 著者が自ら作成したオリジナル情報 – 著作権法の著作物が代表的な情報 • 1次情報が必要な時 – 論文の論拠/新しい価値の創造 – 意思決定の判断材料 • Web情報には原文情報だけでない – 伝聞に基づいて作成された二次情報も多い 63 1-8書誌事項 • 検索対象とする書誌事項は原文情報の所 在と内容を表現する項目からなる。 書誌事項 内容 1 著者 情報発信者の氏名 2 所属 著者の所属 3 表題(内容情報) 情報や論文のタイトル 4 抄録(内容情報) 情報の概要、アブストラクツとも呼ばれる 5 出版年月日 情報が公開された年月日 6 雑誌名 論文が掲載された雑誌名 7 巻・号・ページ 論文が掲載された雑誌の巻・号・ページ 8 出版社 雑誌や図書の出版社 9 分類 情報のデータベース内の分類 64 情報の信頼性 • • • • • • 情報は人によって創られることから 信頼性の高い情報 ①情報発信者である著者名 ②著者の所属する団体などの固有名詞 ③情報の発信日時 ④出版社,新聞社のような情報発信責任者 が明示されている 65 1-9遡及情報検索 • 情報検索では過去30年程度の情報を検 索可能 • 特定の話題に関する一定期間の複数の記 事を時系列で並べることにより、過去から 現在に至るまでの変遷を理解できる – 現在の状況をより深く分析することが可能 • 過去に遡って情報収集を行う検索を遡及 情報検索と呼ぶ – 遡及情報検索では過去の情報も情報としての 価値を有している。 66