Transcript URL
富山大学知能情報工学科 「統計学」第1回 オリエンテーション 第1章 統計的方法の性質 高 尚策 (コウ ショウサク) 准教授 Email: [email protected] 1 教科書・参考書 • 教科書 ポール G.ホーエル (著), 浅井 晃 (翻訳), 村上 正康 (翻訳) 出版社: 培風館 参考書 「統計解析の基本と仕組み」(秀和システム) 「データ分析のための統計入門」(共立出版) 2 講義の進め方 • 講義 + 演習・実習 + レポート 練習問題・簡単な分析を実践 • 講義用パワーポイントの請求 [email protected] まで • 質問を受ける時間 在室時随時 (情報棟5階5506室) ※メールにてアポイントメントを取ることを推奨 3 本講義の構成 1. 記述統計学 (表・グラフ・基本統計量) 第2章 標本データの記述 (2回の講義にする) 2. 確率 (確からしさの定式化) 第3章 確率 (2回の講義) 第4章 確率分布 (1回の講義) 第5章 重要な確率分布 (2回の講義) 3. 推計学 (推定・検定; 統計的推論) 第6章 標本抽出 (1回の講義) 第7章 推定 (2回の講義) 第8章 仮説の検定(2回の講義) 第9章 相関と回帰 (1回の講義) 3部構成(1と3が中心・2は基礎のみ) 4 成績評価 • 全体の 2/3 (10回)以上の出席を満たさない場合 期末試験を受験できない(学内履修規定) • 毎回講義後に演習問題を提示 最終日に期末試験を実施 • 演習問題40%・期末試験60% の比率で総合評価 • 演習と試験の合計得点を100点満点に換算 – 優:80点以上 – 良:70点以上~80点未満 – 可:60点以上~70点未満 5 統計学 (Statistics) とは 言葉によって定義できないものがある -経済学者 ジョーン・ロビンソン “Reduction of Data” -推測統計学の創始者 R.A.Fisher [目的] 全体を見ること ×平均などの指標を計算すること ○分布全体の傾向や特徴を抽出すること つまり、 データから有効な情報を取り出すこと 多くの場合,母集団に関する推論を行うことを意味する 『統計的方法とは母集団に関する結論を標本から 引き出す方法である.』(テキスト p.3) [特徴] 帰納的 ×演繹論理(数学・論理学的な世界:一般 ⇒ 特殊) ○帰納論理(推理・推論の世界:特殊 ⇒ 一般) 6 調査の例 • 世論調査 – 内閣支持率、政策に対する意見... • 視聴率調査 – 野球中継の視聴率、人気ドラマの... • マーケティングリサーチ – 人気のある商品は...、 理由は... • ... 7 統計調査の例(その1) (YOMIURI ONLINEより) 8 統計調査の例(その2) 表. フランス大統領選挙 調査日時 4月27日~28日 5月 2日~ 4日 5月 6日 5月 7日 5月 8日 5月10日 (投票日) by Le Monde 紙 ミッテラン 51.5 53 52 53 52.5 51.75 ジスカール デスタン 48.5 47 48 47 47.7 48.0 単位:パーセンテージ 9 統計調査の例(その3) 表. 喫煙と肺がん 肺がん患者 正 常 喫 煙 者 60 32 非喫煙者 3 11 単位:人 10 調査の流れ 調査 確率(sampling) 母集団 標本 知りたい対象 得られた データ (未知な調査対象) (分析可能) 記述統計 推測 確率(推定・検定) 11 母集団と標本の定義 • 母集団(population):興味のある対象全体. 性質を明らかにしたい対象集団.観測値の原泉 (テキスト p.3). • 標本(sample):観測値の集まり(テキスト p.3). 母集団 の一部を 標本(データ) として取り出す 母集団の一部を標本 (データ) として取り出し、取り出さ → 取り出された標本に 統計的手法 を適用する れた標本に、統計的手法を適用することで母集団に関 → 母集団 に関する結論が得られる. する結論が得られる. [比喩:スープの味見] 12 母集団と標本の関係 母集団(population) 知りたい全体 標本(sample) 入手した情報 = データ 情報の抽出 記号:{ x1, x2, …, xn } 統計的推測 (帰納論理:特殊 ⇒ 一般) 各種の代表値 • 観測個数 n (または 標本の大きさ、標本サイズ、 Sample Size) • n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 13 母集団の例 • 選挙での,有権者(あるいは投票者)全体 – 選挙速報は,一部の有権者に対する出口調査や 開票結果から,母集団での支持割合(得票数)を 推測する.(テキスト p.5 例 (a) 参照) • 特定の年齢層の子どもを対象とした薬を開発 するときの,その年齢層の子ども全体 – 何人かの子どもに対して実験を行い,薬の効果 を検証する. (テキスト p.5 例 (b) 参照) 14 全数調査と標本調査 • 母集団全体のデータを取得することは大変な手間 がかかることが多い. – 調査では,全数調査 あるいは 悉皆(しっかい)調査 と呼ばれる(complete survey) . 例:国勢調査 • 母集団から「うまく」標本を抽出すれば,小さな標本 でも,母集団に関する精度の高い推測が可能. – 無作為抽出(random sampling)を行う.(テキスト第6章) 15 全数調査と標本調査の特徴 • 全数調査 全数調査 • 標本調査 – 標本誤差がない 標本誤差がない – 調査終了まで時間 がかかる 膨大な時間と調査費用 – 膨大な費用 標本調査 – 時間と調査費用の節 標本抽出の方法次第で 約 標本誤差を推定 – 標本抽出の方法如何 では、標本誤差が推 時間と調査費用の節約 定可能 16 記述統計と推測統計 • 記述統計(descriptive statistics) データの収集,要約に関する統計学 (テキスト p.4). 得られたデータを要約する. – 標本データの要約 – 小さな母集団(学級など)でのデータの要約 • 推測統計(statistical inference) 母集団に関する結論を引き出す統計学 (テキスト p.4). 17