Transcript URL

富山大学知能情報工学科
「統計学」第1回 オリエンテーション
第1章 統計的方法の性質
高 尚策 (コウ ショウサク) 准教授
Email: [email protected]
1
教科書・参考書
• 教科書
ポール G.ホーエル (著),
浅井 晃 (翻訳), 村上 正康 (翻訳)
出版社: 培風館
参考書
「統計解析の基本と仕組み」(秀和システム)
「データ分析のための統計入門」(共立出版)
2
講義の進め方
• 講義 + 演習・実習 + レポート
練習問題・簡単な分析を実践
• 講義用パワーポイントの請求
[email protected] まで
• 質問を受ける時間
在室時随時 (情報棟5階5506室)
※メールにてアポイントメントを取ることを推奨
3
本講義の構成
1. 記述統計学 (表・グラフ・基本統計量)
第2章 標本データの記述 (2回の講義にする)
2. 確率
(確からしさの定式化)
第3章 確率 (2回の講義)
第4章 確率分布 (1回の講義)
第5章 重要な確率分布 (2回の講義)
3. 推計学 (推定・検定; 統計的推論)
第6章 標本抽出 (1回の講義) 第7章 推定 (2回の講義)
第8章 仮説の検定(2回の講義) 第9章 相関と回帰 (1回の講義)
3部構成(1と3が中心・2は基礎のみ)
4
成績評価
• 全体の 2/3 (10回)以上の出席を満たさない場合
期末試験を受験できない(学内履修規定)
• 毎回講義後に演習問題を提示
最終日に期末試験を実施
• 演習問題40%・期末試験60% の比率で総合評価
• 演習と試験の合計得点を100点満点に換算
– 優:80点以上
– 良:70点以上~80点未満
– 可:60点以上~70点未満
5
統計学 (Statistics) とは
言葉によって定義できないものがある
-経済学者 ジョーン・ロビンソン
“Reduction of Data”
-推測統計学の創始者 R.A.Fisher
[目的] 全体を見ること
×平均などの指標を計算すること
○分布全体の傾向や特徴を抽出すること
つまり、 データから有効な情報を取り出すこと
多くの場合,母集団に関する推論を行うことを意味する
『統計的方法とは母集団に関する結論を標本から
引き出す方法である.』(テキスト p.3)
[特徴] 帰納的
×演繹論理(数学・論理学的な世界:一般 ⇒ 特殊)
○帰納論理(推理・推論の世界:特殊 ⇒ 一般)
6
調査の例
• 世論調査
– 内閣支持率、政策に対する意見...
• 視聴率調査
– 野球中継の視聴率、人気ドラマの...
• マーケティングリサーチ
– 人気のある商品は...、 理由は...
• ...
7
統計調査の例(その1)
(YOMIURI ONLINEより)
8
統計調査の例(その2)
表. フランス大統領選挙
調査日時
4月27日~28日
5月 2日~ 4日
5月 6日
5月 7日
5月 8日
5月10日 (投票日)
by Le Monde 紙
ミッテラン
51.5
53
52
53
52.5
51.75
ジスカール
デスタン
48.5
47
48
47
47.7
48.0
単位:パーセンテージ
9
統計調査の例(その3)
表. 喫煙と肺がん
肺がん患者
正 常
喫 煙 者
60
32
非喫煙者
3
11
単位:人
10
調査の流れ
調査
確率(sampling)
母集団
標本
知りたい対象
得られた
データ
(未知な調査対象)
(分析可能)
記述統計
推測
確率(推定・検定)
11
母集団と標本の定義
• 母集団(population):興味のある対象全体.
性質を明らかにしたい対象集団.観測値の原泉
(テキスト p.3).
• 標本(sample):観測値の集まり(テキスト p.3).
母集団 の一部を 標本(データ) として取り出す
母集団の一部を標本
(データ)
として取り出し、取り出さ
→ 取り出された標本に
統計的手法
を適用する
れた標本に、統計的手法を適用することで母集団に関
→ 母集団 に関する結論が得られる.
する結論が得られる.
[比喩:スープの味見]
12
母集団と標本の関係
母集団(population)
知りたい全体
標本(sample)
入手した情報
= データ
情報の抽出
記号:{ x1, x2, …, xn }
統計的推測
(帰納論理:特殊 ⇒ 一般)
各種の代表値
• 観測個数 n (または 標本の大きさ、標本サイズ、 Sample Size)
• n が母集団サイズに等しい時 … 全標本 または 全数調査 (census)
13
母集団の例
• 選挙での,有権者(あるいは投票者)全体
– 選挙速報は,一部の有権者に対する出口調査や
開票結果から,母集団での支持割合(得票数)を
推測する.(テキスト p.5 例 (a) 参照)
• 特定の年齢層の子どもを対象とした薬を開発
するときの,その年齢層の子ども全体
– 何人かの子どもに対して実験を行い,薬の効果
を検証する. (テキスト p.5 例 (b) 参照)
14
全数調査と標本調査
• 母集団全体のデータを取得することは大変な手間
がかかることが多い.
– 調査では,全数調査 あるいは 悉皆(しっかい)調査
と呼ばれる(complete survey) .
例:国勢調査
• 母集団から「うまく」標本を抽出すれば,小さな標本
でも,母集団に関する精度の高い推測が可能.
– 無作為抽出(random sampling)を行う.(テキスト第6章)
15
全数調査と標本調査の特徴
• 全数調査
全数調査
• 標本調査
– 標本誤差がない
標本誤差がない
– 調査終了まで時間
がかかる
膨大な時間と調査費用
– 膨大な費用
標本調査
– 時間と調査費用の節
標本抽出の方法次第で
約
標本誤差を推定
– 標本抽出の方法如何
では、標本誤差が推
時間と調査費用の節約
定可能
16
記述統計と推測統計
• 記述統計(descriptive statistics)
データの収集,要約に関する統計学 (テキスト p.4).
得られたデータを要約する.
– 標本データの要約
– 小さな母集団(学級など)でのデータの要約
• 推測統計(statistical inference)
母集団に関する結論を引き出す統計学 (テキスト p.4).
17