講義資料ppt

Download Report

Transcript 講義資料ppt

確率と統計2011(第2日目)
メディア学部
2011年9月29日(木)
担当教員:亀田弘之
Copyright© 2010 Tokyo University of Technology
前回の内容(復習)
1. 統計学の構成
– 記述統計学
• データの整理(効果的な表・図の作り方)
– (確率)
• 推計学(統計的推論)の基礎
– 推計学(推測統計学・数理統計学)
• 推定・検定など
2. データ整理の実演(紹介)
2
Copyright© 2011 Tokyo University of Technology
前回受けた質問
• Q1: 数学が不得意なのですが...
• Q2: 成績評価はレポートだけですか?
3
Copyright© 2011 Tokyo University of Technology
初回アンケートについて
• 単位がほしい
• 数学が苦手だから統計を学んでできるように
なりたい。
• 数式を使ってほしい。
4
Copyright© 2011 Tokyo University of Technology
今日の内容
• データ解析の演習(各自で実施)
1. 度数分布表の作成
2. ヒストグラムの作成
3. グラフの分析
• (データの)代表値
• (データの)散らばり
統計ソフトの使い方よりも、
統計的データ処理の考え方
を理解してください。
5
Copyright© 2011 Tokyo University of Technology
データ解析の演習
• 処理対象データ:
• 作成するもの:
– 度数分布表
– ヒストグラム
• 処理手段:
– コンピュータ(EXCEL)
– 手計算
• 分析の観点
– 代表値と散らばり
6
Copyright© 2011 Tokyo University of Technology
処理対象データ
• http://kameken.clique.jp/Lectures/
Lectures2011/Stat2011/index.html
7
Copyright© 2011 Tokyo University of Technology
新生児60人の体重(1998)
表. 新生児の体重
(1998年)
3740
2550
2920
2530
3280
2840
2520
3350
3610
3430
3020
3320
2790
3050
3620
3260
3320
3800
2640
3360
3320
4100
2720
4050
3850
3380
3040
2710
4150
3200
4120
2780
3220
2780
2490
2950
2580
2020
3010
2010
2800
2760
4480
2990
3700
2960
2320
3060
3200
3380
3100
2840
2990
3100
3530
3270
2600
3640
3300
4570
単位はグラム
8
Copyright© 2011 Tokyo University of Technology
手順1: EXCELの起動
[スタート]-[すべてのプログラム][Microsoft Office]-[Microsoft Excel 2007]
手順2:データの入力
9
Copyright© 2011 Tokyo University of Technology
3740
2550
2920
2530
3280
2840
2520
3350
3610
3430
3020
3320
2790
3050
3620
3260
3320
3800
2640
3360
3320
4100
2720
4050
3850
3380
3040
2710
4150
3200
4120
2780
3220
2780
2490
2950
2580
2020
3010
2010
2800
2760
4480
2990
3700
2960
2320
3060
3200
3380
3100
2840
2990
3100
3530
3270
2600
3640
3300
10
Copyright© 2011 Tokyo University of Technology
4570
手順1: EXCELの起動
[スタート]-[すべてのプログラム][Microsoft Office]-[Microsoft Excel]
手順2: データの入力
手順3: 度数分布表の作成
11
Copyright© 2011 Tokyo University of Technology
度数分布表の作成
12
Copyright© 2011 Tokyo University of Technology
度数分布表とは
データをいくつかのグループに分類し、
各グループに属するデータ数を添えた表。
13
Copyright© 2011 Tokyo University of Technology
度数分布表とは
• イメージとしては右図の
•
ようなもの。
キャプション・
表頭・表側・
区間(階級)・
区間幅(階級幅)
表.度数分布表の例
区
間
度 数
0-99
20
100-199
50
200-299
120
300-399
65
14
Copyright© 2011 Tokyo University of Technology
度数分布表の作成
1. 最大値と最小値を求める。
2. 最大値と最小値の差R(範囲)を求める。
3. 区間の個数(棒グラフの棒の本数)kを決める。
•
•
•
k= n
k=1 + 3.32 log10(n)
[スタージェスの式]
簡単に、k=7~10ぐらいにする。
4. 区間幅hを求める。
1. h=R÷k
2. hの値を見て、きりのいい数字に設定する。
15
Copyright© 2011 Tokyo University of Technology
度数分布表の作成
1.
2.
3.
4.
5.
最大値 = ____, 最小値 = ___
範囲 R = 最大値-最小値
区間数 k = ____
区間幅 h = ____
最小値と最大値とを勘案して、区間の両端
を決める。
16
Copyright© 2011 Tokyo University of Technology
新生児の体重(1998年)
体重(g)
人数
~2000
0
2000~2400
3
2400~2800
14
2800~3200
16
3200~3600
14
3600~4000
7
4000~4400
4
4400~4800
2
17
Copyright© 2011 Tokyo University of Technology
1998年の新生児の体重[g]
16
14
10
8
系列1
6
4
2
0
20
00
23
00
26
00
29
00
32
00
35
00
38
00
41
00
44
00
47
00
50
00
人数[人]
12
体重[g]
18
Copyright© 2011 Tokyo University of Technology
練習問題1
• 講義と同じデータ(新生児の体重)を使って
– 度数分布表
– ヒストグラム
を作成してみよう。
<注> データはWebにアップされています。
19
Copyright© 2011 Tokyo University of Technology
練習問題2
• 講義とは違うデータを使って
– 度数分布表
– ヒストグラム
を作成してみよう。
<注> データはWebにアップされています。
20
Copyright© 2011 Tokyo University of Technology
自由研究問題
• 講義と同じデータ(新生児の体重)を使って
– 度数分布表
– ヒストグラム
を作成してみよう。
ただし、区間幅(ヒストグラムの棒の本数)をいろいろ変
えたものを作ってみよう。
(データ数と区間幅の適切な関係を考察してみよう。)
<注> データはWebにアップされています。
21
Copyright© 2011 Tokyo University of Technology
おわり
22
Copyright© 2011 Tokyo University of Technology