2014 FTU2 C6 - WordPress.com

Download Report

Transcript 2014 FTU2 C6 - WordPress.com

PHẦN 2
THỐNG KÊ
Thống kê là khoa học về các phương pháp thu
thập, tổ chức, trình bày, phân tích và xử lý số
liệu.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
1
Bài toán
Nghiên cứu chiều cao của thanh niên Việt Nam trong
độ tuổi từ 15 đến 30.
Điều tra một loại bệnh mới trên gia cầm ở HCM.
Đánh giá chất lượng bia của nhà máy bia Sài gòn.
Nghiên cứu về giới tính trẻ sơ sinh lương công nhân ở
khu công nghiệp Sóng Thần…
Đánh giá về một dịch vụ ngân hàng mới trên địa bàn
tỉnh X
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
2
Các khái niệm
Tổng thể
Kích thước tổng thể
Dấu hiệu nghiên cứu
Ví dụ.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
3
Các khái niệm
Mẫu
Kích thước mẫu
Mẫu ngẫu nhiên
Mẫu tổng quát
Mẫu cụ thể
Ví dụ
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
4
Phân phối xác suất
Biến ngẫu nhiên gốc tổng thể
Phân phối xs tổng thể
Phân phối xs mẫu
Ví dụ
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
5
Ví dụ 1
Cho tổng thể là 200 sinh viên trong một lớp.
Số liệu về cân nặng của tổng thể này như sau:
Cân nặng
45 46 49 54 55 57 60
Số sinh viên 10 20 30 50 40 30 20
Nếu ta quan tâm dấu hiệu định lượng: “số cân nặng của
một sinh viên” thì:
X: ”cân nặng của một sinh viên trong lớp”
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
6
Ví dụ 1_ppxs tt
Khi này phân phối của tổng thể:
X 45 46 49 54 55 57 60
P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Nếu ta quan tâm đến dấu hiệu định tính: ”nặng
trên 50kg” thì đặt biến ngẫu nhiên:
0
Y 
1
, X  50kg
, X  50kg
Y 0
1
Khi này phân phối của tổng thể:
P 0,3 0,7
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
7
Ví dụ 1_ppxs mẫu
Lấy ngẫu nhiên một sinh viên trong lớp. Gọi X1 là trọng
lượng của sinh viên này.
Ppxs của X1:
X1 45 46 49 54 55 57 60
P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Gọi X2 là cân nặng của sinh viên thứ 2. Ta cũng có:
X2 45 46 49 54 55 57 60
P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
8
Ví dụ 1(tiếp theo)
Tương tự cho đến sinh viên thứ n.
Ppxs của Xn:
Xn 45 46 49 54 55 57 60
P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Như vậy ta có một mẫu ngẫu nhiên cỡ n:
(X1, X2,…,Xn)
Và Xi là n biến ngẫu nhiên độc lập và có cùng ppxs với
X. Ta nói đây là mẫu ngẫu nhiên tổng quát.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
9
Mẫu ngẫu nhiên cụ thể
Khi đã làm phép thử chọn sinh viên. Giả sử các kết quả
như sau:
• Sinh viên 1: 45kg
• Sinh viên 2: 57kg
• ….
• Sinh viên n: 65kg
Thì bộ n số: (45, 57,…,65) gọi là mẫu cụ thể
Ký hiệu tổng quát: (x1,x2,…,xn)
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
10
Ví dụ 2
Lấy mẫu ngẫu nhiên cỡ 5 từ tổng thể:
Y 0
1
P 0,3 0,7
Y ~ B 1;0,7 hay Y ~ A 0,7
Mẫu tổng quát: (X1, X2, X3, X4, X5) trong đó Xi có phân
phối B(1; 0,7) hay A(0,7)
Một mẫu cụ thể: (1, 0, 0, 1, 0)
Mỗi lần lấy mẫu cho ta một mẫu cụ thể.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
11
Tóm lại
Mẫu ngẫu nhiên cỡ n: n biến ngẫu nhiên có cùng ppxs
với tổng thể. Chưa thực hiện phép thử.
Ký hiệu: (X1, X2,…,Xn)
Mẫu cụ thể cỡ n: n giá trị (giá trị cụ thể của các bnn). Đã
thực hiện phép thử.
Ký hiệu: (x1, x2, …, xn)
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
12
Lý thuyết mẫu
Nghiên cứu để
đưa ra các kết quả
Suy diễn cho tổng thể
Nghiên cứu mối quan hệ giữa tổng thể và mẫu rút ra từ
tổng thể đó.
Xác suất: nghiên cứu tổng thể  hiểu về mẫu (cụ thể)
Thống kê: nghiên cứu mẫu (cụ thể) hiểu tổng thể.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
13
Phân loại mẫu
• Mẫu định tính
• Mẫu định lượng
• Trình bày mẫu
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
14
Tham số tổng thể
• Định nghĩa
• Các tham số thường gặp: trung bình, phương sai, tỷ lệ
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
15
Ví dụ
• Tổng thể nghiên cứu là một xí nghiệp có 40 công nhân
với dấu hiệu nghiên cứu là năng suất lao động (sản
phẩm/ đơn vị thời gian)
Năng suất lao động
50 55 60 65 70 75
Số công nhân
3
5
10 12 7
3
• Tính trung bình, phương sai tổng thể
• Tính tỉ lệ công nhân có năng suất cao hơn 65sp.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
16
Các tham số tổng thể
 Trung bình cộng tổng thể:
N

x
i 1
i
N
 EX 
 Phương sai tổng thể:
N
 
2
Bài giảng Xác suất Thống kê 2014
x  
i 1
i
N
2
V X 
Nguyễn Văn Tiến
17
Các tham số tổng thể
• Xét tổng thể định tính, dấu hiệu A.
• Tỉ lệ tổng thể:
M
p
N
• N: kích thước tổng thể.
• M: số phần tử trong tổng thể có dấu hiệu A.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
18
Thống kê mẫu
• Định nghĩa
• Các thống kê mẫu thường gặp: trung bình, phương sai,
phương sai hiệu chỉnh, phương sai biết µ, tỷ lệ …
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
19
Tính thống kê mẫu
Điều tra thời gian sử dụng internet trong tuần của 90
sinh viên một trường ta được bảng số liệu sau:
Thời gian (giờ)
Số sv
3 4 5 6 7 8
7 8 17 24 20 14
Hãy tính các thống kê mẫu sau:
a) Trung bình mẫu, các phương sai mẫu
b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5
giờ một tuần?
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
20
Các thống kê mẫu_tổng quát
• Cho mẫu định lượng tổng quát:
 X1, X 2 ,..., X n 
• Trung bình mẫu:
X 1  X 2  ...  X n
X
n
• Phương sai mẫu:

1 n
S   Xi  X
n i 1
2
Bài giảng Xác suất Thống kê 2014

2
 
1 n
  X i2  X
n i 1
Nguyễn Văn Tiến
2
21
Các thống kê mẫu_tổng quát
• Phương sai mẫu hiệu chỉnh::

n
1
S2 
Xi  X

n  1 i 1

2
n 2

S
n 1
• Độ lệch mẫu:
S S
2
• Độ lệch mẫu hiệu chỉnh:
S S
Bài giảng Xác suất Thống kê 2014
2
Nguyễn Văn Tiến
22
Các thống kê mẫu_tổng quát
• Phương sai mẫu: (đã biết trung bình tổng thể )
n
1
2
S   Xi   
n i 1
*2
S  X  2 X  
*2
Bài giảng Xác suất Thống kê 2014
2
2
Nguyễn Văn Tiến
23
Các thống kê mẫu_cụ thể
• Cho mẫu định lượng cụ thể thu gọn:
X
x1
x2 …
xk
Tần số n1 n2 …
nk
• Trung bình mẫu:
1 k
x   ni xi
n i 1
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
24
Các thống kê mẫu_cụ thể
• Phương sai mẫu:

1 k
s   ni xi  x
n i 1
2

2

1 k
  ni xi2  x
n i 1
2
• Phương sai mẫu hiệu chỉnh:

k
1
2
s 
ni xi  x

n  1 i 1
Bài giảng Xác suất Thống kê 2014

2
n 2

s
n 1
Nguyễn Văn Tiến
25
Các thống kê mẫu_cụ thể
• Độ lệch chuẩn mẫu:
s s
2
• Độ lệch chuẩn mẫu hiệu chỉnh:
s s
Bài giảng Xác suất Thống kê 2014
2
Nguyễn Văn Tiến
26
Tỷ lệ mẫu_tổng quát
• Xét tổng thể định tính, dấu hiệu nghiên cứu là tính
chất A, tỉ lệ tổng thể là p.
• Lấy mẫu ngẫu nhiên kích thước n: (X1, ..., Xn)
• Tỉ lệ mẫu tổng quát:
k X 1  X 2  ...  X n
F 
X
n
n
• Xi là các biến ngẫu nhiên có phân phối A(p)
• Tỷ lệ mẫu = trung bình của n biến ngẫu nhiên cùng
phân phối A(p)
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
27
Tỷ lệ mẫu_cụ thể
• Xét tổng thể định tính, dấu hiệu nghiên cứu là tính
chất A, tỉ lệ tổng thể là p.
• Lấy mẫu cụ thể kích thước n: (x1, x2 ,..., xn)
• Tỉ lệ mẫu cụ thể:
k x1  x2  ...  xn
f  
n
n
• k: số phần tử trong mẫu có tính chất A.
• n: cỡ mẫu
• Với mẫu cụ thể ta đếm cho nhanh.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
28
Tổng thể và mẫu
Tổng thể
Mẫu TQ
Mẫu cụ thể
Kích thước
N
n
n
Trung bình
  EX 
Phương sai
 V  X 
2
Độ lệch chuẩn   V  X 
Tỷ lệ A
p  P  A
Bài giảng Xác suất Thống kê 2014
X
x
S  ; S ;S  s ; s ;s 
2
* 2
2
S; S; S
F
*
2
* 2
2
*
s; s; s
f
Nguyễn Văn Tiến
29
Tính thống kê mẫu
Điều tra thời gian sử dụng internet trong tuần của 90
sinh viên một trường ta được bảng số liệu sau:
Thời gian (giờ)
Số sv
3 4 5 6 7 8
7 8 17 24 20 14
Hãy tính các thống kê mẫu sau:
a) Trung bình mẫu, phương sai mẫu, phương sai mẫu
hiệu chỉnh?
b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5
giờ một tuần?
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
30
Cách 1_Lập bảng
xi
….
….
Tổng
ni
….
….
xini
….
….
(xi)2ni
….
….
n
 xi ni
2
x
 i ni
i
xn

x
n   ni
s
2

x n
2
i i
n
i i

 x
Bài giảng Xác suất Thống kê 2014
2
n
n
2
s 
s
n 1

2
Nguyễn Văn Tiến
31
Cách 1_Lập bảng
xi
3
4
5
6
7
8
Tổng
ni
7
8
17
24
20
14
90
Bài giảng Xác suất Thống kê 2014
xini
21
32
85
144
140
112
534
(xi)2ni
63
124
425
864
980
896
3352
Nguyễn Văn Tiến
32
Cách 1_Lập bảng
n   ni  90
• Cỡ mẫu:
xn

x
• Trung bình mẫu:
i i
n
• Phương sai mẫu:
s
2

2
x
 i ni
n
• Phương sai mẫu hiệu chỉnh:

n
s 
s
n 1
2
2
 2,0633
Bài giảng Xác suất Thống kê 2014
534

 5,9333
90

 x
2
 ...  2,0404
Độ lệch mẫu hiệu
chỉnh:
s  2,0633  1,4364
Nguyễn Văn Tiến
33
Cách 2__dùng máy tính 570ES
1.
2.
3.
4.
Shift + 9 + 3 + = + =: Reset máy
Shift + Mode +  + 5 + 1: bật tần số
Mode + 3 + 1: vào tính thống kê 1 biến
Khi này ta có bảng sau:
X
FREQ
1
2
3
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
34
Cách 2__dùng máy tính 570ES
• Ta nhập vào như sau:
1
2
3
4
5
6
X
3
4
5
6
7
8
FREQ
7
8
17
24
20
14
• Nhấn AC để thoát.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
35
Cách 2_dùng máy tính 570ES
6. Lấy số liệu thống kê: Shift + 1 + 4.
Ta có bảng sau:
1: n
2: x
3: x
4: sx
Tương ứng:
1: cỡ mẫu
2: trung bình mẫu Không
phải
3. Độ lệch chuẩn mẫu.
phương
4. Độ lệch chuẩn mẫu hiệu chỉnh.
sai
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
36
Đối với FX 500MS hoặc 570MS
1. Reset máy: Shift + Mode + 3 + = + =
2. Vào hệ SD:
• Máy 500MS: Mode + 2
• Máy 570MS: Mode + Mode + 1
3. Nhập dữ liệu: “Giá trịShift , Tần sốM+”
• 3Shift , 7M+
• Nhập đến hết. Nhấn AC
4. Lấy số liệu:
• Shift 2 1 = : Trung bình mẫu.
• Shift 2 3 = : Độ lệch chuẩn mẫu hiệu chỉnh.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
37
Ví dụ 1
Đường kính (mm) của
100 chi tiết do một
máy sản xuất kết
quả cho ở bảng sau:
a) Tính thống kê mẫu?
b) Tính tỷ lệ chi tiết từ
20mm trở lên trong
mẫu?
Bài giảng Xác suất Thống kê 2014
Đường kính
19,80 – 19,85
19,85 – 19,90
19,90 – 19,95
19,95 – 20,00
20,00 – 20,05
20,05 – 20,10
20,10 – 20,15
20,15 – 20,20
Số chi tiết
3
5
16
28
23
14
7
4
Nguyễn Văn Tiến
38
Ví dụ 1
• Ta viết lại mẫu:
xi 19,825 19.875 19.925 19.975 20.025
ni 3
5
16
28
23
20.075 20.125 20.175
14
7
4
•
•
•
•
Từ mẫu ta có:
Cỡ mẫu: n=100
Trung bình mẫu: x=20,0015
Độ lệch chuẩn mẫu hiệu chỉnh: s=0,077997≈0,0780
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
39
Định lí Giới hạn trung tâm (CLT)
1. Cho X1, X2, …, Xn là n đại lượng ngẫu nhiên độc lập
toàn phần.
2. Nếu: E  X i   ;
V  X i    2 thì:
  
X 1  X 2  ...  X n
X
~ N  , 
n
n 

2
Với n đủ lớn.
Trong thống kê ta coi n>30 là đủ lớn.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
40
Định lí Giới hạn trung tâm (CLT)
1.
2.
3.
4.
Cho n biến ngẫu nhiên độc lập.
Cùng kỳ vọng, cùng phương sai.
Số lượng biến ngẫu nhiên đủ lớn (>30).
Trung bình của n biến ngẫu nhiên này sẽ có phân phối
xấp xỉ phân phối chuẩn
5. Điều này đúng bất chấp phân phối của các biến ngẫu
nhiên thành phần là gì.
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
41
Phân phối xs thống kê mẫu
• Trung bình mẫu
• Tỷ lệ mẫu
• Phương sai mẫu
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
42
Tính chất của trung bình mẫu
• Cho tổng thể có kì vọng  và phương sai 2
• Lấy mẫu ngẫu nhiên cỡ n.
• Gọi X là trung bình mẫu. Ta có:
i) E  X   
ii ) V  X  
Bài giảng Xác suất Thống kê 2014
2
n
Nguyễn Văn Tiến
43
Phân phối của trung bình mẫu
Tổng thể
Trung bình mẫu
Kích thước mẫu
 2 
X ~ N  ;

n 

Tùy ý
Không chuẩn
 2 
X  N  ;

n


n>30
Không chuẩn
nhưng đối
xứng.
 2 
X  N  ;

n 

Có thể được với
n nhỏ.
X ~ N   ;
2

Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
44
Chuẩn hóa ppxs
Tổng thể
TB mẫu
Chuẩn,
đã biết 
 2 
X ~ N  ;

n


X  

Z
n
~ N  0;1
n>30,
đã biết 
 2 
X  N  ;

n


X  

Z
n
~ N  0;1
n>30,
chưa biết 
 2 
X  N  ;

n 

X  

Z
n
~ t  n  1
Chuẩn, n<30
chưa biết 
 2 
X ~ N  ;

n 

X  

Z
n
~ t  n  1
Bài giảng Xác suất Thống kê 2014
Chuẩn hóa


S
S
Nguyễn Văn Tiến
45
Tính chất của PS mẫu
• Cho tổng thể có kì vọng  và phương sai 2
• Lấy mẫu ngẫu nhiên cỡ n.
• Ta có:
n 1 2
2
ˆ
i) E S 

n
 
ii ) E  S
iii)
Bài giảng Xác suất Thống kê 2014
 
E S   
2
2
*2
2
Nguyễn Văn Tiến
46
Phân phối của phương sai mẫu
Kích thước mẫu
Tổng thể
Phương sai mẫu
Phân phối
chuẩn
Không biết
Tùy ý
Không
chuẩn
Không biết
n>30
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
47
Phân phối của hàm PS mẫu
Tổng thể
PS mẫu
Chuẩn,
đã biết 
S

* 2
Không chuẩn * 2
S  ,  n  30 

đã biết 
Chuẩn
chưa biết 
S
2
Không chuẩn
S 2 ,  n  30
chưa biết 
Bài giảng Xác suất Thống kê 2014
Hàm của PS mẫu
 Xi   
Z  2  




i 1 
Z ~  2 n
nS
*2
n  1 S

Z
n
2
 Xi  X 
 

2


i 1 

2
Z ~   n  1
2
n
Nguyễn Văn Tiến
2
48
Tính chất của tỷ lệ mẫu
• Cho tổng thể có tỷ lệ p về tính chất A.
• Lấy mẫu ngẫu nhiên cỡ n.
• Gọi F là tỷ lệ mẫu. Ta có:
i) E  F   p
p 1  p 
ii) V  F  
n
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
49
Phân phối của tỷ lệ mẫu
Tổng thể
Phân phối
B(1,p)
Kích thước mẫu
Tỷ lệ mẫu
F
 p 1  p  
N  p;

n


F  p

Z
n
p (1  p )
Bài giảng Xác suất Thống kê 2014
n>30
~ N  0,1
Nguyễn Văn Tiến
50
Bài 1
Một mẫu kích thước n được rút ra từ tổng thể phân phối
chuẩn với trung bình là μ và độ lệch chuẩn 10. Hãy xác
định n sao cho:


b) P    2  X    2  0,9544
a) P   10  X    10  0,9544
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
51
Bài 2
Trọng lượng một loại sản phẩm là biến ngẫu nhiên phân
phối chuẩn với trung bình là 20,5 và độ lệch chuẩn 2.
Lấy ngẫu nhiên 4 sản phẩm để kiểm tra thì với xác suất
0,95 trọng lượng trung bình của chúng sai lệch so với
trọng lượng qui định tối đa là bao nhiêu?
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
52
Bài 3
Chiều cao của thanh niên ở một địa phương là biến ngẫu
nhiên phân phối chuẩn với trung bình 170 cm và độ lệch
chuẩn 10cm. Chọn ngẫu nhiên 31 thanh niên ở vùng đó.
a) Tìm xác suất để chiều cao trung bình của số thanh
niên nói trên không vượt quá 172 cm?
b)Tìm xác suất để độ lệch chuẩn hiệu chỉnh về chiều cao
của số thanh niên nói trên lớn hơn 15 cm?
Bài giảng Xác suất Thống kê 2014
Nguyễn Văn Tiến
53