dữ liệu kiểm định

Download Report

Transcript dữ liệu kiểm định

Chuỗi thời gian
• dữ liệu được thu nhập, lưu trữ và quan sát theo sự
tăng dần của thời gian
Thành phần của chuỗi thời gian
• Xu hướng (trend)
• Chuỗi dữ liệu quan sát
tăng hoặc giảm trong
suốt thời đoạn quan sát
• Chu kì (cyclical)
• giá trị quan sát tăng lên,
hoặc giảm xuống trong
những khoảng thời gian
khác nhau
• Tính mùa (seasonal)
• Những thay đổi lặp lại
hằng năm được
• Bất qui tắc (irregular)
• thể hiện sự biến đổi
ngẫu nhiên không thể
dự đoán được
Thành phần xu hướng
Chuỗi thời gian tĩnh
(1) 𝐸 𝑋𝑡 = 𝜇 ∀𝑡
(2) 𝐶𝑜𝑣 𝑋𝑡 , 𝑋𝑡+𝑘 = 𝛾𝑘 ∀𝑡
Thành phần chu kì
• những dao động dạng sóng quanh xu hướng luôn thay
đổi cả về biên độ và khoảng thời gian xuất hiện
-> xem như là một phần của thành phần xu hướng
Thành phần mùa vụ
Thành phần bất qui tắc
• hiện sự biến đổi ngẫu nhiên
• không thể dự đoán được
Thành phần chuỗi thời gian
• Việc nhận ra các thành
phần của chuỗi thời
gian cũng khá quan
trọng đối với nhiều mô
hình dự báo. ARIMA
Dự báo chuỗi thời gian
Dự báo cảm tính
Dự báo đơn biến
Dự báo đa biến
Mô hình bài toán dự báo
chuỗi thời gian
Thành phần
Kĩ thuật dự báo
Trung bình đơn giản (simple average )
Áp dụng
Mô hình đơn giản có ít dữ liệu ban
Trung bình di động (moving average ) đầu: mới thành lập của 1 công ty.
Chuỗi tĩnh
Xu hướng
Tự hồi quy kết hợp trung bình di động Hoặc là những chuỗi thời gian được
(Autoregressive moving average -
sinh ra trong những điều kiện, môi
ARMA)
trường ổn định.
Trung bình di động (MA)
Xuất hiện trong thời đoạn phát triển của
Tự hồi qui tích hợp trung bình di động
dòng đời 1 sản phẩm. Sự gia tăng dân số
(autoregressive integrated moving
average – ARIMA)
Mô hình làm trơn theo hàm mũ của Winter
Mùa
(Winter’s exponential smoothing)
Tự hồi qui tích hợp trung bình di động
(ARIMA)
làm tăng lên nhu cầu về lương thực, thực
phẩm, dịch vụ. Tất cả những dữ liệu này
đều có tính xu hướng.
Những dữ liệu này thường gắn liền với
chu kì thời tiết, hoặc là các mốc thời gian
đặc biệt của năm (khai giảng, giáng sinh,
Tết…)
Mô hình ANN
Sơ lược về mạng neural
• tế bào hình cây
• tế bào thân
• sợi trục thần kinh
Mạng nơron nhân tạo
• là một mạng gồm một tập các đơn vị (unit) được kết
nối với nhau bằng các cạnh có trọng số
Mạng nơron nhân tạo
Hàm kích hoạt
• Hàm đồng nhất:
𝑔 𝑥 =𝑥
• Hàm ngưỡng:
1, 𝑥 ≥ 𝜃
𝑔 𝑥 =
0, 𝑥 < 𝜃
• Hàm sigmoid:
𝑔 𝑥 =
• Hàm sigmoid lưỡng cực
1
1+𝑒 −𝑥
1 − 𝑒 −𝑥
𝑔 𝑥 =
1 + 𝑒 −𝑥
Mạng nơron nhân tạo
Hình dạng mạng
Mạng truyền thẳng
Mạng hồi quy
Giải thuật lan truyền ngược
• tìm tập các trọng số thích hợp cho một mạng
nơron truyền thẳng nhiều lớp
• áp dụng phương pháp giảm độ dốc để tối
thiểu hóa bình phương sai số
• giá trị lỗi sẽ được lan truyền ngược từ tầng
xuất về tầng nhập để tính 𝛻𝐸 𝑤
Giải thuật lan truyền ngược
Nguyên tắc hoạt động
Giải thuật lan truyền ngược
Ưu điểm – nhược điểm
• Ưu điểm:
– Đơn giản
• Nhược điểm:
– Khó khăn trong việc lựa
chọn tham số đầu van
– Phụ thuộc vào độ lớn
đạo hàm
– Quá trình học không ổn
định
Giải thuật lan truyền ngược
Giải thuật lan truyền đàn hồi
• resilient propagation
• lan truyền đàn hồi là một phương pháp thích nghi
cục bộ
• cập nhập các trọng số 𝑤𝑖𝑗 dựa vào thông tin về dấu
của các đạo hàm riêng phần
• thực hiện theo mô hình học theo bó nghĩa là cập
nhật hệ số dựa vào thông tin của tổng độ dốc cho
toàn bộ tập dữ liệu
Giải thuật lan truyền đàn hồi
Phương pháp cập nhật hệ số
𝑡−1
𝑡
𝜕𝐸
𝜕𝐸
𝑡
𝜂+ ∗ ∆𝑖𝑗 , 𝑖𝑓
∗
>0
𝜕𝑤𝑖𝑗
𝜕𝑤𝑖𝑗
(𝑡)
∆𝑖𝑗 =
𝑡−1
𝑡
𝜕𝐸
𝜕𝐸
𝑡
𝜂− ∗ ∆𝑖𝑗 , 𝑖𝑓
∗
<0
𝜕𝑤𝑖𝑗
𝜕𝑤𝑖𝑗
(𝑡−1)
∆𝑖𝑗 , 𝑒𝑙𝑠𝑒
• Lưu ý: khi đạo hàm riêng phần đổi dấu, nghĩa là bước
cập nhập trước quá lớn làm cho điểm tối ưu bị nhảy
vượt qua. Thực hiện
(𝑡)
∆𝑤𝑖𝑗 =
(𝑡−1)
−∆𝑤𝑖𝑗
𝑣à
𝜕𝐸 𝑡
𝜕𝑤𝑖𝑗
=
Giải thuật lan truyền đàn hồi
Giải thuật lan truyền đàn hồi
Ưu điểm
– Việc khởi tạo giá trị ban đầu cho các tham số ít ảnh
hưởng đến tốc độ hội tụ [4]
– Thông số đưa vào ít: ∆0 và ∆𝑚𝑎𝑥
– Việc cập nhật dựa vào dấu của đạo hàm riêng phần nên
việc cập nhật sẽ trải đều cho toàn mạng chứ không thiên
vị như mô hình lan truyền ngược
Áp dụng vào bài toán dự báo
chuỗi thời gian
Xây dựng mô hình ANN
•
•
•
•
•
•
•
•
Lựa chọn các biến
Thu thập dữ liệu
Tiền xử lý dữ liệu
Phân chia tập dữ liệu
Xây dựng cấu trúc mạng
Xác định tiêu chuẩn đánh giá
Huấn luyện mạng
Dự báo và cải tiến
Xây dựng mô hình ANN
Lựa chọn biến dự báo
• Xác định được tổng quan vấn đề
• Xác định yếu tố ảnh hưởng quan trọng, mấu
chốt
• Lựa chọn tần xuất ghi nhận thông tin phù hợp
Xây dựng mô hình ANN
Tiền xử lý dữ liệu
• Chuẩn hóa dữ liệu đầu vào
• Chuyển đổi dữ liệu dùng:
– Phương pháp lấy hiệu
– Lograit
– Tỉ số giá trị đầu van
– Trung bình di động
Xây dựng mô hình ANN
Phân chia tập dữ liệu
• Tập huấn luyện, kiểm tra và kiểm định (ngoài
các mẫu)
– Tập huấn luyện thường có kích thước lớn nhất
– Tập kiểm tra chiếm khoảng 10% - 30% dữ liệu tập
huấn luyện
– Tập kiểm định phụ thuộc vào kích thước mẫu, bao
gồm các giá trị dự đoán mới nhất
• Phương pháp walk-forward
Xây dựng mô hình ANN
Xây dựng cấu trúc mạng
• xác định sự liên kết giữa các nơron
• xác định số lớp ẩn: thông thường các mạng
nơron được khởi tạo với một hoặc hai lớp ẩn.
• Xác định số nơron trong từng lớp:
– Tạo ra một số mô hình mẫu, huấn luyện và chọn
mô hình có lỗi tối ưu nhất
– Thay đổi cấu trúc ngay trong giai đoạn huấn luyện
(phức tạp)
Xây dựng mô hình ANN
Xác định tiêu chuẩn đánh giá
• Thường dùng tổng bình phương lỗi
𝑛
𝑆𝑆𝐸 =
𝑡𝑘 − 𝑜𝑘
2
𝑘=1
• n là số điểm trong tập dữ liệu kiểm tra
• tk và ok lần lượt là giá trị mong muốn trong bộ
dữ liệu và giá trị xuất của mạng nơron
Xây dựng mô hình ANN
Huấn luyện mạng
• Mục tiêu của việc huấn luyện mạng đó là tìm
ra tập các trọng số cho ta giá trị nhỏ nhất toàn
cục của chỉ số hiệu năng hay hàm lỗi
• Có ba cách thường dùng để dừng một quá
trình huấn luyện:
– điểm hội tụ
– số lần lặp tối đa
– sử dụng tập dữ liệu kiểm định (validation set)
Xây dựng mô hình ANN
Dự báo và cải tiến
• Sử dụng mô hình xây dựng được dự báo cho
bài toán
• Các giá trị dự báo của mạng được lưu lại và so
sánh với các giá trị thực tế
• tiến hành cải tiến mạng hoặc học lại và xây
dựng mạng mới nếu cần thiết
Kết luận về mô hình ANN
• phụ thuộc nhiều vào cấu hình của mạng (số
lớp, số đơn vị mỗi lớp) và các tham số của giải
thuật huấn luyện
• Đối với những chuỗi thời gian có xu hướng và
tính mùa chương trình sử dụng mạng nơron
dự đoán với độ chính xác chưa cao
Kết luận chung
• Đối với các chuỗi dữ liệu chỉ có tính mùa hoặc
xu hướng thì mô hình SARIMA có kết quả
chính xác hơn mô hình mạng nơron
• Đối với các chuỗi dữ liệu có tính phi tuyến thì
mô hình mạng nơron cho kết quả chính xác
hơn.
• Mô hình kết hợp có thể dự báo với nhiều loại
dữ liệu hơn các mô hình thành phần và cho
kết quả chính xác hơn
Kết luận chung
Hạn chế - định hướng
• Hạn chế
– chỉ sử dụng các dữ liệu đã thu thập sẵn nên chưa
có bước tiền xử lý dữ liệu
• Định hướng
– Kết hợp các phương pháp xử lý tính mùa và xu
hướng khác cho mô hình SARIMA thay vì chỉ dùng
phương pháp lấy hiệu như hiện nay
– Xây dựng mô hình ước lượng trực tuyến
Q&A