Transcript 蝪∪��
指導教授:陳牧言 老師 學生:資管四1 謝鎧宇、黃俊憲 緒論 文獻探討 研究方法 實驗結果與分析 結論 參考文獻 研究動機 研究目的 研究方法 研究資料與所需軟體 因為股票一直都是大家喜愛投資的,不管男女老 少都很愛投資,所以我們將利用類神經網路對股 票市場做分析,用來判斷股票市場的漲跌,試著 讓投資股票可以獲利。 因股票市場各方面因素皆會影響股票的漲跌,在 此我們使用類神經網路希望能讓股票市場漲跌預 測更加準確,在投資股票時能夠獲利,是此次的 研究目的。 將技術指標萃取後,用多種遺傳神經網路,比 較各個網路取得較佳的預測結果。 再將較佳的類神經模型應用在台灣大盤股市, 觀察預測結果。 最後使用Microsoft Office Excel 2003 和 NeuroSolution 5 架設大盤股市分析系統。 研究資料為台灣大盤股市:1993/02/18-2009/11/23 採用SPSS17.0進行主成分分析,萃取出價量值較高的技 術指標。(往後章節會提到) 採用PC NeuroSolution 5 與XP 與Microsoft Office Excel 2003 來架設類神經網路 類神經網路原理 上面是一張類神經網路的圖。類神經網路模擬人類的大腦 ,圓圈代表神經元,箭頭代表神經連結。類神經網路就是 經由左邊的輸入,以及中間神經鍵結強度的調整,來學習 如何產生右邊的輸出。學習後的類神經網路,就能夠對不 同的輸入,產生正確的輸出了。 系統架構 資料收集:台灣大盤:1993/02/18-2009/11/23 技術指標計算:DW、RSI、PVI、PVC、MAI、MVI、PVI、NVI 正規化:標準差正規化 資料排序:每50筆為單位,進行排序 主成分分析:SPSS17.0主成分分析,萃取出全重值最佳指標 軟體分析:NeuroSolution5(將各個類神經採用黑箱作業預測) 結果輸出 比較正確率:採用最新資料作為收集來預測實際。 台灣股市: 每筆資料包含當日開盤價(Open)、最高價(High)、最 低價(Low)、收盤價(Close) 以8:2的切割方式分為訓練樣本與測試樣本 1993/02/18~2006/05/12 共3521筆作為訓練樣本 2006/05/13~2009/11/24 共880筆作為測試樣本 (1)趨向指標(Durbin Watson, DW) (2)相對強弱指標(Relative Strength Indicator, RSI) (3)價量指標(Price Volume Indicator, PVI) (4)價量變化指標(Price Volume Change, PVC) (5)移動平均價指標(Moving Average Indicator, MAI) (6)移動平均量指標(Moving Volume Indicator, MVI) (7)正量指標(Positive Volume Index, PVI) 假如今日成交量「大於」昨日成交量則 今日PVI = 昨日 PVI + 今日股價漲跌幅 否則 今日PVI = 昨日 PVI + 0 (8)負向指標(Negative Volume Index, NVI) 假如今日成交量「小於」昨日成交量,則 今日NVI = 昨日 NVI + 今日股價漲跌幅 否則 今日NVI = 昨日 NVI + 0 輸入變數 台股輸入變數: DW5, DW10, DW20, DW30 RSI5, RSI10, RSI20, RSI30 MAI5_10, MAI5_20, MAI5_30, MAI10_20, MAI10_30, MAI20_30 PVI NVI 共計16個輸入變數。 輸出變數 以明天的收盤價減今日收盤價做為計算: IF ( Tomorrow Close- Today Close ) > 0 Then “result” = 1 , Else “result” = 0 所有輸入變數,以標準差正規化: (1)將台股指數的訓練樣本,依照以下方式排序: 以每50筆資料為單位 將1~50筆資料,依照「result」由大到小排序,此時, 1~50筆為排序過後的資料。 將51~100筆資料,依照「result」由大到小排序,此 時,51~100筆為排序過後的資料。 依造上述規則,對訓練樣本進行排序。 SPSS17.0主成分分析: NeuroSolutions5分析 NeuroSolutions5分析:MLP NeuroSolutions5分析:SOFM NeuroSolutions5分析:RN NeuroSolutions5分析:SVM 將台股數據的16個輸入變數,利用SPSS 17.0進 行主成分分析 最後萃取出9個輸入變數 RSI10 MAI5_10, MAI5_20, MAI5_30, MAI10_20, MAI10_30, MAI20_30 ,PVI, NVI 使得「平方和負荷量萃取」達到94.077% 將各類神經分為五項測試 CV測試分為30組↓ 訓練樣本:測試樣本為8:2測試↓ 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) NeuroSolutions5 EXCEL 測試 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 監督式學習(prediction delta=1) 非監督式學習(prediction delta=0) 最後將此20個類神經預測最新一個月(四月)的股 市資料!發現 SVM-1-C 100% SOFM-0-C 61% RN-1-T 100% MLP-1-T 100% MLP-1-C 100% 為有效之類神經預測 最後將資料一筆一筆的比對明天會漲會跌!則發 現監督式學習會產生神經比對輸出值之謬誤。 則發現SOFM-0-C 61%為目前之研究較準的情 況。 黃兆瑜、葉怡成、連立川(2008),「遺傳神 經網路股票決策系統的實證」,電子商務學報, 第十卷,第四期,第821-1040頁。 人工智慧與機器學習 http://mmdays.wordpress.com/2007/05/03/ai/ 37