機率預測? 應用資料探勘於網路拍賣價格預測與 交易成功 之研究

Download Report

Transcript 機率預測? 應用資料探勘於網路拍賣價格預測與 交易成功 之研究

應用資料探勘於網路拍賣價格預測與
交易成功機率預測?之研究
資訊管理研究所
口試教授: 耿伯文 老師
指導教授: 吳植森 老師
研究生: 黃俊華
2016/5/27
1
研究動機
•目前沒有交易網站能幫消費者預測一個
最佳的結標價格、交易成功因素評估,
或是幫商品拍賣者建議一個購買的價格
等
2016/5/27
2
研究目的
•預測商品的結標價格
•賣方登錄拍賣商品時,會自動搜尋過去
的歷史交易紀錄而產生建議購買價格等
•評估影響交易成功之因素
•交易天數評估與改善
2016/5/27
3
研究範圍與限制
•僅為線上交易網站,並以Yahoo、eBay等
為例,而非所有型態的網站(如聊天室、
個人網頁等)
•只針對某項商品做研究(本研究以手機為
主)
2016/5/27
4
研究範圍與限制
•只考慮競價次數有在10次以上的商品作
探討
•此一預測的方式,不能夠進行在個人價
值觀過重的拍賣產品上
2016/5/27
5
利用explore瀏覽器瀏覽Y
ahoo.e-Bay等拍賣網站
利用軟體代理人擷取網站
上之交易紀錄資料
將網站上的交易資料儲存
並轉換
2016/5/27
6
應用資料探勘與類神經網
路的方法來分析資料
資料驗證之結論與探討
2016/5/27
7
資料擷取流程
異地端
利用軟體代理人
擷取網站資料
eBay資料庫
Yahoo資料庫
eBay資料庫
Yahoo資料庫
本地電腦
資料轉換
軟體代理人將網
站資料回傳到本
地做資料轉換
資料轉換與儲存
2016/5/27
8
2016/5/27
9
2016/5/27
10
研究步驟四:應用Bagging與倒傳遞類
神經網路(BPN)的方法來分析資料
•當完成第二、三步驟之後便是利用本論
文中所提到的Bagging與倒傳遞類神經網路
(BPN)的方法來分析資料
2016/5/27
11
Bagging (1/2)
•Bagging是學者Nilsson在1965年就提出
委員會機器(Committee Machine)的概念,
其目的是為了提昇簡單學習法(weak
learner)所建構之分類器效能
•Bagging 主要是利用Bootstrap方式,以
置回重複隨機抽取方式,從原始資料集
合中選取與原集合相同數量的資料點產
生多個訓練集合並加以分析
2016/5/27
12
Bagging (2/2)
2016/5/27
13
買/賣方
輸入所需資訊
系統介面
資料處理
2016/5/27
14
內部處理概念
功能
資料庫
搜尋過去交易紀錄
並給予賣方起標價
格建議(建議買方
競標價格)
搜尋資料庫
賣方
登錄商品
(買方欲買
商品)
資料探勘
交易成功因素評估
資料處理方法
資訊回傳
買/賣方
2016/5/27
15
研究資料
• 本研究利用代理人(Agent)取得eBay與Yahoo
的公開競價資訊,以時間為單位,從2006年
的1月24日的資料至2003年2月28日的資料,
一共為期35日的競價週期,所得資料一共有
1100筆的競價紀錄資料
• 另外為了預測交易的成功率故其中的100筆
為失敗的交易記錄,因此總共有1100筆的實
際成交資料筆數
2016/5/27
16
本研究所關切的資料(1/2)
•價格差異幅度(賣方期望的價格與實際成
交價格的差異)
•起標價格
•競標時間
•競標次數
•交易天數
•直接購買價
2016/5/27
17
本研究所關切的資料(2/2)
•預測購買價格
•預測結標價格
•交易成功與否的因素
•交易天數
2016/5/27
18
2016/5/27
19
2016/5/27
20
Bagging 預測
• 在蒐集與整理完資料後便是利用Bagging
來預測分析,而其分析結果如下
2016/5/27
21
2016/5/27
22
2016/5/27
23
2016/5/27
24
2016/5/27
25
BPN vs Bagging
•用Bagging預測完購買與結標價格後接下
來便是用倒傳遞類神經網路(BPN)預測以
比較分析BPN與Bagging的分析效能
2016/5/27
26
2016/5/27
27
2016/5/27
28
2016/5/27
29
Bagging與BPN分析小結
• 從以上分析可以得知BPN與Bagging在預
測價格方面都有良好的結果
• 利用Bagging和BPN可以有效的幫我們做
預測以供賣方與買方做參考
2016/5/27
30
評估影響交易成功之因素
•本研究的另一個目的,也就是分析交易
失敗的例子,藉此找出交易成功與失敗
的關係因素以提升交易的成功率。而在
分析失敗的例子中多加入了幾項屬性,分
別是
•賣方的信用度(Seller’s credit)
•賣方心中的期望價格(Seller’s
expected value)
•交易是否成功(Deal)
2016/5/27
31
2016/5/27
32
J48決策樹分析
•J48方法可用來產生實驗用之決策樹
(Witten & Frank, 2000)
•J48方法係以Java語言來撰寫之決策樹歸
納學習系統,其內處理方式相同於
Quinlan(1992)的C4.5方法
•Weka 機器學習系統提供一般用途的自動
化分類、迴歸、聚集和屬性選取等功能,
它可應用於解決資料探勘(Data Mining)
的問題(Frank et. al., 2004)
2016/5/27
33
2016/5/27
34
2016/5/27
35
J48路徑說明
•路徑一:若最後交易的成交價與賣方心中所期
望的價格相差大於969則交易可能失敗。
•路徑二:若最後交易的成交價與賣方心中所期
望的價格相差小於等於969且賣方的信用度小
於等於72則交易可能失敗。
•路徑三:若最後交易的成交價與賣方心中所期
望的價格相差小於等於969且賣方的信用度大
於72且最後的成交價小於等於461.0則交易可
能失敗。
•路徑四:若最後交易的成交價與賣方心中所期
望的價格相差小於等於969且賣方的信用度大
於72且最後的成交價大於461.0則交易可能成
功。
2016/5/27
36
2016/5/27
37
交易天數評估與改善
•交易天數是賣方在拍賣商品時自行決定
的,然而,交易天數定的好壞也會影響
整個交易的結果
•定的太少天,則可能無法讓多數的買方
獲知該項商品的資訊而喪失了獲取更高
售價的機會,但是,如果定的太多天則
又有可能浪費時間和資源
2016/5/27
38
2016/5/27
39
2016/5/27
40
交易浪費天數
•從圖中我們可以發現在浪費天數(Waste
Days)中,沒有浪費交易天數的有978筆、
浪費一天的有18筆、浪費2天的有30筆、
浪費三天的有19筆、浪費四天的有16筆、
浪費五天的有19筆、浪費六天的有9筆、
浪費七天的有8筆、浪費八天的有4筆,
也就是說浪費天數在三天以上的有75筆
2016/5/27
41
inst#,
actual,
predicted,
error
1
0
0
0
2
0
0
0
3
0
0
0
4
0
0
0
5
0
0
0
6
5
5
0
7
0
0
0
8
0
0
0
9
1
0
0.922
10
0
0
0
11
3
2
0.922
2016/5/27
42
表4-10 J48交易天數正確率評估
=== Evaluation on training set ===
=== Summary ===
Correctly Classified Instances
Incorrectly Classified Instances
2016/5/27
1015
92.1889 %
86
7.8111 %
43
小結
•在資料分析的過程中及決策樹我們可以
發現競價次數與實際交易天數有相當的
關係,越少次的競價次數其實際交易的
浪費天數越可能偏高,而如果競價次數
少,競價天數又定的太多天則其浪費天
數越是明顯,因此賣方可以參考競價次
數來調整自己的交易天數
2016/5/27
44
未來研究建議 (1/2)
•可以利用不同類別的產品進行比較
與研究顧客的競價行為,以發掘顧客
在面對不同的拍賣商品時,心理的價
格定位所產生的變化
•本研究目前只針對一特定產品(手機)
做研究,未來可擴展到其他的商品上
2016/5/27
45
未來研究建議 (2/2)
• 本研究目前只做到買方與賣方的價格預測、
交易成功的評估及建議等,未來則可朝其他
更多的交易功能著手研究,例如:提供一個
動態地圖可以讓買方隨時查詢自己所購買的
商品目前的位置以隨時掌握商品動向等。
• 本研究只提出一個方法論(Methodology) ,
而無其雛型系統(Prototype),所以未來可以
考慮結合系統(System)與方法(Method)以形
成一個完整的拍賣交易系統(Auction
System)。
2016/5/27
46