MODUL-1-DATA

Download Report

Transcript MODUL-1-DATA

1
Referensi :
•The Data Warehouse Toolkit by Ralph Kimball (John Wiley and Sons, 1996)
•Building the Data Warehouse by William Inmon (John Wiley and Sons, 1996)
• Building the Data Warehouse Bill Inmon, 1992
•The Data Warehousing, Institute profit organization, 1995
• Releases the Data Vault, Daniel Linstedf, 2000
• Budi Santoso, Data Mining, ( Graha Ilmu, 2007 )
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
2
TUJUAN MATAKULIAH
1. Memahami Perbedaan data Warehouse dan data
Mining.
2. Menguasai metode penggunaan Data Warehouse
dan Data Mining.
3. Menguasai metode pengolahan data yang benar.
4. Mampu mengcluster data dengan methode clustering
data mining.
5. Menyediakan
alat
dan
metodologi
untuk
mengekplorasi pola dan makna dalam sejumlah data
yang besar.
6. Diharapkan
mampu
menciptakan
knowledge
Information.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
3
Beda Data Warehouse dan Data Minning
1. Data Mining
Data mining adalah metode analisis
data menggunakan pola pengenalan
logika (pattern recognition logic) untuk
mengidentifikasikan trend di dalam
sebuah
set
sampel
data
dan
meramalkan kemungkinan informasi
tersebut terhadap data yang lebih besar.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
4
Beda Data Warehouse dan Data Minning
Penggunaan data mining pada umumnya
untuk :
a. Membuat program marketing yang
ditargetkan secara khusus
b. Mengidentifikasikan financial fraud
c. Menandai pola-pola yang tidak biasa
pada sudut pandang keamanan.
d. Mengcluster suatu data dengan pola
acak secara cepat.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
5
Beda Data Warehouse dan Data Minning
2. Data Warehouse
Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data
yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat
tetap dari koleksi data dalam mendukung proses pengambilan keputusan
management.
Menurut Vidette Poe, data warehouse merupakan database yang bersifat
analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang
keputusan.
Menurut Paul Lane, data warehouse merupakan database relasional yang
didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya
mengandung history data dari proses transaksi dan bisa juga data dari sumber
lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja
transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari
berbagai macam sumber.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
6
Beda Data Warehouse dan Data Minning
Jadi, data warehouse merupakan metode dalam
perancangan database, yang menunjang DSS(Decission
Support System) dan EIS (Executive Information
System).
Secara fisik data warehouse adalah database, tapi
perancangan data warehouse dan database sangat
berbeda. Dalam perancangan database tradisional
menggunakan normalisasi, sedangkan pada data
warehouse normalisasi bukanlah cara yang terbaik.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
7
Beda Data Warehouse dan Data Minning
Sebuah data warehouse merupakan sebuah
produk software yang digunakan untuk
menyimpan
data
berukuran
besar
dan
menjalankan query dan report yang dirancang
khusus.
Mis : SQL, ORACLE, UNIX
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
8
DATA WAREHOUSE CONCEPT
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
9
DATA WAREHOUSE CONCEPT
Data
Warehouse
merupakan
tempat
menampung berbagai jenis data dari Proses,
Extract, Laporan, Sistem Operasi, Data
murni, Analisa dll.
3 Kelompok Data warehouse :
a. Data mentah ( Raw data )
b. Data Ringkasan laporan
c. Data pengelompokan / extract
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
10
DATA WAREHOUSE CONCEPT
Ada empat tugas yang bisa dilakukan dengan adanya data warehouse :
1. Pembuatan Laporan / Report Create
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling
umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan
perhari, perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.
2. On-Line Analytical Processing (OLAP)
OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para
pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah
SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang
berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda.
Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down.
Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up
adalah kebalikannya.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
11
DATA WAREHOUSE CONCEPT
3. Data mining
Data mining merupakan proses untuk menggali pengetahuan dan informasi baru dari
data yang berjumlah banyak pada data warehouse, dengan menggunakan
kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining
merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data
dan pemakainya.
4. Proses informasi executive
Data warehouse dapat membuat ringkasan informasi yang penting dengan tujuan
membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan
menggunakan data warehouse segala laporan telah diringkas dan dapat pula
mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses
pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi
target informative bagi user
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
12
DATA MINING CONCEPT
Data mining muncul setelah banyak dari pemilik data
baik perorangan maupun organisasi mengalami
penumpukan data yang telah terkumpul selama
beberapa tahun, misalnya data pembelian, data
penjualan, data nasabah, data transaksi, email dan
sebagainya. Kemudian muncul pertanyaan dari
pemilik data tersebut, apa yang harus dilakukan
terhadap tumpukan data tersebut.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
13
DATA MINING CONCEPT
Beberapa solusi yang diberikan data mining antara
lain :
1. Menebak Target Pasar
Data mining dapat mengelompokkan (clustering)
model-model pembeli dan melakukan klasifikasi
terhadap setiap pembeli dan melakukan klasifikasi
terhadap
setiap
pembeli
sesuai
dengan
karakteristik yang diinginkan.
2. Melihat Pola Beli dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola
beli dari waktu ke waktu.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
14
DATA MINING CONCEPT
3. Cross-Market analysis
Data mining dapat dimanfaatkan untuk melihat
hubungan antara satu produk dengan produk
lainnya.
4. Profil pelanggan
Data mining bisa membantu pengguna untuk
melihat profil pembeli sehingga dapat diketahui
kelompok pembeli tertentu cenderung kepada
suatu produk apa saja.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
15
DATA MINING CONCEPT
5. Informasi Summary
Data mining dapat membuat laporan summary
yang bersifat multi dimensi dan dilengkapi dengan
informasi statistik lainnya.
DATA WAREHOUSE DAN DATA MINING
EKO GANDHI SISWANTO
16