Data warehouse

Download Report

Transcript Data warehouse

Integrasi Data
Eka Ismantohadi
Sistem Integrasi Data


Sistem yang dapat
menyelaraskan data yang
berasal dari sejumlah sumber
ke dalam sebuah bentuk
representasi
Memungkinkan suatu
pandangan yang terintegrasi
yang jika dilihat pada
masing-masing sumber data Sumber
akan memiliki perbedaan
1
antarmuka
….
….
….
Sumber
2
Sumber
3
Motivasi Pengintegrasian Data


Pemakai fokus pada data apa yang
diperlukan.
Memfasilitasi aplikasi pengambilan
keputusan.
Saya butuh
data
kompetitor?
Motivasi Pengintegrasian Data
(Lanjutan…)

Memungkinkan pembandingan dari
berbagai sumber secara langsung
Bank BCA
BCA
Bank Danamon Bank BNI
Danamon
BNI
Contoh Aplikasi pada Data
Warehouse
Sumber Data
Internal
Sumber
Data
Operasional
1
Sumber
Data
Operasional
2
Sumber
Data
Eksternal
Manajer
Data
Warehouse
Data
Warehouse
•Perangkat EIS
•Perangkat pelaporan
•Perangkat
pengembangan aplikasi
Pokok Masalah yang Terjadi





Sumber data bersifat heterogen
Sumber data bersifat otonom
query yang berbeda-beda untuk
setiap sumber data
Sumber data gampang berubah
Jumlah sumber data terlalu banyak
Heterogenitas

Derajat ketidaksamaan pada sumber
data
• Platform
• Sistem operasi
• Model data dan atribut
• Bahasa pemrograman
Otonomi

Kebebasan masing-masing sumber data
dalam beroperasi
• Otonomi perancangan



Model data
Atribut
dll
• Otonomi komunikasi


kebebasan menentukan informasi yang disajikan
Kebebasan mengubah antarmuka informasi
• Otonomi eksekusi

Kebebasan dalam mengeksekusi permintaan yang
masuk
Otonomi (Lanjutan)
Format yang berbeda
Pendekatan Integrasi Data
Virtual View Approach



Data diakses dari sumber data ketika
ada kebutuhan dari pemakai
Disebut juga “lazy approach”
Perlu suatu “sistem mediasi”
Sistem Mediasi

Menggabungkan
sumber data
yang heterogen
dan membentuk
“virtual view”
Sumber Data 1
Virtual View
…
Sumber Data 2
Sistem Mediasi (Lanjutan…)




Sistem bisa saja tidak memiliki
database
Kemampuan melakukan query
ditangani oleh sistem mediasi
Akses ke sumber data dibatasi hanya
bisa membaca (read only)
Sumber data bersifat otonom
Sistem Mediasi (Lanjutan…)
Query pemakai
Mediator
query
Sumber 1
query
query
Sumber n
Mediator (Integrator)



Menerima query dari pemakai
Memecah query menjadi sejumlah
sub-query ke masing-masing sumber
data
Menggabungkan hasil query
kemudian menyajikan informasi ke
pemakai
Ilustrasi Sistem Mediasi

Perusahaan mobil Honda mempunyai database
berbeda yang menyiratkan data mobil
MobilCivic(ID_Mob, Model, Tahun, CC)
MobilJazz(ID, Mod, Tahun_Perakitan)
DetailJazz(ID, CC, Kecepatan_Max)

Sistem mediasi menggunakan model berupa
MobilHonda(ID, Model, Tahun, CC)
Pendekatan Integrasi Data
Materialized View / Warehousing
Approach

Data tertentu dari sumber data diambil
pada waktu tertentu dan disimpan dalam
database yang disebut data warehouse;
bukan ketika pemakai melakukan
permintaan.
Data Warehouse




Data warehouse biasanya berisi terabyte
data dan dapat menggabungkan dari
berbagai database, dan berbagai sumber
Query biasanya kompleks
Berisi ringkasan dan sejarah data yang
dipakai untuk pengambilan keputusan
Informasi bersifat read only (baca-tulis)
Sifat Data Warehouse


Multidimensional yang
berarti bahwa terdapat
banyak lapisan kolom dan
baris.
Berdasarkan susunan
data seperti itu, amatlah
mudah untuk
memperoleh jawaban
atas pertanyaan seperti:
“Berapakah jumlah
produk 1 terjual di Jawa
Tengah pada tahun n-3?”
Tahun n-4
Tahun n-3
Tahun n-2
Tahun n-1
Jawa Tengah
Jawa Barat
Produk 3
Produk 2
Produk 1
Tiga Hal Penting dalam
Membangun Data Warehouse



Pemodelan dan Perancangan
• Informasi yang diperlukan dari sumber data.
• View dari sumber data.
Pemeliharaan (Penyegaran)
Tiga cara yang bisa ditempuh:
• Dilakukan secara periodis manakala tidak ada query
• Incrementally update. Hanya data yang perlu disegarkan
yang diubah
• Total update jika ada perubahan pada sumber data
Operasi
Operasi pada data warehouse yang melibatkan:
• Pemrosesan query
• Penyimpanan
End