Transcript proposal

IMPLEMENTASI METODE RADIAL BASIS PROBABILISTIC NEURAL
NETWORK (RBPNN) UNTUK KLASIFIKASI BREAST CANCER
I.
LATAR BELAKANG
Breast cancer atau kanker payudara adalah jenis kanker yang terdapat pada
jaringan payudara. Kanker payudara merupakan penyakit yang paling banyak
menyerang kaum wanita. Kaum pria juga dapat terserang kanker payudara,
walaupun kemungkinannya lebih kecil. Di Indonesia kanker payudara menempati
urutan pertama pada pasien rawat inap di seluruh rumah sakit (Makhfudhoh, 2014).
Berdasarkan situs kesehatan Deherba, pada tahun 2004 penderita kanker
payudara mencapai 5.207 penderita di Indonesia. Satu tahun kemudian, banyaknya
penderita kanker payudara meningkat menjadi 7.850 kasus. Banyaknya penderita
penyakit kanker payudara ini semakin meningkat pada tiap tahunnya hingga
mencapai 8.328 penderita pada tahun 2006. Pada tahun 2007 banyaknya penderita
tidak jauh berbeda meski sedikit mengalami penurunan yaitu, 8.277 kasus
(Makhfudhoh, 2014).
Deteksi
dini
kanker
payudara
memegang
peranan
penting
dalam
mengantisipasi penyebaran kanker. Dengan deteksi dini, timbulnya sel-sel kanker
dapat segera diatasi dan dicegah penyebarannya. Karena jika pasien kanker
terlambat dideteksi, dapat menyebabkan resiko kematian akibat kanker semakin
tinggi.
Pemeriksaan payudara berguna untuk memastikan bahwa payudara seseorang
masih normal. Bila ada kelainan seperti infeksi, tumor, atau kanker dapat ditemukan
1
lebih awal. Kanker payudara dapat dideteksi salah satunya melalui diagnosis
definitif dari massa payudara yang hanya dapat dibentuk melalui fine-needle
aspiration (FNA) biopsy, core needle biopsy, atau excisional biopsy (Chester,
1993).
FNA adalah cara termudah dan tercepat untuk mendapatkan biopsi payudara,
dan efektif bagi wanita yang memiliki kista berisi cairan. FNA menggunakan jarum
yang lebih kecil dari yang digunakan untuk tes darah untuk mengeluarkan cairan,
sel, dan fragmen kecil jaringan untuk diteliti di bawah mikroskop (Tingting, 2007).
Setelah sampel FNA diambil dari massa payudara, materi dipasang pada slide
mikroskop dan diberi warna untuk menyoroti inti sel. Sebagian dari sel yang
terdiferensiasi dipindai menggunakan kamera digital. Gambar analisa sistem
software Xcyt digunakan untuk mengisolasi inti individu. Untuk kemudian
dievaluasi ukuran, bentuk dan tekstur masing-masing inti sel. Ditetapkan sepuluh
karakteristik, yaitu jari-jari (radius), keliling (perimeter), luas (area), kepadatan
(compactness), kelunakan (smoothness), kecekungan (concavity), poin cekung
(concave points), simetri (symmetry), dimensi fraktal (fractal dimension), dan
tekstur (texture) (Al-Timemy, 2009). Sepuluh karakteristik tersebut merupakan isi
dari data set Wisconsin Diagnosis Breast Cancer (WDBC) yang akan digunakan
dalam penelitian ini untuk mengklasifikasikan kanker payudara jinak dan ganas.
Untuk mengklasifikasi tingkat keganasan dapat dilakukan dengan metode
Radial Basis Probabilistic Neural Network (RBPNN) yang merupakan salah satu
model dari Jaringan Syaraf Tiruan. Model Radial Basis Probabilistic Neural
network (RBPNN) ini sendiri merupakan penggabungan model Radial Basis
2
Function
(RBFNN) dan Probabilistic Neural network (PNN). Model RBFNN
melibatkan dimensi tinggi pada lapisan tersembunyi (hidden Layer) dan neuron
tersembunyi yang tak linier, namun metode ini memiliki struktur yang rumit,
sedangkan model PNN mempunyai kemampuan klasifikasi yang secara langsung
bisa dicapai tanpa melatih vektor bobot. Namun PNN tidak mempertimbangkan
lingkungan dan overlapping antara vektor-vektor data training dari kategori yang
berbeda sehingga berakibat bias. Selain itu pada PNN semua vektor data training
digunakan sebagai center pada lapisan tersembunyi yang berakibat sangat rumit
diterapkan pada data training yang berukuran besar sehingga performancenya
menjadi lambat (Huang dan Zao, 2005). Dengan Radial Basis Probabilistic Neural
Network (RBPNN) kelemahan kedua model ini bisa diatasi, karenanya Radial Basis
Probabilistic Neural Network (RBPNN) inilah yang akan diterapkan pada sistem
yang dibuat
nantinya.
Diharapkan
metode
ini
dapat
membantu
dalam
pengklasifikasian breast cancer, serta dapat memberikan alternatif diagnosa dan
mempercepat pemeriksaan kesehatan payudara.
II.
RUMUSAN MASALAH
Berdasarkan latar belakang tersebut maka rumusan masalah yang dapat
diambil adalah bagaimana prosedur klasifikasi breast cancer menggunakan Radial
Basis Probabilistic Neural Network (RBPNN)?
3
III.
TUJUAN PENELITIAN
Adapun tujuan yang ingin dicapai dari penelitian ini yaitu untuk menjelaskan
prosedur klasifikasi breast cancer menggunakan metode Radial Basis Probabilistic
Neural Network (RBPNN).
IV.
MANFAAT PENELITIAN
Manfaat dari penelitian ini, yaitu untuk:
1.
Mengetahui pengklasifikasian breast cancer dengan metode Radial Basis
Probabilistic Neural Network (RBPNN) sehingga dapat memberikan
alternatif diagnosa dan mempercepat pemeriksaan kesehatan payudara.
2.
Menambah wawasan mengenai metode Radial Basis Probabilistic Neural
Network (RBPNN) dalam aplikasi pengklasifikasian breast cancer.
3.
Membantu sebagai bahan penambah ilmu pengetahuan, serta dapat dijadikan
sebagai bahan perbandingan untuk melakukan penelitian di masa yang akan
datang.
V.
BATASAN MASALAH
Batasan masalah pada penelitian ini adalah sebagai berikut:
1.
Data yang digunakan pada penelitian ini adalah data set Wisconsin Diagnosis
Breast Cancer (WDBC) yang berasal dari University of Wisconsin Hospitals,
Madison (UCI) Machine Learning Repository dengan judul Breast Cancer
Wisconsin (Diagnostic). Dengan jinak (benign) sebanyak 357 kasus dan ganas
(malignant) sebanyak 212 kasus.
4
2.
Penelitian ini mengklasifikasikan breast cancer dengan menggunakan metode
Radial Basis Probabilistic Neural Network (RBPNN).
VI.
TINJAUAN PUSTAKA
6.1.
Kajian Terdahulu
Penelitian tentang klasifikasi breast cancer dengan metode Radial Basis
Probabilistic Neural Network (RBPNN) bukanlah pertama kali dilakukan, telah ada
penelitian terdahulu tentang penerapan metode RPPBN tersebut. Penelitian terdahulu
yang relevan dengan penelitian ini adalah sebagai berikut.
Ali H. Al-Timemy, dkk (2009) dengan judul “Probabilistic Neural Network
for Breast Biopsy Classification”. Penelitian ini bertujuan untuk mengembangkan
metode PNN yang akan mengklasifikasikan sampel biopsi payudara menjadi kista
ganas dan jinak berdasarkan fitur masukan karakteristik inti sel. Yang mana
penelitian ini akan bertindak untuk membantu dalam pengklasifikasian kanker
payudara. Dan menghasilkan klasifikasi dari input fitur menjadi ganas (malignant)
dan jinak (benign). Dengan sensitivitas, spesifitas, dan akurasi yang dihasilkan
berturut-turut sebesar 97.5%, 92.5%, dan 96.2%.
Fourina Ayu Novianti dan Santi Wulan Purnami (2012) dengan judul
“Analisis Diagnosis Pasien Kanker Payudara Menggunakan Regresi Logistik dan
Support Vector Machine (SVM) Berdasarkan Hasil Mamografi”. Penelitian ini
bertujuan untuk mengklasifikasikan diagnosis keadaan pasien kanker payudara
benign (jinak) dan malignant (ganas) berdasarkan hasil mamografi dan melakukan
analisis faktor-faktor apa saja yang mempengaruhi kanker payudara. Penelitian ini
5
menghasilkan pengklasifikasian menggunakan regresi logistik biner dengan ketepatan
klasifikasi sebesar 88,72% dimana terdapat dua faktor yang berpengaruh terhadap
kanker payudara malignant yaitu intermediate findings dan BIRADS. Sedangkan
dengan menggunakan seleksi variabel L1-Norm SVM, semua variabel prediktor yang
digunakan berpengaruh terhadap kanker payudara malignant dengan kontribusi
terbesar adalah intermediate findings, kemudian BIRADS, suspicious for malignancy,
letak abnormal, dan usia dengan ketepatan klasifikasi sebesar 94,34%.
Imma Rizki Fitriani (2014) dengan judul “Peningkatan Metode Naive Bayes
Classification untuk Penentuan Tingkat Keganasan Kanker Payudara Menggunakan
Particle Swarm Optimization”. Penelitian ini menganalisis tentang pengelompokan
data kanker payudara untuk mengetahui kanker tersebut termasuk kanker jinak atau
kanker ganas dengan menggunakan teknik data mining yakni algoritma klasifikasi
Naive Bayes Classifier (NBC). Dari hasil pengujian dengan tenfold cross validation
dan confusion matrix diketahui bahwa Naive Bayes Classifier (NBC) dalam PSO
terbukti memiliki akurasi 96,86%, sedangkan algoritma NBC memiliki akurasi
95,85%. Hasil penelitian ini terbukti bahwa PSO dapat meningkatkan akurasi
algoritma NBC.
Noor Uswah Makhfudhoh (2014) dengan judul “Klasifikasi Kanker Payudara
dari Citra Mammografi Menggunakan Model Fuzzy Neural Network”. Penelitian ini
menjelaskan bagaimana prosedur klasifikasi kanker payudara menggunakan model
Fuzzy Neural Network (FNN). Prosedur awal klasifikasi kanker payudara
menggunakan FNN adalah ektraksi citra mammografi untuk mendapatkan parameterparameter statistik, yaitu energy (X1), kontras (X2), korelasi (X3), sum of squares
6
(X4), inverse difference moment (X5), sum average (X6), sum variance (X7), sum
entropy (X8), entropy (X9), difference variance (X10), difference entropy (X11),
maksimum probabilitas (X12), homogenitas (X13), dan dissimilarity (X14).
Penentuan variabel input, yaitu parameter-parameter statistik dari hasil ektraksi citra
mammografi dan variabel output, yaitu klasifikasi tumor. Pembagian data menjadi
dua, yaitu 80% data training dan 20% data testing. Penelitian ini menghasilkan
klasifikasi kanker payudara dengan nilai sensitivitas, spesifisitas, akurasi secara
berurutan sebesar 96%, 75%, 89% pada data training dan 77%, 83%, 79% pada data
testing.
Oni Soesanto dan Mohammad Isa Irawan (2010) dengan judul “Hybrid PCARBPNN Pada Klasifikasi Data Multivariat”. Penelitian ini mengkaji tentang Hybrid
PCA-RBPNN (Principal Component Analysis- Radial Basis Probabilistik Neural
Network) untuk klasifikasi data multivariat. Hasil percobaan memberikan hasil ratarata akurasi klasifikasi model Hybrid PCA-RBPNN sebesar 98.2818% untuk training
86.909705% untuk testing dengan CPU time 5.2969 detik.
6.2.
Breast Cancer
Breast Cancer atau kanker payudara merupakan salah satu jenis kanker yang
sering ditemukan pada kebanyakan wanita. Kanker payudara terjadi karena
pertumbuhan berlebihan atau perkembangan yang tidak terkendali dari sel-sel
jaringan payudara. Berdasarkan data Sistem Informasi Rumah Sakit (SIRS) tahun
2007, kanker payudara menempati urutan pertama pada pasien rawat inap di seluruh
rumah sakit di Indonesia, yaitu 16,85%. Menurut profil kesehatan Departemen
7
Kesehatan Republik Indonesia, tahun 2007 kanker yang diderita oleh wanita
Indonesia adalah kanker payudara atau Breast Cancer dengan angka kejadian 26 per
100.000 perempuan. Pada tahun 2011, World Health Organization (WHO)
memperkirakan bahwa lebih dari 508.000 wanita diseluruh dunia meninggal karena
breast cancer (Fitriani, 2014).
Meskipun kanker payudara sering ditemukan pada kebanyakan wanita, kaum
pria juga dapat terserang kanker payudara, walaupun kemungkinannya lebih kecil.
Berdasarkan situs kesehatan Deherba, tahun 2004 penderita kanker payudara hampir
mencapai 5.207 penderita di Indonesia. Setahun kemudian banyaknya penderita
kanker payudara meningkat menjadi 7.850 kasus. Banyaknya penderita penyakit
kanker payudara ini semakin meningkat pada tiap tahunnya hingga mencapai 8.328
penderita pada tahun 2006. Pada tahun 2007 banyaknya penderita kanker payudara
tidak jauh berbeda meski sedikit mengalami penurunan yaitu, 8.277 kasus. Penderita
kanker payudara dari tahun ke tahun cenderung mengalami peningkatan yang cukup
tinggi (Makhfudhoh, 2014).
Faktor-faktor risiko kanker payudara adalah usia, jenis kelamin, riwayat
reproduksi, riwayat keluarga, obesitas, dan konsumsi makanan lemak tinggi. Kanker
payudara merupakan penyakit yang mematikan. Salah satu pengobatan yang dapat
dilakukan adalah dengan pembedahan kemudian dilakukan kemoterapi tetapi
pengobatan tersebut belum tentu berhasil jika kanker telah mencapai stadium akhir.
Berdasarkan beberapa penelitian, kanker payudara dapat bersifat mematikan ketika
diagnosa dan perawatan yang diberikan sudah terlambat. Kanker payudara yang
diobati sejak stadium dini dapat menurunkan angka kematian sampai 30%. Jadi,
8
risiko kematian akibat kanker payudara dapat diminimalkan dengan deteksi sejak
dini, sehingga deteksi dini perlu dilakukan untuk mencegah dampak buruk yang bisa
terjadi (Makhfudhoh, 2014).
Metode konvensional memantau dan mendiagnosa penyakit dengan
mengandalkan pendeteksian keberadaan fitur tertentu oleh pengamat manusia.
Dikarenakan banyaknya pasien di Intensive Care Units (ICU) dan diperlukan
pengamatan yang berkelanjutan atas kondisi ini, beberapa teknik untuk sistem
diagnostik otomatis telah dikembangkan dalam beberapa tahun terakhir, untuk
menyelesaikan masalah ini. Teknik-teknik tersebut bekerja dengan mengubah
kebanyakan kriteria diagnostik kualitatif menjadi masalah klasifikasi yang lebih
obyektif kuantitatif (Al-Timemy, 2009).
Kanker payudara dapat dideteksi melalui studi teliti dari riwayat klinis,
pemeriksaan fisik, dan pencitraan, baik dengan mamografi atau USG. Namun,
diagnosis definitif dari massa payudara hanya dapat dibentuk melalui fine-needle
aspiration (FNA) biopsy, core needle biopsy, atau excisional biopsy (Chester, 1993).
Di antara metode ini, FNA adalah cara termudah dan tercepat untuk mendapatkan
biopsi payudara, dan efektif bagi wanita yang memiliki kista berisi cairan. FNA
menggunakan jarum yang lebih kecil dari yang digunakan untuk tes darah untuk
mengeluarkan cairan, sel, dan fragmen kecil jaringan untuk diteliti dengan
menggunakan mikroskop (Tingting, 2007).
Penelitian yang dikerjakan pada data Wisconsin Diagnosis Breast Cancer
(WDBC) merupakan data yang muncul dari keinginan Dr. Wolberg untuk
mendiagnosis massa payudara secara akurat hanya berdasarkan FNA. Sebelumnya,
9
peneliti dari University of Wisconsin, Madison, menerapkan teknik pengolahan citra
untuk memperoleh dataset WDBC langsung dari scan digital dari FNA slide.
Kemudian teknik machine learning dipakai untuk membedakan yang jinak dari
sampel ganas, yang bisa menjadi studi awal penerapan aplikasi machine learning
untuk mendeteksi kanker payudara (Wolberg, 1994).
Dari FNA sampel digital yang telah dihitung itulah fitur dalam dataset ini
didapat, yakni setelah sampel FNA diambil dari massa payudara, materi dipasang
pada slide mikroskop dan diberi warna untuk menyoroti inti sel. Sebagian dari sel
yang terdiferensiasi dipindai menggunakan kamera digital. Gambar analisa sistem
software Xcyt digunakan untuk mengisolasi inti individu. Sebuah batasan perkiraan
dari masing-masing inti diberikan sebagai masukan dan dibawa ke konvergensi tepat
pada batas inti, menggunakan prosedur segmentasi semi-otomatis yang disebut
''snakes''. Dimulai dengan user memperkirakan batas sebagai inisialisasi, snakes
ditempatkan tepat pada batas yang sebenarnya dari inti sel. Untuk mengevaluasi
ukuran, bentuk dan tekstur masing-masing inti sel, ditetapkan sepuluh karakteristik,
termasuk jari-jari (radius), keliling (perimeter), luas (area), kepadatan (compactness),
kelunakan (smoothness), kecekungan (concavity), poin cekung (concave points),
simetri (symmetry), dimensi fraktal (fractal dimension), dan tekstur (texture).
1.
Radius dihitung dengan rata-rata panjang segmen garis radial, yang
mana garis dari pusat massa dari batas kesetiap titik batas.
2.
Perimeter diukur sebagai jumlah dari jarak antara titik batas berturutturut.
10
3.
Area diukur dengan menghitung jumlah piksel pada interior batas dan
menambahkan satu-setengah dari piksel pada perimeter, untuk
mengoreksi kesalahan yang disebabkan oleh digitalisasi.
4.
Compactness (COM) menggabungkan perimeter dan area untuk
memberikan ukuran kepadatan sel, dihitung sebagai:
𝑃𝐸𝑅 2
COM = 𝐴𝑟𝑒𝑎
(1)
Jumlah tanpa dimensi ini diminimalkan untuk lingkaran dan meningkat
dengan batas yang tidak teratur.
5.
Smoothness (SM) dihitung dengan mengukur perbedaan antara panjang
setiap baris radial dan panjang rata-rata dari dua garis radial sekitarnya.
Jika angka ini relatif kecil dibandingkan dengan jarak antara titik batas
berturut-turut, maka kontur halus di daerah itu. Untuk menghindari
ketidakstabilan numerik yang terkait dengan pembagi kecil, persamaan
berikut digunakan untuk menghitung smoothness:
SM =
∑𝑝𝑜𝑖𝑛𝑡 𝑠 |𝑟𝑖 −𝑟𝑖 +𝑟𝑖+1 /2|
𝑃𝐸𝑅
(2)
Dimana ri adalah panjang garis pusat massa dari batas untuk setiap titik
batas.
6.
Concavity diambil dengan mengukur ukuran dari setiap lekukan di batas
inti sel.
7.
Concave point mirip dengan concavity, tetapi hanya menghitung jumlah
titik batas yang terletak di daerah batas kecekungan, bukan besarnya
kecekungan tersebut.
11
8.
Symmetry diukur dengan menemukan perbedaan relatif panjang antara
sepasang segmen garis tegak lurus terhadap sumbu utama dari kontur
inti sel. Sumbu utama ditentukan dengan mencari chord terpanjang,
yang melewati titik batas melalui pusat inti. Sepasang segmen kemudian
ditarik secara berkala. Untuk menghindari hasil numerik yang tidak
stabil karena segmen yang sangat kecil, jumlah dibagi kembali, daripada
menjumlahkan hasil bagi,
∑ |𝑙𝑒𝑓𝑡 −𝑟𝑖𝑔ℎ𝑡 |
Symmetry = ∑𝑖 |𝑙𝑒𝑓𝑡𝑖 +𝑟𝑖𝑔ℎ𝑡𝑖 |
𝑖
𝑖
𝑖
(3)
Dimana lefti dan righti menunjukkan panjang segmen tegak lurus di
sebelah kiri dan kanan sumbu utama, masing-masing.
9.
Fractal Dimension didekati menggunakan coastline approximation
dijelaskan oleh Mandelbrot. Perimeter inti diukur dengan menggunakan
“penggaris” yang lebih besar. Karena ukuran penggaris meningkat,
ketepatan pengukuran menurun, dan perimeter yang diamati menurun.
Merencanakan nilai-nilai ini pada skala log-log dan mengukur
kemiringan ke bawah memberikan perkiraan negatif untuk dimensi
fraktal.
10.
Texture diukur dengan mencari varians dari intensitas skala abu-abu
dalam pixel komponen. Nilai rata-rata, standar error, dan ekstrim
(terbesar atau '' terburuk '').
(Al-Timemy, 2009).
12
6.3.
Klasifikasi Tumor Payudara
Tumor adalah massa jaringan yang tidak normal. Menurut National Breast
Cancer Foundation, terdapat 2 tipe tumor payudara, yaitu:
a.
Tumor Jinak Payudara (Benign Breast Tumors)
Tumor jinak payudara adalah pertumbuhan sel yang tidak normal tetapi tidak
menyebar keluar payudara dan tidak mengancam nyawa manusia. Namun,
tumor jinak payudara dapat meningkat menjadi kanker sehingga tumor jinak
payudara tetap patut diwaspadai. Ketika tumor didiagnosa sebagai tumor
jinak, dokter selalu membiarkannya daripada mengangkatnya. Meskipun
biasanya tumor ini tidak menyerang sekitar jaringan payudara, kadang tumor
ini bisa tumbuh menekan organ dan menyebabkan luka atau masalah lain.
Pada keadaan ini, tumor harus segera diangkat.
b.
Tumor Ganas Payudara (Malignant Breast Tumor/Breast Cancer)
Tumor ganas payudara adalah kumpulan sel kanker yang tumbuh dan dapat
menyebar pada berbagai bagian tubuh. Tumor ganas berbahaya karena
menyerang sekitar jaringan payudara. Ketika tumor dicurigai sebagai tumor
ganas, maka dokter akan melakukan biopsi untuk mendiagnosa tumor.
(Makhfudhoh, 2014).
Berdasarkan klasifikasi diatas, masalah klasifikasi yang dibahas dalam
penelitian ini adalah deteksi tumor payudara ganas dari satu set sampel jinak dan
ganas, yang disebut dataset WDBC, yang diperoleh dari University of Wisconsin
Rumah
Sakit,
Madison,
tersedia
di
http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29.
13
6.4.
Jaringan Syaraf Tiruan
Pembuatan struktur jaringan saraf tiruan diilhami oleh struktur jaringan
biologi, khususnya jaringan otak manusia. Sistem saraf buatan adalah sebuah sistem
proses informasi yang memiliki cara kerja dan karakteristik seperti jaringan saraf
pada makhluk hidup (fausett, 1994). Ini kemudian dikembangkan sebagai generalisasi
pemodelan matematika berpola pada saraf kognitif manusia (Zekic, 2000). Sistem ini
akan melakukan pembelajaran-pembelajaran yang bersifat derifatif untuk mencapai
sebuah konvergensi. Dapat dikatakan juga bahwa Sistem saraf tiruan adalah alat
bantu yang digunakan secara umum dan diaplikasikan untuk memprediksi,
mengklasifikasi dan clustering. Sistem AI akan melakukan proses belajar sendiri
berdasarkan data history yang telah didapat, kemudian berdasarkan itu akan
dihasilkan experience data yang diprepresentasikan pada decision Boundary untuk
mencapai nilai keluaran (Sangadji, 2009).
Gambar1.Struktur jaringan saraf biologi dan Buatan (Sangadji, 2009).
14
Jaringan syaraf tiruan disebut juga dengan kecerdasan jaringan syaraf tiruan.
Jaringan syaraf tiruan banyak ditemukan pada aplikasi-aplikasi diagnosis medis.
Aplikasi jaringan syaraf tiruan banyak digunakan oleh dokter sebagai bahan untuk
proses analisis, pemodelan dan pemahaman data klinis yang sangat kompleks.
Sebagian besar aplikasi jaringan syaraf tiruan pada ilmu kedokteran merupakan
masalah-masalah klasifikasi. Jaringan syaraf tiruan merupakan model komputasional
yang mencoba menjelaskan sifat paralel otak manusia. Jaringan syaraf tiruan adalah
sebuah jaringan dari hubungan proses-proses elemen (neuron) yang beroperasi secara
paralel (Qeethara, 2011).
Pada jaringan syaraf tiruan, masing-masing titik (node) melakukan
perhitungan sederhana dan masing-masing sambungan menyampaikan sinyal dari
satu node ke node lainnya, dimana masing-masing diberi label yang disebut dengan
“connection strength“ atau “bobot” yang menunjukkan sejauh mana sinyal-sinyal
yang ada diperkuat atau dikurangi oleh hubungannya. Jaringan syaraf tiruan
pemodelannya sangat erat dengan cara kerja otak sehingga terminologi pada jaringan
syaraf tiruan mirip dengan neuroscience (ilmu yang berhubungan dengan syaraf)
(Dongare, 2012).
Karakteristik utama dari jaringan syaraf tiruan adalah kemampuannya dalam
mempelajari, pembagian memori dan operasi paralel dimana akan dihasilkan toleransi
kesalahan. Secara umum terdapat tiga lapisan jaringan, yaitu lapisan masukkan (input
/ (I)), lapisan tersembunyi (hidden/(H)) dan lapisan (output/(O)) (Faridah, 2011).
Berikut ini merupakan gambar struktur Jaringan Syaraf Tiruan (JST):
15
Gambar2.Struktur Jaringan Syaraf Tiruan (Faridah, 2011).
6.5.
Radial Basis Probabilistic Neural Network (RBPNN)
Model Radial Basis Probabilistic Neural network (RBPNN) merupakan
penggabungan model Radial Basis Function (RBFNN) dan Probabilistic Neural
network (PNN) berdasarkan keunggulan masing-masing dari dua model tersebut.
RBFNN melibatkan dimensi tinggi pada lapisan tersembunyi (hidden Layer) dan
neuron tersembunyi yang tak linier, namun metode ini memiliki struktur yang rumit,
sedangkan model PNN mempunyai kemampuan klasifikasi yang secara langsung bisa
dicapai tanpa melatih vektor bobot. Namun PNN memiliki permasalahan yaitu tidak
mempertimbangkan lingkungan dan overlapping antara vektor-vektor data training
dari kategori yang berbeda sehingga berakibat bias. Selain itu pada PNN semua
vektor data training digunakan sebagai center pada lapisan tersembunyi yang
berakibat sangat rumit diterapkan pada data training yang berukuran besar sehingga
performancenya menjadi lambat. Namun kelemahan PNN ini bisa diatasi oleh
16
RBFNN
dengan
menyelesaikan
permasalahan
pertama
pada
PNN
dan
mengoptimalkan permasalahan kedua (Huang dan Zao, 2005).
Radial Basis Function Neural Network (RBFNN) merupakan jaringan
Multilayered Feedforward Neural Network (MFNN) yang terdiri dari tiga lapisan,
yaitu input, hidden layer dan output. Jaringan ini merupakan pemetaan fungsi tak
linier multi dimensional yang tegantung pada jarak antara vektor input dan vektor
center. RBFNN merupakan metode yang handal untuk permasalahan regresi dan
klasifikasi. Untuk training data pada RBFNN menggunakan struktur khusus yang
melibatkan dimensi tinggi pada hidden layer dan non linier input pada hidden
layernya untuk mensimulasi sejumlah training data yang memerlukan akurasi (Du
dkk., 2006).
Model Probabilistic Neural Network (PNN) telah banyak digunakan pada
berbagai bidang aplikasi sepeti klustering dan klasifikasi pada forecasting
(Thomassey, 2007), dan klasifikasi pada image recognition (Diamantaras, 2009).
PNN dikonstruksi berdasarkan teori probabilitas klasik seperti klasifikasi Bayesian
dan estimator klasik fungsi kepadatan peluang untuk membentuk jaringan syaraf pada
klasifikasi pola. Pada permasalahan klasifikasi, PNN melakukan training dengan
menghitung jarak input pada lapisan pertama yang mengindikasikan kedekatan
dengan vektor input training. Lapisan kedua merupakan kontribusi setiap klas input
yang menghasilkan net output vektor probabilitas (Huang dan Zao, 2005).
17
Gambar 3 Arsitektur RBPNN (Huang dan Zao, 2005)
Model Radial Basis Probabilistic Neural Network (RBPNN) merupakan
model jaringan yang menggabungkan beberapa keunggulan Jaringan Fungsi Basis
Radial (RBFNN) dan Jaringan Probabilistik (PNN) (Huang dan Du, 2008). Radial
Basis Function Neural Network (RBFNN) dikenal sebagai model neural network
yang handal dan banyak digunakan pada masalah peramalan (forecasting) dan
klasifikasi (Soesanto, 2010). Pada Gambar 3 adalah jaringan RBPNN yang terdiri
dari empat layer, yaitu layer input, dua hidden layer dan layer output. Hidden layer
pertama merupakan layer dengan proses non linier, yang secara umum terdiri dari
center tersembunyi yang ditentukan dari training input. Hidden layer kedua
merupakan penjumlahan dari output layer pertama, dan secara umum memiliki
ukuran yang sama dengan layer output. Bobot antara hidden layer pertama dan
hidden layer kedua, merupakan bobot konstan. Artinya, bobot disetting tetap
sehingga tidak diperlukan learning. Lapisan terakhir dari RBPNN adalah lapisan
output. Secara matematis, RBPNN dengan vektor input x akan menghasilkan nilai
18
aktual untuk neuron output ke-i yang dinyatakan sebagai persamaan berikut (Huang
dan Du, 2008):
M
yi   wik hk ( x )
(1)
k 1
dimana
nk
nk
i 1
i 1
hk ( x)  i ( x, cki )  i ( x  cki 2 ), k  1,2,.., M (2)
Dengan,
hk(x)
: nilai output ke-k dari lapisan hidden kedua
wki
: bobot synaptik antara neuron ke-k pada lapisan hidden kedua dan neuron ke
i pada lapisan output
cki
: vektor center hidden untuk klas ke-k
nk
: jumlah vector center hidden untuk klas ke-k
‖•‖2
: norm Eucledian
M
: jumlah neuron pada lapisan output dan hidden layer kedua atau jumlah klas
untuk sample training
Untuk φi(•) adalah fungsi kernel yang umumnya fungsi kernel Gaussian,
𝜑𝑖 (‖𝑥 − 𝑐𝑘𝑖 ‖2 ), dapat ditulis sebagai berikut:
‖𝑥−𝑐𝑘𝑖 ‖22
𝜑𝑖 (‖𝑥 − 𝑐𝑘𝑖 ‖2 ) = 𝑒𝑥𝑝 (
𝜎𝑖2
)
(3)
Dimana σi adalah parameter pada fungsi kernel Gaussian.
19
Metode penentuan inisialisasi center untuk RBFNN dapat juga dilakukan
pada RBPNN. Salah satu metode yang digunakan untuk menentukan inisialisasi
center RBFNN yaitu dengan menggunakan teknik klustering (Soesanto, 2010).
Berikut adalah algorithma RBPNN:
1. Inisialisasi: Tahap inisialisasi RBPNN menggunakan input hasil klustering.
2. Training: Proses training merupakan pelatihan dari data input RBPNN
kedalam fungsi aktivasi Gaussian.
a. Untuk setiap vektor input pelatihan dihitung jaraknya terhadap center
dengan persamaan fungsi Gaussian berikut:
𝜙𝑖 (‖𝑥 − 𝑐𝑘𝑖 ‖2 ) = exp (−
‖𝑥 − 𝑐𝑘𝑖 ‖22
)
𝜎𝑖2
denganσi adalah parameter pada fungsi kernel Gaussian diberikan sebagai
berikut:
𝜎=
𝑑𝑚𝑎𝑥
√𝐾
Dimana dmaxadalah jarak Euclid maksimal dari kelompok pelatihan dan K
adalah jumlah total kelompok pelatihan.
b. Hitung matriks H yaitu output pada hiddenlayer pertama dengan
persamaan sebagai berikut:
nk
nk
i 1
i 1
hk ( x )   i ( x ,cki )   i ( x  cki
2
), k  1,2,..,m
c. Selanjutnya dilakukan dekomposisi orthogonal matriks H secara rekursif
d. Hitung output: Y = HW
20
3. Testing : Pada proses testing, vektor input untuk testing dimasukkan proses
(1) dan (2) pada training untuk mendapatkan matriks H. Selanjutnya matriks
H tersebut digunakan untuk mencari output Y dengan menggunakan bobot W
yang telah diperoleh pada proses training.
(Soesanto, 2010).
VII.
METODE PENELITIAN
7.1.
Metode Penelitian
Adapun metodologi yang digunakan dalam penelitian ini adalah menggunakan
metode data mining. Tahapan-tahapan untuk pengelolaan data mining yang
digunakan dalam penelitian ini adalah:
1. Analisis Kebutuhan
Tahap ini bertujuan untuk menganalisa terhadap kebutuhan sistem.
Pengumpulan data dalam tahap ini dilakukan melalui penelitian dan studi
literatur.
2. Data Selection dan Addition
Pada tahap ini, melakukan penentuan data dan memilih data yang akan
digunakan. Pada penelitian ini dipilih data yaitu data yang telah diperoleh dari
University of Wisconsin Hospitals, Madison (UCI) Machine Learning Repository
dengan judul Breast Cancer Wisconsin (Diagnostic) yakni data set Wisconsin
Diagnosis Breast Cancer (WDBC).
21
3. Preprocessing dan Cleaning Data
Dalam tahap ini kehandalan data ditingkatkan. Termasuk pembersihan data,
seperti menangani data yang tidak lengkap, menghilangkan gangguan atau outlier.
Dalam penelitian ini, terdapat pembersihan beberapa data yang nantinya akan
menyulitkan dalam menjadikan parameter untuk klasifikasi.
4. Data Mining
Pada tahap ini dilakukan pemilihan algoritma dan implementasi dari algoritma
data mining. Tahap ini terdiri dari:
a. Coding
Tahap ini merupakan tahapan dilakukannya penerjemahan dalam bentuk
pemrograman. Pada proses ini lebih diketahui mengenai metode apa yang
digunakan. Proses pengklasifikasian dilakukan dengan menggunakan metode
Jaringan Syaraf Tiruan dengan model Radial Basis Probabilistic Neural
Network (RBPNN).
b. Testing
Pada tahap ini dilakukan pengujian untuk mengetahui apakah sistem yang
dibuat telah sesuai dengan kebutuhan dan masih terdapat kesalahan atau tidak.
5. Evaluasi
Pada tahap ini dilakukan evaluasi dan penerjemahan dari pola yang diperoleh,
kemudian diinterpretasikan sebagai pengetahuan yang dapat digunakan untuk
dapat menjawab rumusan masalah dan tujuan dari penelitian ini. Yakni
bagaimana prosedur klasifikasi breast cancer menggunakan Radial Basis
Probabilistic Neural Network (RBPNN).
22
7.2.
Jadwal Penelitian
Tabel 1. Jadwal Penelitian
No
Kegiatan
1.
Pengumpulan Data
2.
Analisa Permasalahan
3.
Penerapan Algoritma
4
Desain Sistem
5.
Uji Algoritma dan Implementasi
6.
Pembuatan Laporan
Bulan
1
2
3
4
23
DAFTAR PUSTAKA
Al-Timemy, Ali H., Al-Naima, Fawzi M. dan Qaeeb, Nebras H. (2009). Probabilistic
Neural Network for Breast Biopsy Classification. MASAUM Journal of
Computing, Volume 1 Issue 2.
Chester, M. (1993). Neural Networks: A Tutorial, Englewood Cliffs, NJ: Prentice
Hall, 1993, ch.2.
Diamantaras, K.I. dan Papadimitrious, T. (2009 ). Applying PCA neural models
forblind separation signals. Neurocomputing 73, 3–9.
Dongare, A.D., Kharde, R.R. dan Kachare, Amit D. (2012). Introduction to artificial
neural network. International Journal of Engineering and Innovative Technology,
Vol.2 Issue 1. pp.189-194, ISSN: 2277-3754.
Du, J.X., Huang, D.S., Zhang, G.J. dan Wang, Z.F. (2006), A Novel Full Structure
Optimization Algorithma for Radial Basis Probabilistic Neural network,Journal of
Neurocomputing 70, 592–596.
Faridah, Othman. dan Naseri, Mahdi. (2011). Reservoir inflow forecasting using
artificial neural network. International Journal of The Physical Science, Vol. 6(3)
pp. 434 - 440, ISSN 1992 - 1950.
Fausett, Laurene. (1994). Fundamentals of Neural Network : Architecture algorithm
and Applications, Prentice Hall.
Fitriani, Imma Rizki. (2014). Peningkatan Metode Naïve Bayes Classification untuk
Penentuan Tingkat Keganasan Kanker Payudara Menggunakan Particle Swarm
Optimization. Universitas Dian Nuswantoro.
Hasanuddin. (2008). Kajian Sensitivitas Jaringan Syaraf Probabilistik Basis
Radial,Tesis-Magister. ITS Surabaya.
Huang, DS. dan Du, JX (2008). A Constructive Hybrid Structure Optimization
Methodology for Radial Basis Probabilistic Neural network. IEEE Transactionon
Neural network 19, 2099–2115.
Huang, DS. dan Zao, WB (2005). Determining the Center of radial Basis
ProbabilisticNeural network by Recursive Orthogonal Least Square Algorithms.
Applied Mathematics and Computation 162, 461–473.
Makhfudhoh, Noor Uswah. (2014). Klasifikasi Kanker Payudara dari Citra
Mammografi Menggunakan Model Fuzzy Neural Network.Yogyakarta:Universitas
Negeri Yogyakarta.
24
Novianti, Fourina Ayu. dan Purnami, Santi Wulan. (2012). Analisis Diagnosis Pasien
Kanker Payudara Menggunakan Regresi Logistik dan Support Vector Machine
(SVM) Berdasarkan Hasil Mamografi. Jurnal Sains dan Seni ITS Vol.1, No.1
ISSN: 2301-928X.
Qeethara, Kadhim Al-Shayea. (2011). Artificial neural networks in medical
diagnosis. International Journal of Computer Science Issues, Vol.8 Issue.2.
Sangadji, Iriansyah BM. (2009). Prediksi Pola Pengunjung Terhadap Transaksi pada
Toko Buku Gramedia Menggunakan Jaringan Syaraf Tiruan Metode
Backpropagation. Jurnal Informatika Universitas Kristen Maranatha Volume 5
nomor 2, ISSN 0216-4280.
Soesanto, Oni. dan Irawan, Mohammad Isa. (2010). Hybrid PCA-RBPNN Pada
Klasifikasi Data Multivariat.
Thomassey, S. dan Happiette, M. (2007). A neural clustering and
classificationsystem for sales forecasting of new apparel item. Applied Soft
Computing 7,1177–1187
Tingting, Mu. dan Nandi, A. K. (2007). Breast Cancer Detection from FNA using
SVM with Different Parameter Tuning Systems and SOM–RBF Classifier, Journal
of the Franklin Institute, Vol 344,pp. 285–311, 2007.
Wolberg, W. H., Street, W.N. dan Mangasarian, O.L. (1994). Machine Learning
Techniques to Diagnose Breast Cancer from Fine- Needle Aspirates. Cancer Lett.
77 (1994) 163–171.
Zekic, Marijana.(2000).Neural Network Applications in stock Market Prediction – A
methodology Analisys.
25