Transcript proposal
IMPLEMENTASI METODE RADIAL BASIS PROBABILISTIC NEURAL NETWORK (RBPNN) UNTUK KLASIFIKASI BREAST CANCER I. LATAR BELAKANG Breast cancer atau kanker payudara adalah jenis kanker yang terdapat pada jaringan payudara. Kanker payudara merupakan penyakit yang paling banyak menyerang kaum wanita. Kaum pria juga dapat terserang kanker payudara, walaupun kemungkinannya lebih kecil. Di Indonesia kanker payudara menempati urutan pertama pada pasien rawat inap di seluruh rumah sakit (Makhfudhoh, 2014). Berdasarkan situs kesehatan Deherba, pada tahun 2004 penderita kanker payudara mencapai 5.207 penderita di Indonesia. Satu tahun kemudian, banyaknya penderita kanker payudara meningkat menjadi 7.850 kasus. Banyaknya penderita penyakit kanker payudara ini semakin meningkat pada tiap tahunnya hingga mencapai 8.328 penderita pada tahun 2006. Pada tahun 2007 banyaknya penderita tidak jauh berbeda meski sedikit mengalami penurunan yaitu, 8.277 kasus (Makhfudhoh, 2014). Deteksi dini kanker payudara memegang peranan penting dalam mengantisipasi penyebaran kanker. Dengan deteksi dini, timbulnya sel-sel kanker dapat segera diatasi dan dicegah penyebarannya. Karena jika pasien kanker terlambat dideteksi, dapat menyebabkan resiko kematian akibat kanker semakin tinggi. Pemeriksaan payudara berguna untuk memastikan bahwa payudara seseorang masih normal. Bila ada kelainan seperti infeksi, tumor, atau kanker dapat ditemukan 1 lebih awal. Kanker payudara dapat dideteksi salah satunya melalui diagnosis definitif dari massa payudara yang hanya dapat dibentuk melalui fine-needle aspiration (FNA) biopsy, core needle biopsy, atau excisional biopsy (Chester, 1993). FNA adalah cara termudah dan tercepat untuk mendapatkan biopsi payudara, dan efektif bagi wanita yang memiliki kista berisi cairan. FNA menggunakan jarum yang lebih kecil dari yang digunakan untuk tes darah untuk mengeluarkan cairan, sel, dan fragmen kecil jaringan untuk diteliti di bawah mikroskop (Tingting, 2007). Setelah sampel FNA diambil dari massa payudara, materi dipasang pada slide mikroskop dan diberi warna untuk menyoroti inti sel. Sebagian dari sel yang terdiferensiasi dipindai menggunakan kamera digital. Gambar analisa sistem software Xcyt digunakan untuk mengisolasi inti individu. Untuk kemudian dievaluasi ukuran, bentuk dan tekstur masing-masing inti sel. Ditetapkan sepuluh karakteristik, yaitu jari-jari (radius), keliling (perimeter), luas (area), kepadatan (compactness), kelunakan (smoothness), kecekungan (concavity), poin cekung (concave points), simetri (symmetry), dimensi fraktal (fractal dimension), dan tekstur (texture) (Al-Timemy, 2009). Sepuluh karakteristik tersebut merupakan isi dari data set Wisconsin Diagnosis Breast Cancer (WDBC) yang akan digunakan dalam penelitian ini untuk mengklasifikasikan kanker payudara jinak dan ganas. Untuk mengklasifikasi tingkat keganasan dapat dilakukan dengan metode Radial Basis Probabilistic Neural Network (RBPNN) yang merupakan salah satu model dari Jaringan Syaraf Tiruan. Model Radial Basis Probabilistic Neural network (RBPNN) ini sendiri merupakan penggabungan model Radial Basis 2 Function (RBFNN) dan Probabilistic Neural network (PNN). Model RBFNN melibatkan dimensi tinggi pada lapisan tersembunyi (hidden Layer) dan neuron tersembunyi yang tak linier, namun metode ini memiliki struktur yang rumit, sedangkan model PNN mempunyai kemampuan klasifikasi yang secara langsung bisa dicapai tanpa melatih vektor bobot. Namun PNN tidak mempertimbangkan lingkungan dan overlapping antara vektor-vektor data training dari kategori yang berbeda sehingga berakibat bias. Selain itu pada PNN semua vektor data training digunakan sebagai center pada lapisan tersembunyi yang berakibat sangat rumit diterapkan pada data training yang berukuran besar sehingga performancenya menjadi lambat (Huang dan Zao, 2005). Dengan Radial Basis Probabilistic Neural Network (RBPNN) kelemahan kedua model ini bisa diatasi, karenanya Radial Basis Probabilistic Neural Network (RBPNN) inilah yang akan diterapkan pada sistem yang dibuat nantinya. Diharapkan metode ini dapat membantu dalam pengklasifikasian breast cancer, serta dapat memberikan alternatif diagnosa dan mempercepat pemeriksaan kesehatan payudara. II. RUMUSAN MASALAH Berdasarkan latar belakang tersebut maka rumusan masalah yang dapat diambil adalah bagaimana prosedur klasifikasi breast cancer menggunakan Radial Basis Probabilistic Neural Network (RBPNN)? 3 III. TUJUAN PENELITIAN Adapun tujuan yang ingin dicapai dari penelitian ini yaitu untuk menjelaskan prosedur klasifikasi breast cancer menggunakan metode Radial Basis Probabilistic Neural Network (RBPNN). IV. MANFAAT PENELITIAN Manfaat dari penelitian ini, yaitu untuk: 1. Mengetahui pengklasifikasian breast cancer dengan metode Radial Basis Probabilistic Neural Network (RBPNN) sehingga dapat memberikan alternatif diagnosa dan mempercepat pemeriksaan kesehatan payudara. 2. Menambah wawasan mengenai metode Radial Basis Probabilistic Neural Network (RBPNN) dalam aplikasi pengklasifikasian breast cancer. 3. Membantu sebagai bahan penambah ilmu pengetahuan, serta dapat dijadikan sebagai bahan perbandingan untuk melakukan penelitian di masa yang akan datang. V. BATASAN MASALAH Batasan masalah pada penelitian ini adalah sebagai berikut: 1. Data yang digunakan pada penelitian ini adalah data set Wisconsin Diagnosis Breast Cancer (WDBC) yang berasal dari University of Wisconsin Hospitals, Madison (UCI) Machine Learning Repository dengan judul Breast Cancer Wisconsin (Diagnostic). Dengan jinak (benign) sebanyak 357 kasus dan ganas (malignant) sebanyak 212 kasus. 4 2. Penelitian ini mengklasifikasikan breast cancer dengan menggunakan metode Radial Basis Probabilistic Neural Network (RBPNN). VI. TINJAUAN PUSTAKA 6.1. Kajian Terdahulu Penelitian tentang klasifikasi breast cancer dengan metode Radial Basis Probabilistic Neural Network (RBPNN) bukanlah pertama kali dilakukan, telah ada penelitian terdahulu tentang penerapan metode RPPBN tersebut. Penelitian terdahulu yang relevan dengan penelitian ini adalah sebagai berikut. Ali H. Al-Timemy, dkk (2009) dengan judul “Probabilistic Neural Network for Breast Biopsy Classification”. Penelitian ini bertujuan untuk mengembangkan metode PNN yang akan mengklasifikasikan sampel biopsi payudara menjadi kista ganas dan jinak berdasarkan fitur masukan karakteristik inti sel. Yang mana penelitian ini akan bertindak untuk membantu dalam pengklasifikasian kanker payudara. Dan menghasilkan klasifikasi dari input fitur menjadi ganas (malignant) dan jinak (benign). Dengan sensitivitas, spesifitas, dan akurasi yang dihasilkan berturut-turut sebesar 97.5%, 92.5%, dan 96.2%. Fourina Ayu Novianti dan Santi Wulan Purnami (2012) dengan judul “Analisis Diagnosis Pasien Kanker Payudara Menggunakan Regresi Logistik dan Support Vector Machine (SVM) Berdasarkan Hasil Mamografi”. Penelitian ini bertujuan untuk mengklasifikasikan diagnosis keadaan pasien kanker payudara benign (jinak) dan malignant (ganas) berdasarkan hasil mamografi dan melakukan analisis faktor-faktor apa saja yang mempengaruhi kanker payudara. Penelitian ini 5 menghasilkan pengklasifikasian menggunakan regresi logistik biner dengan ketepatan klasifikasi sebesar 88,72% dimana terdapat dua faktor yang berpengaruh terhadap kanker payudara malignant yaitu intermediate findings dan BIRADS. Sedangkan dengan menggunakan seleksi variabel L1-Norm SVM, semua variabel prediktor yang digunakan berpengaruh terhadap kanker payudara malignant dengan kontribusi terbesar adalah intermediate findings, kemudian BIRADS, suspicious for malignancy, letak abnormal, dan usia dengan ketepatan klasifikasi sebesar 94,34%. Imma Rizki Fitriani (2014) dengan judul “Peningkatan Metode Naive Bayes Classification untuk Penentuan Tingkat Keganasan Kanker Payudara Menggunakan Particle Swarm Optimization”. Penelitian ini menganalisis tentang pengelompokan data kanker payudara untuk mengetahui kanker tersebut termasuk kanker jinak atau kanker ganas dengan menggunakan teknik data mining yakni algoritma klasifikasi Naive Bayes Classifier (NBC). Dari hasil pengujian dengan tenfold cross validation dan confusion matrix diketahui bahwa Naive Bayes Classifier (NBC) dalam PSO terbukti memiliki akurasi 96,86%, sedangkan algoritma NBC memiliki akurasi 95,85%. Hasil penelitian ini terbukti bahwa PSO dapat meningkatkan akurasi algoritma NBC. Noor Uswah Makhfudhoh (2014) dengan judul “Klasifikasi Kanker Payudara dari Citra Mammografi Menggunakan Model Fuzzy Neural Network”. Penelitian ini menjelaskan bagaimana prosedur klasifikasi kanker payudara menggunakan model Fuzzy Neural Network (FNN). Prosedur awal klasifikasi kanker payudara menggunakan FNN adalah ektraksi citra mammografi untuk mendapatkan parameterparameter statistik, yaitu energy (X1), kontras (X2), korelasi (X3), sum of squares 6 (X4), inverse difference moment (X5), sum average (X6), sum variance (X7), sum entropy (X8), entropy (X9), difference variance (X10), difference entropy (X11), maksimum probabilitas (X12), homogenitas (X13), dan dissimilarity (X14). Penentuan variabel input, yaitu parameter-parameter statistik dari hasil ektraksi citra mammografi dan variabel output, yaitu klasifikasi tumor. Pembagian data menjadi dua, yaitu 80% data training dan 20% data testing. Penelitian ini menghasilkan klasifikasi kanker payudara dengan nilai sensitivitas, spesifisitas, akurasi secara berurutan sebesar 96%, 75%, 89% pada data training dan 77%, 83%, 79% pada data testing. Oni Soesanto dan Mohammad Isa Irawan (2010) dengan judul “Hybrid PCARBPNN Pada Klasifikasi Data Multivariat”. Penelitian ini mengkaji tentang Hybrid PCA-RBPNN (Principal Component Analysis- Radial Basis Probabilistik Neural Network) untuk klasifikasi data multivariat. Hasil percobaan memberikan hasil ratarata akurasi klasifikasi model Hybrid PCA-RBPNN sebesar 98.2818% untuk training 86.909705% untuk testing dengan CPU time 5.2969 detik. 6.2. Breast Cancer Breast Cancer atau kanker payudara merupakan salah satu jenis kanker yang sering ditemukan pada kebanyakan wanita. Kanker payudara terjadi karena pertumbuhan berlebihan atau perkembangan yang tidak terkendali dari sel-sel jaringan payudara. Berdasarkan data Sistem Informasi Rumah Sakit (SIRS) tahun 2007, kanker payudara menempati urutan pertama pada pasien rawat inap di seluruh rumah sakit di Indonesia, yaitu 16,85%. Menurut profil kesehatan Departemen 7 Kesehatan Republik Indonesia, tahun 2007 kanker yang diderita oleh wanita Indonesia adalah kanker payudara atau Breast Cancer dengan angka kejadian 26 per 100.000 perempuan. Pada tahun 2011, World Health Organization (WHO) memperkirakan bahwa lebih dari 508.000 wanita diseluruh dunia meninggal karena breast cancer (Fitriani, 2014). Meskipun kanker payudara sering ditemukan pada kebanyakan wanita, kaum pria juga dapat terserang kanker payudara, walaupun kemungkinannya lebih kecil. Berdasarkan situs kesehatan Deherba, tahun 2004 penderita kanker payudara hampir mencapai 5.207 penderita di Indonesia. Setahun kemudian banyaknya penderita kanker payudara meningkat menjadi 7.850 kasus. Banyaknya penderita penyakit kanker payudara ini semakin meningkat pada tiap tahunnya hingga mencapai 8.328 penderita pada tahun 2006. Pada tahun 2007 banyaknya penderita kanker payudara tidak jauh berbeda meski sedikit mengalami penurunan yaitu, 8.277 kasus. Penderita kanker payudara dari tahun ke tahun cenderung mengalami peningkatan yang cukup tinggi (Makhfudhoh, 2014). Faktor-faktor risiko kanker payudara adalah usia, jenis kelamin, riwayat reproduksi, riwayat keluarga, obesitas, dan konsumsi makanan lemak tinggi. Kanker payudara merupakan penyakit yang mematikan. Salah satu pengobatan yang dapat dilakukan adalah dengan pembedahan kemudian dilakukan kemoterapi tetapi pengobatan tersebut belum tentu berhasil jika kanker telah mencapai stadium akhir. Berdasarkan beberapa penelitian, kanker payudara dapat bersifat mematikan ketika diagnosa dan perawatan yang diberikan sudah terlambat. Kanker payudara yang diobati sejak stadium dini dapat menurunkan angka kematian sampai 30%. Jadi, 8 risiko kematian akibat kanker payudara dapat diminimalkan dengan deteksi sejak dini, sehingga deteksi dini perlu dilakukan untuk mencegah dampak buruk yang bisa terjadi (Makhfudhoh, 2014). Metode konvensional memantau dan mendiagnosa penyakit dengan mengandalkan pendeteksian keberadaan fitur tertentu oleh pengamat manusia. Dikarenakan banyaknya pasien di Intensive Care Units (ICU) dan diperlukan pengamatan yang berkelanjutan atas kondisi ini, beberapa teknik untuk sistem diagnostik otomatis telah dikembangkan dalam beberapa tahun terakhir, untuk menyelesaikan masalah ini. Teknik-teknik tersebut bekerja dengan mengubah kebanyakan kriteria diagnostik kualitatif menjadi masalah klasifikasi yang lebih obyektif kuantitatif (Al-Timemy, 2009). Kanker payudara dapat dideteksi melalui studi teliti dari riwayat klinis, pemeriksaan fisik, dan pencitraan, baik dengan mamografi atau USG. Namun, diagnosis definitif dari massa payudara hanya dapat dibentuk melalui fine-needle aspiration (FNA) biopsy, core needle biopsy, atau excisional biopsy (Chester, 1993). Di antara metode ini, FNA adalah cara termudah dan tercepat untuk mendapatkan biopsi payudara, dan efektif bagi wanita yang memiliki kista berisi cairan. FNA menggunakan jarum yang lebih kecil dari yang digunakan untuk tes darah untuk mengeluarkan cairan, sel, dan fragmen kecil jaringan untuk diteliti dengan menggunakan mikroskop (Tingting, 2007). Penelitian yang dikerjakan pada data Wisconsin Diagnosis Breast Cancer (WDBC) merupakan data yang muncul dari keinginan Dr. Wolberg untuk mendiagnosis massa payudara secara akurat hanya berdasarkan FNA. Sebelumnya, 9 peneliti dari University of Wisconsin, Madison, menerapkan teknik pengolahan citra untuk memperoleh dataset WDBC langsung dari scan digital dari FNA slide. Kemudian teknik machine learning dipakai untuk membedakan yang jinak dari sampel ganas, yang bisa menjadi studi awal penerapan aplikasi machine learning untuk mendeteksi kanker payudara (Wolberg, 1994). Dari FNA sampel digital yang telah dihitung itulah fitur dalam dataset ini didapat, yakni setelah sampel FNA diambil dari massa payudara, materi dipasang pada slide mikroskop dan diberi warna untuk menyoroti inti sel. Sebagian dari sel yang terdiferensiasi dipindai menggunakan kamera digital. Gambar analisa sistem software Xcyt digunakan untuk mengisolasi inti individu. Sebuah batasan perkiraan dari masing-masing inti diberikan sebagai masukan dan dibawa ke konvergensi tepat pada batas inti, menggunakan prosedur segmentasi semi-otomatis yang disebut ''snakes''. Dimulai dengan user memperkirakan batas sebagai inisialisasi, snakes ditempatkan tepat pada batas yang sebenarnya dari inti sel. Untuk mengevaluasi ukuran, bentuk dan tekstur masing-masing inti sel, ditetapkan sepuluh karakteristik, termasuk jari-jari (radius), keliling (perimeter), luas (area), kepadatan (compactness), kelunakan (smoothness), kecekungan (concavity), poin cekung (concave points), simetri (symmetry), dimensi fraktal (fractal dimension), dan tekstur (texture). 1. Radius dihitung dengan rata-rata panjang segmen garis radial, yang mana garis dari pusat massa dari batas kesetiap titik batas. 2. Perimeter diukur sebagai jumlah dari jarak antara titik batas berturutturut. 10 3. Area diukur dengan menghitung jumlah piksel pada interior batas dan menambahkan satu-setengah dari piksel pada perimeter, untuk mengoreksi kesalahan yang disebabkan oleh digitalisasi. 4. Compactness (COM) menggabungkan perimeter dan area untuk memberikan ukuran kepadatan sel, dihitung sebagai: 𝑃𝐸𝑅 2 COM = 𝐴𝑟𝑒𝑎 (1) Jumlah tanpa dimensi ini diminimalkan untuk lingkaran dan meningkat dengan batas yang tidak teratur. 5. Smoothness (SM) dihitung dengan mengukur perbedaan antara panjang setiap baris radial dan panjang rata-rata dari dua garis radial sekitarnya. Jika angka ini relatif kecil dibandingkan dengan jarak antara titik batas berturut-turut, maka kontur halus di daerah itu. Untuk menghindari ketidakstabilan numerik yang terkait dengan pembagi kecil, persamaan berikut digunakan untuk menghitung smoothness: SM = ∑𝑝𝑜𝑖𝑛𝑡 𝑠 |𝑟𝑖 −𝑟𝑖 +𝑟𝑖+1 /2| 𝑃𝐸𝑅 (2) Dimana ri adalah panjang garis pusat massa dari batas untuk setiap titik batas. 6. Concavity diambil dengan mengukur ukuran dari setiap lekukan di batas inti sel. 7. Concave point mirip dengan concavity, tetapi hanya menghitung jumlah titik batas yang terletak di daerah batas kecekungan, bukan besarnya kecekungan tersebut. 11 8. Symmetry diukur dengan menemukan perbedaan relatif panjang antara sepasang segmen garis tegak lurus terhadap sumbu utama dari kontur inti sel. Sumbu utama ditentukan dengan mencari chord terpanjang, yang melewati titik batas melalui pusat inti. Sepasang segmen kemudian ditarik secara berkala. Untuk menghindari hasil numerik yang tidak stabil karena segmen yang sangat kecil, jumlah dibagi kembali, daripada menjumlahkan hasil bagi, ∑ |𝑙𝑒𝑓𝑡 −𝑟𝑖𝑔ℎ𝑡 | Symmetry = ∑𝑖 |𝑙𝑒𝑓𝑡𝑖 +𝑟𝑖𝑔ℎ𝑡𝑖 | 𝑖 𝑖 𝑖 (3) Dimana lefti dan righti menunjukkan panjang segmen tegak lurus di sebelah kiri dan kanan sumbu utama, masing-masing. 9. Fractal Dimension didekati menggunakan coastline approximation dijelaskan oleh Mandelbrot. Perimeter inti diukur dengan menggunakan “penggaris” yang lebih besar. Karena ukuran penggaris meningkat, ketepatan pengukuran menurun, dan perimeter yang diamati menurun. Merencanakan nilai-nilai ini pada skala log-log dan mengukur kemiringan ke bawah memberikan perkiraan negatif untuk dimensi fraktal. 10. Texture diukur dengan mencari varians dari intensitas skala abu-abu dalam pixel komponen. Nilai rata-rata, standar error, dan ekstrim (terbesar atau '' terburuk ''). (Al-Timemy, 2009). 12 6.3. Klasifikasi Tumor Payudara Tumor adalah massa jaringan yang tidak normal. Menurut National Breast Cancer Foundation, terdapat 2 tipe tumor payudara, yaitu: a. Tumor Jinak Payudara (Benign Breast Tumors) Tumor jinak payudara adalah pertumbuhan sel yang tidak normal tetapi tidak menyebar keluar payudara dan tidak mengancam nyawa manusia. Namun, tumor jinak payudara dapat meningkat menjadi kanker sehingga tumor jinak payudara tetap patut diwaspadai. Ketika tumor didiagnosa sebagai tumor jinak, dokter selalu membiarkannya daripada mengangkatnya. Meskipun biasanya tumor ini tidak menyerang sekitar jaringan payudara, kadang tumor ini bisa tumbuh menekan organ dan menyebabkan luka atau masalah lain. Pada keadaan ini, tumor harus segera diangkat. b. Tumor Ganas Payudara (Malignant Breast Tumor/Breast Cancer) Tumor ganas payudara adalah kumpulan sel kanker yang tumbuh dan dapat menyebar pada berbagai bagian tubuh. Tumor ganas berbahaya karena menyerang sekitar jaringan payudara. Ketika tumor dicurigai sebagai tumor ganas, maka dokter akan melakukan biopsi untuk mendiagnosa tumor. (Makhfudhoh, 2014). Berdasarkan klasifikasi diatas, masalah klasifikasi yang dibahas dalam penelitian ini adalah deteksi tumor payudara ganas dari satu set sampel jinak dan ganas, yang disebut dataset WDBC, yang diperoleh dari University of Wisconsin Rumah Sakit, Madison, tersedia di http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29. 13 6.4. Jaringan Syaraf Tiruan Pembuatan struktur jaringan saraf tiruan diilhami oleh struktur jaringan biologi, khususnya jaringan otak manusia. Sistem saraf buatan adalah sebuah sistem proses informasi yang memiliki cara kerja dan karakteristik seperti jaringan saraf pada makhluk hidup (fausett, 1994). Ini kemudian dikembangkan sebagai generalisasi pemodelan matematika berpola pada saraf kognitif manusia (Zekic, 2000). Sistem ini akan melakukan pembelajaran-pembelajaran yang bersifat derifatif untuk mencapai sebuah konvergensi. Dapat dikatakan juga bahwa Sistem saraf tiruan adalah alat bantu yang digunakan secara umum dan diaplikasikan untuk memprediksi, mengklasifikasi dan clustering. Sistem AI akan melakukan proses belajar sendiri berdasarkan data history yang telah didapat, kemudian berdasarkan itu akan dihasilkan experience data yang diprepresentasikan pada decision Boundary untuk mencapai nilai keluaran (Sangadji, 2009). Gambar1.Struktur jaringan saraf biologi dan Buatan (Sangadji, 2009). 14 Jaringan syaraf tiruan disebut juga dengan kecerdasan jaringan syaraf tiruan. Jaringan syaraf tiruan banyak ditemukan pada aplikasi-aplikasi diagnosis medis. Aplikasi jaringan syaraf tiruan banyak digunakan oleh dokter sebagai bahan untuk proses analisis, pemodelan dan pemahaman data klinis yang sangat kompleks. Sebagian besar aplikasi jaringan syaraf tiruan pada ilmu kedokteran merupakan masalah-masalah klasifikasi. Jaringan syaraf tiruan merupakan model komputasional yang mencoba menjelaskan sifat paralel otak manusia. Jaringan syaraf tiruan adalah sebuah jaringan dari hubungan proses-proses elemen (neuron) yang beroperasi secara paralel (Qeethara, 2011). Pada jaringan syaraf tiruan, masing-masing titik (node) melakukan perhitungan sederhana dan masing-masing sambungan menyampaikan sinyal dari satu node ke node lainnya, dimana masing-masing diberi label yang disebut dengan “connection strength“ atau “bobot” yang menunjukkan sejauh mana sinyal-sinyal yang ada diperkuat atau dikurangi oleh hubungannya. Jaringan syaraf tiruan pemodelannya sangat erat dengan cara kerja otak sehingga terminologi pada jaringan syaraf tiruan mirip dengan neuroscience (ilmu yang berhubungan dengan syaraf) (Dongare, 2012). Karakteristik utama dari jaringan syaraf tiruan adalah kemampuannya dalam mempelajari, pembagian memori dan operasi paralel dimana akan dihasilkan toleransi kesalahan. Secara umum terdapat tiga lapisan jaringan, yaitu lapisan masukkan (input / (I)), lapisan tersembunyi (hidden/(H)) dan lapisan (output/(O)) (Faridah, 2011). Berikut ini merupakan gambar struktur Jaringan Syaraf Tiruan (JST): 15 Gambar2.Struktur Jaringan Syaraf Tiruan (Faridah, 2011). 6.5. Radial Basis Probabilistic Neural Network (RBPNN) Model Radial Basis Probabilistic Neural network (RBPNN) merupakan penggabungan model Radial Basis Function (RBFNN) dan Probabilistic Neural network (PNN) berdasarkan keunggulan masing-masing dari dua model tersebut. RBFNN melibatkan dimensi tinggi pada lapisan tersembunyi (hidden Layer) dan neuron tersembunyi yang tak linier, namun metode ini memiliki struktur yang rumit, sedangkan model PNN mempunyai kemampuan klasifikasi yang secara langsung bisa dicapai tanpa melatih vektor bobot. Namun PNN memiliki permasalahan yaitu tidak mempertimbangkan lingkungan dan overlapping antara vektor-vektor data training dari kategori yang berbeda sehingga berakibat bias. Selain itu pada PNN semua vektor data training digunakan sebagai center pada lapisan tersembunyi yang berakibat sangat rumit diterapkan pada data training yang berukuran besar sehingga performancenya menjadi lambat. Namun kelemahan PNN ini bisa diatasi oleh 16 RBFNN dengan menyelesaikan permasalahan pertama pada PNN dan mengoptimalkan permasalahan kedua (Huang dan Zao, 2005). Radial Basis Function Neural Network (RBFNN) merupakan jaringan Multilayered Feedforward Neural Network (MFNN) yang terdiri dari tiga lapisan, yaitu input, hidden layer dan output. Jaringan ini merupakan pemetaan fungsi tak linier multi dimensional yang tegantung pada jarak antara vektor input dan vektor center. RBFNN merupakan metode yang handal untuk permasalahan regresi dan klasifikasi. Untuk training data pada RBFNN menggunakan struktur khusus yang melibatkan dimensi tinggi pada hidden layer dan non linier input pada hidden layernya untuk mensimulasi sejumlah training data yang memerlukan akurasi (Du dkk., 2006). Model Probabilistic Neural Network (PNN) telah banyak digunakan pada berbagai bidang aplikasi sepeti klustering dan klasifikasi pada forecasting (Thomassey, 2007), dan klasifikasi pada image recognition (Diamantaras, 2009). PNN dikonstruksi berdasarkan teori probabilitas klasik seperti klasifikasi Bayesian dan estimator klasik fungsi kepadatan peluang untuk membentuk jaringan syaraf pada klasifikasi pola. Pada permasalahan klasifikasi, PNN melakukan training dengan menghitung jarak input pada lapisan pertama yang mengindikasikan kedekatan dengan vektor input training. Lapisan kedua merupakan kontribusi setiap klas input yang menghasilkan net output vektor probabilitas (Huang dan Zao, 2005). 17 Gambar 3 Arsitektur RBPNN (Huang dan Zao, 2005) Model Radial Basis Probabilistic Neural Network (RBPNN) merupakan model jaringan yang menggabungkan beberapa keunggulan Jaringan Fungsi Basis Radial (RBFNN) dan Jaringan Probabilistik (PNN) (Huang dan Du, 2008). Radial Basis Function Neural Network (RBFNN) dikenal sebagai model neural network yang handal dan banyak digunakan pada masalah peramalan (forecasting) dan klasifikasi (Soesanto, 2010). Pada Gambar 3 adalah jaringan RBPNN yang terdiri dari empat layer, yaitu layer input, dua hidden layer dan layer output. Hidden layer pertama merupakan layer dengan proses non linier, yang secara umum terdiri dari center tersembunyi yang ditentukan dari training input. Hidden layer kedua merupakan penjumlahan dari output layer pertama, dan secara umum memiliki ukuran yang sama dengan layer output. Bobot antara hidden layer pertama dan hidden layer kedua, merupakan bobot konstan. Artinya, bobot disetting tetap sehingga tidak diperlukan learning. Lapisan terakhir dari RBPNN adalah lapisan output. Secara matematis, RBPNN dengan vektor input x akan menghasilkan nilai 18 aktual untuk neuron output ke-i yang dinyatakan sebagai persamaan berikut (Huang dan Du, 2008): M yi wik hk ( x ) (1) k 1 dimana nk nk i 1 i 1 hk ( x) i ( x, cki ) i ( x cki 2 ), k 1,2,.., M (2) Dengan, hk(x) : nilai output ke-k dari lapisan hidden kedua wki : bobot synaptik antara neuron ke-k pada lapisan hidden kedua dan neuron ke i pada lapisan output cki : vektor center hidden untuk klas ke-k nk : jumlah vector center hidden untuk klas ke-k ‖•‖2 : norm Eucledian M : jumlah neuron pada lapisan output dan hidden layer kedua atau jumlah klas untuk sample training Untuk φi(•) adalah fungsi kernel yang umumnya fungsi kernel Gaussian, 𝜑𝑖 (‖𝑥 − 𝑐𝑘𝑖 ‖2 ), dapat ditulis sebagai berikut: ‖𝑥−𝑐𝑘𝑖 ‖22 𝜑𝑖 (‖𝑥 − 𝑐𝑘𝑖 ‖2 ) = 𝑒𝑥𝑝 ( 𝜎𝑖2 ) (3) Dimana σi adalah parameter pada fungsi kernel Gaussian. 19 Metode penentuan inisialisasi center untuk RBFNN dapat juga dilakukan pada RBPNN. Salah satu metode yang digunakan untuk menentukan inisialisasi center RBFNN yaitu dengan menggunakan teknik klustering (Soesanto, 2010). Berikut adalah algorithma RBPNN: 1. Inisialisasi: Tahap inisialisasi RBPNN menggunakan input hasil klustering. 2. Training: Proses training merupakan pelatihan dari data input RBPNN kedalam fungsi aktivasi Gaussian. a. Untuk setiap vektor input pelatihan dihitung jaraknya terhadap center dengan persamaan fungsi Gaussian berikut: 𝜙𝑖 (‖𝑥 − 𝑐𝑘𝑖 ‖2 ) = exp (− ‖𝑥 − 𝑐𝑘𝑖 ‖22 ) 𝜎𝑖2 denganσi adalah parameter pada fungsi kernel Gaussian diberikan sebagai berikut: 𝜎= 𝑑𝑚𝑎𝑥 √𝐾 Dimana dmaxadalah jarak Euclid maksimal dari kelompok pelatihan dan K adalah jumlah total kelompok pelatihan. b. Hitung matriks H yaitu output pada hiddenlayer pertama dengan persamaan sebagai berikut: nk nk i 1 i 1 hk ( x ) i ( x ,cki ) i ( x cki 2 ), k 1,2,..,m c. Selanjutnya dilakukan dekomposisi orthogonal matriks H secara rekursif d. Hitung output: Y = HW 20 3. Testing : Pada proses testing, vektor input untuk testing dimasukkan proses (1) dan (2) pada training untuk mendapatkan matriks H. Selanjutnya matriks H tersebut digunakan untuk mencari output Y dengan menggunakan bobot W yang telah diperoleh pada proses training. (Soesanto, 2010). VII. METODE PENELITIAN 7.1. Metode Penelitian Adapun metodologi yang digunakan dalam penelitian ini adalah menggunakan metode data mining. Tahapan-tahapan untuk pengelolaan data mining yang digunakan dalam penelitian ini adalah: 1. Analisis Kebutuhan Tahap ini bertujuan untuk menganalisa terhadap kebutuhan sistem. Pengumpulan data dalam tahap ini dilakukan melalui penelitian dan studi literatur. 2. Data Selection dan Addition Pada tahap ini, melakukan penentuan data dan memilih data yang akan digunakan. Pada penelitian ini dipilih data yaitu data yang telah diperoleh dari University of Wisconsin Hospitals, Madison (UCI) Machine Learning Repository dengan judul Breast Cancer Wisconsin (Diagnostic) yakni data set Wisconsin Diagnosis Breast Cancer (WDBC). 21 3. Preprocessing dan Cleaning Data Dalam tahap ini kehandalan data ditingkatkan. Termasuk pembersihan data, seperti menangani data yang tidak lengkap, menghilangkan gangguan atau outlier. Dalam penelitian ini, terdapat pembersihan beberapa data yang nantinya akan menyulitkan dalam menjadikan parameter untuk klasifikasi. 4. Data Mining Pada tahap ini dilakukan pemilihan algoritma dan implementasi dari algoritma data mining. Tahap ini terdiri dari: a. Coding Tahap ini merupakan tahapan dilakukannya penerjemahan dalam bentuk pemrograman. Pada proses ini lebih diketahui mengenai metode apa yang digunakan. Proses pengklasifikasian dilakukan dengan menggunakan metode Jaringan Syaraf Tiruan dengan model Radial Basis Probabilistic Neural Network (RBPNN). b. Testing Pada tahap ini dilakukan pengujian untuk mengetahui apakah sistem yang dibuat telah sesuai dengan kebutuhan dan masih terdapat kesalahan atau tidak. 5. Evaluasi Pada tahap ini dilakukan evaluasi dan penerjemahan dari pola yang diperoleh, kemudian diinterpretasikan sebagai pengetahuan yang dapat digunakan untuk dapat menjawab rumusan masalah dan tujuan dari penelitian ini. Yakni bagaimana prosedur klasifikasi breast cancer menggunakan Radial Basis Probabilistic Neural Network (RBPNN). 22 7.2. Jadwal Penelitian Tabel 1. Jadwal Penelitian No Kegiatan 1. Pengumpulan Data 2. Analisa Permasalahan 3. Penerapan Algoritma 4 Desain Sistem 5. Uji Algoritma dan Implementasi 6. Pembuatan Laporan Bulan 1 2 3 4 23 DAFTAR PUSTAKA Al-Timemy, Ali H., Al-Naima, Fawzi M. dan Qaeeb, Nebras H. (2009). Probabilistic Neural Network for Breast Biopsy Classification. MASAUM Journal of Computing, Volume 1 Issue 2. Chester, M. (1993). Neural Networks: A Tutorial, Englewood Cliffs, NJ: Prentice Hall, 1993, ch.2. Diamantaras, K.I. dan Papadimitrious, T. (2009 ). Applying PCA neural models forblind separation signals. Neurocomputing 73, 3–9. Dongare, A.D., Kharde, R.R. dan Kachare, Amit D. (2012). Introduction to artificial neural network. International Journal of Engineering and Innovative Technology, Vol.2 Issue 1. pp.189-194, ISSN: 2277-3754. Du, J.X., Huang, D.S., Zhang, G.J. dan Wang, Z.F. (2006), A Novel Full Structure Optimization Algorithma for Radial Basis Probabilistic Neural network,Journal of Neurocomputing 70, 592–596. Faridah, Othman. dan Naseri, Mahdi. (2011). Reservoir inflow forecasting using artificial neural network. International Journal of The Physical Science, Vol. 6(3) pp. 434 - 440, ISSN 1992 - 1950. Fausett, Laurene. (1994). Fundamentals of Neural Network : Architecture algorithm and Applications, Prentice Hall. Fitriani, Imma Rizki. (2014). Peningkatan Metode Naïve Bayes Classification untuk Penentuan Tingkat Keganasan Kanker Payudara Menggunakan Particle Swarm Optimization. Universitas Dian Nuswantoro. Hasanuddin. (2008). Kajian Sensitivitas Jaringan Syaraf Probabilistik Basis Radial,Tesis-Magister. ITS Surabaya. Huang, DS. dan Du, JX (2008). A Constructive Hybrid Structure Optimization Methodology for Radial Basis Probabilistic Neural network. IEEE Transactionon Neural network 19, 2099–2115. Huang, DS. dan Zao, WB (2005). Determining the Center of radial Basis ProbabilisticNeural network by Recursive Orthogonal Least Square Algorithms. Applied Mathematics and Computation 162, 461–473. Makhfudhoh, Noor Uswah. (2014). Klasifikasi Kanker Payudara dari Citra Mammografi Menggunakan Model Fuzzy Neural Network.Yogyakarta:Universitas Negeri Yogyakarta. 24 Novianti, Fourina Ayu. dan Purnami, Santi Wulan. (2012). Analisis Diagnosis Pasien Kanker Payudara Menggunakan Regresi Logistik dan Support Vector Machine (SVM) Berdasarkan Hasil Mamografi. Jurnal Sains dan Seni ITS Vol.1, No.1 ISSN: 2301-928X. Qeethara, Kadhim Al-Shayea. (2011). Artificial neural networks in medical diagnosis. International Journal of Computer Science Issues, Vol.8 Issue.2. Sangadji, Iriansyah BM. (2009). Prediksi Pola Pengunjung Terhadap Transaksi pada Toko Buku Gramedia Menggunakan Jaringan Syaraf Tiruan Metode Backpropagation. Jurnal Informatika Universitas Kristen Maranatha Volume 5 nomor 2, ISSN 0216-4280. Soesanto, Oni. dan Irawan, Mohammad Isa. (2010). Hybrid PCA-RBPNN Pada Klasifikasi Data Multivariat. Thomassey, S. dan Happiette, M. (2007). A neural clustering and classificationsystem for sales forecasting of new apparel item. Applied Soft Computing 7,1177–1187 Tingting, Mu. dan Nandi, A. K. (2007). Breast Cancer Detection from FNA using SVM with Different Parameter Tuning Systems and SOM–RBF Classifier, Journal of the Franklin Institute, Vol 344,pp. 285–311, 2007. Wolberg, W. H., Street, W.N. dan Mangasarian, O.L. (1994). Machine Learning Techniques to Diagnose Breast Cancer from Fine- Needle Aspirates. Cancer Lett. 77 (1994) 163–171. Zekic, Marijana.(2000).Neural Network Applications in stock Market Prediction – A methodology Analisys. 25