13508011 Presentasi Seminar TA1 – v09 Jan2012

Download Report

Transcript 13508011 Presentasi Seminar TA1 – v09 Jan2012

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI

M. ALBADR LUTAN NASUTION 13508011 1

PENDAHULUAN 2

Latar Belakang

• Aplikasi pengenalan huruf sangat praktikal • Bahasa arab dipakai oleh 50 negara • Riset untuk huruf Arab cenderung masih sedikit dibanding huruf latin dan Asia lain • Pembahasan fitur morfologis dan segmentasi huruf Arab masih sedikit 3

Rumusan Masalah

1.

2.

3.

4.

Proses segmentasi yang mendukung Fitur-fitur yang menjadi karakteristik huruf Kepentingan tiap fitur Kombinasi fitur dengan akurasi terbaik 4

Tujuan

Berhasil dibangunnya perangkat lunak yang dapat mengenali huruf Arab.

5

Batasan Masalah

• Bentuk citra : pindaian dokumen • Hanya huruf dan angka arab saja • Tidak mengenali angka arab internasional • Ligatur, harakat, dan tanda baca tajwid tidak ditangani pada tugas akhir 6

STUDI LITERATUR 7

Sistem Tulisan Arab

• • • • • • • Terdapat 28 huruf dan hamzah Tulisan selalu kursif Terdapat komponen sekunder Bentuk huruf berubah sesuai posisi Kata terpisah oleh upakata Sering terdapat ligatur Terkadang terdapat diakritik (harakat tanda baca vokal) 8

Contoh Tulisan Arab 1 upakata

baseline

1 kata 1 kata Al-Mamlakah al-'Arabiyah as-Sa'udiyah – Kerajaan Arab Saudi ligatur 9

Pengenalan Huruf

Piksel Fitur Huruf Praproses Segmentasi Representasi Pelatihan dan Pengenalan Pascaproses 10

Praproses Citra

bertujuan untuk mengolah data citra mentah menjadi data yang lebih berguna .

• Normalisasi histogram • Reduksi noise • Deteksi tepi • Penulangan/ penipisan • • Skala dan rotasi Deteksi garis dasar (baseline) 11

Segmentasi

bertujuan untuk memisahkan antar huruf dalam kata atau memisahkan citra per baris atau per kata 12

Ekstraksi Fitur

• Fitur level rendah • Diperoleh tanpa ada informasi tentang bentuk • Misalnya batas tepi, dan rasio piksel • Fitur level tinggi • Fitur terkait dengan bentuk pada citra • Misalnya bentuk persegi, elips, dan mata 13

Penelitian Terkait (1/4)

1.

• Pengenalan pelat nomor kendaraan oleh Sarfraz dkk. (2003) Fitur perbandingan piksel dengan templat • Akurasi hingga 95% dengan font tunggal 2.

• Pengenalan huruf arab secara online oleh Al-Taani & Al-Haj (2010) Fitur rasio persebaran densitas huruf • Akurasi hingga 90% 14

Penelitian Terkait (2/4)

3.

• Pengenalan huruf arab multifont oleh Izakian dkk. (2008) Fitur kode rantai • Fitur kode posisi komponen sekunder • Pengujian dengan 3 font • Akurasi hingga 97% 15

Penelitian Terkait (3/4)

4.

• Pengenalan huruf arab multifont oleh Zidouri (2010) Dua level pengenalan bentuk upakata lalu huruf • Fitur perbandingan piksel • Jaringan saraf tiruan • Usulan teknik segmentasi baru 16

Penelitian Terkait (4/4)

5.

• Pengujian berbagai fitur huruf arab oleh Abandah dkk. (2005, 2008, 2009) Empat fitur utama: 1.

Komponen sekunder • • 2.

3.

Fitur badan utama Fitur tulang 4.

Fitur perbatasan Implementasi 95 fitur huruf arab Perbandingan akurasi antar fitur 17

DESKRIPSI SOLUSI 18

Implementasi Tahapan Pengenalan Huruf

Praproses Citra Dokumen Segmentasi Penipisan dan Praposes Lanjutan Ekstraksi Fitur Klasifikasi 19

Fitur Huruf

1.

Fitur badan utama huruf Rasio pesebaran, bentuk lengkung, aspek rasio, arah lengkung, jumlah lubang, dll 2.

Fitur komponen sekunder huruf Jumlah, posisi, dan bentuk komponen, dll 3.

Fitur tulang Titik minat, kode rantai, dll 20

Pelatihan dan Pengujian

Data latih dan uji : • Dokumen cetak dengan ragam font • Basis data IFN/ENIT Persentase data latih dan uji : 50% - 50% 21

Terima Kasih

22