Transcript Slide 1

PENGEMBANGAN SISTEM PEMBENTUKAN WORD GRAPH
UNTUK TEKS BERBAHASA INDONESIA
Oleh :
DENI ROMADONI (G64054032)
Pembimbing :
Dr. Ir. Sri Nurdiati, M.Sc
Departemen Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
 Pengenalan Istilah
 Latar Belakang
 Tujuan Penelitian
 Ruang Lingkup Penelitian
 Tinjauan Pustaka
 Metodologi Penelitian
 Hasil dan Pembahasan
 Kesimpulan dan Saran
 Daftar Pustaka
 Bahasa buatan (bahasa formal) adalah bahasa yang
dibuat secara khusus untuk memenuhi kebutuhan
tertentu, misalnya bahasa pemodelan dan bahasa
pemograman tertentu.
 Natural language (bahasa alami ) adalah metode dan
sistem simbol yang paling banyak digunakan untuk
mengekspresikan pikiran manusia dan pertukaran
informasi (Zhang 2002).
 Natural Language Precessing (NLP) merupakan
bidang ilmu yang memproses bahasa alami.
 Knowledge Graph (KG) adalah salah satu jenis dari
representasi NLP, yang mengarahkan pada cara baru
dalam menjelaskan dan memodelkan NLP. KG
menggambarkan bahasa manusia dengan lebih
memfokuskan pada aspek semantik daripada aspek
sintatik.
 Word Graph merupakan graph dari serangkaian kata.
 Bahasa buatan sulit.
 Ambiguitas merupakan kendala utama bahasa alami.
 Implementasi KG untuk berbagai masalah dalam
upaya meminimlisir ambiguitas.
 Pengembangan software untuk implementasi KG.
 Software DelftConStruct belum sepenuhnya
memenuhi konsep KG.
Mengembangkan Perangkat lunak yang dapat
menggunakan metode KG untuk membentuk word
graph dari hasil analisis teks berbahasa Indonesia
 Pengembangan perangkat lunak Bogor DelftConStruct
yang sesuai dengan konsep KG.
 Dapat diimplementasikan untuk teks berbahasa
Indonesia.
 Menyediakan fitur untuk modifikasi word graph dan
pembentukan kamus word graph.
 Graph adalah pasangan dari himpunan verteks-verteks
V dan himpunan edge-edge E yang menghubungkan
antar verteks
 KG berupa graph berarah, tersusun dari concept, dan
basic relationship (ontologi).
 Concept terdiri dari token, type, dan name.
 Ontologi word graph direpresentasikan dengan sebuah
node, 8 binary relationship, 4 frame relationship, dan
ontologi F.
 Token adalah sebuah node dalam KG yang
ditunjukkan dengan persegi. Token merupakan
representasi dari verteks pada graph.
 Type adalah konsep yang masih bersifat umum dan
merupakan hasil dari kesepakatan yang telah dibuat
sebelumnya.
 Name adalah suatu konsep yang bersifat individual.
 8 binary relationship yang didefinisikan sebagai
berikut (Zhang 2002) :
 ALI (alikeness), digunakan di antara type dan token atau
diantara 2 token yang memiliki unsur-unsur yang sama,
contoh :
 CAU (causality), mengekspresikan sebab akibat atau
sesuatu hal mempengaruhi hal yang lain. Contoh :
 EQU (equality), di antara name dan token atau antara 2
token yang mengekspresikan2 token yang sama dan
sederajat. Contoh :
 SUB (subset), menyatakan 1 token adalah bagian dari
token yang lain, contoh :
 DIS (dissparatness), mengekspresikan bahwa 2 token
tidak memiliki hubungan satu dengan yang lainnya.
contoh :
 ORD (ordering), mengekspresikan bahwa 2 hal
mempunyai urutan satu sama lain, contoh :
 PAR (attribute), mengekspresikan bahwa sesuatu adalah
sebuah atribut dari sesuatu yang lain, contoh :
 SKO (informational dependency), digunakan , jika suatu
token informasinya bergantung pada token yang
lainnya, contoh :
 4 frame relationship dapat dijelaskan sebagai berikut :
 FPAR (focusing on a situation), mengekspresikan bahwa
sekumpulan subgraph dari graph adalah bagian dari
seluruh graph yang telah dibentuk.
 NEGPAR (negation of a situation), mengekspresikan
peniadaan atau pengingkaran terjadinya isi dari frame.
 POSPAR (possibility of a situation), mengekspresikan
kemungkinan terjadi Dari isi frame.
 NECPAR (necessity of a situation), mengekspresikan
perlu, butuh atau keharusan terjadi dari isi frame.
contoh penggunaan Frame :
Misalkan p adalah preposisi yang menyatakan” adik
bahagia”. Gambar diatas secara berurutan menunjukkan
graph dari pernyataan bahwa (a) adik bahagia, (b) tidak
benar adik bahagia, (c) kemungkinan adik bahagia, dan
(d) seharusnya adik bahagia
 Ontologi F digunakan untuk menunjukkan fokus dari
suatu graph .
 Pengembangan perangkat lunak menggunakan
metode Evolusioner dengan jenis exploratory.
 Deskripsi Perangkat Lunak
DelftConStruct merupakan tools yang menggunakan
KG untuk melakukan analisis teks dalam bentuk word
graph. Hal utama yang dibutuhkan :
 Membentuk dan modifikasi graph
 Analisis teks
 Membentuk dan modifikasi kamus word graph.

Spesifikasi
1.
Perancangan DelftConStruct meliputi :
Perancangan fungsional
 Modul pembentukan dan modifikasi word graph
 Modul analisis teks
 Modul pembentukan dan modifikasi kamus word graph
2.
Perancangan struktur data
3.
Perancangan antarmuka
Pengembangan
Lingkungan pengembangan / implementasi :

Perangkat keras





Intel® Pentium M Processor @1.8 GHz
Memori DDR 512 MB
Harddisk 60 GB
Monitor
Keyboard dan mouse
Perangkat lunak


Windows XP SP2 Operating System
MATLAB 7.0.1.24704 (R14) SP1 2004

Validasi
Validasi mencakup proses integrasi, uji dan
pemeliharaan sistem. Pengujian dilakukan dengan
menggunakan metode black box.
Hasil dan Pembahasan
Deskripsi batasan sistem
 Sistem tidak membedakan huruf kapital atau bukan.
 Pembuatan relasi antar teks tidak dapat dilakukan.
 Hanya ada sebuah token sebagai fokus.
 Sistem akan menolak penyimpanan word graph,
apabila masih terdapat minimal sebuah token atau
kata dalam graph yang belum terhubung dengan
minimal sebuah token lain.
Hasil dan Pembahasan (Cont …)
Spesifikasi dan perancangan fungsional
 Modul pembentukan dan modifikasi word graph.




Modul analisis graph.



Penambahan dan modifikasi pada token.
Penambahan dan modifikasi pada teks.
Penambahan dan modifikasi pada frame.
Analisis token
Analisis frame
Modul pembentukan dan modifikasi kamus word
graph.
Hasil dan Pembahasan (Cont …)
Spesifikasi dan perancangan struktur data
 Data mengenai token
 Info token bertipe cell
 Line dan arrow bertipe double
 Ontologi antar token dan label ontologi bertipe double

Data mengenai teks
 Info teks bertipe cell
 Line dan arrow bertipe double
 Ontologi antara teks dan token, serta label ontologi
bertipe double
Hasil dan Pembahasan (Cont …)
Spesifikasi dan perancangan struktur data (cont …)
 Data mengenai frame.
 Info frame bertipe cell
 Line dan arrow bertipe double
 Ontologi antar frame dan label ontologi bertipe double
 Ontologi antara frame dan token, serta label ontologi
bertipe double
 Data relasi ontologi.
 Binary relationship bertipe struct
 Frame relationship bertipe struct
Implementasi
Demo DelftConStruct
Validasi

Hasil pengujian menunjukkan kesesuaian antara
hasil yang seharusnya dengan hasil pengujian.

Kelebihan sistem ini yaitu :
 dapat membentuk dan melakukan modifikasi word
graph sesuai dengan konsep KG.
 dapat melakukan penyimpanan terhadap word graph
yang telah dibentuk.
Validasi (Cont …)

kekurangan sistem ini yaitu :
 Tidak terdapat modul untuk membuka dan menutup
sebuah frame.
 modul pembangkitan word graph dari masukan
berupa sebuah frase atau kalimat.
 modul untuk penggabungan word graph dari file yang
ada pada kamus word graph
Kesimpulan dan Saran
Kesimpulan
 DelftConStruct yang dikembangkan telah sesuai
dengan konsep KG.
 Pembentukan dan modifikasi pada setiap elemen.
word graph telah dapat dilakukan.
 Analisis word graph teks berbahas Indonesia dapat
dilakukan.
 Word graph yang telah dibentuk dapat disimpan dan
dimodifikasi.
Kesimpulan dan Saran (Cont…)
Saran
 Melengkapi modul untuk membuka dan menutup
sebuah frame.
 Melengkapi modul pembangkitan word graph dari
Masukan teks berupa frase atau kalimat.
 Melengkapi modul untuk penggabungan word graph
dari file-file yang ada pada kamus graph.
 Melengkapi sistem dengan modul analisis word
graph yang lebih optimal dan menghasilkan analisis
yang lebih sederhana, namun tepat sesuai dengan
makna yang dimaksud oleh word graph.
 Granadi A D, Khatiza E. 2006. Masalah Variasional untuk Persamaan Beda
dalam Graf Terboboti. Bogor : Departemen Matematika FMIPA IPB.
 Hoede C, Nurdiati S. 2008. A Graph Theoritical Analysis of Certain Aspects of
Bahasa Indonesia. Memorandum No. 1870, Departement of Applied
Mathematics, Universuty of Twente, Enschede, The Netherlands, ISSN 18744850.
 Hulliyah K. 2007. Rekayasa Memahami Teks Menggunakan Metode Knowledge
Graph. [tesis].Bogor : Sekolah Pascasarjana, Institut Pertanian Bogor.
 Rusiyamti. 2008. Analisis Teks Berbahasa Indonesia Mengunakan Teori
Knowledge Graph. [tesis]. Bogor : Sekolah Pascasarjana, Institut Pertanian
Bogor.
 Sommerville I. 2001. Software Engineering. 6th Ed. United Kingdom :Pearson
Education.
 Supriyo P T. 2006. Algoritma Rute Terpendek Berbasis Teori Graph. JMA, VOL.
5, No.1. Bogor : Departemen Matematika FMIPA IPB
 Zhang L. 2002. Knowledge Graph Theory And Structural Parsing. [Disertasi].
ISBN 9036518350. Netherlands : Twente University.
TERIMA KASIH