FUZZY INFORMATION RETRIEVAL

Download Report

Transcript FUZZY INFORMATION RETRIEVAL

FUZZY INFORMATION
RETRIEVAL
Kelompok 4
Betha Nurina Sari
Rina Ayoni Dewi
Retnani Latifah
Nur Fadilahtul M
Kingkin Bangkit R
Eka Yanuar P
INFORMATION RETRIEVAL
Information Retrieval (IR) :cabang dari
ilmu komputer yang meliputi
penyimpanan, pemeliharaan dan pencarian
informasi dengan data dalam jumlah besar.
 Data-data tersebut dapat berupa teks,
video, gambar, multimedia dan lain-lain.
(Snasel, Abraham, Owais, Platos, Kromes,
2008).

MODEL Information Retrieval
Boolean
Suatu cara dalam mengekspresikan keinginan
pemakai ke sebuah kueri dengan mamakai
operator-operator Boolean yaitu : “and”, “or”, dan
“not”.
 Vektor
Strategi pencarian dokumen yang mendekati
kondisi queri, pola bobot mengurutkan dokumen
berdasarkan derajat kesamaan pada queri

(Rubens, 2006)
Komponen Information Retrieval
Representasi query
menggambarkan permintaan informasi
user
 Representasi dokumen
menggambarkan koleksi teks
 Fungsi Ranking
merangking dokumen menurut
relevansinya
(Oussalah dan Elitgani, 2005)

FUZZY INFORMATION
RETRIEVAL
Saat ini dikembangkan model baru IR yang
berbasis fuzzy untuk digunakan dalam
pengambilan informasi (Oussalah dan
Eltigani, 2005).
 Model IR dengan teori fuzzy atau
menggunakan logika fuzzy mulai
dikembangkan oleh beberapa peneliti.
Teori ini dikembangkan sekitar akhir 1970
dan dirangkum oleh Salton (Grossman
dan Frieder, 2004).

FUZZY INFORMATION
RETRIEVAL
Sistem IR mencari dokumen berdasarkan query
yang diberikan. Dokumen dan query adalah
contoh dari bahasa natural. Bahasa ini seringkali
ambigu dan tidak pasti. Sulit untuk menentukan
sesuatu yang ambigu dan tidak pasti dalam logika
crisp (Rubens,2006).
 Logika fuzzy berdasar pada teori yang
berhubungan dengan class dari obyek dengan
batasan yang tidak jelas dengan keanggotaan
berdasarkan derajat. Dokumen, query dan
karakteristiknya dapat dengan mudah dilihat
sebagai class granular dari obyek dengan batasan
yang tidak jelas dan keanggotaan fuzzy di banyak
aspek (Rubens,2006).

FUZZY INFORMATION
RETRIEVAL

Logika fuzzy adalah sistem logika yang
merupakan perluasan logika multi value.
Menggunakan logika fuzzy memberikan
keuntungan dari metode Boolean saat
mengatasi kekurangan. Model logika fuzzy
menyediakan framework yang mudah
dimengerti untuk pengguna awam dari
sistem IR. Dokumen yang didapat dari query
dievaluasi dengan aturan Fuzzy Inference
System (FIS) yang memiliki semantik yang
tepat (Rubens, 2006)
FUZZY SET

FUZZY SET(Himpunan fuzzy)
himpunan dari pasangan terurut A = {(x,
µa(x)) : x€X)}. Dimana X adalah himpunan
semesta dari obyek dan µa(x) adalah nilai
keanggotaan suatu obyek x dalam A yang
berada dalam interval tertutup [0,1].
FUZZY RELATION
Fuzzy relation dijelaskan sebagai sebuah
metode untuk menggambarkan hubungan
antara dua objek (kata) yang berbeda.
 Dalam kasus IR adalah kata yang berbeda.
Contohnya kata ‘fuzzy’ dan ‘neural
network’ adalah dua kata yang berbeda
tapi jika terdapat lebih dari satu dokumen
yang memiliki dua kata tersebut maka bisa
jadi keduanya ada hubungan.
(Darmadi dkk, 2006)

Jenis Relasi untuk pencarian paper
dengan Relasi fuzzy

Keyword to paper
Nilai didapatkan dari hasil pencarian pada
karya ilmiah dengan menggunakan
keyword dengan melihat jumlah kata yang
ditemukan. Nilai fuzzy ditentukan dengan
Nilai_keyword_terhadap_paper = min(1,n/20)
(1)
(Darmadi dkk, 2006)
Jenis Relasi untuk pencarian paper
dengan Relasi fuzzy

Paper to paper
(2)

Keterangan:
◦
◦
◦
◦
◦
◦
R : Relasi
Pi : Paper / dokumen ke – i
Pj : Paper / dokumen ke – j
D : Keyword
µ: Membership function sebagai suatu mapping
µPi : D  [0,1]
(Darmadi dkk, 2006)
Jenis Relasi untuk pencarian paper
dengan Relasi fuzzy

Paper to keyword
(3)

Keterangan:
◦
◦
◦
◦
◦
◦
R : Relasi
Pi : Paper / dokumen ke – i
Pj : Paper / dokumen ke – j
D : Keyword
µ: Membership function sebagai suatu mapping
µPi : P  [0,1]
(Darmadi dkk, 2006)
Jenis Relasi untuk pencarian paper
dengan Relasi fuzzy

Keyword to keyword
(4)

Keterangan:
◦
◦
◦
◦
◦
◦
R : Relasi
Pi : Paper / dokumen ke – i
Pj : Paper / dokumen ke – j
D : Keyword
µ: Membership function sebagai suatu mapping
µPi : P  [0,1]
(Darmadi dkk, 2006)
Extended Fuzzy

Rumus diatas masih belum cukup untuk
menghasilkan pencarian dimana juga
melibatkan hubungan dengan kata dan atau
karya ilmiah lain pada halaman yang sama.
Untuk mewujudkan hal tersebut maka
dilakukan lagi satu tahapan perhitungan yaitu
untuk menentukan hubungan dengan kata
atau karya ilmiah lain serta menentukan juga
bentuk urutan keluaran yang diinginkan
(rangking). Perhitungan tersebut disebut
sebagai extended fuzzy (Darmaji dkk, 2006)
Contoh extended fuzzy
Kata pencarian adalah K1 dan K1
mempunyai hubungan dengan kata yang
lain. Hubungannya dijabarkan sebagai
berikut: K1 = {1/K1,0.8/K7,0.5/K8}
 Maka pencarian juga melibatkan kedua
keyword diatas sehingga pencarian akan
mencari K1,K7,K8. Kemudian dari hasil
pencarian masing – masing keyword
didapatkan 3 hasil fuzzy set yang masing –
masing mempunyai nilai sendiri – sendiri.


Misalnya :
◦
◦
◦
◦
◦
◦

P5 = {1/K1,0.5/K7}
P6 = {1/K7}
P7 = {0.4/K1,0.8/K7}
P8 = {0.8/K8}
P9 = {0.7/K8}
P10 = {0.9/K8}
Hubungan antara ketiga fuzzy sets diatas
dibentuk dengan mengalikan nilai (Dot
Product) relasi keyword dengan nilai element
pada hasil
(Darmaji dkk, 2006)
Fuzzy Retrieval Menurut Oussalah
dan Elitgani (2005)

Menentukan himpunan fuzzy µ(ti)
berhubungan dengan tiap indeks kata
kunci ti pada daftar dokumen :
(5)
 idf(ti) adalah frekuensi dokumen sebaliknya dari
kata kunci ti diberikan idf(ti) = log(N/ni)
 N adalah jumlah total dokumen dalam database
dan ni adalah jumlah total dokumen yang berisi
indeks kata kunci ti.
Fuzzy Retrieval Menurut Oussalah
dan Elitgani (2005)

Alternatif dari rumus (5) dalam
menemukan himpunan fuzzy untuk tiap
dokumen dari indeks kata kunci :
µ(dj)(tj) = µ(ti)(dj)
(6)
(7)
dimana qk adalah komponen ke k dari
query q digunakan pada ekspresi logika L
seperti q = L(q1,q2,...) dan L adalah
ekstensi himpunan fuzzy L.
Fuzzy Retrieval Menurut Oussalah
dan Elitgani (2005)
Relevansi dari dokumen dj untuk query
dapat diekspresikan sebagai hasil dari
implikasi fuzzy berikut :
(8)
dimana I menunjukkan operator fuzzy I.
 Contohnya dengan menggunakan
Implikator Lukasiewicz
(9)

Contoh penerapan :
Ada himpunan 3 dokumen :
D1 : “student have access to computers”
D2 : “people do not like computers and laptops”
D3 : “computer courses are fmiliar to students”
Query q : “student have computer OR laptops”
 Himpunan indeks kata kunci :
K = (students, have, access, to, computers, people,
do, like, laptops, courses, are, familiar),
dengan t1 = students, t2 = have,..., t12= familiar

(Oussalah dan Elitgani, 2005)
Contoh penerapan
Penerapan rumus 5
Penerapan rumus 6
(Oussalah dan Elitgani, 2005)
Contoh Penerapan
sehingga
(Oussalah dan Elitgani, 2005)
Contoh Penerapan
Dengan operasi Max maka hasilnya
Menggunakan rumus 9 maka
Sehingga dapat disimpulkan dokumen d1 yang
paling relevan dengan query. Sedangkan
dokumen d2 dan d3 sama-sama relevan
(Oussalah dan Elitgani, 2005)
Aturan Fuzzy untuk mencari
dokumen
Jika term index menunjuk pada judul dokumen maka
diberikan nilai yang paling tinggi
 Jika menunjuk pada daftar keyword pada dokumen,
maka dokumen tersebut diberi nilai tertinggi kedua.
 Jika pada Bab atau subbab maka diberi nilai tertinggi
ketiga.
 Jika ditemukan pada bagian isi yang berhuruf tebal
maka hubungannya secara virtual akan diperluas
 Jika sebuah quantifier ditemukan maka index yang
berhubungan dengan quanifier itu akan dialokasikan
frekuensi lebih atau kurang berdasarkan sifat alami
quantifier dengan cara mengalikan fi,j (1) dengan
kuantitas tetap
(Oussalah dan Elitgani, 2005)

Algoritma pencarian dokumen



Rentangkan dokumen dan bangun
representasi index yang dari semua dokumen
Tulis ulang query dari representasi index
Aplikasikan
dengan p>0 dan
dan µ(dj) ditentukan oleh
untuk mengkalkulasi himpunan fuzzy µ(dj),
untuk j = 1 to n.
(Oussalah dan Elitgani, 2005)
Algoritma Pencarian Dokumen
Tentukan µq menggunakan
 Tentukan kesamaan Sim(dj,q) untuk j = 1
to n menurut

dan urutkan kesamaan menurut
(Oussalah dan Elitgani, 2005)
Daftar Pustaka





Darmadi, B.A, Intan R., Lim, R., 2006, Aplikasi Search Engine
Paper / Karya Ilmiah Berbasis WEB dengan Metode Fuzzy
Relation, http://puslit.petra.ac.id/journals/informatics/
Grossman, D.A, Frieder, O. 2004, Information Retrieval :
Algorithms and Heuristics 2nd Edition, Springer, Netherland
Oussalah, M. and Eltigani, 2005, A., Personalized Information
Retrieval System in The Framework of Fuzzy Logic, EUSFLAT-LFA
2005
Rubens, N.O, 2006, The Application of Fuzzy Logic to The
Construction of the Ranking Function of Information Retrieval,
Computer Modelling and New Technologies, 2006,Vol.10,
No.1, 20-27, Transport and Telecommunication Institute,
Lomonosov 1, LV-1019, Riga, Latvia
Snasel, V; Abraham, A; Owais, S; Platos, J; Kromer,P , 2008,
Optimizing Information Retrieval Using Evolutionary Algorithm and
Fuzzy Inference System.