Fazetové vyh*adávanie - Vyhľadávanie informácií

Download Report

Transcript Fazetové vyh*adávanie - Vyhľadávanie informácií

FAZETOVÉ
VYHĽADÁVANIE
Vyhľadávanie informácií
Riešenie
• Poskytnutie fazetového vyhľadávania nad existujúcou
množinou dát.
• Dáta sú extrahované zo stránky ponúkajúcej byty.
• Cieľom je ponúknuť rýchlejšie, prehľadnejšie a
pokročilejšie vyhľadávanie ako je na stránke.
Postup riešenia.
• Konfigurácia Apache Solr – štruktúra dát a nastavenie
webového prostredia.
• Implementácia aplikácie v prostredí .NET umožňujúcej:
• Extrakciu dát z webu pomocou v pravidelných intervaloch.
• Napĺňanie a aktualizáciu Solr indexu. Fazetové vyhľadávanie nad
Solr indexom.
• Vedenie záznamov o poslednej aktualizácií bytov v indexe do XML
súboru.
• Overenie korektnosti faziet a fazetového vyhľadávania.
Využité knižnice
• HtmlAgilityPack – knižnica pre .NET na parsovanie webu.
• Solr.Net – API pre prácu so Solr indexom s prostredia
.NET – generuje http dopyty.
• Velocity – webové rozhranie, ktoré je súčasťou Apache
Solr.
Implementovaná aplikácia
Overenie
• Extrahované dáta zodpovedali dátam na stránke – dobrá
štruktúrovanosť.
• Overenie prostredníctvom porovnania veľkosti množiny
po výbere viacerých faziet a manuálneho dohľadania na
stránke.