Transcript www.sfis.nu

Innehåll: Nytt och rätt
på söktjänstfronten
• Introduktion
• Vad händer när jag gör en
sökning?
• Olika typer av sökverktyg
• Största söktjänsterna
• Liten användarundersökning
• Google
– Viss kritik
– PageRank vs Content Analysis
• Värdering
• Toolbars
• Söktips
• Uppdatera sig själv
• Framtid
Detta tar vi inte upp!
• Sökalgoritmer
• Specifika tekniska aspekter
• Historik
Olika typer av sökverktyg
• Kravlare - robotar
– T.ex. Google, Teoma
• Kataloger - människor
– T.ex. Open Directory, Yahoo!
• Metasökmotorer
– T.ex. Dogpile, Vivísimo
• Visualisering
– Map.net
– KartOO
– WebBrain
Sökverktyg söker aldrig i själva webbsidorna
utan i kopior som de har sparat i ett index.
• Det finns många webbsidor som de stora
sökmotorerna inte kan eller vill indexera ("Den
osynliga webben")
–
–
–
–
Sidor som skapas med hjälp av databaser
Sidor bakom lösenord
Olänkade sidor
Bara delar av dokumenten tas med
Varför får man olika resultat
olika dagar?
• Alla sökverktygsindex uppdateras kontinuerligt, men
de nyaste sidorna har ofta inte hunnit komma med.
– Internetbrus.com visar när ett sökverktyg senast indexerade
deras sida
– Google har en cachefunktion som gör att du kan titta på
gamla sidor som försvunnit.
• Metasökverktyg är beroende av att de sökverktyg de
anropar svarar snabbt, annars kommer deras
resultat inte med i sökningen.
Google
• Om Google
– Google-Watch
– Greg Notess Review
•
•
•
•
•
Labs.google
Google Fight
Söka inom en URL
Image search
Office-filer & pdf
Att veta om
•
•
Cookies – ger din dator ett unikt ID
nummer som läses av och sparas
Sparad information
–
–
–
–
–
•
•
–
•
Cookie ID
Internet IP adress
Tid/Datum
Söktermer
Konfigurationer
Avslöjar inte vad informationen
används till
Google Toolbar = Spyware.
–
•
Skickar ”hem” information för varje
sida du besöker
Uppdaterar utan att fråga – full access
till din hårddisk! T.o.m. Microsoft
frågar!
•
Cache sparas. Kul för surfare – inte så
kul för webbmaster!
Om du försöker utnyttja Google’s
svagheter för att öka antalet externa
referenser till din sida så kan du
bestraffas av Google och tas bort helt
och hållet. Det finns inga
dokumenterade regler för detta och det
finns inget sätt att överklaga.
Reklamintäkter
–
•
Utlöses av valda sökord
Skydd av användaren
Problemet PageRank
• Den primära rankingalgoritmen har mer att göra med popularitet än
med kvalitet
• Ranking – eller ordningen av sökresultatet är bevisligen av större vikt
än hur själva söksträngen utformas och användaren tittar inte på fler än
i genomsnitt 20 träffar.
• Fungerar: Länk mellan sida A till sida B räknas som en röst men
PageRank analyserar även den som ”lägger rösten” – om den i sig har
många ”röster” så väger dess röst tyngre.
• Svårt att ta sig ur en låg PageRank
• Google hävdar demokrati men i praktiken ges fler röster till de rika…
Toolbars
• Google Toolbar
• Ultrabar
• Copernic
Vem betalar?
• Reklam
• Man får högre rankning ju mer man betalar
– Overture
• Webbsökverktyget som demo
– Stänger av sig när de fått en kundkrets...?
• Northernlight
• Oingo
Tips
•
•
•
•
•
•
Uteslut det du söker
Gissa url:ar
Sök med mer än ett verktyg
Lägg dig till med en testsökning
Sökverktygens egna hjälpsidor
Svenska verktyg för svenska webbsidor
–
–
–
–
–
http://eniro.se/
http://katalogen.sunet.se/
http://www.yahoo.se
http://www.altavista.se
Google har en svensk variant
Lär dig mer och håll dig
uppdaterad - Nybörjare
•
•
•
•
Googles egna söktips
Skoldatanätet
Greg Notess Basic Internet Searching
Fler... http://websearch.about.com/cs/howtosearch/
- När du kan mer
• Prenumerera på nyheter
– Search Engine Watch
– Mary-Ellen Bates
– Websearch.about.com
• Läs på
– Internetbrus
– Greg Notess
• Search Engine Showdown
• Advanced Internet searching
– About.com
Trender..?
• Sökverktyg med grafiskt presentationssätt
• ”Vortaler” – vertikala sökverktyg som går
på djupet inom ett begränsat ämnesområde
• Natural Language Process