wyszuk_internet - Wydział Prawa i Administracji

Download Report

Transcript wyszuk_internet - Wydział Prawa i Administracji

Slide 1


Slide 2

Wyszukiwanie informacji w Internecie

Wydział Prawa i Administracji
Pracownia Komputerowa
mgr inż. Adam Bielański

2


Slide 3

Internet
Inter-net sieć o zasięgu globalnym, łącząca sieci lokalne.
Internet łączy miliony komputerów pracujących z różnymi
systemami operacyjnymi. Aby komputery i programy na nich
pracujące mogły bez przeszkód wymieniać dane, niezależnie
od różnorodnych sposobów przesyłania danych potrzebne są
uniwersalne protokoły transmisji. Stanowią one
„międzykomputerowy” język porozumiewania się.
Wszystkie informacje w Internecie przesyłane są w postaci
niewielkich pakietów. Większe informacje przed przesłaniem
dzielone są na pakiety.
3


Slide 4

Protokół TCP/IP
Transport pakietów w Internecie reguluje zespół dwóch protokołów
TCP/IP. Wymagają one aby każdy komputer przyłączony do Internetu
miał unikalny cyfrowy 32 bitowy adres IP, np.: 149.156.224.2 (cztery
człony ośmiobitowe —liczby z zakresy 0-255, rozdzielone kropkami). Pula
takich adresów (IPv4), używana od wielu lat jest już na wyczerpaniu.
Przygotowane do wdrożenia są adresy 128 bitowe (IPv6), zapisywane
jako 8 członów 16 bitowych. IPv4 dysponuje pulą 232 = 4 294 967 296, a
IPv6 ma 2128 = 3,4028236692093846346337460743177*1038.
8 czerwca 2011 roku najwięksi giganci Internetu (Google, Facebook i
Yahoo!) przełączyli się na nowy protokół.

Adresy są niewygodne dla użytkowników Internetu.

4


Slide 5

Adresy domenowe

Wprowadzono więc drugi system adresów — tak zwane
adresy symboliczne, lub adresy domenowe np.:
cicero.law.uj.edu.pl (odpowiada adresowi IP 149.156.224.2).
Takie adresy łatwiej zapamiętać, można także często je
odgadnąć znając zasady ich tworzenia.
Jeśli człowiek wpisuje adres domenowy, jego komputer
zwraca się do serwera DNS w żądaniem przetłumaczenia
adresu domenowego na adres IP. I tym adresem posługuje
się komputer w dalszej części sesji.

5


Slide 6

Adresy domenowe
Obecnie w adresach domenowych występują tylko małe litery
alfabetu łacińskiego, również z literami alfabetów narodowych (od
końca 2009r.). Adresy składają się z członów rozdzielonych kropką
(a nie przecinkiem).
Ostatni, dwuliterowy człon jest oznaczeniem kraju, a dokładniej
kraju zarejestrowania domeny, a nie krajem „pobytu” komputera.
I tak pl = Polska, de=Niemcy, fr=Francja, hr=Chorwacja,
ru=Rosja, a eu=Europa (Unia Europejska), Brak dwuliterowego
oznaczenia kraju = USA.

Ten fragment adresy domenowego jest zawsze przestrzegany.

6


Slide 7

Adresy domenowe
Niektóre domeny są często używane dla stron niezwiązanych z krajem, któremu
je przydzielono, lecz ze względu na podobieństwo do skrótów, na przykład:
* .tv - Tuvalu, często używane dla stron związanych z telewizją.
* .fm - Mikronezja, często używane dla stron radia internetowego (np.: last.fm).
* .me - Czarnogóra, często używana dla stron społecznościowych, z powodu, że
angielskie słowo "me" oznacza "ja".
* .cd - Demokratyczna Republika Konga - skrót CD oznacza płytę kompaktową.
* .mu - Mauritius - koncerny muzyczne, muzyka.
* .dj - Dżibuti, rzadko używana dla stron dotyczących Dj-ów i branży muzycznej.
* .si - Słowenia, rzadko używana dla stron hiszpańskojęzycznych, ze względu na
to, że hiszpańskie "si" oznacza "tak".
Czasami używa się też innych domen dla stron niezwiązanych z danym krajem,
ale rzadko (mołdawskie .md dla stron medycznych, .sh należące do Wysp
Świętej Heleny, dla stron związanych z Szanghajem lub Shenzhen).
7


Slide 8

Adresy domenowe (cd)
Przedostatni człon adresu (dla USA ostatni) — występuje często, ale nie
koniecznie — określa rodzaj działalności właściciela serwisu
internetowego lub miejsce geograficzne. I tak domeny określające
rodzaj działalności:
• com — podmioty prowadzące działalność komercyjną, tu przeważnie
znajdziemy różne firmy np.: www.fiat.com.pl (fiat w Polsce),
www.tasco.com.pl (sieć supermarketów Geant), www.asus.com.tw
(firma Asus z Tajwanu). Wiele firm o zasięgu międzynarodowym
rejestruje również swoje domeny w USA (np.: www.fiat.com lub
www.ford.com) aby ułatwić ich znalezienie potencjalnym odbiorcom.
Wtedy w takich serwisach umieszczone są odsyłacze do
przedstawicielstw firmy w poszczególnych krajach.
• edu — domena edukacyjne; uczelnie, szkoły, ale również placówki
naukowe nie prowadzące działalności dydaktycznej, np. www.uj.edu.pl
to serwer Uniwersytetu Jagiellońskiego,
8


Slide 9

Adresy domenowe (cd)

• gov — instytucje związane z władzą wszelkiego rodzaju—w

Polsce również sejm (www.sejm.gov.pl),
senat (www.senat.gov.pl) oraz NIK (www.nik.gov.pl),
• mil — instytucje związane z wojskiem i obronnością,
• net — podmioty związane z sieciami komputerowymi,
• org — organizacje nie związane z władzą a więc patie,
organizacje pozarządowe, ruchy społeczne,
• int — instytucja międzynarodowe, np.: strona Światowej
Organizacji Zdrowia www.who.int ,
• prv — strony WWW prywatnych użytkowników internetu.

9


Slide 10

Adresy domenowe (cd)
Niedawno wprowadzono nowe domeny — na razie mało
popularne:
• aero — dla instytucji i organizacji związanych z lotnictwem,
• biz — dla biznesu,
• coop — dla spółdzielni,
• info — dowolne zasoby o charakterze informacyjnym,
• museum — dla muzeów,
• name — dla osób prywatnych,
• pro — dla osób wykonujących wolne zawody.

10


Slide 11

Adresy domenowe (cd)

Domeny określające miejsce w Polsce:
• krakow.pl — (uwaga: krakow nie Kraków) domena Krakowa np.:
www.krakow.pl, www.komunikacja.krakow.pl, www.wawel.krakow.pl
• waw.pl — domena Warszawy
• gda.pl — domena Gdańska, np.. www.pg.gda.pl serwis WWW
Politechniki Gdańskiej
• wroc.pl — domena Wrocławia,
• lodz.pl — domena Łodzi,
Kolejne licząc od prawej człony oznaczają domeny użytkowników np:
cicero.law.uj.edu.pl oznacza czytając od prawej domena polska,
domena edukacyjna, UJ, wydz. Prawa, komputer cicero.

11


Slide 12

Adresy domenowe (cd)
Zasady dotyczące drugiej od prawej domeny często nie są przestrzegane
np.: onet.pl, interia.pl.
Na oznaczania rodzaju serwera (przedostatnia część nazwy) należy
zwracać uwagę, gdyż pomyłki mogą prowadzić do nieoczekiwanych
rezultatów. Np.: www.mswia.gov.pl to serwer Ministerstwa Spraw
Wewnętrznych i Administracji natomiast pod adresem
www.mswia.com.pl do niedawna był serwer pornograficzny.
Jednak przy poszukiwaniu w internecie informacji przeważnie
odgadywanie adresu nie wystarcza. Z tego powodu powstały różnego
typu serwisy wyszukiwawcze ułatwiające poszukiwania.

12


Slide 13

Serwisy wyszukiwawcze
Stopniowo powstawały różne typy serwisów
wyszukiwawczych:
•katalogi stron internetowych,
•wyszukiwarki
•multiwyszukiwarki

13


Slide 14

Katalogi stron internetowych
Najwcześniej powstały katalogi stron internetowych.
Było to przystosowanie do potrzeb Internetu rozwiązania znanego od dawna w
bibliotekach – katalogu działowego.
Tworzona jest drzewiasta struktura tematów, i tam umieszczane są odsyłacze do
skatalogowanych stron internetowych.
Katalogi pozwalają przeszukiwać zasoby Internetu według tematów. To jedyny
typ serwisu wyszukiwawczego odpowiadający na pytanie: Pokaż strony o......
Korzystanie z katalogu jest łatwe, intuicyjne, nie wymaga instrukcji.
www.katalog.onet.pl
http://katalog.wp.pl/
http://dir.yahoo.com/

http://www.dmoz.org/

14


Slide 15

Zalety w wady katalogów
Zalety:
• Korzystanie z katalogu jest łatwe, zgodne z ludzką intuicją, nie
wymaga instrukcji,
• Zasoby są dobrze skatalogowane, w danym dziale znajdziemy zasoby
rzeczywiście na dany temat,
•Katalogi pozwalają rozpocząć poszukiwanie bez znajomości słów
kluczowych określających poszukiwaną tematykę.
Wady:
•Zawartość katalogów jest bardzo uboga (tworzą je ludzie pracujący
powoli),
•Niekiedy trudno odgadnąć, w którym dziale umieszczono jakiś temat.
Podsumowanie: Katalogi znakomicie nadają się do rozpoczęcia
poszukiwań, pozwalają określić jakimi hasłami prezentowana jest
poszukiwana tematyka. Lecz na szukaniu w katalogach nie można
zakończyć poszukiwań!
15


Slide 16

Niektóre adresy
www.sejm.gov.pl  prace Sejmu  przegląd wszystkich projektów
ustaw
www.europa.eu/rapid

16


Slide 17

Wyszukiwarki
Główną wadą katalogów jest ich skąpa zawartość spowodowana
zbieraniem stosunkowo powolną pracą człowieka. Aby zapewnić szybsze
zbieranie informacji o zasobach Internetu postanowiono „zatrudnić” do
tego komputer i program.
Dla wyszukiwarki informacje o zasobach Internetu zbiera program,
zwany robotem lub szperaczem. Działa on wg schematu: wczytaj stronę
internetową, skopiuj na serwer, wyszukaj na niej jeden odsyłaczy i po
tym odsyłaczu przejdź na następną stronę.
Jednak współczesny program nie potrafi określić tematyki strony (jak to
robił człowiek katalogujący strony WWW), a jedynie zapamiętać słowa
występujące na stronie. Z tego powodu wyszukiwarka nie może
odpowiedzieć na pytanie „pokaż strony o..” a jedynie „pokaż strony
zawierające wskazany wyraz lub wyrazy”.
17


Slide 18

Wyszukiwarki
Wyszukiwarka przeważnie tak rozumie pytania:
spacja między wyrazami zamieniana jest na operator logiczny AND w
więc zapytanie ukryty internet zostanie zrozumiane: pokaż strony
www zawierające oba te wyrazy na stronie – lecz w dowolnej
konfiguracji, nie koniecznie razem.
dwa (lub więcej) wyrazy razem musza być objęte cudzysłowem więc
zapytanie „ukryty internet” oznacza pokaż strony, na których
występuję te wyrazy razem.
operator OR rozdziela hasła, z których musi wystąpić przynajmniej
jedno. tak więc zapytanie „opieka społeczna” OR „pomoc
społeczna” oznacza: pokaż strony, na których występuje przynajmniej
jeden z podanych terminów.
Wystąpienie hasła po operatorze NOT wyklucza stronę w wyniku
poszukiwania, więc gmina NOT budżet oznacza: pokaż strony
zawierające słowo gmina, lecz strony zawierające również budżet
18
należy odrzucić.


Slide 19

Wyszukiwarki
Wyszukiwarka przeważnie tak rozumie pytania:
•spacja między wyrazami zamieniana jest na operator logiczny AND w
więc zapytanie ukryty internet zostanie zrozumiane: pokaż zasoby
zawierające oba te wyrazy na stronie – lecz w dowolnej konfiguracji, nie
koniecznie razem.
•dwa (lub więcej) wyrazy razem musza być objęte cudzysłowem więc
zapytanie „ukryty internet” oznacza pokaż strony, na których
występuję te wyrazy razem.
•operator OR rozdziela hasła, z których musi wystąpić przynajmniej
jedno. tak więc zapytanie „opieka społeczna” OR „pomoc

społeczna” oznacza: pokaż strony, na których występuje przynajmniej
jeden z podanych terminów.
•gwiazdka * zastępuje dowolną ilość znaków do końca hasła, tak więc
zapytanie stworzy* dotyczy wyrazów: stworzył, stworztła, stworzyciel
itd..

19


Slide 20

Do wyszukania
znaleźć odpowiedź na pytanie:
Odpowiedź na pozew została złożona po terminie. Sąd
odrzucił wniosek o przywrócenie terminu. Czy, w wypadku
wystąpienia pozwanego z powództwem wzajemnym,
dowody i twierdzenia przytoczone w odpowiedzi na pozew
ulegają prekluzji w związku z orzeczeniem Sądu
Najwyższego, czy też są one traktowane jako niebyłe, nie
przedstawione w sprawie i mogą zostać przytoczone w
pozwie wzajemnym?

20


Slide 21

Do wyszukania
znaleźć odpowiedź na pytanie:
Odpowiedź na pozew została złożona po terminie. Sąd
odrzucił wniosek o przywrócenie terminu. Czy, w wypadku
wystąpienia pozwanego z powództwem wzajemnym,
dowody i twierdzenia przytoczone w odpowiedzi na pozew
ulegają prekluzji w związku z orzeczeniem Sądu
Najwyższego, czy też są one traktowane jako niebyłe, nie
przedstawione w sprawie i mogą zostać przytoczone w
pozwie wzajemnym?

sugestia: prekluzja "termin zawity"

21


Slide 22

Do wyszukania
znaleźć odpowiedź na pytanie:
Jakie zalety i wady ma spółka cicha?
powództwo przeciwegzekucyjne
Jak prawo polskie traktuje przestępstwa komputerowe?
Jakie są dostępne materiały omawiające zjawisko
uporczywego prześladowania w internecie.

22


Slide 23

Do wyszukania
znaleźć odpowiedź na pytanie:
Jakie zalety i wady ma spółka cicha
sugestia: „spółka cicha” wady zalety

Co to jest powództwo przeciwegzekucyjne?
sugestia: „powództwo ekscydencyjne”

Jak prawo polskie traktuje przestępstwa komputerowe?
sugestia: "przestępczość komputerowa" "prawo polskie„

Jakie są dostępne materiały omawiające zjawisko
uporczywego prześladowania w internecie.
sugestia: "prześladowanie w internecie" uporczywe

23


Slide 24

Inne wyszukiwarki

AltaVista www.altavista.com
HotBot http://www.hotbot.com/
Lycos http://www.lycos.com pokazuje miniatury
znalezionych stron WWW

24


Slide 25

Multiwyszukiwarki
Zasoby poszczególnych wyszukiwarek różnią się między sobą. Gdy
porównamy zasoby dwóch wyszukiwarek, okaże się, że będą strony
występujące w obu, a także strony WWW występujące tylko w jednej,
a w drugiej nie. Pomimo, że wyszukiwarka Google jest najpotężniejsza,
są zasoby, których nie znajdziemy w Googlach, a znajdziemy w innych
wyszukiwarkach. Przy robieniu poważnych poszukiwań materiałów w
Internecie należy skorzystać z kilku wyszukiwarek.
W takim przypadku warto skorzystać z jednej z multiwyszukiwarek.
Multiwyszukiwarka to serwis nie posiadający własnej bazy zasobów
Internetu, ale współpracujący z kilkoma wyszukiwarkami. Pytanie
odebrane od użytkownika jest rozsyłane do współpracujących
wyszukiwarek. Z odpowiedzi tych wyszukiwarek tworzona jest wspólna
lista przedstawiana użytkownikowi.
25


Slide 26

Multiwyszukiwarki – wady i zalety
Multiwyszukiwarki nie mają własnych baz danych. Jednakże wyraźnie
podnoszą komfort pracy, bo umożliwiają jednoczesne korzystanie z wielu
"zwykłych" wyszukiwarek/katalogów.
Otrzymane zapytanie multiwyszukiwarka jest wysyła równocześnie (lub
sekwencyjnie) do wielu serwisów wyszukiwawczych, a zebrane w ten sposób
wyniki są wyświetlane na oddzielnej stronie. Mogą być segregowane według
miejsca skąd pochodzą, trafności itd.
Niektóre multiwyszukiwarki dają się skonfigurować, czyli ustawić liczbę i rodzaj
serwisów wyszukiwawczych, do których będzie wysłane zapytanie.
Zalety
Multiwyszukiwarka pozwala na szybkie wygodne przeszukanie naraz zasobów
kilku wyszukiwarek.
Wady
Ze względu na różny sposób interpretowania pytań złożonych przez
poszczególne wyszukiwarki, przez multiwyszukiwarki nie przechodzą takie
pytania.
26


Slide 27

Multiwyszukiwarki – przyklady
Multiwyszukiwarki są dostępne poprzez swoje adresy w Internecie lub są
osobnymi programami.
DogPile to multiwyszukiwarka, sprawdza światowe zasoby Internetu,
wykorzystuje kilkanaście serwisów naraz, m.in.: Excite, Go2.com, Lycos,
Lycos A2Z, Magellan, Thunderstone, WebCrawler, What U Seek,
Yahoo. http://www.dogpile.com/
Metacrawler sprawdza między innymi Google, Yahoo, Bing i Ask
http://www.metacrawler.com/,
Search sprawdza między innymi Google, Yahoo, Bing Ask, Open
Directory http://www.search.com/
Ixquick http://s3-eu.ixquick.com/do/metasearch.pl
InfoSpace http://www.infospace.com/ispace/ws/index szuka stron WWW,
obrazów, video

27


Slide 28

Multiwyszukiwarki – programy
Są też multiwyszukiwarki w postaci programów do
zainstalowania. Jedną z nich jest Copernic Agent
występujący w trzech wersjach „Basic” (darmowy) i
bardziej rozbudowane, płatne „Personal” i „Proffesional”.
Strona producenta www.copernic.com.
Polski program Negative do pobrania ze strony
http://www.negative.pl/

28


Slide 29

Grupowanie wyników multiwyszukiwarek (clustering)
Prowadzona jest analiza występowania poszczególnych terminów w wynikach w
wyszukiwarek, co pozwala sa sensowne pogrupowanie wyników poszukiwania.
http://search.carrot2.org/stable/search

29


Slide 30

Możliwe jest wyświetlenie wyników w postaci grup w folderach (folders) lub w
postaci graficznej (circles) lub FoamTree)

30


Slide 31

Grupy dyskusyjne
Z Wikipedii, wolnej encyklopedii
Grupa dyskusyjna – w Internecie to ogólna nazwa wszelkich form
dyskusji internetowej przypominających wymianę korespondencji, a nie
rozmowy w czasie rzeczywistym. Grupy dyskusyjne przyjmują formę list
dyskusyjnych pozwalających na automatyczną wymianę e-maili, grup
Usenetowych, grup występujących w Fidonecie i forów dyskusyjnych
dostępnych przez bramki WWW.
Grupy dyskusyjne mogą stanowić cenne źródło informacji.

31


Slide 32

Grupy dyskusyjne – podział ze względu na
dostępność
Grupy dyskusyjne ze względu na dostępność można podzielić na:
• zamknięte – tzn. być dostępne tylko dla wybranej grupy osób (np:
grupy przeznaczone dla pracowników jednej firmy),
• półotwarte – tzn. dostępne dla wszystkich, ale pod pewnymi
warunkami, (np. po udowodnieniu swoich kwalifikacji),
• moderowane – czyli dostępne dla wszystkich, ale wysyłane nań
komunikaty są cenzurowane przez specjalną osobę,
• otwarte dla zarejestrowanych – czyli dostępne dla wszystkich, którzy
się doń zapisali i niecenzurowane,
• całkowicie otwarte – czyli dostępne także dla tych, którzy się do nich
nie zapisali.
32


Slide 33

Grupy dyskusyjne – podział ze względu na
dostępność
„Instrukcja obsługi” grup dyskusyjnych http://rtfm.killfile.pl/
Przykłady adresów poprzez które można przeglądnąć grupy
dyskusyjne:
http://usenet.gazeta.pl/usenet/0,0.html
http://groups.google.pl/
Ale standardowym czytnikiem grup dyskusyjnych jest program
pocztowy np.: Mozilla Thunderbird (raczej nie Outlook)
Zasady korzyskania z grup dyskusyjnych reguluje netetykieta, dostępna
między innymi pod adresem http://pl.wikipedia.org/wiki/Netykieta.

33


Slide 34

Księgi Wieczyste
Siatka działek geodezyjnych:
http://maps.geoportal.gov.pl/webclient/
Wyszukiwarka działek Księgi wieczyste (jeszcze niekompletna)
http://ksiegi-wieczyste-online.pl/
->"wyświetl mapy" w górnym menu mapy -> "dane o charakterze
katastralnym".
http://ekw.ms.gov.pl/pdcbdkw/pdcbdkw.html
Niestety na razie brak rozsądnego przejścia od numeru działki o
numeru księgi wieczystej. Można to zrobić jedynie z pomocą Wydziału
Geodezji, Kartografii i Katastru, Starostwa Powiatowego.
34


Slide 35

KRS
Krajowy Rejestr Sądowy on line
http://www.ekrs.pl/
http://www.krs-online.com.pl

Wyszukiwanie ludzi
http://people.yahoo.com
www.ditel.com.pl instytucje i formy

35


Slide 36

Praca
www.pracuj.pl (łącze do płatnej usługi LM i CV)
www.praca.pl
www.infopraca.pl (podaje ilość zgłoszeń)
www.gazetapraca.pl (kalkulator płac, porady do CV)
www.praca.gratka.pl

36


Slide 37

Ukryty internet (deep web)
Z zasady działania wyszukiwarki wynika, że zawiera ona wyłącznie
informacje o tych stronach WWW, do których dojdzie jej robot, zbierający
informacje. Są jednak takie serwisy WWW, w których trzeba podać jakieś
zapytanie (np.: katalog biblioteki, baza aktów prawnych) lub zalogować się
(podać nazwę użytkownika i hasło). Do takich zasobów Internetu roboty nie
mają dostępu, bo nie potrafią zadać pytania, podać nazwy użytkownika oraz
hasła..
Tak więc te zasoby — tworzące „ukryty internet” nie będą widoczne w
wyszukiwarkach. Polska nazwa „ukryty internet” nie oddaje istoty zjawiska.
Tych zasobów nikt nie ukrywa, są tylko niewidoczne w wyszukiwarkach.
Lepiej oddają charakter angielskie nazwy „deep web” (głęboki internet) lub
„invisible internet” (niewidoczny internet).
Tzw. głęboki Internet albo ukryty Internet zawiera kilkaset razy więcej
zasobów niż Internet do powszechnego użytku, widoczny dla zwykłych
przeglądarek.
37


Slide 38

Ukryty internet (deep web)

38


Slide 39

Ukryty internet (deep web)
Większość zasobów ukrytego stanowią specjalistyczne bazy danych i
dokumentów elektronicznych, a także archiwa bardzo cennych materiałów
źródłowych i referencyjnych. Zwykłe przeglądarki nie indeksują stron
internetowych z tymi materiałami.
Zasoby te utrzymywane są w sieci głównie przez uniwersytety oraz
instytucje rządowe i międzynarodowe. Odnośniki do tych olbrzymich
zasobów są zbierane, kwalifikowane i katalogowane przez
wyspecjalizowanych redaktorów. Katalogi są często jedyną "bramą", przez
którą można dotrzeć do zasobów wielokrotnie większych, niż te dostępne
powszechnie.
Do zasobów głębokiego internetu można uzyskać dostęp poprzez „bramy”
stanowiąca adresy WWW odpowiednich serwerów. I tak poprzez bramę o
adresie http://www.bj.uj.edu.pl/uj/katalog (adres katalogu on-line
Biblioteki Jagiellońskiej) mamy dostęp do zasobów katalogu tej biblioteki.
39


Slide 40

Ukryty internet (deep web)
Przeszukiwania w ukrytym internecie są znacznie bardziej mozolne niż
poszukiwania w „płytkim internecie” – widocznym w wyszukiwarkach, ale
wyniki poszukiwań są często znacznie ciekawsze.
Po wpisaniu w wyszukiwarce zapytania „ukryty internet” lub „deep web”
otrzymamy jako odpowiedź strony zawierające spis bram do ukrytego
internetu.
Kolekcję bram do zasobów ukrytego internetu zawierają między innymi
strony WWW:
http://www.bg.umcs.lublin.pl/nowa/deep.php
http://www.ukrytyinternet.yoyo.pl/gleboki.html

40


Slide 41

Niektóre bramy do ukrytego internetu
http://dmoz.org/ - największy na świecie katalog stron redagowany przez
internautów.
http://scholar.google.com/ - najnowsze dziecko Google - przeszukuje sieć pod
kątem materiałów akademickich dla wykładowców i studentów.
http://www.allsearchengines.com/ - ogromny zasób linków do wyszukiwarek
ogólnych i specjalistycznych .
http://www.searchenginecolossus.com/ - wyszukiwarki lokalne ze 153 krajów.
http://www.northernlight.com/ - katalog kwalifikowanych materiałów z różnych
dziedzin. Szerokie możliwości dostosowania do indywidualnych potrzeb, wiele opcji
wyszukiwania.
http://www.digital-librarian.com/ - miejsce do poszukiwania bibliografii, źródeł i
opracowań ze wszelkich dziedzin.
(http://www.scirus.com/) - ponad 410 mln dokumentów, z licznych stron www, m.
in.nw domenach edu, org, gov (np. PubMed Central, Nature Publishing Group,
strony uczelni wyższych, strony Open Access, raporty techniczne NASA)
http://vlib.org/ The WWW Virtual Library
41


Slide 42

Niektóre bramy do ukrytego internetu
http://www.freepint.com/gary/direct.htm - narzędzia przeszukiwania i katalogi
zasobów Niewidocznego Internetu. Są tam także serwisy dodatkowe, na przykład
lista list czyli rankingów z całego świata. "
http://www.completeplanet.com/ - katalog "głębokich" zasobów Internetu,
innowacyjna technologia przeszukiwania LexiBot. Mnóstwo danych i materiałów
źródłowych.
http://infomine.ucr.edu/ - katalog materiałów dla studentów i wykładowców.
http://www.kent.ac.uk/lawlinks/electronic-law-library/index.html - Electronic law
library Legal databases at Kent

42


Slide 43

STRATEGIE WYSZUKIWAWCZE
• Strategia „ON THE WEB” •
najczęściej stosowane przez
internautów. Polega na korzystaniu z
jednej popularnej wyszukiwarki
internetowej i prostych zapytań.
Przeważnie nieskuteczna i
nieefektywna. Wyszukiwarki dobrze
sprawdzają się w wyszukiwaniu
popularnych serwisów WWW,
przeszukiwaniu słowników i
encyklopedii, dokumentów HTML dają miliony odpowiedzi.

Strategia „VIA THE WEB” - jeden
ze sposobów na Ukryty Internet.
Polega na korzystaniu z różnych
narzędzi wyszukiwawczych,
dostosowanych do potrzeb i
oczekiwań użytkowników. Polega na
tym, by nawet za pomocą tych
narzędzi szukać głębiej - poszukiwać
wielowarstwowo, wieloetapowo.
Strategia ta dobrze nadaje się to
poszukiwań naukowych.

43


Slide 44

Wiarygodność informacji w Internecie
Informacje znalezione w Internecie należy poddać weryfikacji. Nie każda
informacja znaleziona w sieci musi być prawdziwa. Najczęściej, lecz nie
jedynie, zagrożenie występuje w serwisach amatorskich i forach
dyskusyjnych. Bardziej wiarygodne są źródła informacji w serwisach WWW
niezależnych instytucji, cieszących się autorytetem. Bardziej wiarygodne są
informacje podpisane przez autora, niż anonimowe.
Ze względu na łatwość publikowania informacji w Internecie i brak
jakichkolwiek form weryfikacji treści – odbiorca informacji musi sam dokonać
zweryfikować jej prawdziwość, przed dopuszczeniem jej do własnej
świadomości i przed jej dalszym wykorzystaniem i rozpowszechnianiem.
Wskazane jest weryfikowanie informacji w tradycyjnych źródłach wiedzyksiążkach i czasopismach fachowych. Można zwrócić się do specjalistów
z danej dziedziny wiedzy.

44


Slide 45

Wiarygodność informacji w Internecie
Przeważnie weryfikacja prawdziwości informacji pochodzącej z Internetu jest
trudniejsza od jej wyszukania! Warto tu zacytować naszego narodowego
wieszcza Adama Mickiewicza”

Wiedzę możemy zdobywać od innych, ale mądrości musimy nauczyć się sami.

45