Transcript slajdy.odp

Google Hacking
Arkadiusz Firus
a.firus[at]students.mimuw.edu.pl
Google hacking
●
Historia
●
Usługi
●
Jak pytać
●
Co można znaleźć
●
Jak się bronić
●
Ciekawostki
Idea Google
Misją Google jest uporządkowanie światowych
zasobów informacji, aby stały się one
powszechnie dostępne i użyteczne.
Do no evil
Zbudujmy narzędzie, które będzie popularne.
Zyski przyjdą same.
Historia
← Założyciele →
Larry Page
Przewodniczący
↓
Sergey Brin
Dr. Eric Schmidt
http://www.google.com/intl/en/corporate/history.html
Oferowane usługi
●
Wyszukiwarki
●
Dodatki dla webmasterów
●
Aplikacje
●
Google dla firm
●
Google na komórki
http://www.google.com/press/descriptions.html
Dodatki dla webmasterów
http://www.google.com/webmasters/tools
http://www.google.com/a
Możliwości wyszukiwarki
●
Pamięć podręczna dla stron
●
Kalkulator
●
Definicje
●
Typy plików
●
Szczęśliwy traf
●
Ładowanie z wyprzedzeniem (firefox)
Możliwości wyszukiwarki (2)
●
Podobne strony
●
Wyszukiwanie w witrynie
●
Połączone witryny
●
Sprawdzanie pisowni
●
Tłumaczenie stron
●
Konwersja do html
Cechy wyszukiwarki
●
Wielkość liter jest bez znaczenia
●
Automatyczny iloczyn (AND)
●
●
●
Automatyczne usunięcie popularnych słów
(„how”, „and”, ...)
Ignorowanie (choć nie do końca) znaków
narodowych („ladny” = „ładny” + „ladny”)
Odmiana wyrazów.
Podstawowe operatory
| (pipe lub „OR”)
- (minus)
+ (plus)
~ (tylda)
„wyrażenie”
* (gwiazdka)
. (kropka)
- alternatywa
- wykluczenie wyrazu
- wyraz musi być w wyniku
- wyrazy bliskoznaczne (dla
polskiego języka działa słabo)
- szukamy dokładnego
wyrażenia
- dowolny ciąg słów
- zastępuje spację
Można (a nawet należy) używać nawiasowania
do ustalenia priorytetów.
Operatory zaawansowane
cache:
- kopia lokalna
link:
- linki do
related:
- strony podobne do
info:
- informacje o
define:
- definicja słowa
site:
- tylko w danej domenie
[all]intitle:
- fraza muszą być w tytule
[all]inurl:
- fraza musi być w URL
[all]intext
- fraza musi być w tekście
[all]inanchor - fraza musi być w odnośnikach
filetype:
- tylko pliki/w plikach danego typu
http://www.google.com/help/operators.html
Struktura URL
http://www.google.pl/search?
q=Uniwersytet+Warszawski&ie=utf-8&oe=utf8&client=firefox-a&hl=pl&bl=lang_pl
?
&
q
ie
oe
client
num
hl
lr
bntl
strip=1
- po nim podajemy parametry
- rozdziela parametry
- nasze zapytanie
- kodowanie wejściowe
- kodowanie wyjściowe
- nazwa klienta
- limit wyników na stronie
- język przegladarki
- wyniki tylko w języku (np. lang_pl)
- szczęśliwy traf
- sam tekst (tylko kopia lokalna)
Co nas interesuje?
1) Pliki z loginami lub hasłami:
passwd, shadow, htaccess, htpasswd,
htusers, ...
2)Kopie zapasowe:
rozszerzenia bak, old, ...
3) Logi:
rozszerzenie log lub np. bash_history
Co nas interesuje?
4) Strony urządzeń sieciowych
inurl:hp/device/this.LCDispatcher
5) Wulgaryzmy
występują często w wersjach testowych
6) Plików robots.txt (o tym później)
7) Adresy e-mailowe
to głównie dla spamerów
Przykładowe zapytania
intitle:index.of chopin (mp3|wav|ogg|flac)
ciekawe czy dużo osób słucha Chopina?
http://admin: * @www
hasełka do stron internetowych
intitle:index.of site:mimuw.edu.pl
komu nie chciało się utworzyć pliku
index.html?
Do czego jeszcze można
wykorzystać google
1) Anonimowe Proxy
2) DNS Discovering
3) Obchodzenie zabezpieczeń
podszywamy się pod googlebot'a
Google Kalendarz
1) Ludzie zmieniają hasła
change password
2) Klucze WEP
WEP
3) Popodsłuchujemy troche?
passcode
Jak się bronić?
1) Polityka bezpieczeństwa
edukacja pracowników
2) Prawa dostępu do plików
3) Zmieniamy standardowe nazwy (np. „Index
of”) lub tworzymy plik index.html
4) Sami odpytujemy
niechciane pozycje.
google
i
usuwamy
Jak się bronić?
5) Instruujemy roboty
robots.txt
<meta name=”robots” content=”noindex, nofollow, noarchive”>
<meta name=”googlebot” content=j. w.>
<a href=”www.wp.pl” rel=”nofollow”>
6) Ostatnie, ale najważniejsze:
MYŚLIMY
Search Engine Optimalization,
czyli jak być pierwszym
●
Domena
●
Dobrze napisana strona:
●
–
jak najbliżej standardu
–
używanie tagów <strong> <em> <i> <u>
–
dobrze opisane linki
Linki z innych stron (najlepiej o wysokim
PageRank)
Ciekawostki
Ciekawostki
the answer to life, the universe and everything
Więcej informacji
●
http://blog.konieczny.be/
●
http://johnny.ihackstuff.com/
●
http://googleblog.blogspot.com/
●
http://google.com/