สื่อ search2

Download Report

Transcript สื่อ search2

Search Engine
สามารถแบ่งได ้เป็ น 3 ลักษณะการทางาน ดังนี ้
1. Crawler based Search
engine (Keyword Index)
่ างานในลักษณะนี ้
Search engine ทีท
จะตรวจสอบข ้อมูลบนเวบเพจที่ Crawler
หรือ
Spider
ส่งเข ้ามาพร ้อมกับอิน
้ั
เด็กซ ์ไวบ้ นฐานข ้อมูลโดยอัตโนมัติทงหมด
เช่น Title Tag , Meta Tag , หรือคาใน
่
ส่วนแรกๆ ทีปรากฏบนเว็
บเพจ Search
่ างานในลักษณะนี ้ เช่น
engine
ทีท
ต ัวอย่าง Search Engine
Google :
http://www.google.com
ผลการค้นหา
2. Directories Search engine
่ างานในลักษณะนี ้
Search engine ทีท
จะใช ้คนเขา้ มาช่วยในการจัดเรียงขอ้ มู ลบน
่ าลังมาแรง
ฐานข ้อมูล เช่น Yahoo หรือทีก
เช่น Open Directory Project (ODP)
เป็ นตน
้
และก็เนื่ องจากการใช ้คนเขา้ มา
้ ทาให ้ระยะเวลาที่
จัดเรียงและเก็บข ้อมูลนี เอง
ขอ้ มู ล จะถูกเก็ บไว บ้ นฐานขอ้ มู ล
ใช ้
เวลานานกว่าการจัดเก็บโดยใช ้คอมพิวเตอร ์
แ ล ะ ใ น ก ร ณี ที่ ผู ้ใ ช เ้ ลื อ ก ห ม ว ด ห มู่ ข อ ง
่ บไซต ์
เว็บไซต ์ไม่ถูกต ้อง ก็เป็ นไปได ้ทีเว็
จะไม่ถก
ู อินเด็กซ ์บนฐานข ้อมูล
ต ัวอย่าง Search Engine
YAHOO :
http://www.yahoo.com
ผลการค้นหา
3. Meta Search engine
้
Search
engine
ประเภทนี จะไม่
มี
ฐานข ้อมูลเป็ นของตนเอง แต่จะ Query จาก
่ ดังนั้นเราจะไม่สามารถ Submit
ฐานข ้อมูลอืน
เว็บไซต ์ไปยัง Search engine ประเภทนี ้
โดยตรงได ้ อย่างไรก็ตาม โดยการ Submit
่ ่ Search
เว็บเพจไปยัง Search engine อืนที
้
engine ประเภทนี ไปค
้นหาข ้อมูล ก็จะทาให ้
เว็ บไซต ป
์ รากฏที่ ลิ ส ต ข
์ องการค น
้ หาของ
Search engine ประเภทนี ,้ Search engine
่ างานในลักษณะนี ้ เช่น MetaClawler,
ทีท
ต ัวอย่าง Search Engine
IXQUICK :
http://www.ixquick.com
ผลการค้นหา
ตัวอย่าง Search Engine ของ
ไทย
่
ชือ
SiamZone :
http://www.siamzone.net
Hunsa :
http://www.hunsa.com
Sanook :
http://www.sanook.com
SiamInside :
http://www.siaminside.com
SiamSearch :
http://www.siam-search.com
ThaiWebsite :
http://www.thaiwebsites.com
URL (Address)
ตัวอย่าง Search Engine ของ
ต่างประเทศ
่
ชือ
URL (Address)
Altavista
http://www.altavista.com/addurl
Lycos
Excite
MSN Search
http://www.lycos.com
http://www.excite.com
http://www.search.msn.com
Alltheweb
http://www.alltheweb.com
Infoseek
http://www.infoseek.com
Finding Information
on the Web
Search Engine
คืออะไร
่
Search Engine เป็ นเครืองมื
อ
หรือโปรแกรมในการค้น หาเว็บ ต่า งๆ
่ บไซต ์ และ
โดยมีการเก็บ รายชือเว็
่ ยวข้
่
ข้อมู ลทีเกี
องต่างๆ ของเว็บไซต ์
่
และนามาจัดเก็บไว้ใน server เพือให้
สามารถค้นหาและแสดงผลได้สะดวก
่ น
้
้ ้ บาง
และรวดเร็วมากยิงขึ
ทังนี
search engine อาจไม่ได้มก
ี ารเก็บ
่
“ด้วยข้อมู ลทีหลากหลายบน
เว็บไซต ์
้ ผู ใ้ ช้ตอ
่
ดังนัน
้ งกลันกรอง
เลือกสรรข้อมู ล
่ ร ับออกมาให้ด ี และตัดสิน
ทีได้
่ ร ับ
ออกมาให้ได้วา
่ ข้อมู ลทีได้
่
เทคนิ คการสืบค้นข้อมู ล
โดย Google
Google.com
่ ทสุ
- Search Engine ทีดี
ี่ ดและใหญ่
่ ดในโลก
ทีสุ
- หาข้อมู ลได้แทบทุกอย่างบน
อินเตอร ์เน็ ต
- มีด ัชนี (Index) มากกว่า 3
พันล้านเว็บเพจ
- มีการเรียกใช้บริการมากกว่า 200
้ั อว ัน
ล้านครงต่
้ ย ์เวิร ์ดทีดี
่
เทคนิ คการตังคี
่ ถงึ สิงที
่ ต้
่ องการ
เลือกคาทีระบุ
่ ด เช่น ถ้าต้องการ
ได้ช ัดเจนทีสุ
่
ค้นหาข้อมู ลเกียวกับ
Smart
phone iPhone 4s ก็ให้พม
ิ พ์
คาว่า iPhone 4s เข้าไปในช่อง
ค้นหาจะดีกว่าคาว่า Smart
phone
่
กฎของคีย ์เวิร ์ดทีควรทราบ
-
ไม่สนใจตัวอ ักษรพิมพ ์เล็ก (Lower
case)
หรือพิมพ ์ตัวใหญ่
(Upper
้ Harry Potter = harry
case)ดังนัน
potter
่ จะ “ตรงเป๊ะ”
- คีย ์เวิร ์ดกับผลลัพธ ์ทีได้
้ เช่น ค้นคาว่าwindow ก็จะได้
เท่านัน
่ ใช่เว็บไซต ์ windows เป็ น
คาตอบทีไม่
ต้น
่ จะมีผลกับ
ลาดับคาของคีย ์เวิร ์ดทีใช้
่
ผลลัพธ ์ทีได้
เช่น
Network
Microsoft กับ Microsoft Network
AND ไม่ใส่กเ็ หมือนใส่
่
Google จะถือว่า มีต ัวเชือมเป็
น
่ มพ ์
AND อยู ่ระหว่างคีย ์เวิร ์ดทีพิ
เข้าไปทุกครง้ั ต ัวอย่างเช่น คาว่า
่ จะ
Global Network ผลลัพธ ์ทีได้
่ ทงค
้ั าว่า
หมายถึง เว็บเพจทีมี
Global และ (AND) Network
้ ถ้าสนใจแค่ตอ
ด ังนัน
้ งการให้พบคา
ใด คาหนึ่ งก็ได้ในหน้าเว็บแนะนา
่ั
ให้ใส่ OR คนระหว่
างคีย ์เวิร ์ด เช่น
ค้นหาด้วย “วลี”
ในกรณี ที่ ต อ
้ งการค น
้ หาด ว้ ยวลี
่
หรือกลุ่มคา
ใหใ้ ส่เครืองหมาย
คาพูดล ้อมรอบข ้อความดว้ ย เช่น
“may the force be with you”
่ วลี
Google
จะคน้ หาเว็บเพจทีมี
้ ะๆ
ตามนี เป๊
่
Google จะตัดคาทัวไปในคี
ย์
เวิร ์ด
่
Google จะต ัดเอาคีย ์เวิร ์ดทีเป็ น
อ ักษรต ัวเดียว ต ัวเลขตัวเดียว และ
่ ไป อย่างเช่น “to”, “the”
คาทัวๆ
และ “how” ออกไปโดยอ ัตโนมัต ิ
่
้
ซึงการต
ัดคาเหล่านี ออกไปจะช่
วย
ให้ Google ค้นหาผลลัพธ ์ได้เร็ว
้ แต่ถา้ ยังต้องการให้ Google
ขึน
้
ใช้คาเหล่านี ในการค้
นหาก็ให้ใส่
่
่ าคานัน
้
เครืองหมาย
+ เข้าไปทีหน้
Google จัดลาดับผลลัพธ ์อย่างไร
่ ยกว่า
Google ได้สร ้างระบบทีเรี
่ าหน้าทีจั
่ ดอ ันดบ
Page Rank ซึงท
ั
่ จากการค้นหา Page
ผลลัพธ ์ทีได้
่ นทางานด้วยการนับ
Rank เริมต้
จานวนลิงค ์ของเว็บไซต ์ต่างๆ
ที่
ลิงค ์เข้าไปยังแต่ละเว็บไซต ์ผลลัพธ ์
โดยต วั เลขนี ้จะถู กใช้แ ทนคะแนน
โหวตอย่างไม่เป็ นทางการ
Similar Pages Link
ภาษาไทยใช้วา
่ “หน้าที่
คล้ายกัน”
่
่ มาก และ
เป็ นเครืองมื
อวิจย
ั ทีดี
รวดเร็วมากสาหร ับการค้นหาเว็บ
่ ความคล้ายคลึง หรือ
เพจทีมี
่
่
สัมพันธ ์ก ับรายชือผลลั
พธ ์ทีได้
่
่
จากการค้นหา เหมาะทีจะใช้
เมือ
กาลังมองหาวิธท
ี รวดเร็
ี่
วในการ
่
่ ยวข้
องกับ
สร ้างลิงค ์มากมายทีเกี
่ สนใจ
่
สิงที
แม้จะไม่ทราบคีย ์เวิร ์ดที่
-
-
ไฟล ์รองร ับการค้นหาของ
Google
Adobe Portable Document Format
(.pdf)
Adobe Postscript (.ps)
Lotus 123 formats, Lotus WordPro
(.lwp), MacWrite (.mw)
Rich Text format (.rtf), Text (.txt,
.ans)
Microsoft Excel (.xls)
Microsoft PowerPoint (.ppt)
Microsoft Word (.doc), Microsoft
Google images
(http://images.google.com)
 Google
Image Search สามารถ
่
ค้น หาภาพจากทัวโลกได้
ม ากกว่ า
่ อว่าเป็ นดช
425 ล้าน ซึงถื
ั นี ทมี
ี่
ขนาดใหญ่ทสุ
ี่ ดในโลก การค้นหา
ภาพสามารถทาได้โดยใช้คย
ี ์เวิร ์ด
ส่ ว นผลลัพ ธ จ
์ ะส่ ง กลับ มาในรู ป
ของรู ปย่อขนาด 20 รู ป ผู ใ้ ช้
สามารถดู รูปขนาดเต็มได้ดว้ ยการ
Google Toolbar
(http://toolbar.google.com)
Toolbar จะเหมาะก ับผู ท
้ ี่
ต้องใช้งาน Google มากๆ
หลังจากดาวน์โหลด Toolbar มา
้ั
ติดตงในคอมพิ
วเตอร ์ มันจะอยู ่ใต้
ชุดปุ่ มควบคุม (ถอยหลัง, เดินหน้า
, หยุด, แอดเดรส) ของเบราเซอร ์
่
โดยจะมีเครืองมื
อช่วยในการค้นหา
มากมาย
 Google
Google Toolbar
http://toolbar.google.com
่
หลากหลายชือไซต
์ ยังไงก็ไม่
หลงทาง
 แม้ชอ
ื่
Google จะจาง่ าย และพิมพ ์
ง่ ายแต่ ก็ ย งั มี ผู พ
้ ิม พ ผ
์ ิด มากมาย
ท า ใ ห้ ไ ม่ ส า ม า ร ถไ ป เ ว็ บไ ซ ต ์
้
่
ปัญหานี ทาง
Google ได้ เพือแก้
่
เว็บไซต ์
จึงได้จดโดเมนเนมชือ
่ มพ ์ผิด ไว้
Google ในรู ปแบบทีพิ
ด้วย เช่น

Googel.com

Gogle.com