การสืบค้นสารสนเทศจากอินเ

Download Report

Transcript การสืบค้นสารสนเทศจากอินเ

การสืบค้นสารสนเทศ
จากอินเทอร์เน็ต
อ.จุฑาทิพย์ จันทร์ลนุ
1
การสืบค้นสารสนเทศจากอินเตอร์เน็ต
การสื บ ค้ น สารสนเทศจากอิน เทอร์เ น็ ต เป็ นการ
สื บ ค้ น ส า ร ส น เ ท ศ ใ น ลั ก ษ ณ ะ ต่ า ง ๆ ที่ มี
ให้ บ ริ การบนอิ นเทอร์ เ น็ ต เช่ น บทความ
รูปภาพ เพลง
2
การสืบค้นสารสนเทศจากอินเตอร์เน็ต
Search engine คือ เครื่องมือสาหรับสืบค้น
สารสนเทศบนอินเทอร์เน็ต
วิธีการจัดทา
– โดยเขียนโปรแกรมให้คอมพิวเตอร์จดั ทา
– การจัดทาโดยใช้มนุษย์
– การใช้แบบผสม
3
การสืบค้นสารสนเทศจากอินเตอร์เน็ต
วิธีการทางานของ search engine
– โปรแกรมรวบรวมเอกสารเว็บออกไปสารวจ
– จัดเก็บที่ฐานข้อมูล
– Soft ware ทาหน้ าที่สืบค้นเมื่อมีการสืบค้น
4
ประเภทของ search engine
1. Free text search engine
google
2. Multi or Meta search engine
dogpile, metacrawler
3. Resource or Site Specific search engines
รูปภาพ yahoo picture gallery, the amazing picture
machine
4. Index or Directory search engine
Yahoo, Sanook
5. Natural language search engine
Ask jeeves (www.aj.com)
5
6
7
8
9
10
การเปรียบเทียบ search engine
•
•
•
•
•
•
ขนาดของฐานข้อมูล
ความทันสมัยของฐานข้อมูล
คุณลักษณะด้านการติดต่อกับผูใ้ ช้ในการค้นข้อมูล
คุณลักษณะด้านการค้นหา
คุณลักษณะด้านการแสดงผลการค้น
คุณลักษณะพิเศษอื่นๆ
11
เทคนิคการสืบค้น
Google
12
เทคนิคการค้น Google!
• Google – ทาการค้นหาข้อมูลจากเว็บไซต์ต่างๆ จานวน
มากกว่า 8 พันล้านเว็บเพจ ค้นรูปภาพ จานวนมากกว่า 1
พันล้านภาพ
• เทคนิคในการสืบค้น : ให้เลือกใช้คาค้นที่จาเพาะเจาะจง
และมีความหมายตรงกับข้อมูลที่ต้องการให้มากที่ สดุ
• อาจใช้คาเดียว หรือหลายๆ คาก็ได้ เช่น distance
learning Thailand
(โปรแกรมจะทาการค้นทุกคา และเชื่อมด้วย AND โดย
อัตโนมัติ)
13
เทคนิคการค้น Google!
• การคาค้นภาษาอังกฤษ จะพิมพ์อกั ษรตัวใหญ่หรือ
เล็กก็ได้ มีความหมายเท่ากัน
• โปรแกรมจะไม่ค้นคาประเภท command word เช่น
a, an, the, what, when, why ตัวเลข หรือตัวอักษร
เดี่ยวๆ แต่ถ้าต้องการบังคับให้ค้น จะต้องใส่
เครื่องหมาย +นาหน้ า เช่น star war episode +I
14
15
เทคนิคการค้น Google
• อาจบังคับการค้นเป็ นวลี โดยการใส่เครื่องหมาย
คาพูด คร่อม เช่น “star war episode I”
• Google ใช้ stemming technology ในการค้นคา
อื่นๆ ที่ใกล้เคียงกันกับคาที่พิมพ์เข้าไป เช่น ถ้าค้น
คาว่า dietary foods จะได้ผลการค้นที่ใช้คาว่า diet,
diets และ food ด้วยเช่นกัน
16
เทคนิคการค้น Google
• ถ้าไม่ต้องการให้มีคาใด ให้ใส่เครื่องหมาย –
นาหน้ าคานัน้ เช่น information -science
• ปุ่ ม “I’m feeling lucky” หรือ “ดีใจจัง ค้นแล้วเจอ
เลย” เป็ นการสังให้
่ ค้น และแสดงผลตรงไปที่
เว็บไซต์ซึ่งตรงกับคาค้นมากที่สดุ เพียงเว็บไซต์
เดียวเพื่อความสะดวกรวดเร็ว
17
เทคนิคการค้น Google
• ในกรณี ที่ต้องการให้ค้นคาใดคาหนึ่ งก็ได้ ให้ใช้ OR
เชื่อมคา (พิมพ์ด้วยอักษรตัวใหญ่) เช่น
“travel guide” hongkong OR singapore
• ค้นคาพ้อง ให้ใช้เครื่องหมาย ~ (tilde) เช่น
~anthropologist ผลการค้นจะได้ทงั ้
anthropologist (นักมานุษยวิทยา) และ
archaeonologist (นักโบราณคดี)
18
19
เทคนิคการค้น Google
• การค้นข้อมูลตัวเลข เงิน ระยะทาง หรือระยะเวลา
ภายในช่วงที่ต้องการ ให้ใช้ <ตัวเลขแรก>..<ตัวเลข
สุดท้าย> ตัวอย่างเช่น The Kingdom of Siam
1300..1800 (ควรระบุหน่ วยนับของตัวเลขด้วย เช่น
$, kg, km จะทาให้ผลการค้นแม่นยามากขึน้ )
20
21
เทคนิคการค้น Google
• Book Search : ค้นหาหนังสือที่ต้องการ โดยการใช้
คาว่า book about <คาค้น> ตัวอย่างเช่น book
about thai spa
• Google สามารถใช้เป็ นเครื่องคิดเลขได้ด้วย
ตัวอย่างเช่น 100/2 หรือ 10^5 โดยใช้เครื่องหมาย +
- * / ^ % หรือ พิมพ์คาว่า 5 kilometers in miles
(เพื่อถามว่า 5 กิโลเมตรเท่ากับกี่ไมล์ ?)
22
เทคนิคการค้น Google
• ถามอัตราแลกเปลี่ยนเงินตราจากต่างประเทศ เช่น
100 USD in GBP (เพื่อถามว่า 100 US$ เท่ากับกี่
British pounds) หรือพิมพ์ว่า currency of Japan in
Thai money เป็ นต้น
23
24
25
เทคนิคการค้น Google
• ถามความหมายหรือคาจากัดความของคาศัพท์
(definition) ใช้คาว่า define <คาค้น> ตัวอย่างเช่น
- define archaeology
26
•
ใช้
Language
Tool
27
28
29
คาสังพ
่ ิ เศษค้นหาแบบเจาะจง
•
•
•
•
•
•
Info:URL ที่ต้องการ
Filetype:นามสกุลไฟล์ หรือext:
Link:เว็บที่ลิงค์มาเว็บเรา
Related:เว็บไซต์ที่จะค้นหา
Cache: เว็บไซต์ที่จะค้นหา
Site: URL or Domain ที่ต้องการ
30
การสืบค้นขัน้ สูง
31
หาจากผลลัพธ์ด้วยทัง้ หมดของคา
• เงื่อนไข “หาจากผลลัพธ์ด้วยทัง้ หมดของคา”
เหมือนกับการใช้ตวั ดาเนินการ and โดย
จะต้องพิมพ์คาที่ต้องการค้นหาลงในกล่อง
ข้อความ
32
33
34
การค้นหาผลลัพธ์ด้วยทัง้ หมดทุกคา
• เมื่อกาหนดคาที่ต้องการค้นหาในตัวเลือก “หา
จากผลลัพธ์ด้วยทัง้ หมดทุกคา” จะได้ผลลัพธ์
เหมือนกับการใช้เครื่องหมาย “ ” ในหน้ า
หลักการค้นหาของ google
35
36
37
หาจากผลลัพธ์ด้วยบางส่วนของคา
• กาหนดคาที่ต้องการค้นหาในตัวเลือก
“ด้วยบางส่วนของคา” ได้ผลลัพธ์เหมือนกับ
การใช้ตวั ดาเนินการ or
38
39
40
หาจากผลลัพธ์ไม่มีคานี้
• ใช้กาหนดคาที่ไม่ต้องการให้แสดงผลลัพธ์
ด้วยการพิมพ์ลงใน “ไม่มีคานี้ ” และได้ผลลัพธ์
เหมือนกับการใช้ตวั ดาเนินการ (-)
41
42
43
การใช้เครื่องมืออื่นๆ ในการค้นขัน้ สูง
• ภาษา ทาหน้ าที่เหมือนกับ “ค้นหาหน้ าที่เขียน
ด้วยภาษา” ในเพจ “เครื่องมือเกี่ยวกับภาษา”
44
45
การใช้เครื่องมืออื่นๆ ในการค้นขัน้ สูง
• ชนิดของไฟล์ เอกสารที่อยู่บนเว็บมีหลาย
รูปแบบเราสามารถกาหนดรูปแบบไฟล์ที่
ต้องการได้ด้วยการใช้การกาหนดประเภทของ
ไฟล์
46
47
การใช้เครื่องมืออื่นๆ ในการค้นขัน้ สูง
• วันที่ สามารถจากัดการค้นหาเพจที่มีการ
ปรับปรุงภายในระยะเวลากาหนด คือ 3 เดือน
ที่ผา่ นมา 6 เดือนที่ผา่ นมา หรือปี ที่ผา่ นมาได้
48
49
การใช้เครื่องมืออื่นๆ ในการค้นขัน้ สูง
• รูปแบบที่ปรากฏ เป็ นการกาหนดให้คาค้นหา
ปรากฏอยู่ที่
– ในส่วนบนของหน้ า
– ในส่วนเนื้ อหาของหน้ า
– ใน URL ของหน้ าเว็บ
– อยู่ในลิงค์ของหน้ าเว็บ
50
51
การใช้เครื่องมืออื่นๆ ในการค้นขัน้ สูง
• โดเมน การกรองโดเมนช่วยในการจากัดการ
ค้นหาผลลัพธ์ ทาให้การค้นหาทาได้อย่าง
รวดเร็ว และมีประสิทธิภาพมากขึน้ โดยทาการ
จากัดเฉพาะโดเมนที่ต้องการค้นหา หรือ ไม่
ค้นหาได้
52
53
54