slide08_database-on-internet

Download Report

Transcript slide08_database-on-internet

ฐานข้อมู ลออนไลน์บน
เครือข่ายอินเทอร ์เน็ ต
อ. สกนธ ์ ม่วงสุน
ภาควิชาบรรณาร ักษศาสตร ์
คณะอ ักษรศาสตร ์
ฐานข้อมู ล (Database)
่ ความ
หมายถึง แหล่งจัดเก็บข ้อมูลทีมี
่
่ า
เกียวข
้องกัน โดยมีวต
ั ถุประสงค ์เพือน
้
ข ้อมูลต่างๆ เหล่านี มาใช
้ประโยชน์รว่ มกัน
่ ดเก็บจะถูกปร ับปรุง คัด
โดยข ้อมูลทีจั
แยก จัดเรียงและให ้บริการสืบค ้นต่อไป
ประเภทฐานข้อมู ล
่
สามารถแบ่งได ้หลายลักษณะ ซึงอาจ
้
แบ่งตามเนื อหา
หรือลักษณะของข ้อมูล ที่
ได ้จัดเก็บอยูใ่ นฐานข ้อมูล เช่น
ข ้อมูลด ้านวิทยานิ พนธ ์ จะเรียก
้
้
ฐานข ้อมูลนี ตามเนื
อหาของข
้อมูลว่า
“ฐานข ้อมูลวิทยานิ พนธ ์”
ตัวอย่างฐานข้อมู ล
ฐานข ้อมูลด ้านวิทยานิ พนธ ์ของ
มหาวิทยาลัยในประเทศไทย จะเรียกว่า
“ฐานข ้อมูลวิทยานิ พนธ ์”
http://tdc.thailis.or.th/tdc/
ตัวอย่างฐานข้อมู ล(ต่อ)
ฐานข ้อมูล สาขาศิลปะ สถาปัตยกรรม
มนุ ษยศาสตร ์ และสังคมศาสตร ์ จากคอล
่ ั างๆ ในพิพธิ ภัณฑ ์และหอศิลป์ ทัวโลก
่
เลกชนต่
มากกว่า 150 แห่ง
http://library.artstor.org/library
/welcome.html
ตัวอย่างฐานข้อมู ล(ต่อ)
ฐานข ้อมูลงานวิจยั ด ้านวิทยาการ
คอมพิวเตอร ์และเทคโนโลยีสารสนเทศ
http://portal.acm.org/
ตัวอย่างฐานข้อมู ล(ต่อ)
ได ้ที่
่ ดูรายละเอียดเพิมเติ
่ ม
ฐานข ้อมูลอืนๆ
http://www.lib.su.ac.th/d
b.asp
ความสาคัญของเครือข่าย
WWW
การใช ้ประโยชน์จากเครือข่ายอินเทอร ์เน็ ตที่
่ ยมคือ เว็บไซต ์(Website) สารสนเทศ
เป็ นทีนิ
่ จจุบน
ส่วนใหญ่ถก
ู นาเสนอผ่านทางเว็บไซต ์ ซึงปั
ั
มีเว็บไซต ์โดยประมาณ 357,292,065 ไซต ์
สถิต ิ เดือนกรกฏาคม 2011 อ ้างอิงจาก
http://news.netcraft.com/archives/2011/07/08/july-
Google ถือเป็ น
ฐานข้อมู ลหรือไม่ ?
้ (Web Search
เว็บเสิร ์ชเอนจิน
Engines) ่
่ อหรือระบบที่
เป็ นคาทีใช ้เรียกเครืองมื
ช่วยค ้นหาสารสนเทศจากเครือข่าย
Wolrd Wide Web
้ 1. ค้นหาางานหลักๆ ประกอบด ้วย 3
ขันตอนการท
้ 2.
ขันตอน
คือ าดรรชนี (Indexing)
จัดท
(Crawling)
3. ให้บริการค้นคืน (Retrieval)
้ (Web Search
เว็บเสิร ์ชเอนจิน
Engines)
้
ปริมาณการใช ้เว็บเสิร ์ชเอนจินจากบริ
ษท
ั
ต่างๆ
www.googgle.co.th
www.yahoo.com
www.baidu.com
www.bing.com
ประเภทของ Search Engines
1. Free text Search Engines
2. Index or Directory Search
Engines
3. Multi or Meta Search Engines
4. Natural language Search Engines
5. Resource or Site Specific Search
Engines
1. Free Text Search Engine
่
เป็ น Search Engine ทีสามารถค
้นได ้
โดยใช ้คาค ้นเพียงคาเดียว หรือหลายๆ คาได ้
1. Free Text Search Engine(
ต่อ) ข้อดี ใช ้งานง่าย โดยเพียงแค่คดิ คาที่
ต ้องการ ก็สามารถค ้นหาและได ้ผลลัพธ ์
กลับคืนมาอย่างรวดเร็ว
ข้อเสีย
้
- คุณภาพของผลการค ้นจะขึนอยู
ก
่ บ
ั
ความสามารถในการกาหนดคาค ้นของผูท้ ี่
ต ้องการค ้นหา ผูค้ ้นต ้องทราบแน่ ช ัดว่าการ
่
่
สารสนเทศเรืองใดและทราบค
าศัพท ์ทีจะใช
้ใน
การค ้น
1. Free Text Search Engine(
ต่อ) ดังนั้น เสิร ์ชเอนจินประเภทนี
้
้ งเหมาะ
จึ
่
กับการค ้นหาสารสนเทศเฉพาะเรือง
่ วๆ
่ ไป เนื่ องจาก
มากกว่าการค ้นหาเรืองทั
จะมีปัญหาในการกาหนดคาศัพท ์ที่
่
่ าไปใช ้ในการค ้น
เกียวข
้องเพือน
ตัวอย่าง Search Engine ประเภท
Free- Text
Google
(http://www.google.com)
- Bing (http://www.bing.com)
- Yahoo (http://www.yahoo.com)
- Lycos (http://www.lycos.com)
- All the Web
(http://www.alltheweb.com)
- Alta Vista
(http://www.altavista.com)
- Excite (http://www.excite.com)
ตัวอย่าง Search Engine ประเภท
Free Text
ตัวอย่าง Search Engine ประเภท
Free Text
ตัวอย่าง Search Engine ประเภท
Free Text
2. Index or Directory Search
Engines
้ จั
่ ดทาดรรชนี และจัดกลุม
เป็ นเสิร ์ชเอนจินที
่
่ ภายใต ้หัวเรืองจะท
่
ข ้อมูลตามหัวเรือง
าการ
่
่ วไปจน
่
แบ่งย่อยหัวเรืองตามล
าดับจากเรืองทั
่
นาไปสูเ่ รืองเฉพาะเจาะจงมากขึ
น้
โครงสร ้างการจัดทาหมวดหมู่จะถูกกาหนด
ไว ้ก่อนล่วงหน้าโดยมนุ ษย ์ จากนั้นจึงนาข ้อมูล
่
ดเก็บตาม
จากเว็บไซต ์ต่างๆ ทีรวบรวมไปจั
หมวดหมู่ทจั
ี่ ดทาไว ้
2. Index or Directory Search
Engines
ข ้อดี
1. การแบ่งหมวดหมู่ทช
ี่ ัดเจนช่วยให ้ผู ้ใช ้
่ งไม่
สามารถเข ้าถึงข ้อมูลจากประเด็นกว ้างๆ ทียั
ช ัดเจนไปสูป
่ ระเด็นเฉพาะเจาะจง ดังนั้น ในการ
่ ค
่ ้น
ค ้น ผูใ้ ช ้ไม่จาเป็ นต ้องมีความรู ้ในเรืองที
หรือไม่จาเป็ นต ้องรู ้คาศัพท ์เฉพาะมาก่อน
2. Index or Directory Search
Engines
ข ้อเสีย คือ
1. หากกาหนดโครงสร ้างของหมวดหมู่หรือ
การกาหนดคาแทนหมวดหมู่ไม่ชดั เจน ไม่
สมเหตุสมผล อาจสร ้างความสับสนให ้ผูใ้ ช ้ได ้
2. หากผูใ้ ช ้ต ้องการสารสนเทศในหมวดหมู่
ย่อยในระดับลึก ผูใ้ ช ้ต ้องเสียเวลาในการเลือกเข ้า
่ ้องการ
ไปทีละระดับ จนถึงระดับทีต
ตัวอย่าง Index or Directory
Search Engines
- Yahoo (http://www.yahoo.com)
- Sanook (http://www.sanook.com)
- Look Smart
(http://www.looksmart.com)
- Galaxy (http://www.einet.net)
ตัวอย่าง Index or Directory
Search Engines
ตัวอย่าง Index or Directory
Search Engines
Multi or Meta Serach Engines
้ แท
่ ้จริง
อาจจัดได ้ว่าไม่ใช่เสิร ์ชเอนจินที
เนื่ องจากไม่ได ้ทาการสืบค ้นข ้อมูลเอง แต่จะส่งต่อ
ข ้อคาถามของผูใ้ ช ้ (Query) ไปให ้ Search
่ ซึงเป็
่ นกลุม
่ ความร่วมมือ
Engines ตัวอืน
่ ทีมี
ระหว่างกัน
่ ้จึงเป็ นผลการค ้นหา
ดังนั้น ผลการค ้นทีได
้ วอืน
่ ไม่ใช่ของ
จากฐานข ้อมูล เสิร ์ชเอนจินตั
Multi Search Engine เอง
Multi or Meta Serach Engines
ข้อดี
่
่ องการได้
1. ผู ใ้ ช้สามารถค้นเรืองที
ต้
จากแหล่งเดียว ไม่ต ้องเสียเวลาไปค ้นจาก
หลายแหล่ง
2. สามารถเปรียบเทียบผลลัพธ ์จาก
่
หลายแหล่ง ทาให ้มีโอกาสได ้สารสนเทศทีตรง
กับความต ้องการได ้มาก เนื่ องจากเสิร ์ชเอนจิ ้
นเพียงแหล่งเดียวอาจรวบรวมข ้อมูลไม่ครอบคลุม
้
ทังหมด
Multi or Meta Search Engines
ข้อเสีย
่ ร ์ชเอนจินแต่
้
1. รู ปแบบคาค้นทีเสิ
ละตวั
มีความแตกต่างกัน ในบางกรณี การสร ้าง
่
่ ้
ข ้อคาถามอาจมีการใช ้ตัวเชือมค
าค ้นเพือให
่ ด
ได ้ผลลัพธ ์ตรงตามความต ้องการมากทีสุ
ดังนั้น หาก Multi Search Engine ใช ้ข ้อ
คาถามเดียวจากหน้าจอของตนเองแล ้วส่งไปถาม
้ วอืน
่ อาจทาให ้ผลการค ้นไม่
เสิร ์ชเอนจินตั
่
่ ้องการทังหมด
้
เทียงตรงหรื
อไม่เป็ นไปตามทีต
้
เนื่ องจากเสิร ์ชเอนจินบางตั
วอาจไม่เข ้าใจข ้อ
ตัวอย่าง Multi or Meta Search
Engines
- Metacrawler
(http://www.metacrawler.com)
- ProFusion
(http://www.profusion.com)
- Dogpile (http://www.dogpile.com)
- EZ2WWW
(http://www.ez2www.com)
- Katoo (http://www.katoo.com)
- Ixquick (http://www.ixquick.com)
ตัวอย่าง Multi or Meta Search
Engines
ตัวอย่าง Multi or Meta Search
Engines
4. Natural-language Search
Engine
้
้ สามารถนาคาค ้นที่
เสิร ์ชเอนจินประเภทนี
่ ้ใน
เป็ นภาษาธรรมชาติหรือคาถามทีใช
ชีวต
ิ ประจาวันมาใช ้ในการสืบค ้นข ้อมูล
้
้ าข ้อคาถาม
โดยเสิร ์ชเอนจินประเภทนี
จะน
แยกเป็ นคาแล ้วนาไปเปรียบเทียบกับคาศัพท ์
่ ความ
่ ลก
่ ทีมี
ั ษณะใกล ้เคียง หรือทีมี
ชนิ ดอืนๆ
่
เกียวข
้องกัน
4. Natural-language Search
Engine
ข้อดี
่
่ องการได้
1. ผู ใ้ ช้สามารถค้นเรืองที
ต้
่ นภาษาธรรมชาติ โดยอาจ
โดยใช้คาทีเป็
่ ดจะถามใน
พิมพ ์เป็ นประโยคคาถามทีคิ
่ าให ้ไม่ต ้องคัดเลือกคาศัพท ์ที่
ชีวต
ิ ประจาวัน ซึงท
จะนามาใช ้ในการค ้นหา
4. Natural-language Search
Engine
ข้อเสีย
1. อาจได้ผลลัพธ ์ไม่ตรงกับความ
ต้องการ เนื่ องจากการค ้นหาโดยใช ้ข ้อคาถามที่
เป็ นภาษาธรรมชาติ หากมีการตัดคาหรือ
่ าให ้
ประมวลผลข ้อคาถามไม่ดพ
ี อ โอกาสทีจะท
่ ตรงกับความต ้องการมีคอ
่ นข ้างสูง
ได ้ผลลัพธ ์ทีไม่
ตัวอย่าง Natural-language
Search Engine
- Ask (http://www.ask.com)
- Ask Jeeves (http://uk.ask.com)
ตัวอย่าง Natural-language
Search Engine
5. Resource or Site-Specific
Search Engines
้ ่
่
เป็ นเสิร ์ชเอนจินทีจัดทาเพือใช ้ค ้นหาข ้อมูล
่
่
่ งเฉพาะ หรือจัดทาขึนเพื
้ อ
่
ในเรืองใดเรื
องหนึ
ค ้นหาข ้อมูลจากทร ัพยากรประเภทใดประเภท
่ ดเก็บอาจไม่มใี นเสิร ์ชเอน
หนึ่ งเท่านั้น ข ้อมูลทีจั
้ วไป
่
จินทั
5. Resource or Site-Specific
Search Engines
ข้อดี
1. ผู ใ้ ช้สามารถค้นหาประเภทของ
สารสนเทศได้ตรงตามความต้องการมาก
้ เนื่ องจากเป็ นเสิร ์ชเอนจินเฉพาะเรื
้
่ ง
ขึน
องจึ
่
่ ้นๆ ทาให ้ข ้อมูล
รวบรวมข ้อมูลเกียวข
้องกับเรืองนั
้ ข ้อมูลในเชิง
้
มี
สารสนเทศในเสิร ์ชเอนจินประเภทนี
้ วไป
่
ลึกมากกว่าเสิร ์ชเอนจินทั
่ ้นหาผ่านเสิร ์ชเอนจินประเภทนี
้
้ ผลลัพธ ์ที่
เมือค
ได ้จึงมีโอกาสตรงตามความต ้องการมากกว่า
5. Resource or Site-Specific
Search Engines
ข้อเสีย
่ จากการค้นหา อาจจะ
1. ผลลัพธ ์ทีได้
่ ความสัมพันธ ์ก ับสิงที
่ ค้
่ น
ไม่ได้สงที
ิ่ มี
ออกมาด้วย เช่น ค ้นหาสูตรอาหารในเว็บไซต ์
yummly ก็จะได ้เฉพาะข ้อมูลการทาอาหาร
้
่ เนื อหาอธิ
ออกมา อาจไม่ได ้เว็บไซต ์ทีมี
บาย
่ มเกียวกั
่
รายละเอียดหรือให ้ข ้อมูล ความรู ้เพิมเติ
บ
สูตรอาหารนั้นๆ ออกมาด ้วย เช่น คุณค่าทาง
สมุนไพร
ตัวอย่าง Resource or SiteSpecific Search Engines
Images
- Lycos Multimedia
(http://multimedia.lycos.com)
Recipe
- yummly
(http://www.yummly.com/)
Traveling
- Goby Inc. (http://www.goby.com/)
ตัวอย่าง Resource or SiteSpecific Search Engines
ตัวอย่าง Resource or SiteSpecific Search Engines
การสืบค้น
สารสนเทศ
บน www
ด้วย
การสืบค้น
ด้
วยตั
Search
by วอ ัก
Free Text
การค้นหาแบบบู ลน
ี
(Boolean)
เป็ นการค ้นหาโดยมีคาค ้นมากกว่า 2 คา
้
่
ขึนไป
และทาการเชือมระหว่
างคาด ้วย + - OR
โจทย ์
่ ยวกั
่
1. ต ้องการเว็บทีเกี
บ
สุนัข แมว และนก
โจทย ์
2. ต ้องการไฟล ์เอกสาร
่ เนื อหา
้
นามสกุล “.doc” ซึงมี
่
เกียวกั
บ google
โจทย ์
3. ต ้องการข ้อมูลเชฟหมี (อ.
่ นอาจารย ์คณะ
คมกฤช) ซึงเป็
อักษรศาสตร ์ มหาวิทยาลัย
ศิลปากร
โจทย ์
4. ต ้องการข ้อมูลเชฟหมี (อ.
้
คมกฤช)ทังหมด
เฉพาะจากเว็บ
คณะอักษรศาสตร ์
โจทย ์
5. อยากทราบว่านอกจาก
google chrome แล ้ว ยังมี
google อะไรอีกบ ้าง
การสืบค้น
รูSearch
ปภาพ
for
image
โจทย ์
6. ต ้องการรูปภาพเชฟหมี
้ ์
ขนาดใหญ่มาก (สาหร ับปรินท
ไปขอลายเซ็นต ์)
การสืบค้น
ด้
วยรูby
ปภา
Search
image
้
รูป์ นี คืออะไร ????
โจทย
้
รูป์นี คืออะไร ????
โจทย
้
รูป์ นี คืออะไร ????
โจทย
การสืบค้น
ด้
วยเสี
Search
byยง
Voice
การสืบค้นด้ายเสียง
การสืบค ้นสารสนเทศด ้วย
เสียง กูเกิลเรียกเทคโนโลยีนีว่้ า
“Voice Search”