Web browser and Search Engine

Download Report

Transcript Web browser and Search Engine

Web browser ,
Search Engine
อ.วรพจน์ พรหมจั ก ร
Web Browser
 Web Browser หมายถึง ซอฟต์ แวร์ หรื อโปรแกรมคอมพิวเตอร์ ที่ใช้ ในการเข้ าถึง
ข้ อมูลเและติดต่ อสื่ อสารกับระบบสารสนเทศที่ อยู่ในรู ปแบบของเว็บเพจ ซึ่ งอยู่บน
เครื อข่ ายคอมพิวเตอร์ ที่ชื่อว่ า World Wide Web (WWW)
 What’s Browser?
ประวัตคิ วามเป็ นมาของ Web Browser
 ทิม เบอร์ เนิร์ส-ลี จากศูนย์วิจยั เซิ ร์น ได้คิดค้นระบบไฮเปอร์ เท็กซ์ โปรแกรมค้นดูเว็บตัว
แรกมีชื่อว่า เวิลด์ไวด์เว็บ (World Wide Web)
 แต่เว็บที่ได้รับความนิยมอย่างจริ งจัง คือเว็บบราวเซอร์ ของศูนย์วจิ ยั NCSA ของ
มหาวิทยาลัยอิลลินอยส์เออร์แบน่าแชมเปญจ์ ประเทศสหรัฐอเมริ กา ซึ่งได้พฒ
ั นาเว็บเบ
ราวเซอร์ MOSAIC (หรือเรียกว่ าโมเสค) ขึ้นมาโดย Marc
Andreessen ซึ่ งเป็ นเว็บบราวเซอร์ระบบกราฟฟิ ก
 หลังจากนั้นทีมงานที่ทาโมเสคก็ได้ออกไปเปิ ด บริษัทเน็ตสเคป โดยทาการพัฒนาเว็บ
เบราว์ เซอร์ ที่ชื่อว่ า Netscape Navigator นอกจากนีย้ งั มีเว็บเบราว์เซอร์
ถือกาเนิดขึน้ อีกมากมาย
ประวัตคิ วามเป็ นมาของ Web Browser
ทิม เบอร์ เนอร์ ส ลี ผู้คดิ ค้ นภาษา HTML
เว็บเบราว์ เซอร์ โมเสคทีไ่ ด้ รับความนิยมในยุคแรก
Web browser : Mosaic
 Mosaic เป็ นโปรแกรม Web browser ตัวแรกที่พฒ
ั นาโดยMarc
Andreessen และเพื่อน ที่ National Center for
Supercomputing Application(NCSA) มหาวิทยาลัยอิลลินอยส์
โดยใช้เวลา 4 เดือนในช่วงปลายปี ค.ศ. 1992ถึงต้นปี ค.ศ. 1993
 โปรแกรม Mosaic รุ่ นแรกพัฒนาเสร็ จต้นปี 1993 ได้ถูกแจกจ่ายให้ผใู ้ ช้อย่าง
รวดเร็ ว โดยไม่เสี ยค่าใช้จ่าย จึงกลายเป็ นโปรแกรมยอดนิยมทันที เนื่องจากมีลกั ษณะ
การใช้งานเป็ น point-and-click Multimedia interface
 Mosaic เป็ นมาตราฐานของ Web browser
Web Browser ที่ได้ รับความนิยม
 มหาสงคราม Web Browser 1 - 2
Web Browser แบ่ งเป็ น 2 กลุ่มใหญ่
 บราวเซอร์ แบบ Graphic Mode(ใช้งานแบบ Hypermedia)
 Internet Explorer
 Firefox
 Opera
 บราวเซอร์ แบบ Text mode(ใช้งานแบบ Hypertext)

Lynx และ DosLynx โดยมหาวิทยาลัยแคนซัส สหรัฐอเมริ กา

http://www.cs.brown.edu/memex/ACM_HypertextTestbed/p
apers/62.html
ส่ วนประกอบของ Web Browser
 Title Bar หรื อแถบชื่อ ทาหน้าที่ในการแสดงชื่อของเว็บเพจที่กาลังใช้งานอยู่
 Menu Bar หรื อแถบเมนู ทาหน้าที่แสดงเมนูคาสัง่ ต่างๆ ซึ่ งแบ่งกลุ่มของคาสัง่ เพื่อใช้
งานในหน้าที่ที่แตกต่างกันไปโดยประกอบไปด้วยกลุ่มคาสัง่ File Edit View
Favorites Tools และ Help โดยคาสัง่ เหล่านี้จะมีการแสดงคาสัง่ ย่อยๆภายใน
คาสัง่ นั้นๆ
 Tool Bar หรื อ แถบเครื่ องมือ ทาหน้าที่แสดงปุ่ มคาสัง่ ต่างๆที่มีการใช้งานบ่อยๆ โดย
แสดงปุ่ มรู ปภาพซึ่ งสื่ อถึงการใช้งาน ซึ่ งปุ่ มสัญลักษณ์ส่วนใหญ่จะเป็ นการแทนคาสัง่ ใน
เมนูคาสัง่ View และ Favorites ใน Menu Bar
ส่ วนประกอบของ Web Browser
 Address Bar หรื อ แถบที่อยู่ ทาหน้าที่ในการเชื่อมโยงไปยังเว็บไซต์ต่างๆ ด้วยการ
ป้ อนชื่อของเว็บไซต์น้ นั ๆ ที่ตอ้ งการใช้งาน
 พื้นที่ในการแสดงข้อมูล บนเว็บเพจ โดยพื้นที่ดงั กล่าวจะแสดงข้อมูลต่างๆ ที่ปรากฏใน
เว็บเพจต่างๆ ซึ่ งพื้นที่ในการแสดงข้อมูลบนเว็บเพจนี้ จะประกอบไปด้วยข้อมูลที่เป็ น
ตัวอักษร รู ปภาพ และการเชื่อมโยง (Link) ข้อมูล ตลอดจนการนาเสนอข้อมูลใน
รู ปแบบของมัลติมีเดีย
 Status Bar หรื อ แถบสถานะ ทาหน้าที่ ในการแสดงข้อมูลเกี่ยวกับการเชื่อมโยง
(Link) ในเว็บเพจ ซึ่ งจะแสดงชื่อของเว็บเพจที่ทาการเชื่อมโยง
Hotlists, Bookmarks, Favorites
 Hotlists/Bookmarks/Favorites ใช้สาหรับจัดเก็บที่อยูใ่ น
รู ปแบบ URL ของWebsite ที่เคยเรี ยกดู ซึ่งมีประโยชน์สาหรับการ
เรี ยกดูในภายหลัง และทาให้เราไม่ตอ้ งจดจาชื่อ Website นั้น
 เราสามารถเพิ่มหรื อลบที่อยูข่ อง Website ที่จดั เก็บไว้ใน
Hotlists/Bookmarks/Favorites ได้โดยง่าย
Web browser features
ลักษณะสาคัญของ Web browsers ทีใ่ ช้ งานในปัจจุบัน
 Mouse-driven graphical interface
 สามารถแสดงเอกสารแบบ Hypertext และ Hypermedia
 สามารถแสดงข้อความตามชนิ ดของ fonts และตัวอักษรลักษณะพิเศษเช่นตัวหนา




ตัวเอียง
สามารถจัดรู ปแบบของเอกสารที่จะแสดงเช่น paragraph, lists
สนับสนุนการใช้เสี ยงและวิดีโอ
สนับสนุนบริ การต่างๆ บนเครื อข่ายเช่น ftp, telnet, gopher
สามารจัดเก็บรหัสสื บค้น URLs และเรี ยกใช้งานได้
 http://www.it24hrs.com/2012/thailand-digital-
statistic-internet-user/
Search Engine
 What’s Search engine?
 Search Engine เป็ นโปรแกรมที่ถูกออกแบบมาเป็ นเครื่ องมือในการค้นหาข้อมูล
บนเว็บไซต์ต่างๆ ส่ วนใหญ่จะเป็ นการค้นหาคาสั้นๆหรื อที่เรี ยกว่า keyword นัน่ เอง
โดยข้อมูลการเก็บรายชื่อเว็บไซต์ และข้อมูลที่เกี่ยวข้องต่างๆ ของเว็บไซต์และนามา
จัดเก็บไว้ใน server เพื่อให้สามารถค้นหาและแสดงผลได้สะดวกและรวดเร็ วมาก
ยิง่ ขึ้น การทางานของ Search Engine นั้นจะทางานก็ต่อเมื่อมีคนป้ อนคาหรื อที่
เรี ยกว่า keyword ลงไปใน Search Engine นั้นๆจากนั้น Search
Engine ก็จะแสดงรายการผลลัพธ์ที่มนั คิดว่าผูใ้ ช้น่าจะต้องการขึ้นมา
การทางานของ Search Engine
 Search Engine แต่ละประเภทจะมีการทางานที่คล้าย ๆ กันนัน
่ คือ การ
ส่ ง Web Crawler หรื อ Spider ไปเก็บข้อมูลเว็บไซต์ต่าง ๆ เข้ามาเก็บไว้ใน
ระบบ เพื่อจัดทาเป็ นดัชนี (Indexing) การค้นหา และเมื่อผูใ้ ช้งานค้นหาข้อมูลผ่าน
Search Engine ตัวโปรแกรม Search Engine ก็จะทาการประมวลผล
ด้วยอัลกอลิทึมการจัดอันดับ (Ranking) และนาผลลัพธ์จากข้อมูลที่มีอยูอ่ อกมา
แสดงผลให้ผใู ้ ช้งานได้เห็น
Search Engine
Search Engine แบ่ งออกเป็ น 3 ประเภท
 1. Crawler Based Search Engines
 2. Web Directory หรื อ Blog Directory
 3. Meta Search Engine
1. Crawler Based Search Engines
 Crawler Based Search Engines คือ เครื่ องมือการค้นหาบน
อินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็ นหลัก ซึ่ งจะเป็ นจาพวก
Search Engine ที่ได้รับความนิยมสู งสุ ด เนื่องจากให้ผลการค้นหาแม่นยาที่สุด
และการประมวลผลการค้นหาสามารถทาได้อย่างรวดเร็ ว จึงทาให้มีบทบาทในการค้นหา
ข้อมูลมากที่สุดในปั จจุบนั
1. Crawler Based Search Engines
 โดยมีองค์ ประกอบหลักเพียง 2 ส่ วนด้ วยกันคือ
1. ฐานข้อมูล โดยส่ วนใหญ่แล้ว Crawler Based Search Engine
เหล่านี้จะมีฐานข้อมูลเป็ นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ
เป็ นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่ องมือหลักสาคัญที่สุดอีกส่ วนหนึ่งสาหรับ Search Engine
ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรี ยกว่า จิ๋วแต่แจ๋ ว) ทาหน้าที่ในการ
ตรวจหา และ ทาการจัดเก็บข้อมูล หน้าเพจ หรื อ เว็บไซต์ต่าง ๆ ในรู ปแบบของการทา
สาเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่ งเราจะรู ้จกั กันในนาม Spider หรื อ
Web Crawler หรื อ Search Engine Robots
1. Crawler Based Search Engines
 ตัวอย่ าง
2. Web Directory หรื อ Blog Directory
 Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้
คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริ มาณ
มาก ๆ คล้าย ๆ กับสมุดหน้าเหลือง ซึ่ งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่าง
ชัดเจน ซึ่ งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่น้ นั ๆ ได้รับการเปรี ยบเทียบ
อ้างอิง เพื่อหาข้อเท็จจริ งได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรื อ
Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้
อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา)
2. Web Directory หรื อ Blog Directory
 ตัวอย่ าง
3. Meta Search Engine
 Meta Search Engine คือ Search Engine ที่ใช้หลักการในการ
ค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่ งมีการประกาศชุดคาสัง่ ต่าง ๆ
เป็ นรู ปแบบของ Tex Editor ด้วยภาษา HTML นัน่ เองเช่น ชื่อผูพ้ ฒั นา คา
ค้นหา เจ้าของเว็บ หรื อ บล็อก คาอธิบายเว็บหรื อบล็อกอย่างย่อ
 ผลการค้นหาของ Meta Search Engine นี้มกั ไม่แม่นยาอย่างที่คิด เนื่องจาก
บางครั้งผูใ้ ห้บริ การหรื อ ผูอ้ อกแบบเว็บสามารถใส่ อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการ
ค้นหาและพบเว็บ หรื อ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย
Search Engine Index Server หลาย ๆ แห่งมาประมวลผลรวมกัน จึงทา
ให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.
 Meta tags เป็ นข้อความที่เราประกาศเอาไว้ใน Code จะไม่แสดงผลในเว็บเพจ
โดยเป็ นเนื้อหาที่เกี่ยวกับเว็บไซต์ , Keywords ที่ใช้ที่เกี่ยวข้อกับ
เว็บไซต์ Search Engine จะทาการเก็บรายละเอียดพวกนี้ไว้อา้ งอิงเว็บไซต์เรา
3. Meta Search Engine
 Meta tags ที่ใช้ กาหนดชนิดตัวอักษร
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html;charset=UTF-8">

meta tags นี้จะบอกชุดตัวอักษรที่ใช้กบั ภาษาไทย ให้ Browser ใช้ชุดตัวอักษร UTF-8
สาหรับเปิ ดเว็บเพจของเรา
 Meta tags ที่จาเป็ นสาหรับ Search Engine
<META NAME="keywords" CONTENT="ออกแบบเว็บไซต์,
เว็บดีไซต์ ">

บอกคาที่เกี่ยวข้องกับเว็บเพจหน้านี้ เป็ นคาที่ใช้ในการค้นหาหน้านี้ คัน่ ด้วยสัญลักษณ์ (,)
 <META NAME="description" CONTENT="รับออกแบบ
เว็บไซต์ คุณภาพดี ในราคาที่คุณกาหนดได้ ">

บอกรายละเอียดของเว็บเพจแบบคร่ าวๆ
Search Engine ที่เป็ นที่นิยม
 Search Engine ที่เป็ นที่นิยม
ในปั จจุบนั ผูใ้ ช้งานในประเทศไทยจะใช้งาน Google Search Engine ซึ่ งคิด
เป็ น % แล้วมากถึง 99% เลยทีเดียว เนื่องด้วยคุณภาพ ความเร็ วในการค้นหา และลูกเล่น
อื่น ๆ
เทคนิคการใช้ Search Engine
 1. การใช้ คาสาคัญ (keyword) เพือ่ เจาะจงเนือ้ หา
 มี 3 ลักษณะ คือ
1. คาสาคัญที่เป็ นภาษาไทยล้วนๆ
2. คาสาคัญที่เป็ นภาษาอังกฤษล้วนๆ
3. คาสาคัญที่มีท้ งั 2 ภาษาปนกัน
 ใช้คามากกว่า 1 คาที่มีลกั ษณะเกี่ยวข้องกันช่วยค้นหา เพราะจะได้ผลลัพธ์ที่มีขนาด แคบ
ลงและชี้เฉพาะมากขึ้น
 พิมพ์ข้ ึนต้นด้วยตัวอักษรตัวใหญ่ ระบบก็จะเข้าไปหาคานั้น ๆ ก่อนอักษรตัวเล็ก
เทคนิคการใช้ Search Engine
 2. การใช้ คาสาคัญ (keyword) เพือ่ เจาะจงรู ปแบบของไฟล์
 ตัวอย่าง *.doc (ไฟล์ที่สร้างจากโปรแกรม Microsoft Word), *.xls
(ไฟล์ที่สร้างจากโปรแกรม Microsoft Excel), *.ppt (ไฟล์ที่สร้างจาก
โปรแกรม Microsoft PowerPoint) และไฟล์ *.pdf (Portable
Document Format)
เทคนิคการใช้ Search Engine
 3. หลีกเลีย่ งการใช้ คาหรือเครื่องหมายบางประเภทประกอบในคาสาคัญ
 search engine ส่ วนใหญ่มกั จะไม่รวมเอาคาสรรพนามไม่ช้ ีเฉพาะ คาบุพบท
คาสันธานในภาษาอังกฤษ เช่น a , an , the , on ฯลฯ เข้าไว้ในการค้นหา ถ้าหาก
ว่าต้องการให้คาสรรพนามชี้เฉพาะ หรื อคายกเว้นต่างๆ รวมอยูใ่ นการค้นหาด้วย แนะนา
ว่าให้ใช้เครื่ องหมาย “ ” คร่ อมคาเฉพาะนั้น
เทคนิคการใช้ Search Engine
 4. หลีกเลีย่ งการใช้ คาสาคัญที่มคี วามยาวเกินไป
 แตกคาสาคัญที่ยาวๆ นั้นให้ส้ น
ั ลง แล้วใช้วิธีการเว้นวรรค หรื อใช้
เครื่ องหมาย “ ” คร่ อมคาสาคัญคู่ใดคู่หนึ่งแทน ในกรณี น้ ีกอ็ าจเปลี่ยนไปใช้คาว่า “พหุ
นาม” “แยกตัวประกอบ” ก็ได้
เทคนิคการใช้ Search Engine
 5. การค้ นหาข้ อมูลที่เป็ นราชทินนาม, ฐานันดรศักดิ์, บรรดาศักดิ์, ชื่อบุคคล
 ในบางครั้งถ้าหากเราต้องการข้อมูลเกี่ยวกับสมาชิกในพระบรมราชวงศ์
บรรดาศักดิ์
ของขุนนาง ชื่อของบุคคล เป็ นต้น เราอาจพบว่าไม่มีขอ้ มูลที่ตอ้ งการ สาเหตุประการ
หนึ่งก็คือคาสาคัญที่ยาวเกินไป ในกรณี น้ ีเทคนิคที่ 4 สามารถนามาประยุกต์ใช้ได้ แต่
ถ้าหากว่าเราต้องการค้นหาชื่อบุคคล เราก็สามารถประยุกต์ใช้เทคนิคที่ 4 ได้อีกเช่นกัน
โดยการแยกส่ วนที่เป็ นชื่อกับนามสกุลออกจากกัน
เช่น ต้องการหาข้อมูล
ของ “วรพจน์ พรหมจักร” สมมติวา่ search engine ไม่พบข้อมูลเกี่ยวกับ
“วรพจน์ พรหมจักร” หรื อพบแต่ไม่ใช่สิ่งที่เราต้องการ ก็เลี่ยงไปใช้คา
สาคัญ “วรพจน์” “พรหมจักร” แทนอย่างนี้เป็ นต้น
เทคนิคการใช้ Search Engine
 6. การใช้ คาสาคัญในทางตรรกศาสตร์
 ใช้ตรรกศาสตร์ เข้าช่วย ได้แก่ AND, NOT, OR
หากพิมพ์ Keyword คาว่า Computer AND Hardware ก็แสดงว่า
Website ที่จะแสดงออกมาจะต้องมีท้ งั คาว่า Computer และ Hardware
ปรากฏอยูใ่ น Website ดังกล่าว และหากพิมพ์คาว่า Software NOT
Macromedia ก็จะหมายถึง Software ที่ไม่ใช่ของบริ ษทั
Macromedia และตรรกศาสตร์ตวั สุ ดท้าย คือ OR หากพิมพ์คาว่า
Macromedia OR Microsoft ก็จะหมายถึงบริ ษทั Macromedia
หรื อบริ ษทั Microsoft อย่างใดอย่างหนึ่ง เป็ นต้น
เทคนิคการใช้ Search Engine
 7. การใช้ Wildcard (*) เข้ าช่ วย
 เช่น พิมพ์คาว่า Hyper* ก็จะหมายถึง ค้นหาคาอะไรก็ได้ที่ข้ ึนต้นด้วย Hyper
ผลลัพธ์ที่ได้อาจจะเป็ น Hypermedia, Hypertext, Hypercard หรื อ
คาอื่น ๆ ที่ข้ ึนต้นด้วย Hyper
เทคนิคการใช้ Search Engine
 8. การใช้ เครื่องหมาย + , - , ˜เข้ าช่ วย
 เครื่ องหมาย + มีผลเหมือนกับ AND เช่น เมื่อพิมพ์คาว่า Tour + Thailand ก็
จะหมายถึง การท่องเที่ยวในประเทศไทย หากพิมพ์เพิ่มอีก 1 ประโยคเป็ น Tour +
Thailand + Chiengmai ก็จะจากัดผลลัพธ์ให้แคบลงเหลือเฉพาะท่องเที่ยว
ในจังหวัดเชียงใหม่เท่านั้น
 เครื่ องหมาย – มีผลเหมือนกับ not เพื่อไม่เอาคานั้น
 เครื่ องหมาย ˜ ใช้เพื่อค้นหาข้อมูลที่มีความหมายเหมือนกัน
เทคนิคการใช้ Search Engine
 9. หลีก เลีย่ งภาษาพูด หลีกเลี่ยงคาประเภท Natural Language
หรื อเรี ยกง่ายๆ ว่าคาหรื อข้อความที่เป็ นภาษาพูด หรื อเป็ นประโยค คุณควร
สรุ ปเป็ นเพียงกลุ่มคาหรื อวลี ที่มีความหมาย
เทคนิคการใช้ Search Engine
 10. ถ้ารู ้จกั search engine เฉพาะทาง เช่น
SearchNetworking ที่ตรงกับหัวข้อ (เช่น เครื อข่าย) จะ
ประหยัดเวลาโดยการใช้ search engine นั้น
ประโยชน์ ของการค้ นข้ อมูลโดยใช้ search engine
 1. ค้นหาเว็บที่ตอ้ งการได้สะดวก รวดเร็ ว
 2. สามารถค้นหาแบบเจาะลึกได้ ไม่วา่ จะเป็ น รู ปภาพ, ข่าว, MP3 และอื่นๆ อีกมากมาย
 3. สามารถค้นหาจากเว็บไซต์เฉพาะทาง ที่มีการจัดทาไว้ เช่น download.com
เว็บไซต์เกี่ยวกับข้อมูลและซอร์ฟแวร์ เป็ นต้น
 4. มีความหลากหลายในการค้นหาข้อมูล
 ฯลฯ
รายงานและนาเสนอ
Web Browser
 Internet Explorer
 Google Chrome
 Mozilla Firefox
 Opera
 Safari
Search Engine
 Google
 Sanook.com
 Yahoo.com
 Bing
 Ask Jeeves
 AOL
 Alexa
 Lycos
 Exsite