เทคโนโยลีเว็บและมาตรฐานส

Download Report

Transcript เทคโนโยลีเว็บและมาตรฐานส

เทคโนโยลีเว็บและมาตรฐานสาหรับห้องสมุดดิจิทลั
เนณุภา สุ ภเวชย์
Internet และ World Wide Web
Internet
 WWW (World Wide Web)
 Web site, Web page, Homepage
 URL (Uniform/Universal Resource
Locator)

http://www.mwa.or.th:8080/services/news.html
Protocol
domain
port
path
file name
https ? (=secure server)
มาตรฐานด้านการสื่ อสาร
TCP/IP เป็ นprotocol ในการสื่ อสารบนเครื อข่ายอินเทอร์เนต ประกอบด้วย protocol ย่อย
มากมาย เช่น FTP (File Transfer Protocol), Telnet, SMTP (Simple Mail Transfer Protocol)
 HTTP เป็ น protocol ของ world wide web ใช้เป็ นมาตรฐานการรับส่ งข้อมูลระหว่าง server
และ client หรื อ web browser (เช่น Internet Explorer, Netscape) การรับส่ งข้อมูล ทาผ่าน IIS
(Internet Information Server) เช่น Apache, Microsoft IIS เป็ นต้น
 Z39.50, ISO 23950 (search and retrieve protocol) เป็ น protocol สาหรับการค้นคืน
สารนิเทศข้ามระบบห้องสมุดโดยใช้เครื่ อง terminal เดียว (origin) ส่ ง request ไปยัง server
(target) ต่างๆ
 ISO10160 และ ISO10161 เป็ นมาตรฐานด้านการยืมระหว่างห้องสมุดที่เป็ นไปในทานอง
เดียวกับมาตรฐาน Z39.63 สาหรับการสื่ อสารข้ามระบบห้องสมุด
 EDI มาตรฐานการสื่ อสารระหว่างห้องสมุดกับ supplier มี 3 standards Tradacoms, Edifact
และ X12. Edifact ใช้ในกระบวนการจัดซื้ อ

การค้นหาสารนิเทศด้วย Z39.50







เป็ น Protocol หนึ่งสาหรับการค้นสารนิเทศข้ามระบบห้องสมุด
ค้นหาข้อมูลในฐานข้อมูลหลายฐานได้พร้อมกัน (เช่น online
databases หรื อระบบห้องสมุด)
ค้นหาโดยหน้าจอใช้งานเดียว (Interface)
ส่ งเสริ มการยืมคืนระหว่างห้องสมุด
ดูการทางานของ z39.50 ได้จาก
www.copac.ac.uk
http://www.webclarity.info/video/BookWhere5F
eatures.html
มาตรฐานด้านการเข้ารหัส

ASCII เป็ นชุดอักขระ 7 บิต เช่น A จะแสดงเป็ น 1000001
ต่อมาขยายชุดแอสกีเป็ น 8 บิต มีอกั ขระเพิ่มขึ้นเป็ น 256 อักขระ
คือ 0-255 ครอบคลุมอักขระที่จาเป็ นในภาษาอังกฤษและมีอกั ขระ
พิเศษหลายตัวด้วย

UNICODE (Universal Character Set,
ISO10646) เป็ นแบบ 16 บิต แทนค่าได้มากกว่า 65,000
อักขระ ใช้แทนอักขระได้ทุกตัว ทุกภาษา รวมถึงเครื่ องหมายต่างๆ
 มอก.620 หรื อ TIS-620 เป็ นอักขระชุดภาษาไทย
 Windows-874 เป็ นอักขระชุดภาษาไทย เช่นกัน
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร
Mark up language เป็ นโครงสร้างภาษาที่ใช้ในการแสดง
รายละเอียดของสารนิเทศ ประกอบไปด้วย tag ต่างๆ
 SGML เริ่ มสร้างในปี 1969 โดย IBM และเป็ นมาตรฐานเปิ ดใน
ปี 1986 ประกอบไปด้วย 3 ส่ วนคือ
 Declaration
 Document
Type Definition (DTD)
 Document (ตัวข้อมูล)
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร

HTML เริ่ มต้นในปี 1990 พัฒนามาจาก SGML เพื่อช่วยให้แสดงผล
ข้อมูลได้ง่ายขึ้น ประกอบด้วย

Tag
attribute ของ tag
ข้อความที่ตอ้ งการแสดง อยูร่ ะหว่าง tag เปิ ดและ tag ปิ ด
ปั ญหาเกิดเพราะ เริ่ มมีคนใช้ www มาก ใช้ HTML สร้างเว็บไซต์มาก
เริ่ มมี search engine แต่คน้ หาข้อมูลได้ไม่ละเอียดมาก
มี Meta tag สาหรับช่วยให้คาสาคัญและรายละเอียดของเว็บเพจ ซึ่ ง
search engine จะนาไป index ในฐานข้อมูล




มาตรฐานด้านการแสดงรายละเอียดทรัพยากร





XML คิดค้นในปี 1996 มุ่งเน้นสาหรับการจัดโครงสร้างข้อมูล แต่ไม่สามารถ
แสดงผลข้อมูลหรื อจัดหน้า/สี /ข้อความได้ในตัว การแสดงผล ต้องใช้ Style
sheet เช่น XSL (eXtensible Stylesheet Language) ในการใช้ XML จะ
ประกอบด้วย
XML – ตัวข้อมูล
XSL – สาหรับแสดงผล
DTD (Document Type Declaration) หรื อ XML Data Schema สาหรับ
ตรวจสอบโครงสร้างข้อมูล โดยประกาศว่า 1 record ประกอบด้วย element และ
element ย่อยอะไรบ้าง มีชนิดของข้อมูล เช่น empty, textonly เป็ นต้น
Database (หากต้องการใช้ ต้องมีการแปลงข้อมูลเป็ น XML ก่อน)
มาตรฐานห้องสมุดทัว่ ไป
ห้องสมุดทัว่ ไป ใช้ MARC ในการลงรายการทางบรรณานุกรม
 MARC มีหลาย Format ซึ่ งแต่ละ Format เป็ นผลการนาไป
ประยุกต์ใช้งานจากมาตรฐาน ISO 2709:1981 Format for
Bibliographic Information Interchange ซึ่งระบุวา่ record หนึ่งๆ ต้อง
ประกอบด้วย record label (indicator, subfield), directory, data fields,
record terminator

มาตรฐานห้องสมุดทัว่ ไป2
MARC เป็ นการ Map ISBD ลงไปใน field ต่างๆ
 ปั ญหาของ ISO2709 คือไม่ได้ระบุความหมายของชื่อ field หรื อ tag
ทาให้เกิด MARC format ต่างๆมากมาย เช่น Statement of
Responsibility ใน
USMARC ใช้ 245$h UNIMARC ใช้ 200$b
 การแลกเปลี่ยน import/export MARC record ต้องเป็ น MARC
ตระกูลเดียวกัน software บางชื่อจะมี converter ติดตั้งในตัว เช่น
import AusMARC>UniMARC เป็ นต้น

ปัญหาของ MARC เมื่อจะนามาใช้กบั Digital Library
ขนาดของข้อมูลใน field(tag) และrecord ใน tag จากัดที่ 9,999 และรวม
ขนาด record ทั้งหมด ต้องไม่เกิน 99,999 character ในขณะที่ขอ้ มูลใน
digital library ส่ วนใหญ่เป็ น Full-text ทาให้มี record ขนาดใหญ่
 ไม่ support สารนิ เทศที่ digitally born, digitally live.
 ขัดแย้งกับ Entity-relationship Model การสร้าง library software ที่
support MARC จะทาให้โครงสร้างฐานข้อมูล complex มากกว่า NonMARC system
 MARC ต้องทา Inverted File Index ขณะที่ RDBMS เช่น MS Access
สามารถค้นหาคาใน field ได้ โดยไม่ตอ้ งตัดแบ่งคามาทา inverted file

XML กับห้องสมุด
ใช้เป็ นสื่ อกลางในการ import/export ข้อมูล สาหรับ MARC
ทุก Format และ Non-MARC
 อาจใช้ หรื อไม่ใช้ Database ช่วยในการจัดเก็บอีกชั้นหนึ่ งก็ได้
 มาตรฐาน MARC สาหรับ XML ดูได้ที่


http://www.loc.gov/standards/marcxml
XML กับ Other industries





เนื่องจากสามารถประกาศโครงสร้างข้อมูลเองได้ใน DTD/Schema
หากต้องการแลกเปลี่ยนข้อมูลกันจริ งๆ ต้องกาหนดมาตรฐานโครงสร้างข้อมูล
ขึ้นมาใช้ร่วมกัน มาตรฐานที่กาหนดขึ้นมาแล้ว เป็ น Metadata เช่น
Dublin Core สาหรับทรัพยากรห้องสมุด
GILS สารนิเทศภาครัฐ (สหรัฐอเมริ กา)
TEI นิยมใช้ในทางวรรณกรรมและภาษา มีtag revision
EAD (Encoded Archival Description) สาหรับสารนิเทศ
จดหมายเหตุ ใช้สร้าง finding aids
XML กับ Other industries





ใช้ในวงธุรกิจ และ computer system เนื่องจาก Microsoft
ผลักดันให้มีการใช้ XML
ใช้ใน E-Commerce
ใช้ในการแลกเปลี่ยนข้อมูล
ทั้งนี้ หากต้องการนาข้อมูล XML record ไปใช้งานต่อ ต้องมีโปรแกรม
รองรับ
ใช้ในการสร้างเว็บไซต์ เนื่องจากการแยกส่ วนของข้อมูลกับ
Programming ทาให้การทางานร่ วมกันระหว่าง graphic และ
Programmer ง่ายขึ้น
Link XML และ Metadata ที่น่าสนใจ

How does XML Help Libraries
http://www.infotoday.com/cilmag/sep02/Banerjee.htm
 Encoded Archival Description (EAD)
http://www.loc.gov/ead/
 Text Encoding Initiative (TEI) Consortium
http://www.tei-c.org
http://etext.lib.virginia.edu/bin/tei-tocsp3?div=DIV1&id=HD
 มาตรฐานต่างๆบน web www.w3c.org
 Z39.50 Maintenance Agency
http://lcweb.loc.gov/z3950/agency
มาตรฐานด้านสื่ อประเภทต่างๆ







Graphic Interchange Format – Gif
Joint Photographic Experts Group – Jpeg
Portable Network Graphics – PNG
Audio Interchange File Format – AIFF
Musical Instrument Digital Interface – MIDI
MPEG Audio Player3 – MP3
Moving Picture Experts Group - MPEG
More information

http://www.loc.gov/standards/marcxml/
How does xml help libraries?
http://www.infotoday.com/cilmag/sep02/B
anerjee.htm
 More from e-journal articles
