เทคโนโยลีเว็บและมาตรฐานส
Download
Report
Transcript เทคโนโยลีเว็บและมาตรฐานส
เทคโนโยลีเว็บและมาตรฐานสาหรับห้องสมุดดิจิทลั
เนณุภา สุ ภเวชย์
Internet และ World Wide Web
Internet
WWW (World Wide Web)
Web site, Web page, Homepage
URL (Uniform/Universal Resource
Locator)
http://www.mwa.or.th:8080/services/news.html
Protocol
domain
port
path
file name
https ? (=secure server)
มาตรฐานด้านการสื่ อสาร
TCP/IP เป็ นprotocol ในการสื่ อสารบนเครื อข่ายอินเทอร์เนต ประกอบด้วย protocol ย่อย
มากมาย เช่น FTP (File Transfer Protocol), Telnet, SMTP (Simple Mail Transfer Protocol)
HTTP เป็ น protocol ของ world wide web ใช้เป็ นมาตรฐานการรับส่ งข้อมูลระหว่าง server
และ client หรื อ web browser (เช่น Internet Explorer, Netscape) การรับส่ งข้อมูล ทาผ่าน IIS
(Internet Information Server) เช่น Apache, Microsoft IIS เป็ นต้น
Z39.50, ISO 23950 (search and retrieve protocol) เป็ น protocol สาหรับการค้นคืน
สารนิเทศข้ามระบบห้องสมุดโดยใช้เครื่ อง terminal เดียว (origin) ส่ ง request ไปยัง server
(target) ต่างๆ
ISO10160 และ ISO10161 เป็ นมาตรฐานด้านการยืมระหว่างห้องสมุดที่เป็ นไปในทานอง
เดียวกับมาตรฐาน Z39.63 สาหรับการสื่ อสารข้ามระบบห้องสมุด
EDI มาตรฐานการสื่ อสารระหว่างห้องสมุดกับ supplier มี 3 standards Tradacoms, Edifact
และ X12. Edifact ใช้ในกระบวนการจัดซื้ อ
การค้นหาสารนิเทศด้วย Z39.50
เป็ น Protocol หนึ่งสาหรับการค้นสารนิเทศข้ามระบบห้องสมุด
ค้นหาข้อมูลในฐานข้อมูลหลายฐานได้พร้อมกัน (เช่น online
databases หรื อระบบห้องสมุด)
ค้นหาโดยหน้าจอใช้งานเดียว (Interface)
ส่ งเสริ มการยืมคืนระหว่างห้องสมุด
ดูการทางานของ z39.50 ได้จาก
www.copac.ac.uk
http://www.webclarity.info/video/BookWhere5F
eatures.html
มาตรฐานด้านการเข้ารหัส
ASCII เป็ นชุดอักขระ 7 บิต เช่น A จะแสดงเป็ น 1000001
ต่อมาขยายชุดแอสกีเป็ น 8 บิต มีอกั ขระเพิ่มขึ้นเป็ น 256 อักขระ
คือ 0-255 ครอบคลุมอักขระที่จาเป็ นในภาษาอังกฤษและมีอกั ขระ
พิเศษหลายตัวด้วย
UNICODE (Universal Character Set,
ISO10646) เป็ นแบบ 16 บิต แทนค่าได้มากกว่า 65,000
อักขระ ใช้แทนอักขระได้ทุกตัว ทุกภาษา รวมถึงเครื่ องหมายต่างๆ
มอก.620 หรื อ TIS-620 เป็ นอักขระชุดภาษาไทย
Windows-874 เป็ นอักขระชุดภาษาไทย เช่นกัน
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร
Mark up language เป็ นโครงสร้างภาษาที่ใช้ในการแสดง
รายละเอียดของสารนิเทศ ประกอบไปด้วย tag ต่างๆ
SGML เริ่ มสร้างในปี 1969 โดย IBM และเป็ นมาตรฐานเปิ ดใน
ปี 1986 ประกอบไปด้วย 3 ส่ วนคือ
Declaration
Document
Type Definition (DTD)
Document (ตัวข้อมูล)
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร
HTML เริ่ มต้นในปี 1990 พัฒนามาจาก SGML เพื่อช่วยให้แสดงผล
ข้อมูลได้ง่ายขึ้น ประกอบด้วย
Tag
attribute ของ tag
ข้อความที่ตอ้ งการแสดง อยูร่ ะหว่าง tag เปิ ดและ tag ปิ ด
ปั ญหาเกิดเพราะ เริ่ มมีคนใช้ www มาก ใช้ HTML สร้างเว็บไซต์มาก
เริ่ มมี search engine แต่คน้ หาข้อมูลได้ไม่ละเอียดมาก
มี Meta tag สาหรับช่วยให้คาสาคัญและรายละเอียดของเว็บเพจ ซึ่ ง
search engine จะนาไป index ในฐานข้อมูล
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร
XML คิดค้นในปี 1996 มุ่งเน้นสาหรับการจัดโครงสร้างข้อมูล แต่ไม่สามารถ
แสดงผลข้อมูลหรื อจัดหน้า/สี /ข้อความได้ในตัว การแสดงผล ต้องใช้ Style
sheet เช่น XSL (eXtensible Stylesheet Language) ในการใช้ XML จะ
ประกอบด้วย
XML – ตัวข้อมูล
XSL – สาหรับแสดงผล
DTD (Document Type Declaration) หรื อ XML Data Schema สาหรับ
ตรวจสอบโครงสร้างข้อมูล โดยประกาศว่า 1 record ประกอบด้วย element และ
element ย่อยอะไรบ้าง มีชนิดของข้อมูล เช่น empty, textonly เป็ นต้น
Database (หากต้องการใช้ ต้องมีการแปลงข้อมูลเป็ น XML ก่อน)
มาตรฐานห้องสมุดทัว่ ไป
ห้องสมุดทัว่ ไป ใช้ MARC ในการลงรายการทางบรรณานุกรม
MARC มีหลาย Format ซึ่ งแต่ละ Format เป็ นผลการนาไป
ประยุกต์ใช้งานจากมาตรฐาน ISO 2709:1981 Format for
Bibliographic Information Interchange ซึ่งระบุวา่ record หนึ่งๆ ต้อง
ประกอบด้วย record label (indicator, subfield), directory, data fields,
record terminator
มาตรฐานห้องสมุดทัว่ ไป2
MARC เป็ นการ Map ISBD ลงไปใน field ต่างๆ
ปั ญหาของ ISO2709 คือไม่ได้ระบุความหมายของชื่อ field หรื อ tag
ทาให้เกิด MARC format ต่างๆมากมาย เช่น Statement of
Responsibility ใน
USMARC ใช้ 245$h UNIMARC ใช้ 200$b
การแลกเปลี่ยน import/export MARC record ต้องเป็ น MARC
ตระกูลเดียวกัน software บางชื่อจะมี converter ติดตั้งในตัว เช่น
import AusMARC>UniMARC เป็ นต้น
ปัญหาของ MARC เมื่อจะนามาใช้กบั Digital Library
ขนาดของข้อมูลใน field(tag) และrecord ใน tag จากัดที่ 9,999 และรวม
ขนาด record ทั้งหมด ต้องไม่เกิน 99,999 character ในขณะที่ขอ้ มูลใน
digital library ส่ วนใหญ่เป็ น Full-text ทาให้มี record ขนาดใหญ่
ไม่ support สารนิ เทศที่ digitally born, digitally live.
ขัดแย้งกับ Entity-relationship Model การสร้าง library software ที่
support MARC จะทาให้โครงสร้างฐานข้อมูล complex มากกว่า NonMARC system
MARC ต้องทา Inverted File Index ขณะที่ RDBMS เช่น MS Access
สามารถค้นหาคาใน field ได้ โดยไม่ตอ้ งตัดแบ่งคามาทา inverted file
XML กับห้องสมุด
ใช้เป็ นสื่ อกลางในการ import/export ข้อมูล สาหรับ MARC
ทุก Format และ Non-MARC
อาจใช้ หรื อไม่ใช้ Database ช่วยในการจัดเก็บอีกชั้นหนึ่ งก็ได้
มาตรฐาน MARC สาหรับ XML ดูได้ที่
http://www.loc.gov/standards/marcxml
XML กับ Other industries
เนื่องจากสามารถประกาศโครงสร้างข้อมูลเองได้ใน DTD/Schema
หากต้องการแลกเปลี่ยนข้อมูลกันจริ งๆ ต้องกาหนดมาตรฐานโครงสร้างข้อมูล
ขึ้นมาใช้ร่วมกัน มาตรฐานที่กาหนดขึ้นมาแล้ว เป็ น Metadata เช่น
Dublin Core สาหรับทรัพยากรห้องสมุด
GILS สารนิเทศภาครัฐ (สหรัฐอเมริ กา)
TEI นิยมใช้ในทางวรรณกรรมและภาษา มีtag revision
EAD (Encoded Archival Description) สาหรับสารนิเทศ
จดหมายเหตุ ใช้สร้าง finding aids
XML กับ Other industries
ใช้ในวงธุรกิจ และ computer system เนื่องจาก Microsoft
ผลักดันให้มีการใช้ XML
ใช้ใน E-Commerce
ใช้ในการแลกเปลี่ยนข้อมูล
ทั้งนี้ หากต้องการนาข้อมูล XML record ไปใช้งานต่อ ต้องมีโปรแกรม
รองรับ
ใช้ในการสร้างเว็บไซต์ เนื่องจากการแยกส่ วนของข้อมูลกับ
Programming ทาให้การทางานร่ วมกันระหว่าง graphic และ
Programmer ง่ายขึ้น
Link XML และ Metadata ที่น่าสนใจ
How does XML Help Libraries
http://www.infotoday.com/cilmag/sep02/Banerjee.htm
Encoded Archival Description (EAD)
http://www.loc.gov/ead/
Text Encoding Initiative (TEI) Consortium
http://www.tei-c.org
http://etext.lib.virginia.edu/bin/tei-tocsp3?div=DIV1&id=HD
มาตรฐานต่างๆบน web www.w3c.org
Z39.50 Maintenance Agency
http://lcweb.loc.gov/z3950/agency
มาตรฐานด้านสื่ อประเภทต่างๆ
Graphic Interchange Format – Gif
Joint Photographic Experts Group – Jpeg
Portable Network Graphics – PNG
Audio Interchange File Format – AIFF
Musical Instrument Digital Interface – MIDI
MPEG Audio Player3 – MP3
Moving Picture Experts Group - MPEG
More information
http://www.loc.gov/standards/marcxml/
How does xml help libraries?
http://www.infotoday.com/cilmag/sep02/B
anerjee.htm
More from e-journal articles