Semantic Web – הדור הבא של הרשת

Download Report

Transcript Semantic Web – הדור הבא של הרשת

Dr. Alon Hasgall
[email protected]
http://vamola1.wordpress.com = ‫בלוג‬
http://www.vanola.info = ‫אתר אישי‬
Alon @ MavinU
www.mavinU.com = ‫אתר החברה‬
‫‪ ‬הדור ה – ‪ 3‬של הרשת מתייחס ל ‪ -‬רשת סמנטית ‪-‬‬
‫‪ ,Semantic Web‬מונח שטבע טים ברנרס‪-‬לי‬
‫‪ ‬הרשת הסמנטית החכמה תאפשר למחשבים לקרוא‬
‫ולהבין דפי אינטרנט כפי שאנשים מבינים אותם‪ ,‬ולמצוא‬
‫את המידע המבוקש עבורנו באופן אוטומטי‬
‫האם ניתוח סמנטי יעלה את יכולתו‬
‫של המשתמש להשיג את מטרותיו?‬
‫האם נוכל ליצור סביבת ידע‬
‫מותאמת אישית‪ ,‬מהירה ורלוונטית‬
‫יותר למשתמש?‬
‫אלמנטים היוצרים ידע‬
‫[ע"פ הקבלה ‪] wu-hsing ,‬‬
‫• הידע ניקבע על פי יחסי גומלין אינטראקטיביים ולא‬
‫על ידי סיבה ותוצאה‪.‬‬
‫• לידע יש מבנה פרקטלי (תגיות‪ ,‬פיסקאות ורעיונות‬
‫יותר מכתבות ומאמרים)‪.‬‬
‫• הרלוונטיות של הידע נקבע לפי רמת הזרימה שלו [צ'י ]‬
‫ולא על פי מעמדו של הכותב‪.‬‬
‫• רמת הרגישות של הידע גבוהה‪ .‬המשמעות משתנה‬
‫בהקשר למגוון הפרעות‪ ,‬אפילו מזעריות‪ .‬הידע תלוי‬
‫בהקשר ובמיקום‪.‬‬
‫‪4‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
‫‪7/18/2015‬‬
‫‪7/18/2015‬‬
‫התאמת הידע ל"יודע" ולהקשר‪.‬‬
‫חוק ריסטון (‪)1992‬‬
‫‪ ‬הון רעיוני‪/‬אינטלקטואלי ישוחרר לנוע‬
‫במהירות האור וברשת גלובלית‪.‬‬
‫‪ ‬הוא ינוע למקום שבו הוא רצוי וישאר‬
‫במקום זמני שבו הוא זוכה ליחס ראוי‪.‬‬
‫‪‬‬
‫‪5‬‬
‫חוק ריסטון משמש לחיזוי יכולת ההתפתחות של‬
‫מדינות וכאחד מבסיסי מדד "הפער הדיגיטאלי"‪.‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
‫‪7/18/2015‬‬
‫היחס בין הידע האישי‬
‫לפתרונות קבוצתיים‬
‫הידע מייצג חוויות ואינטרפטציות מנקודות השקפה שונות‪.‬‬
‫הידע מופיע בתצורה פולקסונומית (ד"ר אשר עידן) כמו ויקי‪,‬‬
‫‪ ,IM‬קאזה‪ ,‬בלוגים‪.RSS ,‬‬
‫פיתוח משותף של פתרונות מביא לידע ספציפי ושונה אצל כל‬
‫אחד‪.‬‬
‫‪6‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
7/18/2015
“Semantic Web” ‫התפתחות‬
•
•
•
•
:‫• מבוסס על‬
“Qualitative Data Analysis” (QDA).
Automatic personal tagging
Contextually relating of relevant users
Automatic assignment of Meta Data.
Meaningful information is based on
personal semantic association.
7
‫הדגמת יתרונות ה ‪SEMANTIC WEB‬‬
‫[על פי מאמרו של טום ברנרד לי]‪.‬‬
‫‪‬דרישה לרופא מומחה ‪ -‬תוכנת סוכן הרשת‬
‫הסמנטית תפעיל רשת ניידת‪ ,‬תאתר מידע‪,‬‬
‫תבדוק את פרטי ההפניה מול הסוכן של‬
‫הרופא‪ ,‬כולל כיסוי הביטוח הרפואי ויאשר‬
‫‪ Second Opinion‬עם רופא מומחה בדירוג‬
‫מצוין ברדיוס של ‪ 32‬ק"מ מביתה‪.‬‬
‫‪ ‬דואר אלקטרוני יאפשר הצעת שיתוף פעולה‬
‫מסחרי כלשהו‪ ,‬תוך כתיבתו‪ .‬כולל עדכונים על‬
‫פעילות עמית לרשת שכבר נמצא בפעילות‬
‫באותו נושא‪.‬‬
‫‪‬הזמנת טיסה באמצעות הטלפון הסלולארי‪,‬‬
‫תפעיל מערך הודעות והזמנות ביעד וביטולים‬
‫ממקור היציאה‪.‬‬
‫‪7/18/2015‬‬
‫הניתוח הסמנטי‬
‫תהליך של למידת קשרי מילים אצל משתמש‪:‬‬
‫‪ .1‬מונחים‪ ,‬אמירות‪ ,‬זיהוי גבולות המילה‬
‫‪ .2‬מיפוי קשרים‪ ,‬ניתוח ניגודים לקסיקלי‬
‫‪ .3‬הענקת משמעות‬
‫אבל הבעיה היא שיש‪:‬‬
‫‪ .1‬התייחסות ספציפית מידי לפירוש של‬
‫מילה‪/‬מונח‪/‬משפט‪.‬‬
‫‪ .2‬או הפוך ‪ -‬הרחבת יתר‪ .‬הכללה של‬
‫מילה‪/‬מונח‪/‬משפט‪.‬‬
‫‪9‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
‫‪7/18/2015‬‬
‫מורכבות השפה‬
‫‪ ‬פונולוגיה – מערכת הצלילים הקיימת בשפה‪.‬‬
‫‪ ‬סמנטיקה – משמעות של מילים ומשפטים‪.‬‬
‫‪ ‬מורפולוגיה – תורת הצורות‪.‬‬
‫‪ ‬תחביר – כללי הדקדוק‪.‬‬
‫‪ ‬פרגמטיקה – כללי השימוש החברתי בשפה‪.‬‬
‫‪10‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
‫‪7/18/2015‬‬
‫השפעת הסביבה והתורשה‬
‫[ חומסקי ]‬
‫‪ ‬בני האדם נולדים עם מנגנון תורשתי המותאם‬
‫במיוחד לרכישה ופרשנות של דימויים‪.‬‬
‫‪Lad= language acquisition device‬‬
‫‪ ‬באינטרנט הגולש נחשף להשפעות סביבתיות‪,‬‬
‫ומחבר בין השפה שלו לכללי ההתמצאות במרחב‪.‬‬
‫‪ ‬האתגר – התאמה בין משמעות היחיד‪ ,‬משמעות‬
‫הטקסט ומשמעות חברתית לאותו מושג!!‬
‫‪11‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
Who knows?
concerning to what?
Where is he?
Who transfer info to
whom?
Why? When?
TEXT
MINING
‫•מקור המידע הספציפי‬
‫•מרחב סמנטי מותאם אישית‬
‫למשתמש‬
‫•בהתאמה למובהקות החברתית‬
‫במרחב‬
POPULAR
RATING
PERSONAL
FRAME WORK
‫סוכני תוכנה (תוכנות‬
‫המבצעות פעולות של‬
‫איסוף וניתוח נתונים)‬
‫מבצעים הקשריות‬
‫[אסוציאציות] בין‬
‫פירטי מידע‪.‬‬
‫החלפת החיפוש‬
‫באיתור אוטומטי‪,‬‬
‫מותאם אישית‪,‬‬
‫קונטקסטואלית‪ ,‬בזמן‬
‫ספציפי ומשתנה‪.‬‬
‫תקשורת שימושית‬
‫בשפה טבעית‪.‬‬
‫הקשר‬
‫סמנטי‬
‫הרשת הסמנטית תוארה במאמר מכונן בשנת ‪ ,Scientific American- ,2001‬שבין כותביו היה ברנרס‪-‬לי‪.‬‬
‫‪ ‬ניתוח הקשרים וקביעת מילות‬
‫מפתח‪ ,‬נושאי עניין אוטומטית‪.‬‬
‫‪ ‬יצירה אוטומטית של רשת‬
‫תכנית ואנושית מבוססת תיוג‬
‫אוטומטי [לפי תגים רבים]‬
‫‪ ‬עיבוד של שפה טבעית [‬
‫‪ Powerset‬ו‪TextDigger-‬‬
‫‪ Clear forest‬מבוססים על‬
‫פרויקט הקוד הפתוח האקדמי‬
‫‪]WordNet‬‬
‫‪7/18/2015‬‬
‫גישת ה‪Pipeline -‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪15‬‬
‫‪ INPUT‬מיוצג על ידי כל תוכן תחבירי‪.‬‬
‫יש צורך בצמצום משמעויות על ידי שימוש במתייג [כמו‬
‫‪]STEM‬‬
‫יש קושי בשפה טבעית שאינה לפי תחביר פורמאלי‬
‫יש שימוש ב‪prepositional phrase attachments :‬‬
‫ניסיונות לניתוח באמצעות ‪word sense‬‬
‫‪.disambiguation‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
‫‪7/18/2015‬‬
‫‪rule to rule hypothesis‬‬
‫‪Bach 1976‬‬
‫‪ ‬יצירת אינסוף משפטים באמצעות שימוש בצירופים‬
‫שונים [בעיה‪ -‬כמות עצומה]‬
‫‪ ‬הרכבת חוקים סמנטיים של צירוף וקביעת היגיון‬
‫תחבירי [בעיה‪ -‬יש יוצאים מהכלל]‬
‫‪ ‬הכרת משמעות של כל חלק תחבירי וצמצום‬
‫משמעויות לא סבירות [בעיה – מהן משמעויות לא‬
‫סבירות בפולקסונומיה ?]‬
‫‪ ‬התייחסות להקשר של כל משמעות סבירה [בעיה –‬
‫מהו ההקשר? ] ‪.‬‬
‫‪16‬‬
‫ד"ר אלון הסגל‬
‫‪http:;www.mavinu.com‬‬
7/18/2015
Creating* contextual environment
[MavinU.com ]
•
Defining the environment context
•
•
the intensity of each Item, Extract the relations between Items].
Titling the environment content
•
•
[ Extract
[ Reengineering
the content, Assigning each Item and knowledge holders, Add Meta Data for each Item].
Extracting actual relations and linkages:
•
[by scoring traffic in the organization].
Ite
m
Ite
5
m
Ite
3
m Emplo
4 yee 2
context 1
USER 2
Ite
m5
Ite
m2
Ite
m1
Ite
m3
context 2
Ite
m2
Ite
m4
USER 3
Ite
m1
Ite
m6
context 3
17
‫‪‬‬
‫‪‬‬
‫הוספת הערות ‪ metadata‬או מטה‪-‬נתונים [‪]Radar Networks‬‬
‫פיתוח תוכנות [סוכני רשת] בעלי יכולת התאמה בין מטה‪-‬דאטה‪.‬‬
‫מבוסס על תקני ‪( Resource Description Framework‬או ‪ )RDF‬ו‪Web -‬‬
‫‪( Ontology Language‬או ‪.)OWL‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫הבנת המשמעות של דף רשת באופן אוטומטי‪ ,‬באמצעות אחזור פיסות מידע‬
‫שמקושרות לדף זה מאתרים ומשירותים אחרים [‪BlueOrganizer‬מבית‬
‫‪.]AdaptiveBlue‬‬
‫מנוע המלצות [‪ , ]A-9 Amazon‬מציע לגולש מוצרים נוספים בהתאם להעדפות‬
‫גלישה וקניות קודמות‬
‫איחזור מותאם אישית של עדכוני [‪ ]RSS‬חדשות‪ ,‬מסחר וחברה [ ‪.]MavinIT‬‬
‫יצירת ‪ ,COMPOZ-DOC‬כולל הצעות לינקים תוך כדי כתיבה‪ .‬התאמת תכנים‪,‬‬
‫אנשים‪ ,‬מוצרים ופרסומות [‪.]MavinIT‬‬