گرید داده

Download Report

Transcript گرید داده

‫تکثیر فایل‌ها در سیستم‌های گرید‬
‫ا رائه دهندگان ‪:‬‬
‫مسلم کاویانی‬
‫محمد رضا کمانکش‬
‫امیررضا فایض زاده‬
‫استاد ‪:‬‬
‫دکتر حنانی‬
‫واحد علوم و تحقیقات کرمانشاه‬
‫رئوس مطالب‬
‫‪ ‬سیستم‌های‌گرید‬
‫‪ ‬تکثیربرداری‬
‫‪ ‬انواع‌گرید‬
‫‪ ‬انواع‌معماری‌گرید‬
‫‪ ‬طبقه‌بندی‌تکنیک‌های‌موجود‌تکثیر‌داده‬
‫‪ ‬چالش‌های‌تکثیرداده‬
‫‪ ‬ارزیابی‌تکثیرداده‌ها‌‬
‫‪ ‬تكنیك‌هاي‌تكثیربرداري‬
‫‪ ‬نتیجه‌گیری‬
‫‪2/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫سیستمهای گرید‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪3/36‬‬
‫گرید‌یک‌نوع‌سیستم‌موازی‌و‌توزیع‌شده‌است‌که‌بمنظور‌فراهم‌آوردن‌‬
‫دسترسی‌قابل‌اطمینان‌به‌داده‌ها‌و‌منابع‌محاسباتی‌در‌شبکه‌های‌با‬
‫گستردگی‌جهانی‌طراحی‌شده‌است‪.‬‬
‫هنگامیکه‌کاربر‌یک‌فایل‌را‌درخواست‌می‌کند‌پهنای‌باند‌زیادی‌برای‌‬
‫انتقال‌فایل‌از‌سرویس‌دهنده‌به‌سرویس‌گیرنده‌مصرف‌می‌شود‪‌،‬بعالوه‌‬
‫همچنین‌با‌در‌نظر‌گرفتن‌اندازه‌فایل‪‌،‬تاخیر‌نیز‌مهم‌خواهد‌بود‪.‬‬
‫گرید‌عبارت‌است‌از‌اشتراک‌هماهنگ‌منابع‌و‌حل‌مسئله‌سازمان‌های‌‬
‫مجازی‌چندبخشی‬
‫در‌محیط‌های‌توزیع‌شده‌ی‌گرید‌دسترس‌پذیری‌داده‌ها‪‌،‬زمان‌پاسخ‪‌،‬‬
‫هزینه‌های‌دستیابی‪‌،‬مصرف‌پهنای‌باند‪‌،‬قابلیت‌اعتماد‌و‌مقیاس‌پذیری‌‬
‫معیارهای‌مهمی‌هستند‌که‌باید‌مد‌نظر‌قرار‌گیرند‪.‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫تکثریبرداری‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪4/36‬‬
‫مدیریت‌حجم‌عظیمی‌از‌داده‌ها‌در‌یک‌محل‌متمرکز‪‌،‬زمان‌دستیابی‌به‌داده‌ها‌‬
‫را‌افزایش‌داده‌و‌بنابراین‌زمان‌بیشتری‌برای‌انجام‌یک‌کار‌الزم‌است‪،‬‬
‫بنابراین‌برای‌کاهش‌زمان‌دستیابی‌داده‌ها‪‌،‬تکثیربرداری‌استفاده‌می‌شود‌‪.‬‬
‫هنگامیکه‌کاربر‌درخواستی‌برای‌یک‌فایل‌دارد‪‌،‬حجم‌باالیی‌از‌پهنای‌باند‌‬
‫برای‌انتقال‌فایل‌از‌سرویس‌دهنده‌به‌سرویس‌گیرنده‌مصرف‌می‌شود‪ .‬بعالوه‌‬
‫تاخیر‌موجود‌با‌در‌نظر‌گرفتن‌اندازه‌فایل‪‌،‬قابل‌توجه‌خواهد‌بود‪.‬‬
‫تکثیربرداری‌تکنیکی‌است‌که‌در‌سیستم‌های‌گرید‌بمنظور‌بهبود‌زمان‌پاسخ‌‬
‫برنامه‌های‌کاربردی‌و‌کاهش‌مصرف‌پهنای‌باند‌مورد‌استفاده‌قرار‌می‌گیرد‪.‬‬
‫هدف‌اصلی‌استفاده‌از‌تکثیربرداری‪‌،‬کاهش‌تاخیر‌دسترسی‌و‌مصرف‌پهنای‌‬
‫باند‌است‪.‬‬
‫مزایای‌دیگر‌تکثیربرداری‪‌،‬کمک‌به‌تعادل‌بار‌کاری‌و‌بهبود‌قابلیت اعتماد‌با‌‬
‫ایجاد‌چندین‌کپی‌از‌داده‌ها‌است‪.‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫انواع گرید‬
‫‪ ‬محاسبات گرید به روش‌های مختلفی مورد استفاده قر ‌ار می‌گیرد تا انواع مختلفی ‌از‬
‫نیازمندی‌های برنامه‌های کاربردی تامین گردد‪ ،‬سه نوع اصلی دارند‪ .‬هیچ مرزی بین‬
‫سه نوع گرید وجود ندارد ‌و ممکن است گریدها ترکیبی ‌از تعدادی ‌از آنها باشد‪.‬‬
‫‪5/36‬‬
‫‪‬‬
‫گرید محاسباتی‬
‫‪‬‬
‫گرید جوینده منابع‬
‫‪‬‬
‫گرید داده‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫))‪Computational grid‬گرید حماسباتی‬
‫‪ ‬گرید‌های‌محاسباتی‌بر‌تنظیم‌منابع‌خارجی‌برای‌قدرت‌محاسباتی تمرکز‌‬
‫دارند‪.‬‬
‫‪ ‬بعنوان‌مثال‌بسیاری‌از‌ماشین‌ها‪‌،‬سرورهایی‌با‌کارایی‌باال‌هستند‪.‬‬
‫‪ ‬گرید‌محاسباتي‌امکان‌دسترسي‌به‌سوپر‌کامپیوترهاي‌توزیع‌شده‌براي‌‬
‫اجراي‌کارهاي‌زمانبر‌را‌فراهم‌ميکند]‪.[11‬‬
‫‪6/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫گرید جوینده منابع (‪)Scavenging grid‬‬
‫‪ ‬این گریدها اغلب با تعداد زیادی از ماشین‌های رومیزی استفاده می‌شوند‬
‫که سیکل‌های در دسترس پردازنده و دیگر منابع را جستجو می‌کنند‪.‬‬
‫‪ ‬مالکان ماشین‌های رومیزی مشخص می‌کنند که منابع‌شان چه زمانی‬
‫برای شرکت در گرید در دسترس باشند‪.‬‬
‫‪ ‬این سیستم‌ها به‌صورت مداوم به‌دنبال ظرفیت‌ها‪ ،‬منابع آزاد و چرخه‬
‫پردازنده (‪ )CPU cycle‬كامپیوتر‌هاي متصل به گرید هستند و از این‬
‫منابع استفاده مي‌نمایند]‪.[11‬‬
‫‪7/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫گرید داده (‪)Data grid‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪8/36‬‬
‫گرید داده مجموعه‌ای از منابع کامپیوتری توزیع شده جغرافیایی است که این‬
‫منابع در بخش‌های مختلف یک کشور و یا حتی در کشورهای مختلف قرار‬
‫دارند‪.‬‬
‫گریدهای داده موظفند اطال‌عات را ذخیره كنند و آن‌ها را در اختیار كاربران‬
‫قرار دهند‪ .‬كاربران این سیستم‌ها بدون آن‌كه از موقعیت جغرافیایي و مكاني این‬
‫اطالعات آگاه باشند‪ ،‬به‌اطالعات دسترسي دارند]‪.[9‬‬
‫در این نوع گرید دستگاه‌هاي متصل به‌سیستم نیاز به‌قدرت زیاد ندارند و فقط‬
‫مسئول به‌اشتراك گذاشتن اطالعات هستند‪.‬‬
‫برای مثال‪ :‬دو دانشگاه بر روی یک تحقیق علمی کار می‌کنند هر یک داده‌های‬
‫خود را دارند یک گرید این دو محل را به هم متصل کرده و امکان اشتراک‬
‫داده‪ ،‬مدیریت داده‪ ،‬مدیریت نکات امنیتی مثل اینکه چه کسی به داده‌ها دسترسی‬
‫تکثیر‌فای‪.‬ل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫پیدا‌کند را فراهم می‌کند]‪[12‬‬
‫زاده‬
‫انواع معماری گرید‬
‫‪ ‬کارائی‌استراتژی‌های‌تکثیربرداری‌به‌شدت‌به‌الیه‌های‌زیرین‌معماری‌‬
‫گرید‌وابستگی‌دارد‪.‬‬
‫•‬
‫•‬
‫•‬
‫•‬
‫‪9/36‬‬
‫معماری‌گراف‬
‫معماری‌درختی‬
‫معماری‌نظیر‌به‌نظیر‬
‫معماری‌ترکیبی‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫معماری گراف‬
‫‪10/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫معماری درختی‬
‫‪ ‬یک‌توپولوژی‌درختی‌دارای‌‬
‫کاستی‌هایی‌است‪ .‬ساختار‌درختی‌‬
‫گرید‌بدان‌معنی‌که‌مسیرهای‌‬
‫خاصی‌که‌پیام‌ها‌و‌فایل‌ها‌‬
‫می‌توانند‌به‌سمت‌مقصد‌حرکت‬
‫کنند‪‌،‬می‌باشد‪ .‬بعالوه‪‌،‬انتقال‬
‫داده‌ها‌در‌میان‌گره‌های‌با‌والد‌‬
‫یکسان‌و‌یا‌گره‌های‌واقع‌شده‌در‬
‫یک‌ردیف‌امکان‌پذیر‌‬
‫نمی‌باشد]‪.[13‬‬
‫‪11/ 36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫معماری نظیر به نظیر‬
‫‪ ‬ویژگی‌های‌کلیدی‌که‌یک‌سیتم‌‬
‫‪ P2P‬را‌از‌دیگر‌سیستم‌های‌به‬
‫اشتراک‌گذاری‌منابع‌متمایز‌‬
‫می‌کند‪‌،‬مدل‌ارتباطات‌متقارن‌بین‌‬
‫نظیر‌ها‌است‌که‌هر‌کدام‌به‌‬
‫عنوان‌یک‌سرویس‌دهنده‌و‌‬
‫سرویس‌گیرنده‌عمل‌می‌کنند‪.‬‬
‫‪12/ 36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫معماری ترکیبی‬
‫‪ ‬یک‌توپولوژی‌ترکیبی‌ویژگی‌های‌‬
‫معماری‌‪ P2P‬و‌درختی‌را‌در‌‬
‫برگرفته‌و‌در‌نتیجه‌برای‌‬
‫عملکرد‌بهتر‌یک‌استراتژی‌‬
‫تکثیر‌می‌تواند‌استفاده‌شود‬
‫‪13/ 36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫طبقهبندی تکنیکهای موجود تکثری داده‬
‫‪ ‬الگوریتم‌تکثیربرداری‌داده‌بایستی‌به‌یک‌سوال‌کلیدی‌در‌خصوص‌اینکه‌‬
‫کدام‌داده‌بایستی‌تکثیر‌شده‌و‌تکثیر‌کجا‌باید‌قرار‌داده‌شود‪‌،‬پاسخ‌دهد‪ .‬با‌‬
‫توجه‌به‌رفتار‌پویای‌کاربران‌گرید‪‌،‬تصمیم‌گیری‌در‌مورد‌تکثیر‌داده‌ها‌‌‬
‫برای‌رسیدن‌به‌هدف‌حداکثری‌در‌دسترس‌پذیری‪‌،‬را‌مشکل‌می‌کند]‪.[14‬‬
‫‪ ‬تکنیک‌های‌تکثیربرداری‌به‌دو‌رده‌‌تقسیم‌می‌شوند‌‪:‬‬
‫‪14/36‬‬
‫•‬
‫تکثیربرداری ایستا‬
‫•‬
‫تکثیربرداری پویا‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫تکثیربرداری ایستا‬
‫‪ ‬در‌استراتژی‌تکثیربرداری‌ایستا‪‌،‬تعداد‌تکثیرها‌و‌نودهای‌میزبان‌در‌‬
‫آغاز‌چرخه‌ی‌کار‌بصورت‌ایستا‌انتخاب‌می‌شوند‪‌،‬ایجاد‌و‌یا‌اتصال‬
‫تکثیرها‌بعد‌از‌آن‌انجام‌نمی‌شود‪.‬‬
‫‪15/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫تکثیربرداری پویا‬
‫‪ ‬استراتژی‌های پویا با تغییرات در الگوی درخواست کاربر‪ ،‬ظرفیت‬
‫ذخیره‌سازی و پهنای باند انطباق می‌یابد و می‌تواند تکثیرها را بر روی‬
‫نودهای جدید ایجاد و تکثیرهایی را که دیگر مورد نیاز نیست را پاک کند‪.‬‬
‫‪ ‬استراتژی‌های پویا از ایستا بهتر هستند زیرا آنها می‌توانند تصمیم‌گیری‬
‫هوشمندی در مورد قرار دادن یا مکان‌یابی مناسب داده‌ها بسته به‬
‫اطالعات از محیط گرید داشته باشند‪.‬‬
‫‪16/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫چالشهای تکثریداده‬
‫‪ ‬استفاده از استراتژی‌های تکثیر در محیط‌های گرید باعث بوجود‬
‫آمدن چالش‌هایی خواهد شد‪ .‬چهار چالش مهم در محیط‌های تکثیر‬
‫شده شامل موارد زیر است ‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪17/36‬‬
‫زمان‌ایجاد‌یک‌‌تکثیر‌جدید‬
‫سازگاری‌داده‬
‫عملکرد‌پایین‌نوشتن‬
‫سربار‌نگهداری‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫ارزیابی تکثریدادهها‬
‫‪ ‬تمامی‌استراتژی‌های‌تکثیربرداری‌از‌زیر‌مجموعه‌ای‌از‌این‌پارامترها‌‬
‫استفاده‌می‌کنند‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪18/36‬‬
‫تاخیر‌زمان‌دسترسی‌‬
‫مصرف‌پهنای‌باند‌‬
‫تعادل‌حجم‌کار‌‬
‫هزینه‌نگهداری‬
‫مکان‌یابی‬
‫زمان‌اجرای‌کار‬
‫تحمل‌پذیری‌خطا‌و‌تضمین‌کیفیت‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫مزایای اسرتاتژی تكثریبرداري داده ها‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫دسترس‌پذیري‌‬
‫قابلیت‌اطمینان‌‬
‫مقیاس‌پذیری‌‬
‫وفق‌پذیري‬
‫كارایي‬
‫‪19/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫تكنیكهاي تكثریبرداري‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫تكنیك‌هاي‌تکثیربرداری‌معماري‌نظیر‌به‌نظیر و‌عمومی‬
‫تكنیك‌هاي‌تکثیربرداری‌معماري‌درختي‬
‫تكنیك‌هاي‌تکثیربرداری‌معماري‌ترکیبی‬
‫تكنیك‌هاي‌تکثیربرداری‌معماري‌گراف‬
‫‪20/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫تكنیكهاي تکثریبرداری معماري نظری به نظری‬
‫]‪ Cashing plus cascading[12‬‬
‫]‪ Bandwidth Hierarchy Replication (BHR)[27‬‬
‫‪21/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫تكنیكهاي تکثریبرداری معماري درخيت‬
 Plain Cashing[12]
 Fast Spread[12]
 Simple Bottom-Up (SBU)[18]
 Aggregate Bottom-Up (ABU)[18]
 Proportional Share Replica (PSR)[19]
 Multi-objective[20]
 Latest Access Largest Weight (LALW)[21]
‌‫‌فایض‬،‫‌کمانکش‬،‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‬
‫زاده‬
22/36
)‫تكنیكهاي تکثریبرداری معماري درخيت(ادامه‬
 Adaptive Popularity Based Replica Placement




(APBRP)[22]
Predictive hierarchical fast spread (PHFS)[23]
Dynamic Hierarchical Replication (DHR)[24]
Modified Latest Access Largest Weight (MLALW)[25]
Modified Dynamic Hierarchical Replication Algorithm
(MDHRA)[26]
‌‫‌فایض‬،‫‌کمانکش‬،‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‬
‫زاده‬
23/36
‫تكنیكهاي تکثریبرداری معماري گراف‬
 Agent-based replica
 Least Frequently Used(LFU)[30]
 Least Recently Used (LRU)[30]
 Weight-based dynamic replica[31]
 Efficient Replication[32]
 Value-based replication strategy (VBRS)[33]
 Enhance Fast Spread (EFS)[34]
‌‫‌فایض‬،‫‌کمانکش‬،‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‬
‫زاده‬
24/36
‫با‌تشکر‌از‌حسن‌توجه‌شما‬
‫‪25/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫پرسش‌و‌پاسخ‬
‫‪26/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬
‫پایان‬
‫‪27/36‬‬
‫تکثیر‌فایل‌ها‌در‌سیستم‌های‌گرید‌‌‌‌‌‌‌‌‌‌کاویانی‪‌،‬کمانکش‪‌،‬فایض‌‬
‫زاده‬