Data mining application for customer segmentation based on loyalty

Download Report

Transcript Data mining application for customer segmentation based on loyalty

‫کاربردهای داده کاوی برای تقسیم بندی مشتریان‬
‫بر اساس وفاداری ‪:‬‬
‫مطالعه موردی بر روی یک صنعت غذایی ایران‬
‫درس ‪ :‬سمینار مباحث ویژه در مدیریت فناوری اطالعات‬
‫سید محمد حسین صدر‬
‫دانشجوی دکتری مدیریت فناوری اطالعات‬
‫دانشکده مدیریت دانشگاه عالمه طباطبایی‬
‫نیمسال اول سال تحصیلی ‪92-91‬‬
: ‫کاربردهای داده کاوی برای تقسیم بندی مشتریان بر اساس وفاداری‬
‫مطالعه موردی بر روی یک صنعت غذایی ایران‬
2011
‫عنوان مقاله‬
‫سال‬
Hajiha, A.a , Radfar, R.b , Malayeri, S.S.c
Department of Industrial Management, Islamic Azad University,
North Tehran Branch, Tehran, Iran
b Department of Industrial Management, Islamic Azad University,
Science and Research Branch, Tehran, Iran
c Department of Management, Islamic Azad University, UAE Branch,
Dubai, United Arab Emirates
a
IEEE International Conference on Industrial
Engineering Management
2011, Article number6117968, Pages 504-508
Engineering
)‫مولف (مولفین‬
and
‫محل انتشار‬
، ‫ داده کاوی‬، ‫ مدیریت ارتباط با مشتری‬، ‫وفاداری مشتری‬
RFM ‫ مدل‬،K-means ‫الگوریتم‬
‫لغات کلیدی‬
‫شرکت لبنیاتی کاله یکی از بزرگترین تولیدکنندگان و توزیع کنندگان‬
‫محصوالت لبنی و بستنی در ایران می باشد‪ .‬این شرکت تالش می نماید‬
‫تا محصوالت لبنی با کیفیت تولید نماید و از جدید ترین ماشین آالت و‬
‫تکنولوژی ها در زمینه تولید و توزیع آنها استفاده می نماید‬
‫در این مقاله ‪ 18‬محصول لبنی و داده های ‪ 3‬سال و منتهی به‬
‫سال ‪ 2010‬مورد بررسی قرار گرفته است‬
‫آماده سازی داده‬
‫محاسبه متغیر‬
‫متغیر‬
‫نرمال سازی متغیر‬
‫مدل تحقیق‬
‫خوشه بندی با الگوریتم ‪K-Means‬‬
‫خوشه بندی فاصله خوشه‬
‫ها با هم‬
‫خوشه بندی فاصله بین‬
‫خوشه ها‬
‫خوشه بندی‬
‫تعیین تعداد خوشه ها‬
‫تعیین وزن متغیرها‬
‫محاسبه ارزش متوسط خوشه ها‬
‫تجزیه تحلیل خوشه ها‬
‫تجزیه تحلیل‬
‫متغیر‬
‫آماده سازی داده‬
‫بر اساس اطالعات بازیابی شده از پایگاه داده شرکت لبنیاتی کاله ‪ ،‬این پایگاه داده‬
‫شامل بیش از ‪ 15000‬رکورد ‪ 808 ،‬مشتری ‪ ،‬تعامالت ‪ 36‬ماه و ‪ 18‬محصول بود‬
‫پایگاه داده‬
‫‪ 18‬محصول‬
‫تعامالت ‪ 36‬ماه‬
‫‪ 15000‬رکورد‬
‫‪ 808‬مشتری‬
‫متغیر‬
‫آماده سازی داده‬
‫پایگاه داده شامل کد مشتری ‪ ،‬اطالعات مشتری ‪ ،‬تاریخ تراکنش ها ‪ ،‬نوع محصول و‬
‫ارزش خرید می باشد‬
‫ارزش خرید‬
‫پایگاه داده‬
‫نوع محصول‬
‫تاریخ تراکنش‬
‫ها‬
‫کد مشتری‬
‫اطالعات‬
‫مشتری‬
‫‪RFMDC‬‬
‫متغیر‬
‫بعد از آماده سازی داده ‪ ،‬معیار ‪ RFM‬و دو پارامتر اضافی دیگر (‪ D‬و ‪ )C‬مورد بررسی قرار‬
‫گرفت ‪ .‬سپس توسط ‪ 16‬مدیر عالی و میانی شرکت که بعنوان خبرگان انتخاب شده بودند ‪،‬‬
‫در خصوص این متغیرها سوال شد که آیا برای وفاداری مشتری مهم می باشد یا خیر؟‬
‫زمانی که خبرگان اعتبار این متغیرها تایید کردند ‪ ،‬از آنها خواسته شد که تا وزن هر متغیر را‬
‫تعیین کند‪.‬‬
‫استمرار خرید‬
‫تنوع‬
‫‪RFMDC‬‬
‫تازگی‬
‫فراوانی و‬
‫تعداد دفعات‬
‫خرید‬
‫پولی‬
‫تازگی خرید ‪ ،‬به آخرین خرید در یک دوره خاص اشاره دارد‬
‫فراوانی و تعداد دفعات خرید ‪ ،‬به تعداد تراکنش ها در یک دوره خاص اشاره می نماید ( برای‬
‫مثال دو بار در یک سال ‪ ،‬دو بار در یک فصل ‪ ،‬و یا دو بار در یک ماه)‬
‫ارزش پولی خرید ‪ ،‬به مقدار مصرف پول در یک دوره خاص اشاره دارد‪.‬‬
‫تنوع خرید ‪ ،‬به تنوع محصوالت در سبدهای خرید در یک دوره خاص اشاره دارد‪ .‬وقتی مردم می‬
‫خواهند که نیازهای روزانه خود را برطرف نمایند ‪ ،‬آنها ترجیح می دهند که سوپرمارکتی بروند که‬
‫بتوانند تمامی چیزهایی را که نیاز دارند را خریداری نمایند ‪ .‬اگر شرکت نتواند تمام اقلم مورد نیاز‬
‫مشتری را فراهم نماید‪ ،‬نمی تواند آنها را نگهدارد‪.‬‬
‫استمرار خرید ‪ ،‬به بزرگترین توالی در استمرار خرید در یک دوره خاص‪ ،‬اشاره می نماید‪ .‬تمامی‬
‫شرکتها مشتریانی را ترجیح می دهند که استمرار در خرید داشته باشند ‪ ،‬در بازاریابی‪ ،‬یک شرکت‬
‫می خواهد که تعداد خرید و استمرار و تکرار را در یک دوره زمانی خاص بررس ی نماید‪.‬‬
‫‪R‬‬
‫‪F‬‬
‫وفاداری مشتری‬
‫‪M‬‬
‫‪D‬‬
‫‪C‬‬
‫زمانیکه آماده سازی داده انجام شد‪ ،‬خوشه بندی مشتریان با استفاده از‬
‫الگوریتم ‪ K-Means‬شروع شد ‪ ،‬در این مرحله ‪، Mi ،Ri Fi ،‬‬
‫‪Di‬و ‪ Ci‬بعنوان متغیرهای ورودی برای تجزیه تحلیل داده ها مورد‬
‫استفاده واقع شد و خوشه های مشتری با استفاده از الگوریتم ‪K-‬‬
‫‪ Means‬بعنوان خروجی در نظر گرفته شد‪.‬‬
‫به منظور ارزیابی کیفیت خوشه بندی‪ ،‬ما تعداد بهینه خوشه ها را در یک‬
‫دامنه پیشنهادی تعیین کردیم‪ ،‬در این تحقیق بر اساس نظر خبرگان و داده‬
‫های موجود ‪ ،‬دامنه پیشنهادی برای ‪ ،K‬بین ‪ 2‬و ‪ 9‬پیشنهاد شد ‪:‬‬
‫‪2<K<9‬‬
‫بمنظور تعیین تعداد بهینه خوشه ها‪ ،‬تعداد خوشه ها می تواند بر اساس‬
‫بهترین فاصیه بین و درون خوشه ها انتخاب شود ‪ ،‬تعداد بهینه خوشه ها‬
‫جایی است که فاصله بین خوشه ها حداکثر و فاصله درون خوشه ها‬
‫حداقل شود‪.‬‬
‫خوشه بندی‬
‫‪CLUSTERING QUALITY COMPARISON‬‬
‫خوشه بندی‬
‫‪For 2<K<9‬‬
‫فاصله درونی خوشه ها‬
‫فاصله بین خوشه ها‬
‫تعداد خوشه ها‬
‫‪220.4106‬‬
‫‪0.8412‬‬
‫‪2‬‬
‫‪162.3384‬‬
‫‪0.851924‬‬
‫‪3‬‬
‫‪47.9888‬‬
‫‪0.85967‬‬
‫‪4‬‬
‫‪99.15597‬‬
‫‪0.808449‬‬
‫‪5‬‬
‫‪86.21611‬‬
‫‪0.794131‬‬
‫‪6‬‬
‫‪79.84071‬‬
‫‪0.763483‬‬
‫‪7‬‬
‫‪65.00168‬‬
‫‪0.800886‬‬
‫‪8‬‬
‫‪53.84907‬‬
‫‪0.80787‬‬
‫‪9‬‬
‫خوشه بندی‬
‫ماکزیمم‬
‫‪dbetween‬‬
‫مینیمم‬
‫‪dwithin‬‬
‫در‬
‫‪K=4‬‬
‫رخ می دهد‬
‫تعداد بهینه خوشه ها ‪ 4‬تا‬
‫می باشد‬
‫آنها ‪ 4‬تا خوشه می باشند و هر خوشه شامل مجموعه ای از مشتریان می باشد‬
‫که با یکدیگر در یک خوشه مشابه می باشند و با سایر مشتریان در خوشه ها‬
‫دیگر متفاوت می باشند‬
‫بمنظور تجزیه تحلیل خوشه ها‪ ،‬مدل ‪ RFMDC‬استفاده شد‪ .‬معیار ‪،F ،R‬‬
‫‪ D ،M‬و ‪ C‬باید برای تمامی خوشه ها محاسبه می شد‪.‬‬
‫برای تعیین وزن متغیرها ‪ ،‬پرسشنامه برای دریافت نظرات و دیدگاه های‬
‫خبرگان مورد استفاده واقع شد‪.‬‬
‫‪WC = 0.21‬‬
‫‪WD = 0.20‬‬
‫وزن متغیرها‬
‫‪WR = 0.17‬‬
‫‪WF = 0.25‬‬
‫‪WM = 0.17‬‬
‫تجزیه‬
‫تحلیل‬
‫نتایج تجزیه تحلیل ‪RFMDC‬‬
‫محاسبه ارزش متوسط هر خوشه‬
‫تعداد‬
‫‪Vk‬‬
‫‪Ck‬‬
‫‪Dk‬‬
‫‪Mk‬‬
‫‪Fk‬‬
‫‪Rk‬‬
‫خوشه ها‬
‫‪142‬‬
‫‪0.472‬‬
‫‪0.326‬‬
‫‪0.733‬‬
‫‪0.057‬‬
‫‪0.437‬‬
‫‪0.829‬‬
‫خوشه ‪0‬‬
‫‪254‬‬
‫‪0.808‬‬
‫‪0.924‬‬
‫‪0.887‬‬
‫‪0.171‬‬
‫‪0.966‬‬
‫‪0.995‬‬
‫خوشه ‪1‬‬
‫‪82‬‬
‫‪0.905‬‬
‫‪0.986‬‬
‫‪0.936‬‬
‫‪0.543‬‬
‫‪0.998‬‬
‫‪1.000‬‬
‫خوشه ‪2‬‬
‫‪330‬‬
‫‪0.175‬‬
‫‪0.080‬‬
‫‪0.218‬‬
‫‪0.012‬‬
‫‪0.098‬‬
‫‪0.535‬‬
‫خوشه ‪3‬‬
‫خوشه ‪2‬‬
‫خوشه ‪ ، 2‬با ارزش ترین خوشه می باشد‬
‫اعضای این خوشه مشتریان وفادار باارزش هستند و اعضای آن باالترین ارزش پولی را دارا می باشند‪ ،‬شرکت ارتباط‬
‫بلند مدت با این مشتریان دارد ‪ ،‬و این مشتریان وفادار و فعال می باشد و دارای باالترین سطح سودآوری برای شرکت‬
‫می باشد و باید حفظ شوند و باید آنها را نگه داشت و نباید هیچکدام از آنها را از دست داد‪.‬‬
‫خوشه ‪1‬‬
‫خوشه ‪ 1‬بسیار شبیه به خوشه ‪ 2‬می باشد در زمینه تازگی‪ ،‬فراوانی و تعداد دفعات خرید ‪ ،‬تنوع و پوستگی خرید اما با‬
‫یک اختلف زیاد در ارزش پولی ‪ ،‬که این خوشه را بعنوان دومین مهمترین خوشه تبدیل کرده است‪.‬‬
‫حجم خریدها کم می باشد ‪ ،‬زیراکه ممکن است کسب و کارهای آنها کوچک باشد‪ .‬با بررس ی و برقراری ارتباط مناسب با‬
‫این مشتریان ‪ ،‬و با اتخاذ استراتژی های مناسب امکان دارد که حجم خریدها افزایش یابد‪.‬‬
‫خوشه ‪0‬‬
‫خوشه ‪ ، 0‬سومین گروه با ارزش می باشد که بعنوان مشتریان جدید تعریف می‬
‫شوند‪ .‬فراوانی و تعداد دفعات خرید این مشتریان بسیار کم می باشد و ارتباط‬
‫بلندمدتی با آنها وجود ندارد‪.‬‬
‫شرکت باید شناخت بهتری از آنها پیدا نماید تا بتواند حجم خریدهای آنها را افزایش‬
‫دهد ‪ ،‬و ارتباط بلندمدت تر و سود ده تری با آنها برقرار نماید‪.‬‬
‫خوشه ‪3‬‬
‫خوشه ‪ 3‬آخرین گروه با ارزش می باشد ‪ ،‬که بعنوان مشتریان غیرفعال تعریف می‬
‫شوند ‪ ،‬و افرادی هستند که به تازگی ارتباط شان را با شرکت قطع کرده اند‪.‬‬
‫متاسفانه تعداد آنها زیاد هستند ‪ ،‬دالیل آن باید به خوبی بررسی شوند و استراتژی ها‬
‫مناسب برای جلوگیری از دست دادن آنها باید تعیین شوند‬