نویسندگان : دکترابراهیم پورزرندی گلثوم اکبرپور (کارشناسی ارشد حسابداری) مقدمه امروزه سیستمهای سنتی در حال تبدیل شدن به سیستمهای اطالعاتی هستند؛ سیستم های اطالعاتی

Download Report

Transcript نویسندگان : دکترابراهیم پورزرندی گلثوم اکبرپور (کارشناسی ارشد حسابداری) مقدمه امروزه سیستمهای سنتی در حال تبدیل شدن به سیستمهای اطالعاتی هستند؛ سیستم های اطالعاتی

‫نویسندگان ‪:‬‬
‫دکترابراهیم پورزرندی‬
‫گلثوم اکبرپور (کارشناسی ارشد حسابداری)‬
‫مقدمه‬
‫امروزه سیستمهای سنتی در حال تبدیل شدن به سیستمهای اطالعاتی هستند؛‬
‫سیستم های اطالعاتی‪ ،‬توانایی های موجود در تولید و جمع آوری داده ها را به‬
‫سرعت افزایش داده است‪ .‬نیاز به استفاده از فنون جدید برای تبدیل این داده ها به‬
‫دانش افزایش یافته است‪.‬‬
‫از طرف دیگرامروزه با حجم بزرگی از داده ها ‪ ،‬در حد مگا یا ترابایت ‪ ،‬مواجه هستیم ‪.‬‬
‫در تمامی منابع داده کاوی براین مطلب تاکید شده است ‪ .‬هر چه حجم داده ها بیشتر و‬
‫روابط میان آنها پیچیده تر باشد دسترس ی به اطالعات نهفته در میان داده ها مشکلتر‬
‫می شود و نقش داده کاوی به عنوان یکی از روشهای کشف دانش ‪ ،‬روشن تر می گردد‪.‬‬
‫داده کاوی چیست؟‬
‫(‪)Data-mining‬‬
‫‪ ‬داده کاوي فرآيند کشف رابطه ها‪ ،‬الگوها و روندهاي جديد‬
‫معني داري است که به بررس ي حجم وسيعي از اطالعات‬
‫ذخيره شده در انبارهاي داده با فناوري هاي تشخيص الگو‬
‫می پردازد‪.‬‬
‫فرایند کلی داده کاوی‬
‫مرحله اول‪ :‬درک کسب و کار ‪Business Understanding‬‬
‫قبل از استفاده از رهیافت داده کاوی‪ ،‬باید نسبت به موضع کسب و‬
‫کار و اهداف آن شناخت جانبی پیدا کنیم‪.‬‬
‫مرحله دوم‪ :‬درک داده‬
‫‪Data Understanding‬‬
‫این مرحله در ارتباط با چگونگی تولید و جمع آوری داده ها میباشد‪.‬باید بدانیم در‬
‫ارتباط با کاری که می خواهیم انجام دهیم داده ها را از کجا و چگونه به دست‬
‫آوریم‪(.‬منابع داده ای ‪)Data Resources‬‬
‫در بعض ی مواقع به دست آوردن داده ها برای یک کار خاص ممکن است غير‬
‫ممکن باشد چه از لحاظ زمان و چه از لحاظ هزینه ‪ .‬در این شرایط بهتر است که‬
‫به مرحله قبل برگردیم و کاری که می خواستیم انجام دهیم و به بن بست‬
‫رسیدیم را تغیير دهیم‪.‬‬
‫مرحله سوم‪:‬آماده سازی داده ها‬
‫‪Data preparation‬‬
‫بعد از اینکه داده ها را به دست آوردیم حاال باید ببینیم کیفیت این داده ها‬
‫چگونه است‪،‬چون بعض ی مواقع اعداد زیادند ولی کیفیت الزم را دارا نیستند‪.‬در این‬
‫مرحله باید این اعداد آماده شوند؛تا در مرحله مدل سازی ‪ ،‬وقتی ما داده ها را به‬
‫الگوریتمها می دهیم دچار مشکل نشویم‪.‬‬
‫از جمله ‪:‬تبدیل داده ها ‪ ،‬کاهش داده ها ‪ ،‬برطرف کردن نقاط پرت و‪...‬‬
‫مرحله چهارم ‪ :‬مدل سازی‬
‫‪Modeling‬‬
‫‪ ‬در مدل سازی‪،‬نخستين گام‪،‬انتخاب تکنیکی است که می خواهیم مورد استفاده‬
‫قرار دهیم‪.‬‬
‫‪ ‬داده کاوی تکنیکهای مختلفی دارد از جمله ‪:‬‬
‫و ‪-2‬تکنیکهای پیش بینی کننده‬
‫‪-1‬تکنیکهای توصیف کننده‬
‫که هر کدام از این تکنیکها الگوریتمهای زیادی دارند ‪.‬‬
‫مثال‪ :‬الگوریتم درخت تصمیم از نوع تکنیکهای پیش بینی کننده است ‪.‬‬
‫دراین تحقیق از الگوریتم خوشه بندی استفاده می کنیم‪.‬‬
‫مرحله پنجم ‪ :‬ارزیابی مدل‬
‫‪Evaluation‬‬
‫اطالعات استخراج شده با توجه به هدف کاربر تجزيه و تحليل و بهترين نتايج‬
‫معين مي گردند‪.‬هدف ازاين مرحله تنها ارائه نتيجه (بصورت منطقي و يا‬
‫نموداري) نيست‪،‬بلکه پااليش اطالعات ارايه شده به کاربر نيز از اهداف مهم اين‬
‫مرحله است ‪.‬‬
‫وقتی نتایج را به دست می اورید از کل فرایند داده کاوی که تا اینجا انجام شده‬
‫است ‪،‬یک ارزیابی انجام می شود‪.‬آیا ما به نتایج واهدافی که در مرحله اول تعریف‬
‫کرده بودیم رسیدیم ؟آیا این سیستم را می توانید با ‪ %90‬اطمینان ‪،‬اجرا کنید؟‬
‫مرحله ششم ‪ :‬توسعه و گسترش‬
‫‪Deployment‬‬
‫ساختن مدل پایان پروژه نیست‪ .‬حتی اگر کسب اطالعات بیشتر از داده ها‬
‫هدف مدلسازی باشد‪ ،‬اطالعات به دست آمده به سازماندهی و ارائه شدن‬
‫نیازمندند؛ به نحوی که مشتری بتواند از آنها استفاده کند‪.‬‬
‫کاربرد داده کاوی در بانکها‬
‫در حوزه بانک داری داده های مالی جمع آوری شده‪ ،‬اغلب شامل داده هایی نسبتا کامل‪ ،‬قابل اطمینان و با‬
‫کیفیت باال هستند‪ ،‬به گونه ای که تحلیل داده ها و انجام فرآیند داده کاوی را تسهیل می نمایند‪.‬‬
‫مهمترین خدمات قابل ارایه در حوزه بانک داری با استفاده از روش های داده کاوی‪:‬‬
‫‪ ‬تحلیل اعتبار مشتریان؛‬
‫‪ ‬شناسایی فاکتورهای اصلی در ریسک بازپرداخت وام؛‬
‫‪ ‬دسته بندی و خوشه بندی مشتریان با توجه به رفتار مشابه آنها در زمینه بانک داری و بازپرداخت وام؛‬
‫‪ ‬تحلیل پاسخگویی مشتریان به ارائه خدمات جدید بانکی؛‬
‫‪ ‬شناسایی جرائم مالی؛‬
‫‪ ‬پيش بيني الگوهاي کالهبرداري از طريق کارتهاي اعتباري‬
‫‪ ‬تشخيص مشتريان ثابت‬
‫‪ ‬تعيين ميزان استفاده از کارتهاي اعتباري بر اساس گروههاي اجتماعي‬
‫شناسایی و کشف‬
‫جرائم و تقلب‬
‫داده کاوی‬
‫کنترلهای داخلی‬
‫کنترلهای داخلی کالسیک‬
‫‪ ‬کنترلهای داخلی در بانکها‬
‫کنترلهای داخلی برمبنای ‪IT‬‬
‫(بانکداری الکترونیکی)‬
‫کنترلهای داخلی امانت داری دربانکها را تقویت می کند‪.‬‬
‫بانک‬
‫امانت داری‬
‫مشتری‬
‫کارکنان‬
‫چگونگی استفاده ازرویکرد داده کاوی در شناسایی کشف تقلب‬
‫با پیشرفت تکنولوژی‪ ،‬همانطور که سیستمهای اطالعاتی پشرفته می شوند ؛ رفتار‬
‫متقلبان نيز تغیير می کند و به اصطالح دزدی ها نيز الکترونیکی شده اند و‬
‫ما با متقلبان رایانه ای سروکار داریم ؛ که این موضوع ‪ ،‬کار بازرسان را سخت تر‬
‫کرده است و در پیچیدگی و ابهامی که در حجم زیادی از داده ها وجود دارد نیاز‬
‫به تکنیکهایی که خود بتواند با سرعت باال ‪ ،‬در میان داده ها جستجو کرده و در‬
‫نهایت دانش ی استخراج کند که بتواند در تصمیم گيریها مؤثر باشد ‪ ،‬به شدت‬
‫احساس می شود‪.‬‬
‫نتایج و انتظارات‬
‫هدف ما این است که به نوعی بتوانیم با استفاده از تکنیکهای داده کاوی ‪ ،‬به‬
‫شناسائی کشف تقلب ها و جرائم مالی دست یابیم‪.‬‬
‫باید ابتدا تقلب مورد نظر را مشخص کرد ؛ چون هر تقلب با تکنیکهای‬
‫متفاوتی می تواند کشف شود ‪ .‬ما در این کار‪ ،‬بریک تقلب خاص که در‬
‫بانکها اتفاق می افتد ‪ ،‬تاکید کرده ایم ‪.‬‬
‫این تقلب در سرفصل درآمد بانک اتفاق می افتد و به این صورت است که کارمند‬
‫احتمال دارد به جای اینکه درآمد بانک را به حساب مدیریت بانک انتقال دهد به‬
‫حساب خود منتقل کند‪.‬‬
‫در اسناد و مدارک مالی در هر شعبه بانک‪ ،‬مبالغ بدهکار وجوه دریافتی از‬
‫مشتریان از جمله‪ :‬سود (دریافتی – دریافتنی آینده)‪ ،‬وجوه التزام و کارمزد‪ ،‬شکل‬
‫خاص ی باید داشته باشند‪ .‬این وجوه دریافتی بایستی حتما به‬
‫حساب مدیریت شعبه منتقل شود و همچنين نوع سند آنها باید بين واحدی‬
‫باشد‪.‬‬
‫در غير این صورت‪ ،‬اگر وجوه دریافتی بدهکار شوند می بایست یک اشتباه‬
‫محاسباتی انجام شده که در اینجا نيز بایستی طرف حساب‪،‬‬
‫حساب مشتری ای که از حساب او زیاد برداشته شده و نوع سند‪ ،‬انتقالی باید‬
‫باشد‪.‬همانطور که توضیح داده شد‪ ،‬هر کدام از دو حالت‪ ،‬پروسه خاص به خود را‬
‫داراست‪ .‬حال اگر این پروسه ها روال عادی خود را طی نکنند‪ ،‬احتمال تقلب در‬
‫اینجا وجود خواهد داشت‪.‬‬
‫روش کشف تقلب به صورت سنتی‬
‫در این موارد بازرسان ابتدا سراغ دفاتر کل می روند و کل مبالغ بدهکارو تاریخی‬
‫که این مبالغ بدهکار شده اند را به همراه شماره سند حسابداری مربوط به آن را‬
‫خارج می کنند ‪.‬سپس تک تک اسناد را با تطبیق دادن نوع سند وطرف حساب‬
‫چک می کنند و موارد مشکوک را بيرون میکشندو از مسئوالن بانک راجع به آنها‬
‫نظرخواهی میکنند و در صورت قانع نشدن ‪،‬موارد را به عنوان تقلب اعالم خواهند‬
‫کرد‪.‬‬
‫کشف این تقلب خاص با استفاده از تکنیک داده کاوی‬
‫پیاده سازی فرایند داده کاوی‪:‬‬
‫‪Business Understanding‬‬
‫‪ ‬مرحله اول ‪ :‬درک کسب و کار‬
‫در این مرحله ما به طور کامل نسبت به اهدافمان آگاهی داریم و بررس ی های‬
‫زیادی در این زمینه انجام داده ایم که مثال چه تقلبی را می خواهیم با استفاده از‬
‫داده کاوی کشف کنیم و با استفاده از چه تکنیکی از داده کاوی‪.‬‬
‫با تحقیقات انجام شده برروی تکنیکها و نرم افزارهای داده کاو ی به این نتیجه‬
‫رسیدیم که تکنیک خوشه بندی( ‪ )Clustering‬و نرم افزار ‪Rapidminer‬‬
‫برای این امر مفید خواهند بود‪.‬‬
‫مرحله دوم ‪ :‬درک داده‬
‫‪Data Understanding‬‬
‫متناسب با هدفمان که در مرحله قبل تعیين کردیم‪ ،‬اطالعات مربوط به حسابهای‬
‫مشتری سرفصل درآمدی را از پایگاه داده سامانه بانک ملت به دست آوردیم‪.‬‬
‫‪Data Preparation‬‬
‫مرحله سوم ‪ :‬آماده سازی داده‬
‫ما به صفاتی از داده های مالی سرفصل درآمدی به شرح زیر نیازمندیم‪:‬‬
‫در اسناد حسابداری طرف حساب در یک سطر دیگر ثبت می شود و ما‬
‫نیازداشتیم که همردیف با بقیه صفات بیاید تا بتواند به عنوان ورودی وارد نرم‬
‫افزار شود ‪ .‬لذا این مشکل را با استفاده از برنامه نویس ی ‪ SQL‬برطرف کردیم ‪.‬‬
‫مرحله چهارم ‪ :‬مدل سازی‬
‫‪Modeling‬‬
‫در مدلسازی‪،‬نخستين گام‪،‬انتخاب تکنیکی است که می خواهیم مورد استفاده قرار‬
‫دهیم‪.‬در نزم افزار تعیين شده الگوریتم مربوط به خوشه بندی (با استفاده از روش‬
‫‪)k-mean‬را طراحی می کنیم ‪.‬‬
‫تعریف خوشه بندی‪:‬‬
‫تحليل خوشه اي يكي از روشهاي آماري است كه در زمينه كاهش داده ها و پيدا‬
‫كردن گروههاي واقعي مورد استفاده قرار مي گيرد‪ .‬دسته بندي بر اساس مشابهت‬
‫ها يا عدم مشابهت ها انجام مي شود ‪ .‬هدف از خوشه بندی این است که داده‬
‫های موجود را به چند گروه تقسیم کرده و در این تقسیم بندی داده های گروه‬
‫های مختلف باید حداکثر تفاوت ممکن را به هم داشته باشند و داده های موجود‬
‫در یک گروه باید بسیار شبیه به هم باشند ‪.‬‬
‫مدل سازی الگوریتم خوشه بندی ‪K-mean‬در نرم افزار داده کاوی ‪Rapidminer‬‬
‫توجه داشته باشید که بایستی تعداد خوشه ها که در این الگوریتم به عنوان یک پارامرت آمده است باید‬
‫قبل از اجرای الگوریتم مشخص شود و این مقدار را با چند بار اجرا کردن و دادن مقدارهای متفاوت و‬
‫دیدن نتایج برای هر کدام‪ ،‬می توان به دست اورد که کدام عدد برای تعداد خوشه ها مناسب است‪.‬‬
‫اجرای نرم افزار و نتایج مدل در ‪ 4‬خوشه‬
‫جزئیات خوشه ها‬
‫بعد از تجزیه و تحلیل خوشه ها به نتایجی می رسیم که در جدول زیر آمده است‪:‬‬
‫طرف حساب‬
‫مبلغ بدهکار‬
‫نوع سند‬
‫تاریخ سند‬
‫شماره سند‬
‫‪1312‬‬
‫‪798809‬‬
‫‪3‬‬
‫‪13870431‬‬
‫‪38‬‬
‫‪1332‬‬
‫‪597211‬‬
‫‪3‬‬
‫‪13870514‬‬
‫‪495‬‬
‫‪1335‬‬
‫‪460274‬‬
‫‪3‬‬
‫‪13860917‬‬
‫‪548‬‬
‫‪1393‬‬
‫‪25000000‬‬
‫‪3‬‬
‫‪13860625‬‬
‫‪563‬‬
‫‪1511‬‬
‫‪1941340‬‬
‫‪3‬‬
‫‪13880229‬‬
‫‪78‬‬
‫‪1511‬‬
‫‪1941340‬‬
‫‪3‬‬
‫‪13880229‬‬
‫‪78‬‬
‫‪1511‬‬
‫‪1941340‬‬
‫‪3‬‬
‫‪13880229‬‬
‫‪78‬‬
‫‪1521‬‬
‫‪3430135‬‬
‫‪3‬‬
‫‪13870811‬‬
‫‪466‬‬
‫‪1521‬‬
‫‪1197671‬‬
‫‪3‬‬
‫‪13880917‬‬
‫‪542‬‬
‫‪1521‬‬
‫‪788082‬‬
‫‪3‬‬
‫‪13881120‬‬
‫‪150‬‬
‫‪4853‬‬
‫‪191143483‬‬
‫‪3‬‬
‫‪13871224‬‬
‫‪537‬‬
‫‪4855‬‬
‫‪364523‬‬
‫‪3‬‬
‫‪13880524‬‬
‫‪239‬‬
‫‪5311‬‬
‫‪460591‬‬
‫‪3‬‬
‫‪13881026‬‬
‫‪285‬‬
‫مقایسه نتایج با مدل ساخته شده و نتایج دستی‪:‬‬
‫‪ ‬در نتایج دستی عالوه بر نتایج اسالید قبل‪ ،‬رکورد های با طرف‬
‫حسابهای ‪1111‬و ‪ 4131‬نيز استخراج شده است و از نظر بازرسان و‬
‫کارشناسان فن ممکن است مواردی مشکوک تلقی شوند که در نتایج‬
‫برنامه نویس نیامده است‪ .‬در تحلیل خوشه ای حتما باید یک‬
‫کارشناس و کس ی که با داده ها آشنایی کامل دارد در مورد هر خوشه‬
‫نظر دهد‪.‬‬
‫تحلیل انحرافات و مغایرات‬
‫در بررس ی خوشه ها ما مواردی را که فقط یک بار و یا حداکثر سه‬
‫باردر هر خوشه تکرار شده بودند به عنوان نقاط مشکوک گزارش کردیم ؛و‬
‫مواردی راکه بازرس ویژه به صورت دستی داده ها را بررس ی کرده از موارد به‬
‫دست آمده در این تحقیق بیشتر می باشد‪.‬علت این مغایرت تجربه و دانش‬
‫بازرسان در مورد موارد کشف انحراف می باشد مثال انها رکوردهایی را به عنوان‬
‫تقلب اعالم کردند که هر کدام به تعداد زیادی در مجموع رکوردها تکرارشده‬
‫بودند مثال طرف حساب ‪ 1111‬به تعداد ‪ 10‬بار تکرار شده و یا ‪ 4131‬به تعداد‬
‫‪ 11‬بار تکرار شده اند‪ .‬همان طور که می دانیم تقلبها اصوال تعدادشان خیلی‬
‫کم می باشد به خاطر همين رکوردهای اضافه تر در کشف دستی در کشف‬
‫مکانيزه به عنوان رکورد مشکوک اعالم نشده بود‪.‬‬
‫نتیجه گیری کلی‪:‬‬
‫بعد از اجرای الگوریتم و ایجاد خوشه ها حتما باید یک کارشناس فن و کس ی‬
‫که با داده ها و طرز رفتار آنها آشنایی کامل دارد به تجزیه و تحلیل خوشه ها‬
‫بپردازد‪.‬پس اگر بازرسان وبه طور کلی حسابرسان ما با تکنیکهای داده کاوی‬
‫اشنایی کامل داشته باشند و الگوریتمهای مربوط به عملیات کاریشان را‬
‫خودشان مدل سازی کنند‪.‬در آینده ای نه چندان دور روزی خواهد رسید که‬
‫قبل از اینکه تقلبی قصد انجام شدن را داشته باشد مدیران و حسابرسان داخلی‬
‫بتوانند آنها را با استفاده از مدل های پیش بینی داده کاوی‪ ،‬پیش بینی کنند‪.‬‬
‫پیشنهادات‬
‫‪ ‬با توجه به محدودیتهای زیادی که در انجام این پروژه با آن مواجه شدیم در کل‬
‫می توان برای پیشبرد داده کاوی وتسهیل حسابرس ی پیشنهاداتی داد ‪،‬از جمله‬
‫اینکه مهمتر از همه مدیران اجرایی بانکها به این مهم باید توجه الزم را داشته‬
‫باشند که با وجود سیستم ذخيره داده ای که این روزها وجود دارد دسترس ی به‬
‫داده های مورد نیاز خیلی سخت می باشد؛باید زیرساختها تقویت شود و بستر‬
‫برای انجام تحقیقات بیشتر آماده گردد ‪.‬‬
‫ادامه پیشنهادات‪:‬‬
‫همچنين آموزش بازرسان و حسابرسان داخلی بانک نکته مهم دیگری است که باید مد نظر‬
‫قرار بگيرد‪.‬‬
‫همچنين برای تحقیقات آینده ما می توانیم پیشنهاداتی ارائه دهیم‪:‬‬
‫با استفاده از تکنیکهای داده کاوی ما می توانیم همه مراحل حسابرس ی مستقل را پیاده سازی‬
‫کنیم‪.‬از جمله ‪:‬‬
‫در بررس ی های تحلیلی که یکی از مراحل حسابرس ی است ما می توانیم برای پیش بینی مانده‬
‫حسابها از تکنیکهای پیش بینی داده کاوی استفاده کنیم‪.‬‬
‫داده های مورد نیاز که به عنوان ورودی می توان در این امر استفاده کرد از جمله‪:‬‬
‫‪ ‬معامالت حسابداری سالهای قبل‬
‫‪ ‬نسبتهای تجاری‬
‫‪ ‬نسبتهای صنعتی‬
‫‪ ‬شاخص اقتصاد‬
:‫منابع‬
‫سازمان حسابرسی‬،1 ‫ اصول حسابرسی‬- [1]
،‫چاپ دوم‬،‫موسسه کتاب مهربان نشر‬، ‫حسابرسی صورتهای مالی‬،1389 ،‫امیر‬،‫ صفاریان‬-‫ناصر‬، ‫ مکارم‬-[2]
‫تحلیل آماری چند متغییری کاربردی‬1388، ‫ دین‬، ‫ویچرن‬.‫ دبلیو‬، ‫ ریچارد‬،‫جانسون‬.- [3]
[1]- Mieke Jans,Madine Lybaert,Koen Vanhoof(2010) ,“Internal fraud risk reduction ,Result of a case
study”, International Journal of Accounting Information System,p 17-41
[2]- Mieke Jans,Madine Lybaert,Koen Vanhoof(2005) ,Data Mining for Fraud Detection: Toward an
Improvement an Internal Control System?
[3]- Mohd Shaari Abd Rahman(2008), ”Utilization of Data Mining Technology within the Accounting
Information System in Public Sector : A Country Study-Malaysia” ,PHD,School of Accounting and
Corporate Governance Faculty of Business , University of Tasmania
[4]- Efstathios Kirkos,Charalambos Spathis,Yannis Manolopoulos(2007),”Data mining techniques for the
detection of fraudulent financial statement”, Science Direct, p:995-1003
[5]- R.Brause,T.Langsdorf,M.Hepp(2006) ,”Neural Data mining for Credit Card Fraud Detection",
,J.W.Goethe-University,Frankfurt a.m.,Gesellschaftf.Zahlugssysteme GZS,Frankfurt a.m.,Germany
[6]- V. Lee,K.Smith,R.Gayler(2005),” A Comprehensive Survey of Data Mining-based Fraud Detectio
“,Research,Artificial Intelligence Review,arxiv.org
[7]- Nakhaeizade Gholamreza(2008-2010),Tutorial Data Mining :Advance in Predictive Modeling and
Unsupervised Learning
[8]- www.statsoft.com /Fraud Detection 
‫با تشکر از توجه شما‬