
امیرحسین حاجی محمدیزدی
استفاده از تکنیکهای داده کاوی به منظور پیش بینی اظهار نظر حسابرس
- دانشجو
- امیرحسین حاجی محمدیزدی
- استاد راهنما
- مظفر جمالیان پور
- استاد مشاور
- ماندانا طاهری
- استاد داور
- مهدی نیک روش
- مقطع تحصیلی
- کارشناسی ارشد
- تاریخ دفاع
- ۳۱ شهریور ۱۴۰۲
- ساعت دفاع
- چکیده
-
هدف از این پژوهش، مقایسه عملکرد سه روش دادهکاوی به منظور پیشبینی نوع اظهارنظر حسابرس در خصوص صورتهای مالی شرکتهای بورس اوراق بهادار است. پایگاه داده، متشکل از اطلاعات ۴۲۰ شرکت-سال در بازه سالهای ۱۳۹۷ تا ۱۴۰۰ جمعآوری شده که مشتمل بر ۳۰ متغیر مالی و غیرمالی میباشد. در این پژوهش، تکنیکهای درخت تصمیم (DT)، ماشین بردار پشتیبان (SVM) و K-نزدیکترین همسایه (K-NN) جهت توسعه مدلهای پیشبینی اظهارنظر حسابرس مبنا قرار گرفته و علاوه بر آنها، به منظور مقایسه عملکرد تکنیکهای مذکور با تکنیکهای کلاسیک و مرسومتر دادهکاوی، روش رگرسیون لجستیک (LR) نیز استفاده شده است.
نتایج بررسیها حاکی از آن است که سه تکنیک مورد بررسی، نسبت به رگرسیون لجستیک، در پیشبینی اظهارنظر حسابرس عملکرد بهتری دارند و اگرچه این سه تکنیک دادهکاوی، در پیشبینی نوع اظهارنظر نسبتاً از دقت بالایی برخوردارند؛ اما روش K-نزدیکترین همسایه (K-NN)، در مجموع بالاترین عملکرد را در میزان دقت پیشبینی با ۹۱.۷۳% و کمینه خطاهای نوع اول (خطر آلفا) و دوم (خطر بتا)، هر دو به میزان ۴.۱۳% داراست. برمبنای مقادیر خطاها و ضریب حساسیت و صراحت که ترکیب آنها در نمودار ROC نمود پیدا میکند، کارایی و اثربخشی این تکنیکها نیز مورد آزمون قرار گرفته و روش مذکور، بهترین نتایج را نشان میدهد.
همچنین تکنیکهای DT (با حدود ۳۱% تفاوت) و SVM (با حدود ۱۲% تفاوت) در پیشبینی اظهارنظر مقبول عملکرد مطلوبتری نسبت به اظهارنظر مشروط دارند؛ این در حالی است که روش KNN (با حدود ۲% تفاوت)، در پیشبینی هر دو نوع اظهارنظر قابلیت مناسب و مطلوبی داشته و بسیار مشابه عمل میکند.
کلیدواژهها: دادهکاوی، اظهارنظر حسابرس، درخت تصمیم (DT)، K-نزدیکترین همسایه (K-NN)، ماشین بردار پشتیبان (SVM)، رگرسیون لجستیک (LR)
- Abstract
-
The present comparative study investigates the performance of three data-mining methods to predict the type of auditor's opinion regarding the financial statements of stock exchange companies. The database consisted of the information of ۴۲۰ company-years collected between ۲۰۱۸ and ۲۰۲۱, which included ۳۰ financial and non-financial variables. In this study, decision tree (DT), support vector machine (SVM), and K-nearest neighbor (K-NN) techniques were used to develop auditor's opinion prediction models. Additionally, the logistic regression (LR) method was used to compare the performance of the mentioned techniques with >The results revealed that the three investigated techniques perform better in predicting the auditor's opinion than the logistic regression. Although these three data mining techniques showed high accuracy in predicting the type of opinion, the K-nearest neighbor (K-NN) method showed the highest performance in terms of prediction accuracy with ۹۱.۷۳% and the minimum errors of the first type (alpha risk) and the second type (beta risk), both by ۴.۱۳%. According to the values of the errors and the coefficient of sensitivity, and clarity that their combination can be observed in the ROC curve, the efficiency of these techniques was also tested, and the mentioned method showed the best results. Additionally, DT techniques (with a difference of about ۳۱%) and SVM (with a difference of about ۱۲%) perform better in predicting acceptable comments than conditional comments. However, the KNN method (with a difference of about ۲%) has a suitable and desirable capability in predicting both types of comments and works very similarly.
Keywords: Data mining, Auditor's opinion, Decision tree (DT), K-nearest neighbor (K-NN), Support vector machine (SVM), Logistic regression (LR).