امیرحسین حاجی محمدیزدی

امیرحسین حاجی محمدیزدی

عنوان پایان‌نامه

استفاده از تکنیکهای داده کاوی به منظور پیش بینی اظهار نظر حسابرس



    دانشجو امیرحسین حاجی محمدیزدی در تاریخ ۳۱ شهریور ۱۴۰۲ ساعت ، به راهنمایی مظفر جمالیان پور ، پایان نامه با عنوان "استفاده از تکنیکهای داده کاوی به منظور پیش بینی اظهار نظر حسابرس" را دفاع نموده است.


    استاد راهنما
    مظفر جمالیان پور
    استاد مشاور
    ماندانا طاهری
    استاد داور
    مهدی نیک روش
    رشته تحصیلی
    مقطع تحصیلی
    کارشناسی ارشد
    تاریخ دفاع
    ۳۱ شهریور ۱۴۰۲
    ساعت دفاع

    چکیده

    هدف از این پژوهش، مقایسه عملکرد سه روش داده­کاوی به منظور پیش­بینی نوع اظهارنظر حسابرس در خصوص صورت­های مالی شرکت­های بورس اوراق بهادار است. پایگاه داده، متشکل از اطلاعات ۴۲۰ شرکت-سال در بازه سال­های ۱۳۹۷ تا ۱۴۰۰ جمع­آوری شده که مشتمل بر ۳۰ متغیر مالی و غیرمالی می­باشد. در این   پژوهش، تکنیک­های درخت تصمیم (DT)، ماشین بردار پشتیبان (SVM) و K-نزدیک­ترین همسایه (K-NN) جهت توسعه مدل­های پیش­بینی اظهارنظر حسابرس مبنا قرار گرفته و علاوه بر آنها، به منظور مقایسه عملکرد تکنیک­های مذکور با تکنیک­های کلاسیک و مرسوم­تر داده­کاوی، روش رگرسیون لجستیک (LR) نیز استفاده شده است.

    نتایج بررسی­ها حاکی از آن است که سه تکنیک مورد بررسی، نسبت به رگرسیون لجستیک، در پیش­بینی اظهارنظر حسابرس عملکرد بهتری دارند و اگرچه این سه تکنیک داده­کاوی، در پیش­بینی نوع اظهارنظر نسبتاً از دقت بالایی برخوردارند؛ اما روش K-نزدیک­ترین همسایه (K-NN)، در مجموع بالاترین عملکرد را در میزان دقت پیش­بینی با ۹۱.۷۳% و کمینه خطاهای نوع اول (خطر آلفا) و دوم (خطر بتا)، هر دو به میزان ۴.۱۳% داراست. برمبنای مقادیر خطاها و ضریب حساسیت و صراحت که ترکیب آنها در نمودار ROC نمود پیدا می­کند، کارایی و اثربخشی این تکنیک­ها نیز مورد آزمون قرار گرفته و روش مذکور، بهترین نتایج را نشان می­دهد.

    همچنین تکنیک­های DT (با حدود ۳۱% تفاوت) و SVM (با حدود ۱۲% تفاوت) در پیش­بینی اظهارنظر مقبول عملکرد مطلوب­تری نسبت به اظهارنظر مشروط دارند؛ این در حالی است که روش KNN (با حدود ۲% تفاوت)، در پیش­بینی هر دو نوع اظهارنظر قابلیت مناسب و مطلوبی داشته و بسیار مشابه عمل می­کند.

    کلیدواژه­ها: داده­کاوی، اظهارنظر حسابرس، درخت تصمیم (DT)، K-نزدیک­ترین همسایه (K-NN)، ماشین بردار پشتیبان (SVM)، رگرسیون لجستیک (LR)

      

    Abstract

    The present comparative study investigates the performance of three data-mining methods to predict the type of auditor's opinion regarding the financial statements of stock exchange companies. The database consisted of the information of ۴۲۰ company-years collected between ۲۰۱۸ and ۲۰۲۱, which included ۳۰ financial and non-financial variables. In this study, decision tree (DT), support vector machine (SVM), and K-nearest neighbor (K-NN) techniques were used to develop auditor's opinion prediction models. Additionally, the logistic regression (LR) method was used to compare the performance of the mentioned techniques with >The results revealed that the three investigated techniques perform better in predicting the auditor's opinion than the logistic regression. Although these three data mining techniques showed high accuracy in predicting the type of opinion, the K-nearest neighbor (K-NN) method showed the highest performance in terms of prediction accuracy with ۹۱.۷۳% and the minimum errors of the first type (alpha risk) and the second type (beta risk), both by ۴.۱۳%. According to the values of the errors and the coefficient of sensitivity, and clarity that their combination can be observed in the ROC curve, the efficiency of these techniques was also tested, and the mentioned method showed the best results. Additionally, DT techniques (with a difference of about ۳۱%) and SVM (with a difference of about ۱۲%) perform better in predicting acceptable comments than conditional comments. However, the KNN method (with a difference of about ۲%) has a suitable and desirable capability in predicting both types of comments and works very similarly.

    Keywords: Data mining, Auditor's opinion, Decision tree (DT), K-nearest neighbor (K-NN), Support vector machine (SVM), Logistic regression (LR).