فریبا احمدی

فریبا احمدی

عنوان پایان‌نامه

استنباط بعد بالا در شبکه های بیزی



    دانشجو فریبا احمدی در تاریخ ۲۹ شهریور ۱۴۰۲ ساعت ، به راهنمایی وحید رضایی تبار ، پایان نامه با عنوان "استنباط بعد بالا در شبکه های بیزی" را دفاع نموده است.


    دانشجو
    فریبا احمدی
    استاد راهنما
    وحید رضایی تبار
    استاد مشاور
    محمدرضا صالحی راد
    استاد داور
    فرزاد اسکندری
    رشته تحصیلی
    مقطع تحصیلی
    کارشناسی ارشد
    تاریخ دفاع
    ۲۹ شهریور ۱۴۰۲
    ساعت دفاع

    چکیده

      شبکه‌ های بیزی گروهی‌ از مدل های گرافیکی‌ احتمالی‌ هستند که‌ عمدتا_ نشان دهنده ی روابط‌ بین‌ متغیرها می‌ باشند. اصولا مطالعه‌ ی شبکه‌ ی بیزی در دو بخش‌ یادگیری ساختاری و یادگیری پارامتری شبکه‌ دنبال می‌ شود. در این‌ پایان نامه‌ به‌ مسأله‌ ی یادگیری ساختاری شبکه‌ ی بیزی تنک‌ برای متغیرهای تصادفی‌ پیوسته‌ در ابعاد بالا تحت‌ مدل گاوسی‌ می‌ پردازیم‌. به‌ طور کلی‌ یادگیری ساختاری شبکه‌ ی بیزی در مواجهه‌ با داده های بعد بالا به‌ دلیل‌ محدودیتی‌ که‌ ساختار شبکه‌ بر گراف غیرچرخه‌ ای دارد، یک‌ مسأله‌ ی سخت ‌np است‌. بیشتر روش های دقیقی‌ که‌ برای بهبود ساختار بهینه‌ ی شبکه‌ ی بیزی توسعه‌ یافته‌ اند از نظر محاسباتی‌ پر هزینه‌ و زمان بر هستند. این‌ پژوهش‌ شامل‌ یک‌ رویکرد یک‌ مرحله‌ ای است‌ که‌ در آن والدین‌ همه‌ ی متغیرها را به‌ طور مستقیم‌ شناسایی‌ می‌ کند. بنابراین‌ در مقایسه‌ با بسیاری از الگوریتم‌ های موجود که‌ از رویکرد دو مرحله‌ ای استفاده می‌ کنند، احتمال وجود والدین‌ گمشده را کاهش‌ می‌ دهد. در توسعه‌ ی شبکه‌ های بیزی تنک‌، الگوریتمی‌ پیشنهاد می‌ دهیم‌ که‌ شامل‌ یک‌ عبارت جریمه‌ ی نرم ۱Lو یک‌ عبارت جریمه‌ ی دیگر برای اطمینان از اینکه‌ شبکه‌ ی بیزی آموخته‌ شده یک‌ گراف غیر چرخه‌ ای جهت‌ دار است‌ استفاده می‌ کند. ویژگی‌ های تئوری در مورد نحوه ی انتخاب پارامتر انقباضی‌ عبارت جریمه‌ ی دوم مورد بحث‌ و بررسی‌ قرار می‌ گیرد. با استفاده از همین‌ فرمول، الگوریتم‌ نزول مختصات بلوکی۲ به‌ منظور برآورد ساختار شبکه‌ پیشنهاد می‌ شود. نتایج‌ تجزیه‌ و تحلیل‌ تئوری نشان می‌ دهد که‌ پیچیدگی‌ شبکه‌ ی بیزی تنک‌، نسبت‌ به‌ اندازه ی نمونه‌، خطی‌ و نسبت‌ به‌ تعداد متغیرها، درجه‌ دوم است‌. این‌ ویژگی‌ شبکه‌ ی بیزی، آن را در مقایسه‌ با الگوریتم‌ های موجود مقیاس پذیر و کارا می‌ کند. بنابراین‌ برای یادگیری ساختار شبکه‌ ی بیزی در مقیاس بزرگ با داده های ب عد بالا مناسب‌ است‌.

    Abstract

      ayesian networks are

    a group of probabilistic graphical models that mainly represent relationships between variables. Basically, the study of Bayesian network is followed   in two sections, structural learning and parametric learning of the network. In this thesis, we deal with the problem of structural learning of sparse Bayesian network for continuous random variables in high dimensional Gaussian model. In general, structural learning Bayesian network is a np-hard problem in dealing with high-dimensional data due to the limitation that the network structure has on non-cyclic graphs. Most of the exact methods that have been developed to improve the optimal Bayesian network structure are computationally expensive and time-consuming. This research includes a one-step approach in which parents identify all variables directly. Thuse, in comparing with many existing algorithms that use a two-step approach, it reduces the probability of missing parents. In the development of sparse Bayesian networks, we propose a new algorithm that uses a penalty term L۱ and another penalty term to ensure that the learned Bayesian network is a directed acyclic graph. The theoretical features of the method of choosing the tuning parameter of the second penalty term are discussed. Using the same formula, the Block coordinate descent algorithm is proposed to estimate the network structure. The results of the theoretical analysis show that the complexity of the sparse Bayesian network is linear in relation to the sample size and quadratic in relation to the number of variables. This feature of Bayesian network makes it scalable and efficient compared to existing algorithms. Therefore, it is suitable for learning large-scale Bayesian network structure with high-dimensional data.