فواد اسماعیلی

فواد اسماعیلی

عنوان پایان‌نامه

پیش بینی ساختار شکلی فعال مقید برای داده های بالا بعد با استفاده از شبکه عصبی پیچشی



    دانشجو فواد اسماعیلی در تاریخ ۲۰ تیر ۱۴۰۲ ساعت ، به راهنمایی فرزاد اسکندری ، پایان نامه با عنوان "پیش بینی ساختار شکلی فعال مقید برای داده های بالا بعد با استفاده از شبکه عصبی پیچشی" را دفاع نموده است.


    استاد راهنما
    فرزاد اسکندری
    استاد مشاور
    محمدرضا صالحی راد
    استاد داور
    وحید رضایی تبار
    رشته تحصیلی
    مقطع تحصیلی
    کارشناسی ارشد
    تاریخ دفاع
    ۲۰ تیر ۱۴۰۲
    ساعت دفاع

    چکیده

    رعت رشد و پیشرفت مدل‌سازی‌های یادگیری عمیق در مدل‌سازی‌ها و به خصوص قطعه بندی تصویر‌ها باعث شده تا جایگاه ویژه‌ای در مدل‌سازی‌ها و هوش مصنوعی و بینایی ماشین برای خود باز کند، اما با این حال محدودیت‌های موجود در یادگیری عمیق را نیز نمی‌توان در نظر نگرفت، از جمله این محدودیت‌ها، نیاز این مدل‌ها به مجموعه داده‌های زیاد و عدم تضمین در حفظ ساختار شکلی قطعه بندی شده توسط مدل را می‌توان نام برد. عدم ضمانت حفظ ساختار شکل در قطعه بندی باعث می‌شود تا در بسیاری از موارد نتیجه‌های بدست آمده دارای نتیجه‌های مناسبی نباشد، این مورد به خصوص زمانی از اهمیت بالایی برخوردار می‌شود که شکل مورد نظر برای قطعه بندی از پیکسل‌های کمتری نسبت به خود تصویر برخوردار است و یا شکل باریک است، که این باریک بودن شکل باعث می‌شود تا قطعه بندی به دو و یا چند بخش مجزا تقسیم شود. از طرف دیگر محدودیت در تعداد تصویر‌ باعث می‌شود که در بسیاری از موارد هزینه مدل‌سازی بالا باشد، به خصوص در تصویر برداری پزشکی، با محدودیت داده مواجه هستیم، لذا روشی مناسب که بتوان با استفاده از آن تصویر‌های تصادفی تولید کرد به طوری که ساختار شکلی مد نظر برای قطعه بندی حفظ شود، از اهمیت بالایی برخوردار است. یکی از مهمترین روش‌ها برای افزایش داده با استفاده از تحلیل شکل است. در این روش ابتدا ساختار شکل مد نظر بدست آمده و توزیع مناسبی را با استفاده از استنباط آماری برای آن براورد می‌کنند سپس با استفاده از درون‌یابی اسپلاین صفحه‌ای برای بازتولید تصویر‌های جدید تصادفی پرداخته می‌شود. در این پژوهش روش‌های مختلف تحلیل شکل و چگونگی بازتولید تصویر تصادفی با حفظ ساختار شکل مورد بررسی قرار گرفته و افزایش داده توسط روش بیان شده نتیجه‌های خوبی برای مدل‌سازی یادگیری عمیق، نشان می‌دهد؛ به طوری‌که دقت مدل شبکه یادگیری عمیق \\lr{ResUnet} تنها با استفاده از $ ۳۹ $ تصویر به عنوان داده آموزشی، از $ ۰ $ به $ ۸۳ $ درصد رسید. % %به طور کلی تحلیل شکل به دو بخش تابع محور و نقطه شاخص محور تقسیم می‌شود، در مدل‌سازی شکل براساس نقاط شاخص از جبر خطی برای مدل‌سازی و براورد پارامتر‌های مدل و براورد توزیع شکل استفاده می‌شود. %در دو بعد مدل شکل فعال، حالت گسسته ای از مدل کانتور فعال است که از معادلات دیفرانسیل برای مدل‌سازی استفاده می‌کند، در این پایان نامه %از کانتور فعال مدل پایه که آن را با نام %\\lr{snakes} %می‌شناسند، برای قطعه بندی تصویر استفاده می‌شود، به طوری که ناحیه جسم و تصویر را به ورودی مدل داده و خروجی بخش قطعه بندی شده جسم(شکل مد نظر) خواهد بود. در نتیجه در این پایان نامه به یک مقدمه از قطعه بندی تصویر با استفاده از کانتور فعال پرداخته شده است اما تمرکز اصلی به چگونگی استفاده از تحلیل شکل برای کمک به مدل‌های یادگیری عمیق پیچشی(\\lr{CNN}) در این پایان نامه مورد بررسی قرار گرفته است. %استفاده از مدل‌های شکل در کنار مدل‌های یادگیری عمیق به چند روش امکان پذیر است که در فصل یک به انواع آن پرداخته شده، که یکی از آنها استفاده از این روش برای افزایش داده‌های آموزشی است، در این پایان نامه از این روش برای افزایش داده استفاده شده است، تا مدل یادگیری عمیق برای قطعه بندی تصویر نتیجه‌های بهتر و واقعی تری داشته باشد، نتیجه‌های در فصل چهار ارائه شده است که افزایش داده به روش استفاده از مدل‌های شکل، نتیجه‌های قابل قبولی ارائه می‌کند.  

    Abstract

      The speed of growth and progress of deep learning models in modelling specially image segmentation have made a special place in modelling, and artificial intelligence, and computer vision for themselves, but nevertheless the limitation of deep learning can not be ignored, among these limitations are the need for these models to have large datasets and the lack of guarantee in maintaining the structural shape of the segmented images by the model. The lack of guarantee in maintaining the structural shape can effect the segmentation quality,especially for objects with thin boundaries. These objects may be segmented into multiple parts, which does not reflect their true shape. On the other hand, the scarcity of images makes modeling expensive in many cases, especially for medical imaging. Data limitation poses a challenge for preserving the structural shape of the objects in segmentation. Hence, a method that can generate random images with the desired shape is highly valuable. %%% one of the most important methods for data augmentation is using active shape modeling, in this method, we estimate the structure of shape and the shape distribution, then we use thin plate spline to generate new random image. in this research, different methods of shape analysis and how to generate a random image while preserving the structure of the target shape are investigated. The results of data agumentation by the proposed method show good results for deep learning modelling, so that the precision of the ResUnet model reached from $ ۰ $ to $ ۸۳\\% $ using only $ ۳۹ $ images as training data.