مقایسه مدل آنالیز تشخیص خطی با مدل‌های شبکه عصبی

مقایسه مدل آنالیز تشخیص خطی با مدل‌های شبکه عصبی

هدف استفاده از مدل‌های آماری در اعتبارسنجی این است که یک مجموعه داده بر روی یک فضای بعدی با تفکیک‌پذیری خوب طبقه‌بندی شود تا از برازش بیش از حد جلوگیری بعمل آمده و همچنین هزینه‌های محاسباتی کاهش یابد. در میان مدل‌های آماری اعتبارسنجی، تجزیه و تحلیل تشخیص خطی (LDA) بیشتر به عنوان روش کاهش ابعاد در مرحله پیش پردازش برای طبقه بندی الگو استفاده می شود. آنالیز تشخیصی خطی بسیار به تحلیل واریانس و تحلیل رگرسیونی نزدیک است؛ در هر سه این روش‌های آماری، متغیر وابسته به صورت یک ترکیب خطی از متغیرهای دیگر مدل‌سازی می‌شود. با این حال دو روش آخر متغیر وابسته را از نوع فاصله‌ای در نظر می‌گیرند در حالی که آنالیز تشخیص خطی برای متغیرهای وابسته اسمی یا رتبه‌ای به کار می‌رود. از این رو آنالیز تشخیص خطی به رگرسیون لجستیک شباهت بیشتری دارد. آنالیز تشخیص خطی همچنین با تحلیل مؤلفه‌های اصلی و تحلیل عاملی هم شباهت دارد؛ هر دوی این روش‌های آماری برای ترکیب خطی متغیرها به شکلی که داده را به بهترین نحو توضیح بدهد به کار می‌روند و یکی از کاربردهای عمده هر دوی این روش‌ها، کاستن تعداد بعدهای داده است. با این حال این روش‌ها تفاوت عمده‌ای با هم دارند: در آنالیز تشخیص خطی، تفاوت کلاس‌ها مدل‌سازی می‌شود در حالی که در تحلیل مؤلفه‌های اصلی تفاوت کلاس‌ها نادیده گرفته می‌شود. آنالیز تشخیص خطی ارتباط نزدیکی با تحلیل واریانس و تحلیل رگرسیون دارد که سعی دارند یک متغیر مستقل را به عنوان ترکیبی خطی از ویژگی‌های دیگر بیان کنند. همچنین آنالیز تشخیص خطی ارتباطی تناتنگ با تحلیل مولفه‌های اصلی (PCA) دارد، چرا که هر دو متد به دنبال ترکیبی خطی از متغیرهایی هستند که به بهترین نحو داده‌ها را توصیف می‌کنند. از آنالیز تشخیص خطی زمانی استفاده می‌شود که اندازه‌های مشاهدات، مقادیر پیوسته باشند.

* مقایسه مدل‌های اعتبارسنجی:

آنالیز تشخیص خطی که یک مدل آماری پارامتری ساده است، یکی از نخستین مدل‌های اعتبارسنجی برشمرده می‌شود. برخی مدعی شده‌اند که این روش نمی‌تواند ابزار مناسبی برای اعتبارسنجی باشد و دلیل آن را به ماهیت داده‌های اعتبارسنجی نسبت می‌دهند. امروزه، محققان مدل‌های پیچیده‌تری را بررسی می‌کنند تا بتوانند برخی از کاستی‌های مدل آنالیز تشخیص خطی را رفع کنند. به عنوان مثال، کارشناسان اعتبارسنجی مشغول بررسی چند مدل آماری غیرپارامتری از قبیل مدل خوشه‌بندی k (نزدیک‌ترین همسایه)، درخت‌های طبقه‌بندی و مدل‌های شبکه عصبی هستند تا آنها را در نرم‌افزارهای اعتبارسنجی به کار گیرند. یکی از مسائل مهمی که در این نرم‌افزارها باید مد نظر قرار گیرد، نیاز به افزایش دقت اعتبارسنجی در تصمیمات اعتباری است. افزایش اندک در دقت این مدل‌ها می‌تواند به میزان چشمگیری در هزینه‌های آتی صرفه‌جویی کند.

در حال حاضر، از انواع مدل‌های اعتبارسنجی مبتنی بر هوش مصنوعی برای تشخیص مشکلات و تخلفات مالی استفاده می‌شود. American Express از یک سامانه مبتنی بر شبکه عصبی برای شناسایی موارد تخلف کارت‌های اعتباری استفاده می‌کند؛ Lloyds Bowmaker Motor Finance از یک سامانه اعتبارسنجی شبکه عصبی برای اتخاذ تصمیم‌های مالی خودکار استفاده می‌کند. بنا به ادعای Lloyds Bowmaker Motor Finance، سامانه اعتبارسنجی مبتنی بر شبکه عصبی به میزان %10 دقیق‌تر از سامانه پیشین عمل می‌کند. بانک Security Pacific Bank نیز از یک سامانه اعتبارسنجی هوشمند شبکه عصبی استفاده می‌کند تا امکان اعتبارسنجی‌ وام‌های کوچک کسب و کار فراهم آید. مدل اعتبارسنجی شبکه عصبی که این بانک توسعه داده است، پرسپترون چندلایه‌ای به شمار می‌رود. بنا به اعلام این بانک، مزیت عمده‌ی این سامانه اعتبارسنجی شبکه عصبی این است که قابلیت بالایی در تطبیق با کارکردها دارد و دلیل آن را به توانایی شناخت الگوهای غیرخطی شبکه عصبی نسبت می‌دهند. افزون بر این، بهبود دقت پیش‌بینیِ مدل اعتبارسنجی شبکه عصبی از اهمیت بسیار بالایی برخوردار است؛ افزایش یک درصدیِ میزان دقت می‌تواند میلیون‌ها دلار صرفه‌جویی در هزینه‌ها را به همراه داشته باشد. براساس یافته‌ها، شبکه عصبی عملکرد دقیق‌تری نسبت به آنالیز تشخیص خطی دارد؛ به ویژه در پیش‌بینیِ وضعیت شرکت‌هایی که در معرض ورشکستگی مالی قرار می‌گیرند. طبق تحقیقات لیچر، شبکه عصبی می‌تواند سلامت مالی شرکت‌ها را به شکل دقیق‌تری پیش‌بینی نماید. همچنین، سالچنبرگر از این نیز فراتر رفته و یک شبکه عصبی پرسپترون چندلایه را برای پیش‌بینی سلامت مالی سپرده‌ها و وام‌ها بررسی نموده است؛ او به مقایسه‌ی یک شبکه عصبی پرسپترون چندلایه با مدل رگرسیون لجستیک پرداخته‌ است. بر اساس یافته‌ها، مدل شبکه عصبی عملکرد به مراتب بهتری در مقایسه با مدل رگرسیون لجستیک دارد. دقت پیش‌بینی شبکه عصبی با آنالیز تشخیص خطی، رگرسیون لجستیک، الگوریتم خوشه‌بندی k (نزدیک‌ترین همسایه) و یک مدل درخت تصمیم مقایسه شده است. نتایج گویای آن است که پرسپترون چندلایه دقت بسیار بالایی دارد؛ آنالیز تشخیص خطی، رگرسیون لجستیک، درخت‌های تصمیم‌گیری و الگوریتم خوشه‌بندی K (نزدیک‌ترین همسایه) در رتبه‌های بعدی قرار دارند.

لازم به ذکر می‌باشد مدل‌های شبکه عصبی عملکرد بهتری نسبت به مدل‌های آنالیز تشخیص خطی در پیش‌بینی داشته و در طبقه‌بندی وام‌های باکیفیت و بی‌کیفیت موفق‌تر عمل کرده‌اند. از طرفی، این مدل‌ها عملکرد نسبتاً مشابهی با مدل‌های رگرسیون لجستیک دارند اما همچنان قدرت تفکیک‌شان بهتر است.

دیدگاهتان را بنویسید