 
                    مقایسه مدل آنالیز تشخیص خطی با مدلهای شبکه عصبی
هدف استفاده از مدلهای آماری در اعتبارسنجی این است که یک مجموعه داده بر روی یک فضای بعدی با تفکیکپذیری خوب طبقهبندی شود تا از برازش بیش از حد جلوگیری بعمل آمده و همچنین هزینههای محاسباتی کاهش یابد. در میان مدلهای آماری اعتبارسنجی، تجزیه و تحلیل تشخیص خطی (LDA) بیشتر به عنوان روش کاهش ابعاد در مرحله پیش پردازش برای طبقه بندی الگو استفاده می شود. آنالیز تشخیصی خطی بسیار به تحلیل واریانس و تحلیل رگرسیونی نزدیک است؛ در هر سه این روشهای آماری، متغیر وابسته به صورت یک ترکیب خطی از متغیرهای دیگر مدلسازی میشود. با این حال دو روش آخر متغیر وابسته را از نوع فاصلهای در نظر میگیرند در حالی که آنالیز تشخیص خطی برای متغیرهای وابسته اسمی یا رتبهای به کار میرود. از این رو آنالیز تشخیص خطی به رگرسیون لجستیک شباهت بیشتری دارد. آنالیز تشخیص خطی همچنین با تحلیل مؤلفههای اصلی و تحلیل عاملی هم شباهت دارد؛ هر دوی این روشهای آماری برای ترکیب خطی متغیرها به شکلی که داده را به بهترین نحو توضیح بدهد به کار میروند و یکی از کاربردهای عمده هر دوی این روشها، کاستن تعداد بعدهای داده است. با این حال این روشها تفاوت عمدهای با هم دارند: در آنالیز تشخیص خطی، تفاوت کلاسها مدلسازی میشود در حالی که در تحلیل مؤلفههای اصلی تفاوت کلاسها نادیده گرفته میشود. آنالیز تشخیص خطی ارتباط نزدیکی با تحلیل واریانس و تحلیل رگرسیون دارد که سعی دارند یک متغیر مستقل را به عنوان ترکیبی خطی از ویژگیهای دیگر بیان کنند. همچنین آنالیز تشخیص خطی ارتباطی تناتنگ با تحلیل مولفههای اصلی (PCA) دارد، چرا که هر دو متد به دنبال ترکیبی خطی از متغیرهایی هستند که به بهترین نحو دادهها را توصیف میکنند. از آنالیز تشخیص خطی زمانی استفاده میشود که اندازههای مشاهدات، مقادیر پیوسته باشند.
* مقایسه مدلهای اعتبارسنجی:
آنالیز تشخیص خطی که یک مدل آماری پارامتری ساده است، یکی از نخستین مدلهای اعتبارسنجی برشمرده میشود. برخی مدعی شدهاند که این روش نمیتواند ابزار مناسبی برای اعتبارسنجی باشد و دلیل آن را به ماهیت دادههای اعتبارسنجی نسبت میدهند. امروزه، محققان مدلهای پیچیدهتری را بررسی میکنند تا بتوانند برخی از کاستیهای مدل آنالیز تشخیص خطی را رفع کنند. به عنوان مثال، کارشناسان اعتبارسنجی مشغول بررسی چند مدل آماری غیرپارامتری از قبیل مدل خوشهبندی k (نزدیکترین همسایه)، درختهای طبقهبندی و مدلهای شبکه عصبی هستند تا آنها را در نرمافزارهای اعتبارسنجی به کار گیرند. یکی از مسائل مهمی که در این نرمافزارها باید مد نظر قرار گیرد، نیاز به افزایش دقت اعتبارسنجی در تصمیمات اعتباری است. افزایش اندک در دقت این مدلها میتواند به میزان چشمگیری در هزینههای آتی صرفهجویی کند.
در حال حاضر، از انواع مدلهای اعتبارسنجی مبتنی بر هوش مصنوعی برای تشخیص مشکلات و تخلفات مالی استفاده میشود. American Express از یک سامانه مبتنی بر شبکه عصبی برای شناسایی موارد تخلف کارتهای اعتباری استفاده میکند؛ Lloyds Bowmaker Motor Finance از یک سامانه اعتبارسنجی شبکه عصبی برای اتخاذ تصمیمهای مالی خودکار استفاده میکند. بنا به ادعای Lloyds Bowmaker Motor Finance، سامانه اعتبارسنجی مبتنی بر شبکه عصبی به میزان %10 دقیقتر از سامانه پیشین عمل میکند. بانک Security Pacific Bank نیز از یک سامانه اعتبارسنجی هوشمند شبکه عصبی استفاده میکند تا امکان اعتبارسنجی وامهای کوچک کسب و کار فراهم آید. مدل اعتبارسنجی شبکه عصبی که این بانک توسعه داده است، پرسپترون چندلایهای به شمار میرود. بنا به اعلام این بانک، مزیت عمدهی این سامانه اعتبارسنجی شبکه عصبی این است که قابلیت بالایی در تطبیق با کارکردها دارد و دلیل آن را به توانایی شناخت الگوهای غیرخطی شبکه عصبی نسبت میدهند. افزون بر این، بهبود دقت پیشبینیِ مدل اعتبارسنجی شبکه عصبی از اهمیت بسیار بالایی برخوردار است؛ افزایش یک درصدیِ میزان دقت میتواند میلیونها دلار صرفهجویی در هزینهها را به همراه داشته باشد. براساس یافتهها، شبکه عصبی عملکرد دقیقتری نسبت به آنالیز تشخیص خطی دارد؛ به ویژه در پیشبینیِ وضعیت شرکتهایی که در معرض ورشکستگی مالی قرار میگیرند. طبق تحقیقات لیچر، شبکه عصبی میتواند سلامت مالی شرکتها را به شکل دقیقتری پیشبینی نماید. همچنین، سالچنبرگر از این نیز فراتر رفته و یک شبکه عصبی پرسپترون چندلایه را برای پیشبینی سلامت مالی سپردهها و وامها بررسی نموده است؛ او به مقایسهی یک شبکه عصبی پرسپترون چندلایه با مدل رگرسیون لجستیک پرداخته است. بر اساس یافتهها، مدل شبکه عصبی عملکرد به مراتب بهتری در مقایسه با مدل رگرسیون لجستیک دارد. دقت پیشبینی شبکه عصبی با آنالیز تشخیص خطی، رگرسیون لجستیک، الگوریتم خوشهبندی k (نزدیکترین همسایه) و یک مدل درخت تصمیم مقایسه شده است. نتایج گویای آن است که پرسپترون چندلایه دقت بسیار بالایی دارد؛ آنالیز تشخیص خطی، رگرسیون لجستیک، درختهای تصمیمگیری و الگوریتم خوشهبندی K (نزدیکترین همسایه) در رتبههای بعدی قرار دارند.
لازم به ذکر میباشد مدلهای شبکه عصبی عملکرد بهتری نسبت به مدلهای آنالیز تشخیص خطی در پیشبینی داشته و در طبقهبندی وامهای باکیفیت و بیکیفیت موفقتر عمل کردهاند. از طرفی، این مدلها عملکرد نسبتاً مشابهی با مدلهای رگرسیون لجستیک دارند اما همچنان قدرت تفکیکشان بهتر است.
دیدگاهتان را بنویسید لغو پاسخ