معرفی متدولوژی‌های هوش مصنوعی در فرآیند اعتبارسنجی

معرفی متدولوژی‌های هوش مصنوعی در فرآیند اعتبارسنجی

مقدمه:

روش‌های مورد استفاده برای اعتبارسنجی از به کارگیری تکنیک‌های آماری سنتی تا متدهای نوآورانه‌تر مانند هوش مصنوعی (یادگیری ماشین، جنگل‌های تصادفی، ارتقای گرادیان و شبکه‌های عصبی عمیق)، در حال تکامل هستند که در ادامه به صورت مختصر به توضیح انواع متدولوژی‌های اعتبارسنجی با استفاده از هوش مصنوعی و الگوریتم‌های یادگیری ماشین پرداخته می‌شود.

هوش مصنوعی و الگوریتم یادگیری ماشین در اعتبارسنجی:  

هوش مصنوعی یکی از کاربردهای ابزارهای محاسباتی برای پرداختن به وظایفی است که به طور سنتی مستلزم پیچیدگی‌های انسانی است. هوش مصنوعی ماشین‌ها را قادر می‌سازد تا از تجربیات استفاده کرده و از آنها به عنوان داده‌های جدید استفاده کنند و عملکردی همچون عملکرد انسان داشته باشند. بیشتر نمونه‌های هوش مصنوعی که امروزه از محبوبیت ویژه‌ای در میان مردم برخوردار هستند، از اتومبیل‌های خودران گرفته تا پزشکان فوق بشری، به شدت به یادگیری عمیق و پردازش زبان طبیعی متکی هستند. این تکنیک‌ها با استفاده از تجربه، از توانایی رایانه‌ها برای انجام کارهایی مانند دید (Vision) رایانه و ربات‌های چت، بهره می‌برند. امروزه هوش مصنوعی به سرعت در حال تکامل بوده و به توسعه فناوری‌های بنیادی مانند قدرت محاسبات، استفاده از داده‌ها و گسترش الگوریتم‌های نوآورانه کمک می‌کند. با استفاده از این تکنیک‌ها می‌توان به کامپیوترها آموزش داد تا با پردازش و درک داده‌هایی که ممکن است متنوع و از منابع مختلفی باشند، برای انجام وظایف ویژه‌ای استفاده کنند. 

هوش مصنوعی یک زمینه گسترده است که یادگیری ماشین زیرمجموعه‌ای از آن محسوب می‌شود. یادگیری ماشین به عنوان روشی برای طراحی توالی (سلسه مراتب) برای حل مسئله و یا مشکلی خاص (که به عنوان الگوریتم شناخته می‌شود)، تعریف می‌شود و به طور خودکار و با بهره‌گیری از تجربه و مداخله محدود انسان انجام می‌شود. از تکنیک‌های یادگیری ماشین می‌توان برای یافتن الگوهایی پیچیده که در حجم زیادی از داده‌ها و در انواع و اقسام متنوعی وجود دارند، استفاده نمود. 

یادگیری عمیق نیز نوعی یادگیری ماشین است و از الگوریتم‌هایی استفاده می‌کند که در آنها از ساختار و عملکرد مغز انسان الهام گرفته شده است. اخیراً یادگیری عمیق منجر به ایجاد نتایج چشمگیری در برخی زمینه‌ها همچون تشخیص تصویر و پردازش زبان طبیعی شده است. به عنوان مثال ممکن است از یادگیری عمیق برای طبقه‌بندی تصاویر، تشخیص گفتار، تشخیص اشیاء و محتوا استفاده شود.

در سطوح بالا، کاربردهای استفاده از الگوریتم‌های یادگیری ماشین در اعتبارسنجی را می‌توان به صورت ذیل تقسیم نمود:

  • دسترسی به داده‌های خام
  • سهولت ترکیب و تجمیع داده‌های ورودی
  • استفاده از رویکردهای خودکار و اتوماتیک
  • انتخاب ویژگی‌ها و گزینه‌های مناسب
  • ارزیابی و تفسیر نتایج

روش‌های نوآورانه دیگری در اعتبارسنجی وجود دارد که عبارتند از: یادرگیری تکنیک‌های تحت نظارت، بدون نظارت و نیمه نظارتی

در ادامه به معرفی این تکنیک‌ها نیز پرداخته خواهد شد:

1- تکنیک‌های یادگیری تحت نظارت:

در یادگیری تحت نظارت، الگوریتم موردنظر با استفاده از داده‌های حاوی برچسب (تعیین متغیرهای مستقل و وابسته و ویژگی‌های آنها) توسعه داده شده است. سپس الگوریتم با استفاده از این داده‌ها، مقادیر ناشناخته یا موردنظر را پیش‌بینی می‌کند. برخی از تکنیک‌های تحت نظارت شامل رگرسیون، درخت‌های تصمیم‌گیری، جنگل‌های تصادفی، تقویت رادیان و شبکه‌های عصبی عمیق، می‌باشد.

الف) درخت‌های تصمیم‌گیری:

درختان تصمیم‌گیری معمولاً به صورت شماتیک بوده و شاخه‌ها (انشعابات) مورد استفاده در آنها به منظور نشان دادن خروجی‌ها و احتمالات آماری هر حالت تصمیم‌گیری در شرایط مختلف است. درختان طبقه‌بندی و رگرسیونی یکی از تثبیت‌شده‌ترین تکنیک‌های یادگیری تحت نظارت هستند و با یافتن مکرر بهترین و بهینه‌ترین ویژگی، برای تقسیم داده‌ها به زیرمجموعه‌ها کار می‌کنند. مزیت استفاده از درخت‌های تصمیم‌گیری، سهولت انتخاب نهایی یا تصمیم در شرایط نامشخص و مبهم است. اما این الگوریتم و مدل دارای معایبی نیز می‌باشد که نمی‌توان از آنها چشم‌پوشی کرد؛ به عنوان مثال، اگر تعداد انشعابات (شاخه‌ها) یک درخت تصمیم‌گیری زیاد باشد، قابلیت درک چندانی نخواهد داشت و توضیح‌دهندگی آن ناقص و مشکل خواهد بود. همچنین در صورتی که درخت تصمیم‌گیری بزرگ باشد، میزان دقت تصمیم‌گیری به دلیل وجود حالات مختلف کاهش خواهد یافت.

از درختان تصمیم‌گیری می‌توان در فرآیند اعتبارسنجی برای ایجاد و طبقه‌بندی دو گروه از داده‌ها استفاده کرد: گروه یا طبقه اول مربوط به مشاهدات است (مشاهداتی که نشان‌دهنده نکول و یا عدم نکول است) و طبقه دوم مربوط به تخمین مقادیر عددی (به عنوان مثال مقدار ارزش در معرض ریسک)، می‌باشد.

ب) جنگل‌های تصادفی:

جنگل‌های تصادفی ترکیبی از درختان تصمیم‌گیری پیش‌بینی‌کننده هستند به گونه‌ای که در آن هر درخت به نمونه‌ای از داده‌های مدل که به صورت تصادفی انتخاب شده است بستگی دارد. در مدل جنگل‌های تصادفی از تعداد و انواع مختلفی از داده‌های فرعی برای پیش‌بینی استفاده می‌شود و همین امر به دلیل ازدیاد و تنوع لحاظ اطلاعات و داده‌ها موجب کاهش ریسک بیش برازش (یعنی توجه به داده‌ای خاص و درنظر نگرفتن سایر داده‌هایی که ممکن است مفید باشند) می‌شود. به طور کلی جنگل‌های تصادفی یا جنگل‌های تصمیم‌گیری تصادفی مجموعه‌ای از روش‌ها برای رگرسیون و طبقه‌بندی موضوعات و مشکلات مختلف مبتنی بر طراحی درختان تصمیم‌گیری بسیار زیاد و استخراج نتایج متعدد و متنوع در حالات مختلف است.

بانک‌ها از الگوریتم‌های جنگل تصادفی استفاده می‌کنند تا پیش‌بینی کنند متقاضیان وام در دسته‌ی افراد پرخطر قرار می‌گیرند یا خیر.

پ) ارتقای رادیان:

ارتقای رادیان به نوعی الگوریتم تکامل‌یافته درخت تصمیم‌گیری است. الگوریتم ارتقای رادیان از درختان تصمیم‌گیری برای دستیابی به اهداف پیش‌بینی شده استفاده می‌کند و یک مدل را به صورت تکراری آنقدر مورد رگرسیون قرار می‌دهد و هر بار نتایج نامرتبط را کنار می‌گذارد تا به نتیجه مورد انتظار از پیش تعیین شده دست پیدا کند. در واقع، ارتقای رادیان یک روش بهینه‌سازی مدل بر روی یک تابع هدف است. از الگوریتم تقویت رادیان در شرایطی که داده‌های زیاد با پیش‌بینی‌های متعدد وجود دارد، استفاده می‌شود.

ت) شبکه‌های عصبی عمیق:

از شبکه‌های عصبی عمیق با نام شبکه‌های یادگیری عمیق نیز یاد می‌شود. شبکه‌های عصبی عمیق به جای سازمان‌دهی داده‌ها برای اجرای معادلات از پیش تعریف شده، الگوریتم را وادار می‌کنند تا به صورت خودکار و با درک و شناخت لایه‌های بسیار زیاد پردازشی، در تخمین معادلات عمل کنند. در این نوع از شبکه‌های عصبی، از تکنیک‌های بسیار زیاد و پیچیده ریاضیات استفاده می‌شود تا ساختاری شبیه مغز انسان تشکیل شود. در مواردی که تعداد و حجم داده‌ها و اطلاعات ورودی بسیار بیش از حد معمول باشد از شبکه‌های عصبی عمیق برای پردازش استفاده می‌شود؛ زیرا الگوریتم‌هایی که در آن به کار گرفته می‌شود خود داده‌های ورودی را پردازش می‌کنند و هر چقدر میزان داده‌ها بیشتر باشد الگوریتم‌ها قوی‌تر شده و حتی هوشمندتر از مغز انسان عمل خواهند کرد.

در واقع به صورت کلی و خلاصه، شبکه‌های عصبی عمیق در ابتدا ساختارهای ابتدایی داده‌های ورودی را دریافت کرده و آنها را با استفاده از توابع خطی و غیرخطی بسیار پیچیده مورد پردازش قرار می‌دهند و در نهایت نتایجی که استخراج می‌شود با کمترین خطا و بسیار نزدیک به عملکرد مغز انسان خواهد بود.

در بسیاری از بانک‌ها و مؤسسات مالی و اعتباری، از شبکه‌های عصبی عمیق برای بالا بردن کارایی و تقویت سیستم‌های ارزیابی مشتریان در حوزه‌های تخصیص وام و به ویژه اعتبارسنجی، رتبه‌بندی اوراق قرضه، بازاریابی هدف و رتبه‌بندی اعتباری استفاده می‌شود. الگوریتم‌های موجود در شبکه‌های عصبی عمیق به جهت داشتن لایه‌های پردازشی بسیار فراوان و شبیه به مغز انسان، برای تشخیص نمونه‌های کلاهبرداری در معاملات کارت‌های اعتباری بسیار پرکاربرد و با اهمیت هستند.

2- تکنیک‌های یادگیری بدون نظارت:

 یادگیری بدون نظارت به روش‌هایی اطلاق می‌شود که در آنها داده‌های ارائه شده به الگوریتم دارای برچسب نیست. از این رو، نیاز است که الگوریتم‌ها الگوهای موجود در داده‌ها را با تفکیک گروه‌های مشاهداتی که دارای خصوصیات مشابه هستند، شناسایی نمایند. به عبارت دیگر، الگوریتم‌هایی که در این مدل‌ها به کار گرفته می‌شود برای تشخیص خصوصیات و ویژگی‌های داده‌ها ارائه شده است و نه برای پیش‌بینی و یا کشف داده‌های جدید. تکنیک‌های یادگیری بدون نظارت عبارتند از خوشه‌بندی، خوشه‌بندی K Means و خوشه‌بندی سلسله مراتبی که در ادامه به صورت مختصر به آنها پرداخته خواهد شد.

الف) خوشه‌بندی:

خوشه‌بندی به طور کلی فرآیند به دست آوردن گروه‌های طبیعی از داده‌ها است و این مقوله‌ای کاملاً متمایز از کلاس‌بندی و طبقه‌بندی داده‌ها است و راهی برای تجزیه و تحلیل داده‌ها می‌باشد. در خوشه‌بندی، داده‌ها براساس شباهت عناصر در یک گروه قرار می‌گیرند و بدین صورت است که اشیاء یا داده‌ها در یک گروه (به نام خوشه) در مقایسه با دیگر دسته‌ها (خوشه‌ها) مشابه‌تر هستند. الگوریتم‌های خوشه‌بندی بیش از آنکه پیش‌بینی کننده باشند، توصیفی هستند.

با رشد تکنولوژی و توسعه فاکتورهای رقابتی بین بانک‌ها، یافتن ‌روش‌ها و مدل‌هایی با هدف شناخت بهتر مشتریان برای بانک‌ها از اهمیت بسیاری برخوردار شده است. یکی از روش‌ها و مدل‌هایی که بانک‌ها برای شناخت مشتریان خود به کار می‌برند، خوشه‌بندی است. به عنوان مثال، یک الگوریتم خوشه‌بندی ممکن است برای شناسایی قرض‌گیرنده‌ای که دارای ویژگی‌های دشوار برای ارزیابی باشد، مورد استفاده قرار گیرد. اگر الگوریتم مورد استفاده، یک خوشه مناسب و دارای ویژگی‌های شبیه به فرد وام‌گیرنده موردنظر پیدا کند، میانگین نرخ نکول آن خوشه به عنوان نرخ نکول فرد وام‌گیرنده تلقی خواهد شد.

ب) خوشه‌بندی K Means:

K Means ساده‌ترین و در عین حال بهترین الگوریتم خوشه‌بندی است. در این الگوریتم داده‌ها فاقد برچسب هستند و از نظر نوع، از قبل تمییز داده نشده‌اند ولیکن پیش از اجرای این الگوریتم باید تعداد خوشه‌ها (K) به صورت دستوری تعیین شود. در این الگوریتم هدف از خوشه‌بندی تجزیه n داده یا مشاهده در k خوشه یا مرکز خوشه است. از خوشه‌بندی K Means در بانکداری و برای گروه‌بندی مشتریان و آنالیز رفتار آن‌ها استفاده می‌شود؛ به عنوان مثال اگر یک مجموعه داده اعتباری مشتریان از یک بانک بخصوص بصورت متغیرهایی مانند مبلغ وام، نرخ بهره وام، مدت زمان سررسید، نحوه بازپرداخت در سررسید مقرر، زمان درخواست وام و … در دسترس باشد، می‌توان با روش خوشه‌بندی، رفتار اعتباری مشتریان را آنالیز و آنها را در خوشه مناسب خود قرار داد. این امر، کار را برای متخصصین حوزه اعتباری و تدوین سیاست‌های اعتباری در قبال هر گروه از مشتریان آسان می‌سازد.

پ) خوشه‌بندی سلسله مراتبی:

برای انجام خوشه‌بندی سلسله مراتبی، الگوریتم‌های مختلف و متنوعی طراحی و پیاده‌سازی شده است. وقتی صحبت از سلسه مراتب می‌شود یعنی به آرامی و طی چند مرحله باید داده‌ها را خوشه‌بندی کرد. خوشه‌بندی سلسله مراتبی با ارزیابی کلیه داده‌ها به عنوان خوشه‌های مجزا آغاز می‌شود، سپس براساس فاصله‌های اقلیدسی، خوشه‌هایی که به هم نزدیک بوده و با هم شباهت دارند با یکدیگر ترکیب و ادغام می‌شوند و خوشه بزرگتر جدیدی را می‌سازند و آنقدر این روند ادامه دارد تا جایی که خوشه‌های همگرا و با تعداد کمتر در کل الگوریتم ایجاد شود.

3- سایر تکنیک‌های مرتبط با متدهای اعتبارسنجی (نیمه نظارتی):

الف) تقویت یادگیری:

تقویت یادگیری یکی از متدهای نوظهوری است که فی‌مابین تکنیک‌های یادگیری با نظارت و تکنیک‌های یادگیری بدون نظارت قرار دارد و در فرآیندهای اعتباری از آن استفاده می‌شود. تکنیک تقویت یادگیری به ماشین اجازه می‌دهد تا رفتارهای مبتنی بر بازخورد محیط را فرا بگیرد. هدف از بکارگیری این متد، آموزش الگوریتمی است که محیط را در نظر بگیرد، اقدامات مناسب را انجام دهد و متناسب با بازخوردهای محیط، نتایجی را کسب کند. استفاده از متد تقویت یادگیری در زمینه رباتیک و نظریه بازی بسیار رایج است. 

ب) پردازش زبان طبیعی:

پردازش زبان طبیعی، شاخه‌ای از هوش مصنوعی است که به کامپیوتر کمک می‌کند تا زبان انسان را درک، تفسیر و دستکاری کند و به صورت کلی، توانایی ماشین در تجزیه و تحلیل، درک و تولید زبان انسان از جمله گفتار است.

در بانکداری و حوزه‌های مالی، پردازش زبان طبیعی به تجزیه و تحلیل انبوهی از اسناد کمک می‌کند. از این رو، از این تکنیک برای تنظیم توافق‌نامه‌های وام‌های تجاری، شناسایی نیازها و رفتارهای مشتری و حتی ردگیری مخاطرات تقلب و کلاهبرداری، استفاده می‌شود. علاوه بر این موارد، بهره‌گیری از متد پردازش زبان طبیعی باعث تسریع در شناخت مشتری بانک‌ها و تحلیل شرایط تخصیص اعتبار و سرمایه‌گذاری می‌شود.

دیدگاهتان را بنویسید