 
                    معرفی متدولوژیهای هوش مصنوعی در فرآیند اعتبارسنجی
مقدمه:
روشهای مورد استفاده برای اعتبارسنجی از به کارگیری تکنیکهای آماری سنتی تا متدهای نوآورانهتر مانند هوش مصنوعی (یادگیری ماشین، جنگلهای تصادفی، ارتقای گرادیان و شبکههای عصبی عمیق)، در حال تکامل هستند که در ادامه به صورت مختصر به توضیح انواع متدولوژیهای اعتبارسنجی با استفاده از هوش مصنوعی و الگوریتمهای یادگیری ماشین پرداخته میشود.
هوش مصنوعی و الگوریتم یادگیری ماشین در اعتبارسنجی:
هوش مصنوعی یکی از کاربردهای ابزارهای محاسباتی برای پرداختن به وظایفی است که به طور سنتی مستلزم پیچیدگیهای انسانی است. هوش مصنوعی ماشینها را قادر میسازد تا از تجربیات استفاده کرده و از آنها به عنوان دادههای جدید استفاده کنند و عملکردی همچون عملکرد انسان داشته باشند. بیشتر نمونههای هوش مصنوعی که امروزه از محبوبیت ویژهای در میان مردم برخوردار هستند، از اتومبیلهای خودران گرفته تا پزشکان فوق بشری، به شدت به یادگیری عمیق و پردازش زبان طبیعی متکی هستند. این تکنیکها با استفاده از تجربه، از توانایی رایانهها برای انجام کارهایی مانند دید (Vision) رایانه و رباتهای چت، بهره میبرند. امروزه هوش مصنوعی به سرعت در حال تکامل بوده و به توسعه فناوریهای بنیادی مانند قدرت محاسبات، استفاده از دادهها و گسترش الگوریتمهای نوآورانه کمک میکند. با استفاده از این تکنیکها میتوان به کامپیوترها آموزش داد تا با پردازش و درک دادههایی که ممکن است متنوع و از منابع مختلفی باشند، برای انجام وظایف ویژهای استفاده کنند.
هوش مصنوعی یک زمینه گسترده است که یادگیری ماشین زیرمجموعهای از آن محسوب میشود. یادگیری ماشین به عنوان روشی برای طراحی توالی (سلسه مراتب) برای حل مسئله و یا مشکلی خاص (که به عنوان الگوریتم شناخته میشود)، تعریف میشود و به طور خودکار و با بهرهگیری از تجربه و مداخله محدود انسان انجام میشود. از تکنیکهای یادگیری ماشین میتوان برای یافتن الگوهایی پیچیده که در حجم زیادی از دادهها و در انواع و اقسام متنوعی وجود دارند، استفاده نمود.
یادگیری عمیق نیز نوعی یادگیری ماشین است و از الگوریتمهایی استفاده میکند که در آنها از ساختار و عملکرد مغز انسان الهام گرفته شده است. اخیراً یادگیری عمیق منجر به ایجاد نتایج چشمگیری در برخی زمینهها همچون تشخیص تصویر و پردازش زبان طبیعی شده است. به عنوان مثال ممکن است از یادگیری عمیق برای طبقهبندی تصاویر، تشخیص گفتار، تشخیص اشیاء و محتوا استفاده شود.
در سطوح بالا، کاربردهای استفاده از الگوریتمهای یادگیری ماشین در اعتبارسنجی را میتوان به صورت ذیل تقسیم نمود:
- دسترسی به دادههای خام
- سهولت ترکیب و تجمیع دادههای ورودی
- استفاده از رویکردهای خودکار و اتوماتیک
- انتخاب ویژگیها و گزینههای مناسب
- ارزیابی و تفسیر نتایج
روشهای نوآورانه دیگری در اعتبارسنجی وجود دارد که عبارتند از: یادرگیری تکنیکهای تحت نظارت، بدون نظارت و نیمه نظارتی
در ادامه به معرفی این تکنیکها نیز پرداخته خواهد شد:
1- تکنیکهای یادگیری تحت نظارت:
در یادگیری تحت نظارت، الگوریتم موردنظر با استفاده از دادههای حاوی برچسب (تعیین متغیرهای مستقل و وابسته و ویژگیهای آنها) توسعه داده شده است. سپس الگوریتم با استفاده از این دادهها، مقادیر ناشناخته یا موردنظر را پیشبینی میکند. برخی از تکنیکهای تحت نظارت شامل رگرسیون، درختهای تصمیمگیری، جنگلهای تصادفی، تقویت رادیان و شبکههای عصبی عمیق، میباشد.
الف) درختهای تصمیمگیری:
درختان تصمیمگیری معمولاً به صورت شماتیک بوده و شاخهها (انشعابات) مورد استفاده در آنها به منظور نشان دادن خروجیها و احتمالات آماری هر حالت تصمیمگیری در شرایط مختلف است. درختان طبقهبندی و رگرسیونی یکی از تثبیتشدهترین تکنیکهای یادگیری تحت نظارت هستند و با یافتن مکرر بهترین و بهینهترین ویژگی، برای تقسیم دادهها به زیرمجموعهها کار میکنند. مزیت استفاده از درختهای تصمیمگیری، سهولت انتخاب نهایی یا تصمیم در شرایط نامشخص و مبهم است. اما این الگوریتم و مدل دارای معایبی نیز میباشد که نمیتوان از آنها چشمپوشی کرد؛ به عنوان مثال، اگر تعداد انشعابات (شاخهها) یک درخت تصمیمگیری زیاد باشد، قابلیت درک چندانی نخواهد داشت و توضیحدهندگی آن ناقص و مشکل خواهد بود. همچنین در صورتی که درخت تصمیمگیری بزرگ باشد، میزان دقت تصمیمگیری به دلیل وجود حالات مختلف کاهش خواهد یافت.
از درختان تصمیمگیری میتوان در فرآیند اعتبارسنجی برای ایجاد و طبقهبندی دو گروه از دادهها استفاده کرد: گروه یا طبقه اول مربوط به مشاهدات است (مشاهداتی که نشاندهنده نکول و یا عدم نکول است) و طبقه دوم مربوط به تخمین مقادیر عددی (به عنوان مثال مقدار ارزش در معرض ریسک)، میباشد.
ب) جنگلهای تصادفی:
جنگلهای تصادفی ترکیبی از درختان تصمیمگیری پیشبینیکننده هستند به گونهای که در آن هر درخت به نمونهای از دادههای مدل که به صورت تصادفی انتخاب شده است بستگی دارد. در مدل جنگلهای تصادفی از تعداد و انواع مختلفی از دادههای فرعی برای پیشبینی استفاده میشود و همین امر به دلیل ازدیاد و تنوع لحاظ اطلاعات و دادهها موجب کاهش ریسک بیش برازش (یعنی توجه به دادهای خاص و درنظر نگرفتن سایر دادههایی که ممکن است مفید باشند) میشود. به طور کلی جنگلهای تصادفی یا جنگلهای تصمیمگیری تصادفی مجموعهای از روشها برای رگرسیون و طبقهبندی موضوعات و مشکلات مختلف مبتنی بر طراحی درختان تصمیمگیری بسیار زیاد و استخراج نتایج متعدد و متنوع در حالات مختلف است.
بانکها از الگوریتمهای جنگل تصادفی استفاده میکنند تا پیشبینی کنند متقاضیان وام در دستهی افراد پرخطر قرار میگیرند یا خیر.
پ) ارتقای رادیان:
ارتقای رادیان به نوعی الگوریتم تکاملیافته درخت تصمیمگیری است. الگوریتم ارتقای رادیان از درختان تصمیمگیری برای دستیابی به اهداف پیشبینی شده استفاده میکند و یک مدل را به صورت تکراری آنقدر مورد رگرسیون قرار میدهد و هر بار نتایج نامرتبط را کنار میگذارد تا به نتیجه مورد انتظار از پیش تعیین شده دست پیدا کند. در واقع، ارتقای رادیان یک روش بهینهسازی مدل بر روی یک تابع هدف است. از الگوریتم تقویت رادیان در شرایطی که دادههای زیاد با پیشبینیهای متعدد وجود دارد، استفاده میشود.
ت) شبکههای عصبی عمیق:
از شبکههای عصبی عمیق با نام شبکههای یادگیری عمیق نیز یاد میشود. شبکههای عصبی عمیق به جای سازماندهی دادهها برای اجرای معادلات از پیش تعریف شده، الگوریتم را وادار میکنند تا به صورت خودکار و با درک و شناخت لایههای بسیار زیاد پردازشی، در تخمین معادلات عمل کنند. در این نوع از شبکههای عصبی، از تکنیکهای بسیار زیاد و پیچیده ریاضیات استفاده میشود تا ساختاری شبیه مغز انسان تشکیل شود. در مواردی که تعداد و حجم دادهها و اطلاعات ورودی بسیار بیش از حد معمول باشد از شبکههای عصبی عمیق برای پردازش استفاده میشود؛ زیرا الگوریتمهایی که در آن به کار گرفته میشود خود دادههای ورودی را پردازش میکنند و هر چقدر میزان دادهها بیشتر باشد الگوریتمها قویتر شده و حتی هوشمندتر از مغز انسان عمل خواهند کرد.
در واقع به صورت کلی و خلاصه، شبکههای عصبی عمیق در ابتدا ساختارهای ابتدایی دادههای ورودی را دریافت کرده و آنها را با استفاده از توابع خطی و غیرخطی بسیار پیچیده مورد پردازش قرار میدهند و در نهایت نتایجی که استخراج میشود با کمترین خطا و بسیار نزدیک به عملکرد مغز انسان خواهد بود.
در بسیاری از بانکها و مؤسسات مالی و اعتباری، از شبکههای عصبی عمیق برای بالا بردن کارایی و تقویت سیستمهای ارزیابی مشتریان در حوزههای تخصیص وام و به ویژه اعتبارسنجی، رتبهبندی اوراق قرضه، بازاریابی هدف و رتبهبندی اعتباری استفاده میشود. الگوریتمهای موجود در شبکههای عصبی عمیق به جهت داشتن لایههای پردازشی بسیار فراوان و شبیه به مغز انسان، برای تشخیص نمونههای کلاهبرداری در معاملات کارتهای اعتباری بسیار پرکاربرد و با اهمیت هستند.
2- تکنیکهای یادگیری بدون نظارت:
یادگیری بدون نظارت به روشهایی اطلاق میشود که در آنها دادههای ارائه شده به الگوریتم دارای برچسب نیست. از این رو، نیاز است که الگوریتمها الگوهای موجود در دادهها را با تفکیک گروههای مشاهداتی که دارای خصوصیات مشابه هستند، شناسایی نمایند. به عبارت دیگر، الگوریتمهایی که در این مدلها به کار گرفته میشود برای تشخیص خصوصیات و ویژگیهای دادهها ارائه شده است و نه برای پیشبینی و یا کشف دادههای جدید. تکنیکهای یادگیری بدون نظارت عبارتند از خوشهبندی، خوشهبندی K Means و خوشهبندی سلسله مراتبی که در ادامه به صورت مختصر به آنها پرداخته خواهد شد.
الف) خوشهبندی:
خوشهبندی به طور کلی فرآیند به دست آوردن گروههای طبیعی از دادهها است و این مقولهای کاملاً متمایز از کلاسبندی و طبقهبندی دادهها است و راهی برای تجزیه و تحلیل دادهها میباشد. در خوشهبندی، دادهها براساس شباهت عناصر در یک گروه قرار میگیرند و بدین صورت است که اشیاء یا دادهها در یک گروه (به نام خوشه) در مقایسه با دیگر دستهها (خوشهها) مشابهتر هستند. الگوریتمهای خوشهبندی بیش از آنکه پیشبینی کننده باشند، توصیفی هستند.
با رشد تکنولوژی و توسعه فاکتورهای رقابتی بین بانکها، یافتن روشها و مدلهایی با هدف شناخت بهتر مشتریان برای بانکها از اهمیت بسیاری برخوردار شده است. یکی از روشها و مدلهایی که بانکها برای شناخت مشتریان خود به کار میبرند، خوشهبندی است. به عنوان مثال، یک الگوریتم خوشهبندی ممکن است برای شناسایی قرضگیرندهای که دارای ویژگیهای دشوار برای ارزیابی باشد، مورد استفاده قرار گیرد. اگر الگوریتم مورد استفاده، یک خوشه مناسب و دارای ویژگیهای شبیه به فرد وامگیرنده موردنظر پیدا کند، میانگین نرخ نکول آن خوشه به عنوان نرخ نکول فرد وامگیرنده تلقی خواهد شد.
ب) خوشهبندی K Means:
K Means سادهترین و در عین حال بهترین الگوریتم خوشهبندی است. در این الگوریتم دادهها فاقد برچسب هستند و از نظر نوع، از قبل تمییز داده نشدهاند ولیکن پیش از اجرای این الگوریتم باید تعداد خوشهها (K) به صورت دستوری تعیین شود. در این الگوریتم هدف از خوشهبندی تجزیه n داده یا مشاهده در k خوشه یا مرکز خوشه است. از خوشهبندی K Means در بانکداری و برای گروهبندی مشتریان و آنالیز رفتار آنها استفاده میشود؛ به عنوان مثال اگر یک مجموعه داده اعتباری مشتریان از یک بانک بخصوص بصورت متغیرهایی مانند مبلغ وام، نرخ بهره وام، مدت زمان سررسید، نحوه بازپرداخت در سررسید مقرر، زمان درخواست وام و … در دسترس باشد، میتوان با روش خوشهبندی، رفتار اعتباری مشتریان را آنالیز و آنها را در خوشه مناسب خود قرار داد. این امر، کار را برای متخصصین حوزه اعتباری و تدوین سیاستهای اعتباری در قبال هر گروه از مشتریان آسان میسازد.
پ) خوشهبندی سلسله مراتبی:
برای انجام خوشهبندی سلسله مراتبی، الگوریتمهای مختلف و متنوعی طراحی و پیادهسازی شده است. وقتی صحبت از سلسه مراتب میشود یعنی به آرامی و طی چند مرحله باید دادهها را خوشهبندی کرد. خوشهبندی سلسله مراتبی با ارزیابی کلیه دادهها به عنوان خوشههای مجزا آغاز میشود، سپس براساس فاصلههای اقلیدسی، خوشههایی که به هم نزدیک بوده و با هم شباهت دارند با یکدیگر ترکیب و ادغام میشوند و خوشه بزرگتر جدیدی را میسازند و آنقدر این روند ادامه دارد تا جایی که خوشههای همگرا و با تعداد کمتر در کل الگوریتم ایجاد شود.
3- سایر تکنیکهای مرتبط با متدهای اعتبارسنجی (نیمه نظارتی):
الف) تقویت یادگیری:
تقویت یادگیری یکی از متدهای نوظهوری است که فیمابین تکنیکهای یادگیری با نظارت و تکنیکهای یادگیری بدون نظارت قرار دارد و در فرآیندهای اعتباری از آن استفاده میشود. تکنیک تقویت یادگیری به ماشین اجازه میدهد تا رفتارهای مبتنی بر بازخورد محیط را فرا بگیرد. هدف از بکارگیری این متد، آموزش الگوریتمی است که محیط را در نظر بگیرد، اقدامات مناسب را انجام دهد و متناسب با بازخوردهای محیط، نتایجی را کسب کند. استفاده از متد تقویت یادگیری در زمینه رباتیک و نظریه بازی بسیار رایج است.
ب) پردازش زبان طبیعی:
پردازش زبان طبیعی، شاخهای از هوش مصنوعی است که به کامپیوتر کمک میکند تا زبان انسان را درک، تفسیر و دستکاری کند و به صورت کلی، توانایی ماشین در تجزیه و تحلیل، درک و تولید زبان انسان از جمله گفتار است.
در بانکداری و حوزههای مالی، پردازش زبان طبیعی به تجزیه و تحلیل انبوهی از اسناد کمک میکند. از این رو، از این تکنیک برای تنظیم توافقنامههای وامهای تجاری، شناسایی نیازها و رفتارهای مشتری و حتی ردگیری مخاطرات تقلب و کلاهبرداری، استفاده میشود. علاوه بر این موارد، بهرهگیری از متد پردازش زبان طبیعی باعث تسریع در شناخت مشتری بانکها و تحلیل شرایط تخصیص اعتبار و سرمایهگذاری میشود.
دیدگاهتان را بنویسید لغو پاسخ