|
ИНО_ТЕЛ |
|
English version |
|
(ZIP файл, 433 kb) Полезные статьи |
Описание кредитов. В каждом банке кредит описывается параметрами (признаками), каждый из которых имеет градации. На практике число признаков может быть от 10 до 20 и число градаций в признаках от 2 до 11. Например, кредиты физических лиц в одном из Банков РФ описывались следующими признаками (параметрами) и их градациями (табл. 1). Признак успешности кредита - Y (2 градации). Признаки кредита: Z1 - срок кредита (4 градации), Z2 - сумма кредита (6), Z3 - цель кредита (3), Z4 - кредитная история в банке (3), Z5 - владение пластиковыми картами банка (4), Z6 - жилищные условия (3), Z7 - наличие в собственности дорогостоящего имущества (3), Z8 - возраст заемщика (3), Z9 - должностной уровень (4), Z10 - стабильность занятости (период работы в указанной компании) (4), Z11 - доход чистый по месту работы (5), Z12 - количество неработающих членов семьи (3). Количественные данные (срок, сумма кредита) разбиты на интервалы, которым присвоены номера градаций (табл. 2, признаки 1,2,8,10,11). Эту таблицу описания кредита Заказчик по своему желанию может представлять Исполнителю для контроля данных. Формальное табличное представление статистики банка по кредитам.
Данные по кредитам банка можно представить в виде таблицы (табл. 2), содержащей в строках кредиты i=1,2,...,N.
В столбцах таблицы находятся признаки (параметры) кредита Z1,...,Zj, ..., Zn,. В свою очередь, признаки имеют градации Zjr, r=1,2,...,Nj; j=1,2,...,n,. Именно градации находятся в клетках таблицы. В первом столбце табл. 2 находится параметр эффективности кредита Y.
Таблица 1. Описание признаков и градаций кредита
Каждый кредит имеет признак (параметр) успешности кредита Y, который имеет две градации: градация 1 ("хороший") или градация 0 ("плохой"). В итоге получен файл-таблица, в строках которой кредиты, в первом столбце градация успешности кредита, а в остальных столбцах градации для признаков кредитов. Градации рассматриваются как случайные величины или события-градации. В общем случае, градации линейно неупорядочены и нельзя сказать, что градация 3 хуже или лучше градации 4 для итогового события, которое также имеет градации. Множество кредитов делится на два класса-градации: класс 1 - кредит возвращен; класс 0 - кредит не возвращен. События-градации для каждого признака (параметра) образуют группу несовместных событий (ГНС). Наибольшее возможное число комбинаций (разных кредитов) равно: где N1, N2, ..., Nj, ..., Nn - числа градаций в параметрах. Число кредитов в статистике банка должно быть не меньше 20*n, где n - число признаков для описания кредитов. Таблица 2. Кредиты и их признаки и градации
Обезличенное представление статистики по кредитам банка. Обезличенно статистика по кредитам банка представляется в виде файла - таблицы (табл. 3). Этот файл, без первой строки идентификаторов описания кредитов посылается Исполнителю по E_mail. Таблица 3. Фрагмент обезличенного файла по статистике кредитов банка 1000 {число кредитов} 20 {число признаков}
Общее число кредитов, число признаков и число градаций в каждом признаке задает Заказчик. Числа хороших и плохих кредитов подсчитываются по файлу автоматически. Эти данные служат для настройки программы обучения ЛВ-модели риска. Также осуществляется подсчет числа одинаково описанных кредитов в статистических данных и какие градации признаков не используются для описания кредитов. Это позволяет контролировать данные о кредитах банка и результаты обучения ЛВ-модели риска. Для кредитного риска юридических лиц категории клиентов рассматриваются как градации 1, 2, 3 :. Этот параметр описания кредита должен располагаться в последнем столбце файла-таблицы 3 и для него вычисляются дополнительные атрибуты риска. Основные уравнения и целевая функция оптимизации (обучения). Признаки кредита и их градации считаются случайными событиями: событиями-признаками и событиями-градациями. Эти события с определенной вероятностью приводят к неуспеху кредита. Сценарий неуспеха кредита является ассоциативным и формулируется для всего множества возможных событий: неуспех происходит, если происходит какое-либо одно, какие-либо два, ... или все инициирующие события. Заметим, что ни одна из известных скоринговых методик для кредитного риска не может использовать такой сценарий. Логическая переменная Zj равна 1 с вероятностью Pj, если признак j привел к неуспеху, и равна 0 с вероятностью Qj = 1 - Pj в противном случае. Логическая переменная Zjr, соответствующая градации r признака j, равна 1 с вероятностью Pjr и равна 0 с вероятностью Qjr = 1 - Pjr . Вектор Z(i)=(Z1, :, Zj, :, Zn) описывает объект i из таблицы 2. При задании объекта i вместо логических переменных Z1 , :, Zj , :, Zn подставляются переменные Zjr для градаций признаков именно этого объекта i. Логическая функция (Л-функция) риска неуспеха кредита Л-функция риска неуспеха кредита после ее ортогонализации: В-модель (В-полином) риска неуспеха кредита: "Арифметика" В-модели риска такова, что для итогового события величина риска находится в пределах [0, 1] при любых значениях вероятностей инициирующих событий. Целевая функция для оптимизации (идентификации) В-модели риска неуспеха кредита по статистическим данным банка формулируется так: число корректно классифицируемых кредитов ( Fcor ) должно быть максимально где Ngg, Nbb - соответственно числа кредитов, классифицируемых как "хорошие" и "плохие" и статистикой, и В-моделью (совпадающие оценки). Прозрачность ЛВ-модели кредитного риска и результатов оценки и анализа риска обеспечивается возможностью вычисления вкладов признаков и градаций в риск кредита, в средний риск всего множества кредитов банка и в точность (целевую функцию) ЛВ-модели кредитного риска. По соглашению с банком эти вклады могут представляться дополнительно. Форма представления результатов 1. В результате обучения (идентификации) по статистике банка вычисляются следующие атрибуты обученной ЛВ-модели риска:
|
|
|
|||
|
|