Разработка скоринговых карт как инструмента оценки уровня риска. Скоринг: выехать на кредитной машине

При подборе персонала на вакантные должности компании (особенно в массовом подборе) специалисты сталкиваются с большим количеством рисков. Эти риски связаны с ошибочным отсевом кандидатов и как следствие с принятием на работу не профессионалов, что в дальнейшем может порождать все новые и новые цепочки рисков. Следовательно специалисту по подбору персонала важно располагать инструментами, помогающими быстро и по универсальным параметрам оценить степень риска при рассмотрении того или иного кандидата. «Скоринг» (от англ. Scoring) - дословно подсчет очков в игре. В бизнесе скоринг активно используют в маркетинге, страховании, у сотовых операторов в телекоммуникационной сфере и наиболее широко - при кредитовании физических лиц. В общем виде скоринговая модель представляет собой математическую модель, описывающую зависимость степени риска от набора входных факторов. Реализацию данная модель находит в скоринговых картах. Например, применительно к кредитованию - это некоторый набор основных характеристик заемщика, таких как возраст, доход, профессия, стаж работы, наличие имущества и т.д. и соответствующих весовых коэффициентов, выраженных в баллах. Потенциальный заемщик заполняет анкету, сообщая таким образом необходимые для анализа сведения о себе. В результате функционирования скоринговой модели для каждого потенциального заемщика получают интегральный показатель, представляющий собой взвешенную сумму определенных признаков. Надежность клиента можно оценить по уровню данного значения. В зависимости от суммы набранных скоринг-баллов банк определяет класс риска и рассчитывает максимальную сумма кредита, уточняет процентную ставку и срок. Основными критериями банковского скоринга физических лиц являются значения следующих параметров: возраст, пол, совокупный доход (как заемщика, так и поручителей), количество иждивенцев, место жительства и работы и т.п. Каждый из этих параметров переводится в стандартные балы. Подобный подход логично использовать и в процессе принятия решения по отбору кандидатов как при отборе на открытые вакансии или при отборе кандидатов в кадровый резерв. Модель скоринговой оценки строится на основе накопленных данных о зависимости дефолта (увольнения, несоответствия занимаемой должности и т.п.) потенциального кандидата от определенных характеристик. После чего используя статистический аппарат и приемы математического моделирования, составляется скоринговая карта. В процессе моделирования разрабатывается несколько скоринговых карт, каждая из которых будет зависеть от типа вакансии и ряда других признаков. При анализе, сопоставив конкретные анкетные данные о потенциальном или действующем кандидате на вакансию со скоринговой картой, получают соответствующий результат. Для построения эффективной скоринговой модели необходимо решить следующие задачи. На первом этапе необходимо определить ключевую цель, т.е. для чего конкретно будет использоваться скоринг (оценка кандидата, определение оптимальной стратегии по кандидатам на испытательном сроке и т.п.). На втором этапе выделяют показатели, которые будут использованы для моделирования, а также источники их получения. Например, знания кадровых специалистов о требованиях вакансии и компетенциях соискателей, статистика по уже работающему персоналу, учитывающая «успешных» и «плохих» кандидатов. На третьем этапе проводится предварительный анализ данных, их очистку и подготовку, ведь каждый соискатель обладает своим уникальным набором параметров. Для такого анализа необходима унификация данных и специализированное программное обеспечение бизнес-анализа класса Business Intelligence (BI). Система должна предоставлять возможность обработки данных: просмотра, фильтрации, поиска, ручной и автоматической замены. Часто для лучшего понимания данных и для определения их целостности необходимо проводить экспресс-анализ, который осуществляется на основе базовых статистик распределений. Следовательно, система должна уметь проводить частотный анализ и строить распределения. Если очистка данных произведена, необходимо подготовить данные к моделированию. До начала построения модели следует рассчитать на основе функциональных зависимостей все возможные производные параметры, которые будут использованы для дальнейшего анализа. На четвертом этапе полученные признаки разбиваются на классы, выявляются их предиктивные характеристики. Большинство алгоритмов скорингового моделирования основываются на классификации элементов (соискателей), обладающих одинаковыми признаками. Кроме того, в процессе построения модели появляется необходимость разбиения некоторых признаков на классы. Основной принцип в данном случае - группировка соискателей с максимально похожим поведением в один класс. Такой подход основывается на экспертных данных. На основе проводимого анализа выделяются предиктивные характеристики, между значениями которых и вероятностью негативного события существует корреляция. Теоретически предиктивным может быть любой параметр, характеризующий соискателя. К ключевым характеристикам могут быть отнесены следующие: возраст, средний срок работы на одном месте, стаж работы, место жительства, наличие кредитов, количество детей/иждивенцев и т.п. Для каждой модели составляется свой перечень предиктивных характеристик. На основе статистических данных и экспертных оценок для каждой характеристики вводится свой весовой коэффициент, определяющий степень ее влияния на вероятность возникновения негативного события. Отобранные предиктивные характеристики анализируются в совокупности. Это связано с существованием возможных корреляций. Может оказаться, что ввод дополнительной характеристики в модель ухудшит ее качество. На пятом этапе строится нескольких вариантов моделей, из которых выбирается наиболее оптимальный с точки зрения соотношения «качество/ стабильность». На шестом этапе определяют уровень стабильности модели, т.е. ее способность сохранять точность в течение какого-либо будущего периода. Стабильность построенной модели определяется аналитиком на основе тестовых данных. Если на тестовых данных система показывает эффективность, схожую с эффективностью на обучающих данных, считается, что модель стабильна. На седьмом этапе формируют балл отсечения, который базируется на стратегии, используемой фирмой (массовый подбор или закрытие «уникальной» вакансии, поиск уникального специалиста и др.). Балл отсечения устанавливается в зависимости от выбранного приоритета. При внедрении скоринговой модели в практику работы, специалисту по кадрам необходимо определить коэффициенты для различных факторов-характеристик надежности соискателя. Следовательно, кадровый специалист должен быть в состоянии оценить текущую ситуацию на рынке. В результате такой оценки получают набор факторов с весовыми коэффициентами и пороговое значение (балл отсечения), которые являются весьма субъективным мнением и зачастую являются статистически необоснованными. На последнем, восьмом этапе оценивают эффективность разработанной модели При использовании скоринговых карт в подборе персонала специалист по кадрам сможет быстро определять общий сводный бал кандидата и принимать решение о приеме/не приеме, а также прогнозировать успешность/неуспешность кандидата в работе. Преимуществом применения скоринговых карт при массовом подборе (когда обрабатываются данные о сотнях потенциальных соискателей) является возможность получения общего балла каждого кандидата, и автоматическое отсечение тех, кто не набирает «установленного достаточного минимума». Ценность применения скоринговой модели также и в том, что: - легко структурировать и визуализировать полученные данные при подборе на любую должность; - у специалиста по кадрам появляется четкое понимание, что необходимо узнать о соискателе и из какого источника; - оценки становятся стандартизированными, увеличивается прозрачность процедуры отбора в целом; - компания может легко проследить корреляцию между характеристиками нанятых сотрудников и их дальнейшей эффективностью Тем не менее, скоринговые карты не могут полностью заменить специалиста. Как и в банковском деле при нестандартных ситуациях (сложных вакансиях) окончательное решение должно приниматься не по набранным баллам, а по результатам дополнительного анализа соискателя и живого собеседования с ним. Применяя скоринговые карты предприятие оптимизирует бизнес-процессы подбора персонала, повысит эффективность, выбирая только лучших из кандидатов, и снизит риски текучести персонала.

Сегодня это действительно слишком просто: вы можете подойти к компьютеру и практически без знания того, что вы делаете, создавать разумное и бессмыслицу с поистине изумительной быстротой. (Дж. Бокс)

Cкоринг-карты

Начальный анализ характеристик определяет набор тех из них, которые должны быть учтены в итоговой модели и преобразует их в группированный формат переменных. На стадии составления предварительной скоринг-карты различные методики прогнозирования могут использоваться для нахождения такого набора характеристик, который способствует обеспечению наибольшей точности прогноза.

Применяются методы логистической регрессии, а также деревья решений и нейронные сети. Вообще говоря, итоговые скоринг-карты, создаваемые на этой стадии, должны состоять из 8-20 характеристик. Такое количество значений берется для обеспечения устойчивости карты даже при изменении одной или нескольких характеристик. Скоринг-карты с очень маленьким набором характеристик как правило, не выдерживают испытаний, так как они неустойчивы при малейших изменениях в выбранном профиле (наборе характеристик).

Вне зависимости от используемой методики моделирования, результатом работы должна явиться готовая скоринг-карта, состоящая из оптимальной комбинации характеристик, принятых во внимание, например, могут учитываться:

  • корреляция между характеристиками;
  • статистическая сила скоринг-карты;
  • интерпретируемость выбранных характеристик в конкретной отрасли/отделе;
  • используемые средства моделирования;
  • понятность методологии, соответствие предъявляемым требованиям.

Понятие профиля риска

Скоринг-карты могут разрабатываться и использоваться для различных целей: максимизации качества статистических показателей, эффективности (с использованием небольшого числа переменных), и т.д.

В бизнесе скоринг-карты разрабатываются, чтобы помочь специалисту в принятии решений. Они выступают в роли арбитров, хранят в себе правила для принятия решений. Опытный специалист никогда не будет принимать свое решение исходя только из 4-5 правил формы приложения или истории расчетов. Скорее, он проанализирует сразу несколько обобщающих показателей для формирования профиля риска клиента. Так почему же скоринг-карты разрабатываются всего с 4-5 переменными или характеристиками?

Цель процесса разработки карт - построить наиболее полный профиль риска для каждого клиента. Такой широкий подход делает скоринг-карты не только более эффективными, но и менее восприимчивыми к изменениям в одной отдельной области. Такой профиль риска должен включать в себя характеристики, отражающие столько независимых типов информации, сколько возможно. Для примера, кредитная скоринг-карта пользователя должна включать в себя: демографическую информацию о клиенте (возраст, место проживания, регион и стаж работы); раздел кредитных характеристик, отражающих владение недвижимостью, профессию, платежеспособность, некоторую финансовую информацию, а также степень доверия клиенту в отношении погашения долгов (общий коэффициент невозвращения долга), а также другую значимую для рассмотрения информацию о существующих пользователях.

Профиль пользователя также помогает при последующем мониторинге скоринг-карт по релевантности. Большинство аналитиков, занимающихся изучением рисков, используют ежемесячные отчеты типа "стабильность системы" или "стабильность численности клиентов" для подтверждения эффективности применения карт при текущей численности клиентов. Эти отчеты показывают меры эффективности, исходя лишь из характеристик, используемых в скоринг-карте. Общий же профиль риска более реалистично отражает текущие изменения численности, чем при использовании ограниченного количества переменных из скоринг-карты.

Создание карты клиента на основе профиля риска в теории практически ничем не отличается от других процедур прогнозного моделирования. Разница состоит лишь в представлении конечного набора характеристик. Существует большое количество разнообразных методов, которые могут быть использованы для включения значений профилей рисков клиента в скоринг-карту. Оставшаяся часть статьи будет посвящена методам, использующим logit-регрессию для построения скоринг-карт клиентов.

Logit-регрессия

Logit-регрессия применяется для разработки скоринг-карт в большинстве приложений финансовой сферы, где переменные являются категориальными. В случае непрерывных переменных прогноза используется линейная регрессия. Далее будет рассмотрено использование множественной logit-регрессии для прогноза бинарной переменной (имеющей значения плохо/хорошо).

logit-регрессия, как и большинство других методов прогнозирования, использует набор характеристик прогнозирования для определения вероятности (или возможности) достижения результата (цели). logit-преобразование уравнения возможности наступления события выглядит следующим образом:

Р - итоговая вероятность наступления события;

Х - зависимые переменные;

Начальный(нулевой) уровень линии регрессии;

Параметры

Логит-преобразование - это логарифм отношения вероятности наступления события к вероятности его ненаступления: log(p(наступления события)/р(ненаступления события)), и используется оно для линеаризации итоговой вероятности, ограничивая вероятность от 0 до 1. Для оценки параметров и используется метод максимального правдоподобия. Эти параметры оценивают меру изменения результата логит-преобразования при изменении входной переменной на одну единицу (в согласовании с другими входными переменными). На самом деле, эти коэффициенты показывают наклон линии регрессии между переменной-целью (target), и соответствующей входной переменной .

Параметры зависят от единицы измерения входной переменной, например, выражаются в процентном отношении к объему всех анализируемых данных, и их необходимо стандартизировать для облегчения анализа. Стандартизация может быть выполнена различными методами, включая и метод стандартизированных оценок. Другой способ стандартизации состоит в общей отмене единиц измерения входных данных, и выполнении регрессии не на входные данные, а на WOE для каждой группировки, созданной на прошлом шаге.

Регрессия подразумевает наличие целевой переменной и серий входных данных. Эти данные могут иметь различные формы представления. Наиболее общий способ - это использовать необработанную входную информацию для числовых данных и создавать замену для переменных с категориальными данными. Далее в анализе используется метод стандартизированных оценок для нейтрализации эффекта, оказываемого различными единицами измерения входных данных.

В случае скоринг-карт по сгруппированным переменным, входные данные могут быть представлены в виде средних значений для числовых переменных, например средний возраст по каждой группе, или некоторое взвешенное среднее, или замененные переменные для категориальных групп. Но использование замененных переменных для категориальных переменных имеет существенный недостаток - получается, что разница между группой категориальных переменных состоит в их названии. Более предпочтительно использовать для сгруппированных переменных WOE каждой группы в качестве входных данных. Данный подход не только решает проблемы различий единиц измерения входных переменных, но и принимает в расчет точный тренд и шкалу отношений одной группы к другой. В дополнение, если группировка была произведена верно, можно быть уверенным, что значения, распределенные по группам при шкалировании скоринг-карты являются логически обоснованными и отражают разницу в родстве между группами.

Регрессия может быть применена для нахождения наиболее вероятной модели, использующей все доступные опции. Обычно это принято называть методикой "регрессии по доступным параметрам". Данный метод оказывается довольно эффективным, особенно если имеется большое количество независимых входных переменных. Гораздо реже используются следующие три типа поэтапной logit-регрессии:

Предварительный выбор:

Этот метод строит модель по одной характеристике(переменной), затем постепенно добавляет остальные характеристики в эту модель по возрастанию до тех пор, пока не останется переменных с р-value меньше уровня значимости (например, 0,5). Этот метод эффективен, но может не работать, если имеется очень большое количество переменных или присутствует высокая степень их корреляции.

Метод исключения:

Противоположный предварительному выбору метод, работает сразу со всеми переменными модели, и последовательно исключает переменные с наименьшим уровнем значимости. Процесс идет до тех пор, пока все оставшиеся переменные не будут иметь р-value ниже уровня значимости, например 0,1. Этот метод учитывает корреляцию больше, нежели метод предварительного выбора, или поэтапного выбора. Однако это не идеальный метод для исключения корреляции. Обратное исключение также может быть использовано для объединения значимых взаимодействий в модель.

Поэтапный выбор:

Комбинация двух предыдущих методов. Использует и добавление и удаление переменных динамически в карту качества на каждом этапе, вплоть до достижения наилучшей комбинации признаков. Пользователь может задать минимальные p-value, при которых переменная добавляется в создаваемую модель, или остается в модели. Дополнительную информацию Вы можете получить на статистическом портале и сайте компании СтатСофт.

Конструирование скоринг-карты

Пока возможно построить карту качества, применив ко всем переменным регрессионную модель и сгенерировав статистически оптимальный результат, этот метод не может принести лучшие результаты. Разработчик скоринг-карты обычно опирается на некоторые статистические показатели, такие как p-value, ХИ-квадрат, R-квадрат и некоторые другие для определения качества построенной модели. Далее приведены некоторые задачи, решение которых необходимо при разработке скоринг-карты.

Первая задача состоит в определении наилучшего набора входных переменных, и построении полного профиля рисков. Методика построения профиля рисков была описана выше. В идеале, этот профиль должен быть построен с использованием как можно большего числа независимых переменных, например демографических, финансовых, кредитных вопросов, платежеспособности, и т.д. Процесс разработки должен учитывать проблемы корреляции и коллинеарности, и другие факторы, затрагивающие надежность модели.

Разработанная скоринг-карта должна соответствовать по своей структуре с последовательностью принятия решений в организации. Если модель является единственным решающим фактором, необходимость построения всестороннего профиля рисков возрастает. Если модель предполагается использовать для поддержки принятия решений, то переменные, включаемые в карту, должны перекликаться с остальными показателями, и не противоречить им. Например, включение таких характеристик как банкротство, TDSR, информация о совершенных преступлениях, должно быть сведено к минимуму, так как присутствует в полицейских стандартах.

Пример, приведенный в таблице 1, показывает переменные-факторы скоринг-карты, взятые из профиля рисков. Заметьте, что среди показателей представлены различные типы информации, как из внутренних, так и из внешних источников. Включение запросов за последние 12 и за 3 месяца сделано для того, чтобы можно было определить масштаб как коротко- так и долгосрочного кредитования. Банкротство и "статистика нарушений" не были включены в карту показателей, так как они используются в полицейских правилах и автоматически отсеиваютсоответствующих кандидатов.

Обычно подобная скоринг-карта не является результатом автоматического регрессионного алгоритма. Как же получается подобная скоринг-карта?

Рассмотрим на примере.

Разработчик скоринг-карт имеет на вооружении несколько методов, с помощью которых он может построить итоговую форму модели. Предполагается отбор параметров, при котором изначально рассматриваются лишь необходимые, или те, которые "может быть пригодятся".

Один из способов добиться результата - это предположить значимые для модели переменные, шаг за шагом, причем переменные предполагаются совершенно специфичным для каждого шага путем. Этот процесс похож на регрессию с поэтапным выбором (stepwise). Пример приведен в таблице 2 ниже:

Используя данный метод, регрессионный алгоритм сначала выбирает параметры, используя logit-регрессию либо по предварительному отбору, либо по методу исключения, либо поэтапный выбор. Характеристики, удовлетворяющие поставленным критериям отбора (напр. Когда p-value параметра оценивается на каком-либо уровне доверия, параметры добавляются к карте в первую очередь, или наоборот, удаляются из нее в случае регрессии по методу исключения.) В приведенном примере характеристики "возраст", "дата смены места жительства" и "опыт работы" будут вычислены при первой итерации. Характеристика "возраст" появится в модели как оказывающая наибольшее влияние на прогноз.

При второй итерации того же уровня, алгоритм рассмотрит две оставшиеся характеристики, принимая во внимание уже отобранную переменную "возраст". Если окажется, что одна либо обе рассматриваемые переменные оказывают значимое влияние на результат прогноза, то они тоже будут добавлены в модель. Регрессионный анализ остановится, когда не будет ни одной переменной, которую можно было бы добавить, либо исключить из набора данных для анализа.

Все характеристики, включенные в модель на первом шаге, будут участвовать в ней и на 2м шаге. Регрессионный алгоритм на этом шаге проверит такие характеристики как "район", "индекс", и "область", но проверка начнется с характеристик, отобранных на первом шаге и уже включенных в модель. Вновь, такие показатели как p-value и уровень значимости будут использованы для определения значимых характеристик (которые войдут в модель).

Подобный анализ будет проведен для каждого последующего уровня. Итогом анализа будет являться скоринг-карта. Характеристики, включенные в модель на более ранних шагах, будут также включены в модель и при последующих итерациях.

Статистические показатели, такие как ХИ-квадрат или стандартизированные оценки могут быть использованы для определения силы прогноза модели на каждом шаге итерации.

Опытный пользователь может проконтролировать процесс анализа для увеличения шансов вынесения правильного диагноза. Слабые и "Привилегированные" характеристики могут быть помещены на более ранние шаги итерации в целях увеличения шансов их добавления в модель, и для максимизации влияния бесспорных (проверенных) переменных. В дальнейшем, добавление других переменных увеличит точность прогноза.

Более значимые характеристики помещаются в конец, и могут не войти в скоринг-карту, если их влияние может быть уже смоделировано по одному или нескольким другим критериям. Использование нескольких слабых критериев для моделирования поведения одного более значимого применяется для стабилизации, причем без потери силы прогноза, например, 5 характеристик, добавляющих 200 баллов каждая в скоринг-карте предпочтительнее, чем две характеристики, добавляющие по 500 баллов каждая. Модель будет эффективна при более широкой базе (наборе характеристик). Это соответствует идее создания профилей рисков.

Схожие критерии("возраст", "дата смены места жительства" и "опыт работы") объединяются в один шаг итерации для того, чтобы корреляция между этими характеристиками была рассмотрена в дальнейшем. Наиболее подходящие среди коррелированных характеристик войдут в скоринг-карту. Схожие коэффициенты должны быть также помещены в один и тот же шаг итерации в качестве информации о числителе и знаменателе. Вдобавок, рассмотрение различной независимой информации на каждом шаге увеличивает шансы добавления хотя бы одной переменной из каждой группы в итоговую скоринг-карту.

Регрессионный анализ будет повторяться для различных комбинаций характеристик на разных этапах и с разными уровнями доверия в цикличном процессе для построения наилучшего набора правил модели. Характеристики могут быть перемещены на более высокие или более низкие шаги в целях достижения разнообразных комбинаций для скоринг-карт. Эти карты будут оценены позже, с использованием бизнес критериев и статистических показателей прогнозной силы модели.

На практике этот подход реализуется моделью с опцией выбора последовательности в logit-регрессии с поэтапным выбором. Вот два наиболее часто используемых подхода:

Простая регрессия

Выполняется однократный запуск алгоритма регрессионного анализа, причем порядок размещения характеристик следующий: - Все "слабые" характеристики размещаются вверху(вначале), все более значимые характеристики - в конце. Внутри каждого типа информации характеристики могут быть отсортированы, начиная самой менее значимой, и заканчивая наиболее значимой характеристикой. Весомость каждой характеристики может быть рассчитана по ее значению.

Множественная регрессия

При использовании данного подхода алгоритм регрессионного анализа повторяется многократно, рассматривая различную информацию на каждом шаге анализа.

  • Все "слабые" характеристики рассматриваются в первую очередь, на начальных шагах регрессионного анализа.
  • При каждом регрессионном анализе характеристики располагаются в порядке возрастания их значимости, то есть от самой "слабой" к самой "сильной".
  • Характеристики, включенные в скоринг-карту на более ранних шагах анализа, включаются во все последующие шаги.

Также, как и при процессе группировки, такой подход к разработке скоринг-карт восприимчив к понижению эластичности. Хорошее понимание всех шагов анализа, а также статистических компонентов, таких как набор анализируемых характеристик, снизит шансы получения неудовлетворительного качества прогнозирования. Данный подход должен быть протестирован с использованием нескольких различных комбинаций характеристик, чтобы понять динамику изменения данных перед составлением итоговой скоринг-карты.

Этот процесс включает в себя статистическое моделирование (например, регрессионный анализ) и бизнес-анализ. Осуществляется разработка устойчивой, эффективной скоринг-карты, содержащей характеристики из различных источников, и отображающей различные независимые типы информации(демографическая, запросы, информация о прошлой деятельности, о з/п и т.д.). Заметим, что регрессионный анализ выполняется с использованием устойчивого набора характеристик, выбранных из первично отобранных характеристик, и все слабые критерии уже были устранены. Все тесты на значимость следуют из выбора итоговой композиции характеристик, входящих в скоринг-карту, но это не единственный критерий для рассмотрения. Получившаяся карта имеет свою статистическую силу и воздействие. Чаще всего, это как раз то, что используют риск-менеджеры и другие специалисты по принятию решений для выработки компенсирующих риски стратегий.

Когда набор характеристик для включения в скоринг-карту получен, эти характеристики могут быть применены к анализу в сгруппированном виде, для получения итоговых параметров регрессии. Подобные процессы происходят с каждой скоринг-картой при построении, для каждого сегмента в отдельности. Типично несколько скоринг-карт используют различные комбинации характеристик для каждого сегмента, и учитывают поставленные цели и задачи для определения итогового решения. Скоринг-карта с более низкой "силой" может получить больший приоритет, если она нацелена на стратегию, цели и задачи организации.(например, большая прибыль), чем другая, с большей "силой", и поэтому необходимо сравнить несколько карт соответствующим образом, чем полагаться единственно на статистические показатели. Кстати выбор критериев скоринг-карт и их утверждение будет рассмотрено в последующих главах.

В итоге на данном этапе создаются несколько различных скоринг-карт, обобщающих некоторое число характеристик и их параметры регрессии.

Повышение доходности кредитного портфеля банка напрямую зависит от грамотного управления кредитными рисками. И именно скоринговые системы позволяют снизить риски без потери доходности, предложив ответ на ключевые вопросы: насколько проблематичной будет работа банка с конкретным заемщиком, какое значение кредитного лимита установить, и вернет клиент кредит или нет.

В 1941 г. Дэвид Дюран впервые применил методику классификации кредитов на «хорошие» и «плохие». Он определил не только группы факторов, позволяющие максимально определить степень кредитного риска, но и коэффициенты, характеризующие кредитоспособность частного клиента. Таким образом, заемщик, который преодолел пороговое значение, набрав достаточное количество баллов, потенциально мог получить запрашиваемую сумму. Идея Дюрана получила продолжение - вскоре в Сан-Франциско образовалась первая консалтинговая фирма в области скоринга Fair Issac, а несколько позже, с появлением новых массовых кредитных продуктов (кредитных карт), к идее скоринга обратились все финансовые учреждения США.
По сути, скоринг является методом классификации совокупности заемщиков на различные группы, когда необходимая характеристика не известна, однако, известны другие характеристики, которые каким-либо образом коррелируют с интересующей. На практике, в зависимости от задач анализа заемщика, кредитный скоринг включает application-скоринг - оценку кредитоспособности претендентов на получение кредита (скоринг по анкетным данным используется в первую очередь), behavioral-скоринг - оценка вероятности возврата выданных кредитов (поведенческий анализ), а также collection-ско-ринг - оценка возможности полного либо частичного возврата кредита при нарушении сроков погашения задолженности (расчет рисков по портфелю).
Известные сегодня разработки SAS, KXEN, Experian, SPSS, EGAR - это не специализированные программные средства для скоринга, а универсальные аналитические инструменты (Data Mining), так называемое «интеллектуальное ядро», которое можно в том числе использовать и для построения собственных скоринговых моделей. Поэтому, в более полном понимании, скоринговая система изнутри представляет собой сложную систему автоматизации выдачи потребительских кредитов в банковских отделениях, торговых точках, через интернет, которая в качестве аналитического ядра использует решение одной из известных компаний-разработчиков.
Сам по себе скоринг - это не только работа с определенными скоринго-выми моделями, но и построение скоринговой инфраструктуры. Так, во многих Data mining продуктах результат анализа статистических данных (матмо-дель) можно сохранить в виде программного кода, а его вставить в банковское программное обеспечение. То есть, под скоринговой системой подразумевают специальное программное обеспечение, с помощью которого можно рассчитать необходимый показатель на основе исходных данных (рисунок). Скоринговая карта - это набор утвержденных банком определенных характеристик и соответствующих весовых коэффициентов (в баллах).
Скоринговых карт в банках обычно несколько, поскольку они сильно зависят от кредитных продуктов. К примеру, под недвижимость необходима одна карта, а на покупку автомобиля уже совершенно другая. По мнению экспертов, можно использовать и одну общую карту, однако это неудобно для пользователей. Моделей также почти всегда несколько. Обычно заявка на кредит проходит через большое количество моделей, причем для разных категорий лиц могут применяться различные модели даже на одной скоринговой карте.
В процессе эксплуатации скоринговой системы важен мониторинг качества и эффективности работы скоринговой модели. Обычно именно здесь специалисты видят одну из основных проблем кредитного скоринга

Упрощенная модель работы скоринговой системы

ОГРАНИЧЕНИЯ СКОРИНГА И ДЕРЕВО РЕШЕНИЙ

Одной из основных трудностей известных скоринговых систем, как и всех технологических решений в сфере core banking, является плохая адаптируемость. Дело в том, что с течением времени могут меняться условия, в которых функционирует заемщик. А значит, скоринговые модели необходимо актуализировать на наиболее «свежих» клиентах, периодически перепроверяя и, при необходимости, разрабатывая новую модель, как для различных периодов времени, так и для различных регионов. В Западной Европе новая модель разрабатывается в среднем раз в полтора года. В условиях Украины максимальным периодом будет полгода-год. Период между заменой модели может изменяться в зависимости от конъюнктуры рынков и стабильности экономики в это время.
Для адаптации скоринговой модели специалисту финансового учреждения необходимо определить коэффициенты для различных факторов, характеризующих кредитоспособность частного клиента. А значит, аналитик должен быть в состоянии оценить текущую ситуацию на рынке. Результатом работы будет набор факторов с весовыми коэффициентами и пороговое значение (балл отсечения), которые являются весьма субъективным мнением и зачастую являются статистически необоснованными.
Преодоление таких ограничений скоринга решается с помощью инструментов Data minig. Наиболее распространенным методом автоматического анализа данных является построение дерева решений. Поставщики решений уверены: для того чтобы получить обоснованные выводы, не обязательно быть статистиком. К примеру, AnswerTree (продукт SPSS) автоматически строит дерево, позволяя на базе диалоговых окон даже неподготовленному пользователю начать работу с программой. Сам AnswerTree автоматически просеивает данные и находит статистически значимые группы.
С помощью интуитивно понятных древовидных диаграмм, графиков и таблиц программа самостоятельно сегментирует данные, при этом аналитику необходимо лишь указать целевую переменную, переменные-предикаторы и выбрать алгоритм построения дерева решений. Удобно, что древовидная диаграмма, которая похожа на блок-схему, позволяет визуализировать выделенные сегменты и закономерности в данных.
Для получения максимально достоверных результатов обычно рекомендуется обучить модель на подвыборке, а затем протестировать надежность на оставшихся данных. Насколько хорошо модель описывает данные, можно увидеть, переключаясь с обучающей модели на контрольную. Представить результаты анализа можно в любом формате, к примеру, вывести информацию по каждому узлу в виде таблицы или графика.
Правильно построенное на данных прошлых периодов дерево решения обладает еще одной очень важной особенностью, а именно, «способностью к обобщению». Это означает, что если возникает новая ситуация, можно с достаточно большой долей уверенности сказать, что вновь обратившийся заемщик поведет себя так же, как и те заемщики, характеристики которых схожи с характеристиками новых клиентов.

КРИТЕРИИ ВЫБОРА

Критерии выбора скоринговой системы напрямую зависят от задач. Большинство украинских банков воспринимают скоринг довольно узко, как процесс математического расчета скорингового балла на основе введенных данных. При этом часто роль скорин-говых систем нивелируется до уровня «скорингового калькулятора». А ведь скоринговый комплекс можно использовать не только для полной автоматизации работы инспекторов, но и для решения других важных задач - работы с «плохими кредитами», оптимизации маркетинговых кампаний и сегментации клиентской базы, борьбы с мошенничеством, анализа технических сбоев и управления ликвидностью.
Помимо определенности в том, нужен ли кредитной организации просто «скоринговый калькулятор» или автоматизация всего бизнес-процесса скоринга, важную роль играют также:

  • известность бренда (для банков, делающих ставку на рост капитализации);
  • гибкость системы (возможность сохранения формата карты при корректировке методики расчета балла, и в более широком смысле слова «гибкость» - при интеграции в информационную среду банка, учета украинской специфики и другое);
  • способность системы работать на малом объеме кредитных историй с возможностью получения удовлетворительного результата;
  • применяемые статистические/математические методы;
  • скорость внедрения системы;
  • наличие поддержки.

Главным препятствием на пути внедрения каких-либо скоринговых систем, по мнению Яны Нидельской, начальника управления кредитных операций «Агрокомбанка», все-таки остается отсутствие накопленной информации. Лишь при этом условии можно говорить о высокой степени достоверности получаемых в результате данных. Использование же комплексных скоринговых систем на банковском рынке Украины целесообразно лишь для крупных системных банков, которые делают основной упор на розничное кредитование - когда оно поставлено на поток (в особенности ипотека и автокредитование).

ТИПЫ СКОРИНГОВЫХ СИСТЕМ

Скоринговая система традиционно состоит из модуля подготовки исходных данных, аналитического модуля и модуля отчетности.
Данные системы скоринга, могут быть трех типов. Первый тип - знания персонала кредитных отделов банков о конкретных типах кредитных продуктов (потребительских, авто и ипотечного кредитования) и своих клиентах. Второй тип данных - статистика по уже выданным кредитам, учитывающая «хороших» и «плохих» заемщиков. И, если банк не обладает ни одним из типов указанных данных - ни экспертными знаниями, ни статистикой выданных кредитов, модель, лежащая в основе системы скоринга, преимущественно строится на основе региональных и отраслевых данных.
Все фронт-офисные решения для автоматизации процесса потребительского кредитования в большинстве случаев представляют собой Web-приложения, что обеспечивает хорошую масштабируемость системы и простоту подключения к процессу выдачи кредитов новых отделений банка и представительств в торговых точках.
Есть предложения разработчиков скоринга для Украины, которые обеспечивают автоматизацию всего процесса (одновременно создание скоринговой карты и автоматизацию подачи заявки и процесса принятия решения). На рынке есть предложения западных поставщиков (часто дорогие брендовые решения, ориентированные на крупные банки) и украинских компаний-представителей (простые и дешевые расчетные системы-«калькуляторы», где учтена специфика отечественного рынка).
Наиболее известными западными скоринговыми системами сегодня являются SAS Credit Scoring, EGAR Scoring, Transact SM (Experian-Scorex), K4Loans (KXEN), Clementine (SPSS). Среди разработчиков из СНГ - BNS, Basegroup Labs. Наиболее серъезными и дорогими являются решения SAS (около 200 тыс. дол.), достойными также считаются разработки KXEN (около 30 тыс. дол.).
Практически посередине ценового диапазона стоит предложение по скорингу компании EGAR Technology, которая, с одной стороны, является западным вендором, предлагающим скоринговую систему, использующую классические западные модели, с другой стороны,- это решение (EGAR Scoring) максимально адаптировано к украинским условиям и дополнено специальными подходами - например, макроэкономическим подходом к оценке кредитоспособности заемщика, учетом особенностей самих кредитных продуктов и другими возможностями.
Рассматривая различные скоринговые решения, корректно говорить о системах для западного рынка и о системах для украинского (российского) рынка, так как есть и западные поставщики, например, EGAR, которые предлагают версию скоринга, полноценно учитывающую украинскую (российскую) специфику.
Безусловно, системы для западного рынка значительно более функциональны, чем разработки для Украины или СНГ, но заставить их работать в отечественных условиях трудно: необходимо пройти сложный процесс внедрения, интеграции и адаптации.
Сравнивая западные и отечественные системы, необходимо заметить следующее:

1. Западные системы появились намного раньше, у них большой срок эксплуатации, соответственно большой объем кредитных историй, но эти истории не подходят для украинского рынка;
2. В западных системах нет инструментов (возможностей) для работы с малыми объемами кредитных историй (что необходимо для украинского рынка). Разработки в области классического скоринга позволяют работать с ограниченными объемами кредитных историй.

Еще одна особенность - большая разница между скоринговыми картами в зависимости от локальных рынков и для разных банковских продуктов. Соответственно, западные системы недостаточно гибки для отечественного рынка.

ИНТУИТИВНЫЙ СКОРИНГ

При реализации системы скоринга в Украине традиционно работает два подхода. Первый - классический (ретроспективный) скоринг на основе анализа исторических данных с применением современных математических методов, когда такой анализ позволяет выбрать самые значимые поля для анкеты заемщика и другие показатели.
Второй - это скоринг «по правилам», когда просто, например, экспертом, задаются правила оценки кредитоспособности, и программа автоматизирует этот алгоритм без применения каких-либо статистических методов анализа исторических данных.
Сегодня именно второй вариант чаще всего работает не только в средних и малых банках, но и во многих крупных. За последний год, однако, заметно активизировался спрос и на первый вариант, так как появились небольшие, но все-таки значимые объемы кредитных историй по некоторым рынкам.
К примеру, в «Агрокомбанке», как и в большинстве малых и средних банков, используется скоринговая система собственной разработки (с учетом опыта других банков). Это своего рода комплексная оценка, включающая ряд объективных и субъективных показателей. К объективным показателям относятся финансовые показатели деятельности предприятия, а основные направления в оценке по объективным показателям традиционно регламентируются 279 Постановлением Национального банка («…о порядке формирования и использования резерва для возмещения возможных потерь по кредитным операциями банков»). Что касается субъективных показателей - здесь гораздо больше свободы выбора, и банки обычно используют такие факторы, как кредитная история, репутация, территориальное размещение, объем и качество обеспечения.
В крупном банке «Надра» также используют скоринг «по правилам». По словам Андрея Шутова, и. о. директора департамента риск-менеджмента банка «Надра», скоринго-вая система, используемая «Надра»,- это авторская разработка собственных специалистов, которая была создана при участии финансовых консультантов из других стран. Система проста: клиент предоставляет банку минимальный пакет документов - информация заносится в систему - система суммирует данные и дает ответ, указывая степень банковского риска в каждом конкретном случае.
В качестве фактора, который обозначает доминирование скоринга «по правилам», в Украине можно отметить и малое распространение в банковской среде статистических пакетов типа SPSS и SAS. Ведь, не так уж много требуется, чтобы начать анализировать своих клиентов,- ретроспектива прошлых клиентов и статистический пакет.
Ожидается, что в ближайшие несколько лет именно на системы статистического скоринга («скоринг по правилам», «макроэкономический скоринг») будет расти спрос по мере накопления достаточного количества кредитных историй («скоринг по правилам», скорее всего, будет применяться для ипотеки).
В «Дельта-банке», по информации Андрея Ладановского, начальника управления рисками, используются скоринговые карты, разработанные экспертами банка. Работа происходит следующим образом: берутся существующие кредиты с негативной и позитивной кредитной историей, статистическими методами выделяются показатели, которые влияют на кредитную историю, каждому показателю присваивается определенный вес в общей оценке. Соответственно, анкета клиента проходит через систему автоматических проверок на целостность заявки. В результате заемщику автоматически присваивается определенный внутренний рейтинг, что определяет условия кредитного договора.
На текущий момент наиболее эффективным является сочетание нескольких методов скоринга статистического и скоринга «по правилам». Тот факт, что в системе реализованы инструменты, которые позволяют совместить статистический подход и «скоринг по правилам», а также учесть региональную специфику рынка и кредитных продуктов, позволяет говорить о том, что ее можно эффективно использовать в странах с развивающейся экономикой - в России, Украине и Казахстане.
По данным экспертов, у «Райффайзенбанк Украина» (теперь ОТР) также была система, разработанная внутренними ресурсами. Банк «Ренессанс» использует разработку на базе Fair Isaak. Среди отечественных банков, занятых в рознице, уже намечается тенденция к переходу на именитых поставщиков.

УПРАВЛЕНИЕ ПРОБЛЕМНЫМИ АКТИВАМИ

Одна из интересных возможностей, которая открывается перед кредитной организацией с внедрением эффективной системы кредитного скоринга - это участие в торговле портфелями проблемных активов. 2004 год в Европе ознаменовался бумом продаж сомнительных кредитов иностранным инвесторам. Так, Morgan Stanley приобрел портфель сомнительных кредитов итальянского Banca Nazionale del Lavoro на сумму 430 миллионов евро. Чуть позже Dresdner и Hypo Real Estate также провели реструктуризацию портфелей и реализовали их иностранным покупателям.
В качестве причин активности на рынке NPL (проблемных кредитов) аналитики сходны рассматривать высокую конкуренцию и насыщение кредитных рынков Европы, более жесткие требования рейтинговых агентств и новых нормативов Базель 2, а также давление со стороны собственников. Во многом из-за этого продажа части, а то и всего портфеля NPL считается рациональным выходом для банковских учреждений, так как позволяет улучшить способность к возврату средств без ухудшения возможностей генерирования будущих денежных потоков.
Иными словами, когда показатель проблемных кредитов превышает некий допустимый уровень, их уже весьма невыгодно держать на балансе банка, даже если они гипотетически способны возвращать позитивный результат.
Управление проблемными активами потенциально может рассматриваться как выгодный бизнес также и на уровне украинских кредитных организаций. Средний показатель сомнительной задолженности по потребительским кредитам сегодня находится на уровне 7-12% от кредитного портфеля украинских банков. Однако, по мнению экспертов, это далеко не «мертвые» кредиты, ведь некоторые заемщики просто забывают или не успевают вовремя сделать погашение. По словам Андрея Ладановского, «плохой кредит» не всегда однозначно отрицательное явление, так как теоретически самым выгодным клиентом является тот, который платит весь долг с просрочкой, погашая еще и штрафные начисления. Кроме того, важно учитывать диверсификацию по типам кредитования - задолженность по потребительским кредитам и по ипотеке отличается в разы, впрочем, как и средняя доходность по данным видам продуктов.
Единственная проблема, которая сегодня является весомой преградой в деле секью-ритизации и торговле банковскими активами - это отсутствие в украинских банках опыта реструктуризации кредитной задолженности. Согласно доступной статистике, профессиональных мошенников в общей структуре задолженности отечественных банков пока около 1,5-2%, но реального положения дел не знает никто. Таким образом, создание фондов, которые могли бы управлять сомнительной и безнадежной задолженностью украинских заемщиков, может оказаться бизнесом с большой долей риска.
В этих условиях наиболее вероятными покупателями «плохих кредитов» могут выступить скорее коллекторские компании, чем специальные фонды. Так, недавно на рынке появилась киевская «Credit Collection Group» (ССG), которая основывает свою деятельность на работе с просроченной задолженностью.

ПЕРСПЕКТИВЫ И РАЗВИТИЕ СКОРИНГА

Сейчас, за некоторыми исключениями, ни у одного украинского банка нет действующей классической системы скоринга, а кредитоспособность заемщиков обеспечивается преимущественно собственными программными продуктами.
Такая ситуация объективна - намерение внедрить достойное скоринговое решение зачастую наталкивается на отсутствие необходимых исторических данных и возможности применить какой-либо статпакет. Поскольку вся доступная статистика содержится на бумаге и в кредитных делах экспертов, то для создания необходимого «кредитного кладбища» из 10-20 тысяч заемщиков может понадобиться мобилизация значительных ресурсов, на что сегодня готово далеко не каждое финансовое учреждение.
В ближайшее время развитие рынка кредитных продуктов для частных лиц в Украине по прогнозам будет определяться такими тенденциями:

  • рост интереса к «классическому» скорингу будет происходить по мере накопления кредитных историй;
  • крайне актуальной будет становиться задача улучшения качества кредитного портфеля;
  • все более важным станет вопрос управления бизнес-процессом скоринга, а не просто «калькулятор»;
  • в столице некоторые сегменты рынка прогнозируемо исчерпают себя (потребительское кредитование будет постепенно вытесняться кредитными картами);
  • стоимость входа на рынок розничного кредитования резко увеличится, а значит, выйти на рынок новым игрокам станет сложнее.

Технологии скоринга – автоматической оценке кредитоспособности физического лица – в банковской среде традиционно уделяется повышенное внимание. Сегодня можно сказать, что экспертные методы уходят в прошлое, и все чаще при разработке скоринговых моделей обращаются к алгоритмам Data Mining. Классическую скоринговую карту можно построить при помощи логистической регрессии на основе накопленной кредитной истории, применив к ней ROC-анализ для управления рисками.

Постановка задачи. В коммерческом банке имеется продукт «Нецелевой потребительский кредит»: займы предоставляются на любые цели с принятием решения за один день. В настоящее время решение о выдаче кредита принимается на основе скоринговой карты, построенной экспертным способом, с процентом отказа, равным 55%, при этом объем просроченной задолженности велик. Накоплена статистическая информация о заемщиках и качестве обслуживания ими долга за несколько месяцев. Руководство банка, понимая, что высокий уровень отказов препятствует расширению розничного бизнеса в области потребительского кредитования, поставило перед отделом розничных рисков задачу разработать новую скоринговую карту, которая позволила бы значительно сократить число отказов в выдаче и снизить сумму просроченной задолженности.

Исходные данные. Вообще говоря, информация о заемщиках – физических лицах и кредитных договорах хранится в банковской информационной системе. Там же содержатся графики и даты погашений кредита, сведения о просрочках, об их суммах, о процентах и т.д. Получить для построения скоринговой модели таблицу с параметрами заемщиков и информацию о наличии просрочек – отдельная задача. Будем считать, что она уже выполнена и результат представлен в виде текстового файла.

Важным также является вопрос о том, что понимать под параметрами заемщика. Здесь уместно обратиться к методическим аспектам подготовки и сбора данных для анализа, и вспомнить, что на этом этапе требуется активное взаимодействие с экспертами: они с высоты своего опыта ограничат круг входных переменных, которые потенциально могут влиять на кредитоспособность будущего заемщика. Кроме того, следует учитывать аспекты бизнеса и технические вопросы (например, сложно проверить в короткий срок достоверность признака «Сфера деятельности компании», а потому полагаться на него не стоит).

Скоринговые карты часто строятся на категориальных переменных, и для этого непрерывные признаки квантуются при помощи ручного выбора точек разрыва (или полуручного, см., например, «Тест Чоу»). Скажем, переменная Стаж работы разбивается на три категории: «до 1 года», «от 1 до 3 лет», «свыше 3 лет». Такую модель легче интерпретировать, но она менее гибкая при моделировании связей: горизонтальные «ступени» дают плохую аппроксимацию при наличии частых крутых «склонов».

В банковской практике перед скорингом заемщик, как правило, проходит процедуру андеррайтинга – проверку на удовлетворение жестким требованиям: соответствие возрасту, отсутствие криминального прошлого и, конечно, наличие определенного дохода. При этом выдвигаются требования к минимальному уровню дохода, и рассчитывается возможный лимит кредита. При его расчете участвует один из двух коэффициентов – П/Д либо О/Д.

Коэффициент «Платеж/Доход» (П/Д) – отношение ежемесячных платежей по кредиту заемщика к его доходу за тот же период. Считается, что значительная величина этого коэффициента (свыше 40%) свидетельствует о повышенном риске как для кредитора, так и для заемщика.

Коэффициент «Обязательства/Доход» (О/Д) – отношение ежемесячных обязательств заемщика к его доходу за тот же период с учетом удержаний налогов. В обязательства включаются расходы, связанные с выплатой планируемого кредита, а также имеющиеся другие долгосрочные обязательства (выплаты по иным кредитам, на содержание иждивенцев, семьи, алиментов, обязательные налоговые платежи и пр.). Считается, что размер ежемесячных обязательств заемщика не должен превышать 50-60% его совокупного чистого дохода.

Заявки клиентов, не прошедшие андеррайтинг, получат отказ и даже не попадут на скоринг. Поэтому на вход скоринговой процедуры выгоднее подавать не доход клиента, а отношение О/Д или П/Д.

В нашей задаче представлено 2709 кредитов (файл loans.txt) с известными исходами платежей на протяжении нескольких месяцев после выдачи кредита.

В табл. 5.1 отображены структура и описание полей текстового файла с кредитными историями.

Таблица 5.1. Данные по заемщикам и качеству обслуживания ими долга

Поле

Описание

Служебный код заявки

Дата выдачи кредита

Дата/время

Коэффициент О/Д («Обязательства/До­ход») в %

Вещественный

Возраст заемщика (полных лет) на момент принятия решения о выдаче кредита

Проживание

Основание для проживания: собственник; муниципальное жилье; аренда

Строковый

Срок проживания в регионе

Менее 1 года; от 1 года до 5 лет; свыше 5 лет

Строковый

Семейное положение

Холост/не замужем; женат/замужем; разве­дена/вдовство; другое

Строковый

Образование

Среднее; среднее специальное; высшее

Строковый

Стаж работы на последнем месте

Менее 1 года; от 1 года до 3 лет; свыше 3 лет

Строковый

Уровень должности

Сотрудник; руководитель среднего звена; руководитель высшего звена

Строковый

Кредитная история

Информация берется из бюро кредитных историй. Если имеется негативная информация о клиенте (просрочки по прошлым кредитам), то ему присваивается категория «отрицательная»

Строковый

В Европе существует большое количество стран, где кредитный скоринг применяется очень успешно, а проблемы мошенничества или отсутствия корректной информации в кредитных бюро или внутренних базах данных банка стоят не менее остро, чем в России.

Кредитный скоринг, как и другие предикативные модели, является инструментом для оценки уровня риска заемщика. Применяя различные статистические и вероятностные подходы, мы назначаем заемщикам скоринговые баллы, разделяя их на «хороших» и «плохих». Эти скоринговые баллы наряду с другими финансовыми характеристиками, такими как ожидаемый уровень выдачи кредитов, прибыль, потери, помогают в конечном итоге принять решение.

Простейшая скоринговая карта, которая используется при выдаче новых кредитов, состоит из набора характеристик, достаточно значимых со статистической точки зрения, способных разделять данные на «хорошие» и «плохие». Подобный формат карт используется непосредственно в ЗАО «ВТБ24», и имеет следующие обоснования:

l подобное представление баллов легко интерпретировать. Оно соответствует любому регулирующему требованию, обеспечивая необходимую прозрачность;

l причины для отказов, низкий или высокий балл можно легко объяснить, используя стандартные формы отчетности;

l «облегченная» структура скоринговой карты помогает аналитикам выполнить свои функции, не имея глубоких знаний в области статистики или программирования. Это делает скоринговую карту эффективным инструментом для управления рисками.

Скоринговые модели в бизнес-контексте - это инструмент принятия разнообразных кредитных решений, элемент общей стратегии розничного банка. Скоринговые модели в потребительском кредитовании используются на различных этапах работы с клиентом, начиная с получения первой заявки от заемщиков, через организацию работы с текущими заемщиками, и заканчивая прогнозированием возможного уровня потерь в кредитном портфеле и созданием необходимых резервов.

Итак, имея некоторую кредитную историю собственных заемщиков, ВТБ24 создает собственные скоринговые карты, с помощью которых будет оптимизирована работа розничного бизнес-подразделения, а значит, увеличена эффективность всего кредитного портфеля Банка. Процесс разработки и внедрения скоринговых карт, а так же его неотъемлемые компоненты, необходимые для успешного внедрения проекта в Банке, обобщены и приведены в таблице 1.

Таблица 1 - Этапы построения и внедрения скоринговой карты

Подготовка проекта

Работа с данными

Техническое внедрение

Постановка задачи; определение приоритетов; планирование проекта; формирование команды; оценка ИТ-систем

Сбор данных; очистка данных; анализ данных; применение аналитических методов; построение скоринговых карт; валидация карт

Доработка программного обеспечения; внедрение стратегии в программное обеспечение

Минимальное время

Необходимые человеческие ресурсы

Руководитель проекта

Руководитель проекта Разработчик скоринговой карты и специалисты по обработке данных

Руководитель проекта;

ИТ-менеджер

Технические ресурсы

Программное обеспечение для проведения аналитического исследования и построения карт

Фронт-офисное решение для скоринга новых заявок, или коллекторское ПО, или CRM-системы для работы с существующими клиентами банка

Процесс построения скоринговой карты - это синтез информационных технологий (IT) и статистического исследования данных. Только подобная комбинация в сочетании с аналитикой и пониманием бизнес-задач может гарантировать успешный результат. В отличие от уже готовой карты самостоятельно построенная банком скоринговая карта - это не «черный ящик». Опыт показал, что если формирование скоринговых баллов происходит изолированно, то это может привести к различным проблемам наподобие включения характеристик, данные по которым больше не собираются или являются недостаточно достоверными и которые в результате приводят к всевозможным «сюрпризам», а зачастую просто неприменимы. Поскольку процесс построения скоринговой карты комплексный, то на разных стадиях, соответственно, задействованы разные специалисты. Успешное завершение проекта возможно лишь при условии, что есть четкое понимание, какие ресурсы необходимы, и обеспечение наличия этих ресурсов в нужный момент в нужном месте.

Построение скоринговой карты в ЗАО «ВТБ24» включает в себя следующие этапы:

1 Этап: Анализ ситуации. Создание бизнес-плана и выбор стратегии

Существует ошибочное мнение, что разработка скоринговой карты начинается со сбора данных. Это в корне неверно. Прежде всего, необходимо идентифицировать цели проекта и соответствующий состав участников проекта.

Идентификация цели помогает расположить задачи по степени их важности: например, увеличение дохода - уменьшение потерь. Это повышает жизнеспособность проекта, устраняя возникновение сюрпризов, когда, например, банк неожиданно принимает решение об уменьшении балла отсечения с целью выдачи большего количества кредитов или об увеличении того же балла с целью сокращения потерь. Таким образом, цель должна быть определена заранее, что поможет избежать проблем в будущем, будь то:

l сокращение процента задолженности/мошенничества;

l увеличение количества выдаваемых кредитов;

l увеличение доходности;

l увеличение операционной эффективности (например, чтобы лучше управлять технологическим процессом);

l уменьшение расходов или увеличение скорости оборота капитала путем автоматизации;

l улучшение прогнозной силы модели (по сравнению с существующей).

В конечном итоге цель также влияет на процесс валидации и внедрения построенной скоринговой карты, определяя «лучшую» скоринговую карту из имеющихся в наличии. Как правило, на практике приходится сталкиваться сразу с несколькими целями из тех, что были перечислены выше.

Бизнес-план определяет, какие скоринговые карты будут использоваться в проекте, внутренние (построенные в процессе проекта) или внешние (готовые), и обосновывает этот выбор. Готовые карты используются не только тогда, когда в банке нет достаточной кредитной истории. Подобное решение может быть также вызвано отсутствием определенных ресурсов, необходимых для проекта, или отсутствием опыта построения скоринговой карты для специфического продукта, сжатыми сроками по времени или стоимостью внутренней разработки.

Готовые карты бывают также полезны, когда компания предлагает новый продукт, по которому еще не имеется никаких данных в прошлом, но существуют данные по отрасли; когда объем продаж того или иного продукта не покрывает стоимости построения скоринговой карты.

Бывают также случаи, когда статистически невозможно использовать скоринговые карты, ни внутренние, ни внешние. Это происходит обычно из-за очень низких объемов продаж, которые не оправдывают затраты, связанные с любой скоринговой картой. Встречаются также продукты, для которых не существуют готовые скоринговые модели. При таких обстоятельствах модель строится на базе так называемого экспертного мнения.

Развитие такой модели также включает в себя селективный отбор характеристик, обладающих (предположительно) хорошей прогнозной силой, и назначение баллов по каждому признаку, как это происходит со статистическими моделями. Однако внедрение подобной модели производится на основе коллективного опыта, а получающаяся модель отражает проводимую банком политику. В любом случае формирование таких субъективных моделей должно происходить при участии департаментов маркетинга, управления рисками и других соответствующих структур.

2 Этап: Наличие и сбор данных

По времени это наиболее длительный этап, требующий привлечения большого количества ресурсов. На этом этапе определяется, насколько выполним проект по формированию скоринговой карты, а также его основные параметры. Параметры включают в себя исключения, определение цели, выборку и «окна созревания». Оценивается пригодность данных: их качество и количество. Для построения скоринговой карты необходимы надежные и чистые данные с минимальным числом отсутствующих значений, повторных записей и т.п. Этот процесс можно сделать более эффективным, если данные размещать в специальных хранилищах или витринах данных.

Очевидно, что для решения различных скоринговых задач разработчиками скоринговых карт используются различные данные. Как правило, характеристики для скоринговой карты могут быть выбраны как из одного, так и из нескольких источников данных. Суммируя описание данных, которые могут быть использованы для построения различных скоринговых моделей, можно сказать, что данные всегда разделены на две части: в первой - все переменные, которые используются для предсказания того или иного события (например, дефолта), во второй - переменная, характеризующая наступление того или иного события.

Количество необходимых данных может быть разным, но в целом оно должно удовлетворять требованиям статистической значимости и хаотичности. На этом этапе точное количество данных не имеет значения, так как это зависит от определения «плохого» заемщика, которое будет установлено на следующем этапе. Однако по правилам для корректного построения скоринговой карты претендента достаточно приблизительно 2 тыс. «плохих» записей и 2 тыс. «хороших», которые могут быть случайно выбраны для каждой скоринговой карты из набора заемщиков, получивших кредит в течение определенного интервала времени. Для поведенческих скоринговых карт это будет уже другой набор данных, отражающий «платежное» поведение клиента, а для скоринговых карт должников используются записи со статусом просрочки платежа. Данные об отказах (2 тыс. записей) также могут применяться для построения скоринговой карты. Количество заявлений и отчеты по потерям/просрочкам платежей дают первоначальную идею относительно цели и степени ее достижения. На практике труднее найти достаточное количество «плохих» записей, чем «хороших».

Проектная команда также должна определить, насколько «надежны» внутренние данные, предназначенные для разработки скоринговой карты. Демографические данные, а также неподтвержденные публичные данные, например доход, указанный самим заемщиком, могут оказаться искаженными, в то время как данные кредитного агентства, сведения о регистрации недвижимого имущества, финансовая отчетность и т.д. являются более достоверными и реально могут использоваться. Если решено, например, что данные о заемщиках, предоставленные филиалами, ненадежны, то скоринговая карта может быть построена исключительно на данных кредитного бюро.

Банк решает самостоятельно - разработать скоринговую карту на основе только внутренних данных или добавить к этим данным еще и внешние источники, такие как кредитные бюро и внешние информационные провайдеры. Предпочтительно иметь эти данные в электронном виде, хотя в российской банковской практике, к сожалению, до сих пор практикуется «бумажный» вариант анкет заемщика, которые буквально вручную приходится вносить в компьютер. Естественно, это требует дополнительных ресурсов и задерживает процесс разработки. При этом любопытен тот факт, что региональные отделения в этом вопросе зачастую оказываются более «подкованными» и «продвинутыми» по сравнению с центром.

Определившись с типом данных, следует переходить к непосредственному их сбору. Собирать их необходимо в строго определенном формате, отражающем параметры проекта разработки скоринговой карты.

Проектные параметры прежде всего включают в себя определение «хороших» и «плохих» заемщиков, временной горизонт и ограничения (исключения) в использовании определенных данных при создании выборки и непосредственно в процессе разработки карты.

Есть поля, обязательные к заполнению, а есть опционные. В первую очередь нас интересуют следующие поля, извлеченные из данных:

l номер клиента/идентификационный номер;

l дата обращения/получения кредита;

l демографические характеристики заемщика;

l история задолженности в течение жизни скоринговой карты;

l индикатор заявки заемщика - Одобрить/Отказать;

l продукт (тип кредита);

l текущий статус заемщика (например, нет операций по счету/счет закрыт/потеря пластиковой карты/мошенничество и т.д.)

При разработке скоринговой карты поведения заемщика учитывается вся информация на протяжении определенного временного интервала, обычно за последние 6 - 12 месяцев.

В зависимости от бизнес-целей карты в нее могут добавляться всевозможные другие данные, в том числе демографические: возраст, регион, время проведения определенных акций, индикаторы на основе данных бюро и любые другие критерии, которые могут оказаться полезными при создании всестороннего профиля клиентской базы вашего банка.

Данные формируются в структуре, соответствующей задаче проекта. Например, эти банковские данные могут быть размещены с многократными строками для каждой комбинации продукта/учетной записи или с отдельной строкой для каждой учетной записи и многократных столбцов для каждого продукта.

Подготовка данных занимает 90% ресурсов проекта. В принципе, процесс моделирования мог бы принести гораздо большую выгоду, но после изнурительной фазы подготовки данных времени, чтобы провести очистку моделей предсказания, как правило, просто не остается.

Угроза срыва проекта кроется на стадии подготовки данных, когда они идентифицируются, трансформируются и собираются из различных источников, преобразуются и объединяются. Во многих случаях получение данных занимает столько времени, что на выполнение других задач, в том числе и анализа данных, его уже практически не хватает.

3 Этап: Качество и очистка данных. Определение параметров проекта. Период «созревания».

Скоринговые карты строятся исходя из предположения о том, что «прошлое отражает будущее». Таким образом, базируясь на данных об открытых ранее кредитах и анализируя имеющуюся информацию, можно предсказать результат (поведение) будущих заемщиков. Для того чтобы корректно выполнить этот анализ, нужно собрать необходимые данные за определенный промежуток времени, а затем осуществить их мониторинг в течение другого определенного отрезка времени и оценить, были они хорошими или плохими. Собранные данные (переменные) наряду с соответствующей классификацией (цель: «хороший»/»плохой») составляют основу для разработки скоринговой карты.

Процесс определения временного горизонта может быть представлен следующим образом. Предположим, что очередной кредит был предоставлен 1 февраля 2009 г. В некоторый момент времени в будущем (например, через 90 дней) вы должны будете определить, был ли этот заемщик «хорошим» или «плохим». «Окно созревания» представляет собой тот промежуток времени, когда заемщик, собственно говоря, имел возможность себя проявить (цель: 90+). «Окно выборки» представляет собой тот промежуток времени, когда те или иные заемщики отбираются для анализа (попадают в выборку). Рекомендуется также проанализировать, какой период «созревания» является идеальным для того или иного продукта (региона, типа клиента и т.п.). В некоторых случаях, таких как мошенничество и банкротство, временной период уже известен или предопределен. Но, тем не менее, вышеописанный анализ полезно выполнить для того, чтобы определить идеальное «окно созревания».

Самый простой способ определить «окна созревания» и «выборки» состоит в том, чтобы проанализировать портфель на предмет просроченной задолженности и применить различные сценарии «плохих» случаев в течение определенного времени: просрочка более 30,60,90 дней. Хороший источник для подобных данных - ежемесячная или ежеквартальная отчетность, имеющаяся в любом отделе кредитных рисков.

4 Этап: Исключения

Определенные записи о заемщиках должны быть исключены из выборки, используемой для разработки скоринговой карты. В целом набор данных для скоринга должен отражать обычную (нормальную) ситуацию и реальных заемщиков, которые ежедневно обращаются в банк с целью получения кредита. Скоринговые карты, разрабатываемые для определенных целей, например, выявление мошенничества, могут также использовать некоторые дополнительные критерии и, соответственно, особые выборки. Подобные наборы данных специфичны и имеют определенную направленность: это работники самого банка, VIP-клиенты, зарубежные клиенты, «отказники» по кредитам, заемщики с утерянными/похищенными карточками, несовершеннолетние или умершие. Заметим, что некоторые программные разработчики скоринговых карт (например, SAS) сознательно включают данные об «отказниках» для того, чтобы восстановить реальный портрет клиента с улицы. С точки зрения логики это является наилучшим подходом.

Другой способ применения метода исключений состоит в том, что можно рассматривать только определенный сегмент (однородную аудиторию, которая принимается за типичную). Например, если задача состоит в построении скоринговой карты для больших городов, то туда не стоит включать записи о заемщиках, проживающих в сельской местности. Точно так же любой регион в силу своих демографических и географических (климатических) особенностей заслуживает разработки собственной скоринговой карты на основе данных о клиентах исключительно данного региона.

Обычно скоринговая карта включает от пяти до пятнадцати параметров. Что это за параметры и как они оцениваются, узнать постороннему человеку невозможно. Такая конфиденциальность объясняется высокой ценой продукта. Банк или покупает его у компании-разработчика, или же разрабатывает самостоятельно, анализируя собственное «кредитное кладбище», то есть базу данных по невозвращенным кредитам, и пытается найти общее между недобросовестными плательщиками. Во втором случае банку приходится поначалу настежь распахнуть ворота и выдавать деньги лишь на основе документов, подтверждающих платежеспособность заемщика.

Итак, разработка скоринговых карт позволяет во многом облегчит работу банка в части оценки уровня риска, а так же значительно сократить время на обработку кредитной заявки за счет уже имеющихся данных в так называемом «кредитном кладбище».