
Olá.
Somos a equipe Advanced Analytics GlowByte e estamos lançando uma série de artigos sobre modelagem em gerenciamento de risco de crédito. O objetivo do ciclo é falar brevemente sobre o campo, expandir o vocabulário de termos profissionais e fornecer links para artigos e livros úteis. No artigo introdutório, mostraremos as características da aplicação do ML e do DS no campo do risco de crédito, sem nos aprofundarmos na área temática.
A seguir, vamos revelar as questões da metodologia de modelagem, do trabalho com os componentes do risco de crédito, bem como as abordagens de calibração e validação, que levam em consideração as especificidades do funcionamento dos modelos em um banco.
A base das publicações é a nossa experiência de projeto no desenvolvimento e implementação de modelos analíticos no setor bancário.
E agora sob o gato.
Quais são os riscos?
Em termos simples, o risco de crédito é o risco de os clientes violarem as condições de pagamento dos fundos ao abrigo dos contratos de empréstimo.
Vamos nos concentrar em três desafios que surgem no âmbito da gestão de risco de crédito.
- Modelagem de classificação;
- Oferta de crédito;
- Cálculo do nível de perdas esperadas.
Por que exatamente neles?
- Essas tarefas são sempre relevantes para as instituições financeiras;
- Eles podem ser transferidos para outras indústrias (telecomunicações, indústria, seguros);
- Eles têm espaço suficiente para métodos de ML e DS.
Para a classificação geral de riscos das instituições financeiras e o contexto, consulte a revisão [1] .
Tubulação de todos (pipeline) ou esquema do processo de crédito
Esquematicamente, o processo de crédito é assim:

Parte desse processo, desde a aplicação até a emissão, é chamada de transportador de crédito. Existem simplificações neste esquema. Por exemplo, consideramos o processo dentro da estrutura de um produto de empréstimo, ou seja, questões de marketing (otimização de marketing, canibalização de produtos, rotatividade de clientes, etc.) permanecem fora dos parâmetros. Os processos de prescoring, ajuste de classificação de especialistas e o uso de fatores de parada pelos subscritores são excluídos do pipeline. Fatores stop significam restrições, cuja natureza está, antes de mais nada, na estrutura do produto que o banco oferece ao cliente. Um exemplo é o ingresso de um cliente na lista de falidos ou a presença de inadimplência em empréstimos em outros bancos.
Modelagem de classificação
A tarefa da modelagem de classificação (RM) é construir um modelo de classificação do cliente para classificação subsequente. A classificação é realizada em relação a vários eventos negativos - deterioração da qualidade de crédito, falência, etc.
Dependendo do contexto, esta tarefa pode ser classificada de diferentes maneiras:
Por estágio do ciclo de vida do cliente:
- A pontuação de aplicativo (aplicativo) é usada para novos clientes ou clientes com um histórico pequeno (ou antigo e irrelevante) em uma empresa financeira. Na construção de tal modelo de classificação, o perfil e perfil do cliente, dados sobre seu comportamento de pagamento em outras instituições financeiras (disponíveis no Bureau of Credit Histories) e dados sobre a entrada de listas diferentes, por exemplo, listas negativas do Banco Central para pessoas jurídicas, são importantes. A pontuação do aplicativo é usada para decidir se um empréstimo deve ser concedido a um candidato.
- . — -. , .
:
- «» : ( ) , .
- «» : . , , , .
:
- «» . . .
- «» . ( ) . — Z-score [2].
:
- . .
- .
:
- Stand-alone — , . — . , .
- «Supply chain finance» — . , , , ( ) . , — , [3].
:
- : , , . — , ( , ).
- , .. . , .. .
As peculiaridades de resolver este problema na primeira aproximação podem ser encontradas em [1] , [4] , [5] , [6]. Pretendemos falar sobre as características do design no próximo artigo do ciclo, dedicado à metodologia de desenvolvimento.
Entre as tarefas relacionadas, vale a pena mencionar a tarefa de oferta de crédito (veja abaixo) e a tarefa de selecionar um limite de corte com base em uma pontuação de pontuação - determinar o limite de aprovação. O último problema não é abordado neste artigo, mas contém espaço para abordagens de ML de ponta. Por exemplo, existem tentativas de usar RL [7] .
Devemos também mencionar brevemente as tendências atuais para aumentar a qualidade dos modelos de modelagem de classificação desenvolvidos:
A modelagem de classificação é cada vez menos encontrada como uma tarefa independente e cada vez mais em conjunto com outras, sendo parte de um aplicativo aplicado para resolver problemas mais gerais. Uma delas é a oferta de crédito. Nós vamos para isso.
Oferta de crédito ou como fazer uma oferta irrecusável

O resultado do modelo de rating (o valor absoluto da estimativa da probabilidade de default - PD) pode ser utilizado para solucionar o problema da oferta de crédito. Por oferta de crédito entendemos, em primeiro lugar, a tarefa de definir um limite inicial para um cliente.
Obviamente, o valor de PD sozinho - a previsão da probabilidade de inadimplência - não é suficiente para determinar o limite ótimo. Você precisa entender a faixa aceitável de valores-limite razoáveis para oferecer aos clientes. Isso é necessário para que o valor reflita, pelo menos indiretamente, as necessidades do cliente e sua capacidade de serviço da dívida.
Uma referência neste caso pode ser, por exemplo, a rotação dos fundos próprios do cliente para produtos que não sejam de crédito.
O que mais você precisa saber? Para uma melhor compreensão do problema, é necessário ter uma ideia da estrutura do custo do empréstimo. É apresentado esquematicamente no seguinte diagrama (mostrado em [11] ):

"Recurso" - o valor do dinheiro à custa do qual o empréstimo é realizado (por exemplo, a taxa sobre os depósitos, que atrai o dinheiro dos depositantes e fornece o suprimento de dinheiro necessário). “Margem” é o lucro esperado de um empréstimo. “Risco” - dedução em caso de inadimplência. "Despesas" - os custos de atração e manutenção.
Nesta estrutura, a modelagem de classificação pode ser usada para determinar o tamanho e a estrutura do bloco de Risco. O "recurso" é amplamente determinado pela taxa básica do Banco Central. "Custos" e "margem" são componentes do produto, geralmente indicados no passaporte do produto.
Em outras palavras, "Risco" é apenas um dos componentes que afetam a lucratividade final de uma negociação.
E quanto aos outros? Parece que surge um problema de otimização. Vamos tentar formalizar isso. Deve-se ressaltar que as opções podem ser muitas, e vale a pena confiar, antes de tudo, na tarefa do negócio e no contexto do processo de desenvolvimento.
Vamos começar com uma opção simples e depois mostrar os pontos de desenvolvimento potenciais da solução. A maneira mais fácil é otimizar a lucratividade de uma negociação.
Seja o contrato de empréstimo emitido no valor L (limite). Este contrato tem uma probabilidade prevista de PD padrão. Como uma primeira aproximação, assumimos que o cliente no momento do default tem uma dívida igual a L.
Então o problema de otimização será parecido com este:

Vemos que PD é fixo e a dependência de L é linear. Parece que não há nada para otimizar.
Porém, na vida real, a PD depende de L pelos seguintes motivos: quanto maior o limite, mais difícil é o serviço da dívida e, consequentemente, maior a probabilidade de inadimplência. Nesse caso, nossa tarefa realmente se transforma em otimização. No entanto, também há uma nuance aqui. Existem clientes com rendimentos diferentes na amostra, portanto, valores absolutos não serão suficientes. É melhor construir dependências não no limite, mas no nível de carga da dívida, ou seja, parâmetro:

Vício pode ser restaurado a partir de dados históricos ou dados piloto.
Além disso, as paradas do produto podem afetar a tarefa de otimização. Por exemplo, no passaporte do produto, podem ser indicados os limites aceitáveis do nível de risco (probabilidade de inadimplência). Em seguida, a otimização é realizada apenas até o limite especificado.
Para complicar ainda mais, quem está interessado, então sob o gato:
, (, ) (-, EAD — Exposure at default — ) . , , ( EAD, , LGD – Loss Given Default).
EAD . LGD , (, ..) ( LGD ). 0.9-1.
, PD . :
, (, ), , :
«» — , «» — . Marketing Optimization.
— . , , , ..
. -.

EAD . LGD , (, ..) ( LGD ). 0.9-1.
, PD . :

, (, ), , :

«» — , «» — . Marketing Optimization.
— . , , , ..
. -.
O que mais procurar no Google? Palavras-chave limite baseado em risco, abordagem baseada no lucro de gestão de limite de crédito.
Assim, o dinheiro é oferecido e repassado aos clientes. Mas alguns deles estão começando a se atrasar. Como administrar a situação?
Reservas e a função do DS para seu cálculo

Determinar a magnitude do risco é fundamental nas atividades do banco: dependendo do apetite de risco, o banco determina com quais clientes está pronto para trabalhar. Mas em qualquer caso, para minimizar possíveis perdas, uma reserva de caixa é formada na forma de dinheiro ou títulos líquidos. No pior dos casos, o banco perde toda a carteira, mas isso é improvável, portanto, não é muito eficiente ter uma reserva completa. É necessário algum equilíbrio.
Para fazer isso, você precisa determinar com precisão a quantidade de dinheiro que deve ser reservada. É assim que surge a tarefa de garantir a adequação de capital (capital exigido) para as perdas esperadas. (Perda Esperada - EL). Os requisitos de adequação de capital são determinados e monitorados pelo regulador (Banco Central).
Referência histórica:
, . . .
, DS ML .
1974 , .
Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).
, the Basel I Capital Accord RWA, .
, 100 (-, ):
.. 4.
. : XGBoost , , .
Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.
Basel III . . . [6].
? , , RWA:
1. – . — 590-.
( [12]):
, 5 , . , (, ), ( ) .
2. (, 483-) PD, LGD EAD.
:
, , , . , , , , data scientist’.
(Expected Loss – EL) (Unexpected Loss – UL).
, DS ML .
1974 , .
Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).

, the Basel I Capital Accord RWA, .
, % | |
0 | |
50 | |
100 |

.. 4.
. :
Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.
Basel III . . . [6].
? , , RWA:
1. – . — 590-.
( [12]):
« , 590-, . , , ( ) . .».
, 5 , . , (, ), ( ) .
2. (, 483-) PD, LGD EAD.
:

, , , . , , , , data scientist’.
(Expected Loss – EL) (Unexpected Loss – UL).
As perdas em rublos são o produto de três componentes:
- probabilidade de inadimplência (PD - Probabilidade de inadimplência)
- o valor da dívida do pagador no momento da inadimplência (EAD - Exposição na inadimplência),
- uma parte desse valor que permanecerá por pagar (LGD - Loss Given Default).
Em geral, esta fórmula:

encontraremos mais de uma vez em uma série de artigos - este é um refrão do problema de provisionamento em risco de crédito.
Após este tipo de decomposição de EL (ECL), torna-se possível simular (DS e ML, alô!)) Cada um dos valores mencionados PD (modelo de classificação binária), LGD (modelo de regressão), EAD (modelo de regressão), onde, dentro dos limites especificados pelo controlador requisitos em diferentes etapas da modelagem (desenvolvimento, calibração e validação), torna-se possível a utilização de métodos estatísticos e algoritmos de aprendizado de máquina.
Para quem gosta de coisas mais complicadas:
EL UL (Value at Risk – VaR) – , ( 99%) .
PD, LGD, EAD , .
3. 9. .
9 :
9 :
9 DS ML-.

PD, LGD, EAD , .
3. 9. .
9 :
- ( );
- ( «Lifetime-» «Lt») PD, LGD, EAD, ; ECL — Expected Credit Losses;
- ( ).
9 :

9 DS ML-.
?
- 29.12.2012 N 192- « »
- 6 2015 . № 483- « »
- 15 2015 . N 3624- « »
- 6 2015 . № 3752- « , »
- [13].
Os regulamentos e instruções estavam preocupados, os livros foram lidos, mas onde está o DS? Como prometido - o DS está nos
Modelagem de classificação |
Oferta de crédito | Cálculo do nível de
perdas esperadas |
|
---|---|---|---|
Problemas
resolvidos com DS / ML |
- Determinação do
algoritmo de classificação; - Determinação do limite de aprovação; - Calibração. |
- Desenvolvimento de um
otimizador; - Desenvolvimento de modelos de seleção de proposta de empréstimo . |
de componentes PD, LGD, EAD; - Calibração. |
conclusões
A principal conclusão depois de escrever um artigo introdutório para nós (abv_gbc, alisaalisa, artysav, Eienkotowaru) é o seguinte: é extremamente difícil descrever resumidamente mesmo três problemas que surgem no cálculo do risco de crédito. Por quê?
Uma metodologia detalhada foi desenvolvida para essas tarefas, o que fornece um bom alimento para o pensamento ML e SD. Essas reflexões desenvolvem abordagens para responder aos desafios cada vez mais complexos do mercado. Ferramentas baseadas em tais abordagens, a partir de complementares, estão gradativamente se tornando as principais na tomada de decisões. Tudo isso junto permite transferir as melhores práticas e intuições de modelagem de risco para outras indústrias (telecomunicações, seguros, indústria). Quais? Contaremos você nos próximos artigos do ciclo.
Lista de termos usados
- Inadimplência - incumprimento das obrigações do contrato de empréstimo. Normalmente, o inadimplemento é considerado o não pagamento nos termos do contrato em 90 dias.
- PD - probabilidade de default - probabilidade de default.
- EAD – exposure at default – . , , = + .
- LGD – loss given default – EAD, .
- EL – expected loss – .
- EL – expected credit loss – .
- – , .
- - – .
- SCF – supply chain finance – — - .
- RWA – risk-weighted assets – , ; .
- (IRB) – , , , .
- 9 (IFRS9) – , , , .
- VaR – , .
[1] Leo Martin, Suneel Sharma e Koilakuntla Maddulety. "Aprendizado de máquina em gerenciamento de risco bancário: uma revisão da literatura." Riscos 7.1 (2019): 29.
[2] en.wikipedia.org/wiki/Altman_Z-score
[3] www.youtube.com/watch?v=rfCamyEURyw&list=PLLQmSdmAWzkKeiOC1b-nxpoACqgfTc0G5&index=7.
[4] Joseph Joseph Breeden. "Uma pesquisa de aprendizado de máquina em risco de crédito." (2020).
[5] Sorokin Alexander. "Construindo cartões de pontuação usando um modelo de regressão logística." Online Journal of Science of Science 2 (21) (2014).
[6] Baesens Bart, Daniel Roesch, Harald Scheule. Análise de risco de crédito: técnicas de medição, aplicações e exemplos em SAS. John Wiley & Sons, 2016.
[7] github.com/MykolaHerasymovych/Optimizing-Acceptance-Threshold-in-Credit-Scoring-using-Reinforcement-Learning
[8] riskconference.ru/wp-content/uploads/2019/10/%D0%A1%D1%83%D1 % 80% D0% B6% D0% BA% D0% BE_% D0% 92% D0% A2% D0% 91.pdf
[9] Masyutin Alexey. "Pontuação de crédito com base em dados de redes sociais." Business Informatics 3 (33) (2015).
[10] habr.com/ru/company/vtb/blog/508012
[11] vc.ru/finance/83771-kak-formiruetsya-procentnaya-stavka-po-kreditam
[12] Farrakhov Igor. "IFRS 9: Provisões para estimativa de perdas de crédito esperadas." Análise bancária. Aplicativo “MELHOR PRÁTICA 2 (2018).
[13] Bellini Tiziano. IFRS 9 e CECL Modelagem e Validação de Risco de Crédito: Um Guia Prático com Exemplos Trabalhados em R e SAS. Academic Press, 2019.