O PODER PREDITIVO DOS MODELOS COM APRENDIZADO DE MÁQUINA É SUPERIOR AOS MODELOS TRADICIONAIS PARA ANÁLISE DO RISCO DE CRÉDITO?

ALEX CERQUEIRA PINTO

Resumo


O objetivo desse trabalho foi desenvolver e analisar, para o risco de crédito, se modelos com uso de aprendizado de máquina apresentam melhor poder preditivo comparado aos tradicionais e aplicar técnicas de interpretabilidade ao de melhor performance. A metodologia adotada corresponde a pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público-alvo foram empresas do segmento atacado. Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis das empresas, e variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC de 0.99 e acurácia de 0.98, na base teste. Na análise de interpretabilidade, via sharp value, os resultados corroboram o sentido econômico das variáveis. Do mesmo modo, a interpretabilidade via interações mostrou a influência da interação entre variáveis para melhora preditiva do modelo. Estes resultados corroboram a tendência de crescimento do uso de modelos com técnicas de machine learning na área econômica.


Texto completo:

PDF

Referências


Banco Central Do Brasil – Bacen. (2009). Resolução C.M.N. nº 3.721. Dispõe sobre a implementação de estrutura de gerenciamento do risco de crédito.

Betancourt, G. A. (2005). Las máquinas de soporte vectorial (SVMs). Scientia et technica, 1(27).

Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.

Black, F., & Scholes, M. (1973). The pricing of options and corporate liabilities. Journal of political economy, 81(3), 637-654.

Boser, B. E., Guyon, I. M., & Vapnik, V. N. (1992, July). A training algorithm for optimal margin classifiers. In Proceedings of the fifth annual workshop on Computational learning theory (pp. 144-152).

Brito, G. A. S., Assaf Neto, A., & Corrar, L. J. (2009). Sistema de classificação de risco de crédito: uma aplicação a companhias abertas no Brasil. Revista contabilidade & finanças, 20(51), 28-43.

Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16, 321-357.

Chen, T., & Guestrin, C. (2016, August). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785-794).

Damodaran, A. (2010). Avaliação de investimentos: ferramentas e técnicas para a determinação do valor de qualquer ativo. Qualitymark.

Friedman, J. H., & Popescu, B. E. (2008). Predictive learning via rule ensembles. The Annals of Applied Statistics, 2(3), 916-954.

Guimarães, A., & Moreira, T. B. S. (2008). Previsão de insolvência: um modelo baseado em índices contábeis com utilização da análise discriminante. Revista de Economia Contemporânea, 12(1), 151-178.

Grmanová, E., & Ivanová, E. (2018). Efficiency of banks in Slovakia: Measuring by DEA models. Journal of International Studies Vol, 11(1).

Gu, S., Kelly, B., & Xiu, D. (2018). Empirical asset pricing via machine learning (No. w25398). National Bureau of Economic Research.

Haykin, S. (2007). Redes neurais: princípios e prática. Bookman Editora.

Hull, J. (2012). Risk management and financial institutions, Web Site (Vol. 733). John Wiley & Sons.

Jackson, R. H., & Wood, A. (2013). The performance of insolvency prediction and credit risk models in the UK: A comparative study. The British Accounting Review, 45(3), 183-202.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112, p. 18). New York: springer.

Lewis, D. D. (1998, April). Naive (Bayes) at forty: The independence assumption in information retrieval. In European conference on machine learning (pp. 4-15). Springer, Berlin, Heidelberg.

Lundberg, S. M., & Lee, S. I. (2017). A unified approach to interpreting model predictions. In Advances in neural information processing systems (pp. 4765-4774).

Luo, C., Wu, D., & Wu, D. (2017). A deep learning approach for credit scoring using credit default swaps. Engineering Applications of Artificial Intelligence, 65, 465-470.

McCulloch, W. S., & Pitts, W. (1943). A logical calculus of the ideas immanent in nervous activity. The bulletin of mathematical biophysics, 5(4), 115-133.

Merton, R. C. (1974). On the pricing of corporate debt: The risk structure of interest rates. The Journal of finance, 29(2), 449-470.

Perlin, M. (2017). GetDFPData: Reading Annual Financial Reports from Bovespa's DFP, FRE and FCA System. R package version 0.5. Corporate disclosure quality and the cost of debt. Accounting review, 459-474, P.(1998). Disponível em: https://CRAN. R-project. org/package= GetDFPDataSengupta.

Pesaran, M. H., Schuermann, T., Treutler, B. J., & Weiner, S. M. (2006). Macroeconomic dynamics and credit risk: a global perspective. Journal of Money, Credit and Banking, 1211-1261.

Soares, R. A., & Rebouças, S. M. D. P. (2015). Avaliação do desempenho de técnicas de classificação aplicadas à previsão de insolvência de empresas de capital aberto brasileiras. Revista ADM. MADE, 18(3), 40-61.

Souza, Ê. B. M., & Corrar, L. J. (2010). O Uso do Modelo de Merton para Obtenção de Spreads de Crédito: uma Proposta de Implementação Simplificada. Sociedade, Contabilidade e Gestão, 5(1).

Tian, Y., Shi, Y., & Liu, X. (2012). Recent advances on support vector machines research. Technological and Economic Development of Economy, 18(1), 5-33.

Tukey, J. W. (1977). Exploratory data analysis (Vol. 2, pp. 131-160).

Xia, Y., Liu, C., Li, Y., & Liu, N. (2017). A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring. Expert Systems with Applications, 78, 225-241.


Apontamentos

  • Não há apontamentos.
Associada e indexada à