Predição de sinistros agrícolas: uma abordagem comparativa utilizando aprendizagem de máquina

Autores

  • Arthur Lula Mota Universidade de São Paulo
  • Daniel Lima Miquelluti Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz. Departamento de Economia, Administração e Sociologia.
  • Vitor Augusto Ozaki Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz. Departamento de Economia, Administração e Sociologia.

DOI:

https://doi.org/10.11606/1980-5330/ea161194

Palavras-chave:

seguro agrícola, sinistro, previsão, machine learning

Resumo

O seguro agrícola tem ganho maior atenção no Brasil desde o início da década passada, com a implementação do Programa de Subvenção ao Prêmio do Seguro Rural. O presente estudo testou o desempenho de algoritmos de Machine Learning para as seguradoras anteciparem a ocorrência de sinistro, elaborando previsões por meio de dados de apólices e bases de dados climáticas entre os anos de 2006 e 2017. Foram testados os algoritmos Random Forest, Support Vector Machine e k-Nearest Neighbours. O segundo mostrou melhor performance preditiva de sinistros. No entanto, todos os métodos apresentaram baixa capacidade preditiva para a ocorrência de sinistros.

Downloads

Os dados de download ainda não estão disponíveis.

Referências

Abd Elrahman, S. M. & Abraham, A. (2013), ‘A review of class imbalance problem’, Journal of Network and Innovative Computing 1(2013), 332–340.

Baumgartner, C., Gruber, L. F. & Czado, C. (2015), ‘Bayesian total loss estimation using shared random effects’, Insurance: Mathematics and Economics 62, 194–201.

Bekkar, M. & Alitouche, T. A. (2013), ‘Imbalanced data learning approaches review’, International Journal of Data Mining & Knowledge Management Process 3(4), 15.

Berlato, M. A., Farenzena, H. & Fontana, D. C. (2005), ‘Associação entre El Niño, Oscilação Sul e a produtividade do milho no estado do Rio Grande do Sul’, Pesquisa Agropecuária Brasileira 40(5), 423–432.

Borde, S. F., Chambliss, K. & Madura, J. (1994), ‘Explaining variation in risk across insurance companies’, Journal of Financial Services Research 8(3), 177–191.

Boughorbel, S., Jarray, F. & El-Anbari, M. (2017), ‘Optimal classifier for imbalanced data using Matthews correlation coefficient metric’, PloS one 12(6), e0177678.

Brasil (2017), Provisões técnicas: orientações da SUSEP ao mercado de seguros, previdência complementar aberta, capitalização e resseguro local, Technical report, Superintendencia De Seguros Privados (SUSEP). URL: http://www.agricultura.gov.br/assuntos/riscosseguro/segurorural/relatorios-estatisticos

Brasil (2018), Dados de indenizações – 2006 a 2017, Technical report, Ministerio Da Agricultura, Pecuária E Abastecimento (MAPA). URL: http://www.agricultura.gov.br/assuntos/riscosseguro/segurorural/relatorios-estatisticos

Breiman, L. (2001), ‘Random forests’, Machine learning 45(1), 5–32.

Breiman, L., Friedman, J. H., Olshen, R. A. & Stone, C. J. (1984), ‘Classification and regression trees. Belmont, CA: Wadsworth’, International Group 432, 151–166.

Cabrera, V. E., Fraisse, C. W., Letson, D., Podestá, G. & Novak, J. (2006), ‘Impact of climate information on reducing farm risk by optimizing crop insurance strategy’, Transactions of the ASABE 49(4), 1223–1233.

Castro, C. L. & Braga, A. P. (2011), ‘Aprendizado supervisionado com conjuntos de dados desbalanceados’, Sba: Controle & Automação Sociedade Brasileira de Automatica 22(5), 441–466.

Central, B. (2015), ‘Resolução no 4.444, de 13 de novembro de 2015’.

Chawla, N. V., Bowyer, K. W., Hall, L. O. & Kegelmeyer, W. P. (2002), ‘Smote: synthetic minority over-sampling technique’, Journal of artificial intelligence research 16, 321–357.

Cirino, P. H., Féres, J. G., Braga, M. J. & Reis, E. (2015), ‘Assessing the impacts of ENSO-related weather effects on t he Brazilian agriculture’, Procedia Economics and Finance 24, 146–155.

Cortes, C. & Vapnik, V. (1995), ‘Support-vector networks’, Machine learning 20(3), 273–297.

Cunha, G. R. & Assad, E. D. (2001), ‘Uma visão geral do número especial da RBA sobre zoneamento agrícola no Brasil’, Revista Brasileira de Agrometeorologia 9(3), 377–385.

Cunha, G. R., Dalmago, G. & Estefanel, V. (1999), ‘ENSO influences on wheat crop in Brazil’, Revista Brasileira de Agrometeorologia 7(1), 127–138.

Fawcett, T. (2006), ‘An introduction to ROC analysis’, Pattern recognition letters 27(8), 861–874.

Freitas, M. A. L. (2010), ‘Modelo logístico aplicado ao mercado de seguros de auto no Brasil: cálculo da probabilidade de sinistros’, Indicadores Econômicos FEE 37(3).

Harnek, R. F. (1966), Formula loss reserves, Technical report, Insurance Accounting and Statistical Association.

Hastie, T., Tibshirani, R. & Friedman, J. (2009), The elements of statistical learning: data mining, inference, and prediction, Springer Science & Business Media.

Karatzoglou, A., Smola, A., Hornik, K. & Zeileis, A. (2004), ‘kernlab-an s4 package for kernel methods in R’, Journal of statistical software 11(9), 1–20.

Kuhn, M. et al. (2008), ‘Building predictive models in R using the caret package’, Journal of statistical software 28(5), 1–26.

Liu, C., Berry, P. M., Dawson, T. P. & Pearson, R. G. (2005), ‘Selecting thresholds of occurrence in the prediction of species distributions’, Ecography 28(3), 385–393.

Liu, J., Men, C., Cabrera, V. E., Uryasev, S. & Fraisse, C. W. (2008), ‘Optimizing crop insurance under climate variability’, Journal of Applied Meteorology and Climatology 47(10), 2572–2580.

Mack, T. et al. (1994), ‘Which stochastic model is underlying the chain ladder method’, Insurance: mathematics and economics 15(2-3), 133–138.

Menardi, G. & Torelli, N. (2014), ‘Training and assessing classification rules with imbalanced data’, Data Mining and Knowledge Discovery 28(1), 92–122.

Null, J. (2015), ‘El Niño and La Niña years and intensities’, Golden Gate Weather Services (5 Sep 2013) .

Oliveira, N. V. (2005), Mercados de Seguros: Solvência, Riscos e Eficácia Regulatória, PhD thesis, Erasmus University Rotterdam.

Ozaki, V. A. (2008), ‘Em busca de um novo paradigma para o seguro rural no Brasil’, Revista de Economia e Sociologia Rural 46(1), 97–119.

Pei, Y., Kim, T.-K. & Zha, H. (2013), Unsupervised random forest manifold alignment for lipreading, in ‘Proceedings of the IEEE International Conference on Computer Vision’, pp. 129–136.

Pijl, T. (2017), A framework to forecast insurance claims, PhD thesis, Erasmus University Rotterdam.

Rodrigues, A. & Martins, E. (2009), ‘Gerenciamento da informação contábil através das provisões técnicas constituídas por sociedades seguradoras’, Revista Universo Contábil 6(1), 46–66.

Sousa, K. M. M. (2010), Modelos lineares generalizados e modelos de dispersão aplicados à modelagem de sinistros agrícolas, PhD thesis, Universidade de São Paulo.

Steinmetz, S. & Silva, S. (2017), ‘Início dos estudos sobre zoneamento agrí-cola de risco climático (ZARC) no Brasil’, Santo Antônio de Goiás: Embrapa Arroz e Feijão .

Team, R. C. et al. (2013), ‘R: A language and environment for statistical computing’.

Torgo, L. (2016), Data mining with R: learning with case studies, CRC press.

Torgo, L. & Torgo, M. L. (2013), ‘Package ‘dmwr”, Comprehensive R Archive Network .

Vapnik, V. (2006), Estimation of dependences based on empirical data, Springer Science & Business Media.

Weiss, G. M., McCarthy, K. & Zabar, B. (2007), ‘Cost-sensitive learning vs. sampling: Which is best for handling unbalanced classes with unequal error costs?’, Dmin 7(35-41), 24.

Wright, M. N. & Ziegler, A. (2015), ‘Ranger: a fast implementation of random forests for high dimensional data in C++ and R’, Journal of Statistical Software.

Yang, Y., Qian, W. & Zou, H. (2018), ‘Insurance premium prediction via gradient tree-boosted tweedie compound Poisson models’, Journal of Business & Economic Statistics 36(3), 456–470.

Ye, C., Zhang, L., Han, M., Yu, Y., Zhao, B. & Yang, Y. (2018), ‘Combining predictions of auto insurance claims’, ArXiv.

Zaniboni, N. & Montini, A. (2015), ‘Modelos de Poisson inflada de zeros e binomial negativa inflada de zeros na previsão de sinistro de automóveis’, E&G Economia e Gestão 15(41).

Downloads

Publicado

2020-12-01

Edição

Seção

Artigos

Como Citar

Predição de sinistros agrícolas: uma abordagem comparativa utilizando aprendizagem de máquina. (2020). Economia Aplicada, 24(4), 533-554. https://doi.org/10.11606/1980-5330/ea161194