Modelo de regresión logística binario en r para identificar factores de riesgo de morosidad de una empresa financiera de Chiclayo
Resumen
El objetivo general fue el de construir un modelo de regresión logística binario para
identificar los factores de riesgo de morosidad en una Empresa financiera de Chiclayo en
el periodo de julio a octubre del 2023.
Este diseño fue observacional, explicativo, retrospectivo y la muestra de estudio no
probabilística estuvo constituida por 413 clientes en la Empresa financiera en estudio.
El instrumento para la recolección de los datos contuvo las características o
factores que fueron consideradas de riesgo en los clientes de la financiera, y que se
eligieron como de riesgo crediticio, estimando su riesgo probabilístico de poseer la
condición de moroso en por lo menos dos cuotas consecutivas.
Las variables de riesgo de morosidad fueron sexo del cliente, ocupación, número de
hijos y sentencia por omisión a la asistencia familiar, cuyo modelo de Regresión Logística
binario con buena bondad de ajuste fue p = 1
1+ e−A
, donde A es A = -1.571+ 0.804
(número de hijos) – 1.784 (sexo) + 5.01 (Ocupación Policía) + 4.335 (ocupación Abogado)
+ 3.619 (ocupación Docente) + 3.37 (ocupación dependiente) + 1.274 (ocupación
independiente), con una precisión del 81.15%, una especificidad del 85.25%, sensibilidad
del 77.05% y probabilidad bajo la curva COR del 89.1%; con lo que indicaron que el
modelo es bueno para predecir la morosidad en los clientes. The general objective was to build a binary logistic regression model to identify the
risk factors for delinquency in a financial company in Chiclayo in the period from July to
October 2023.
This design was observational, explanatory, retrospective and the non-probabilistic
study sample consisted of 413 clients in the financial company under study.
The instrument for data collection contained the characteristics or factors that were
considered risky in the financial company's clients, and that were chosen as credit risk,
estimating their probabilistic risk of being delinquent in at least two installments.
consecutive.
The default risk variables were client's sex, occupation, number of children and
sentence for omission of family assistance, whose binary Logistic Regression model with
good goodness of fit was p =
1
1+ e−A
, where A is A = -1.571 + 0.804 (number of children)
– 1.784 (sex) + 5.01 (Police Occupation) + 4.335 (Lawyer occupation) + 3.619 (Teaching
occupation) + 3.37 (dependent occupation) + 1.274 (independent occupation), with an
accuracy of 81.15%, a specificity of 85.25%, sensitivity of 77.05% and probability under
the COR curve of 89.1%; with which they indicated that the model is good for predicting
customer delinquency.
Colecciones
- Ingeniería de Sistemas [151]