Desarrollo de un sistema inteligente para predecir la deserción universitaria en Colombia mediante técnicas de machine learning
##plugins.themes.bootstrap3.article.main##
Resumen
Introducción: La deserción estudiantil es un desafío crítico a nivel global con profundos impactos socioeconómicos e institucionales. En promedio, uno de cada cinco estudiantes abandona sus estudios, situación que limita la movilidad social, profundiza inequidades y reduce la sostenibilidad de los sistemas educativos.
Objetivo: Desarrollar un sistema inteligente para predecir la deserción universitaria en Colombia teniendo en cuenta el riesgo de abandono académico, con el fin de implementar intervenciones tempranas y personalizadas.
Metodología: El estudio, enmarcado en la Ciencia del Diseño (DSR), utilizó un dataset longitudinal de 104,147 registros de una universidad colombiana. Se aplicó un riguroso preprocesamiento, incluyendo la reclasificación de la variable objetivo y la ingeniería de 27 características predictoras. Se evaluaron 7 algoritmos, seleccionando LightGBM, el cual fue optimizado en sus hiperparámetros y balanceado con SMOTE (Synthetic Minority Over-sampling Technique).
Resultados: LightGBM demostró ser el algoritmo superior con un F1-Score ponderado de 0.8125. El modelo optimizado alcanzó una precisión global del 87% y un F1-Score de 0.83 para la clase "Desertó". La calibración estratégica del umbral de decisión a 0.45 elevó el recall al 87%, identificando correctamente a 1,447 de 1,654 desertores reales. El análisis SHAP confirmó que el PORCENTAJE_AVANCE_REAL fue el predictor más influyente con un impacto de 1.45.
Conclusiones: El rendimiento académico acumulado, la tendencia de las calificaciones y el porcentaje de avance real constituyen los predictores más determinantes del abandono, en interacción con variables socioeconómicas como el estrato de ingreso y demográficas como el grupo etario.
Descargas
##plugins.themes.bootstrap3.article.details##

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Los artículos publicados son de exclusiva responsabilidad de sus autores y no reflejan necesariamente las opiniones del comité editorial.
La Revista INGE CUC respeta los derechos morales de sus autores, los cuales ceden al comité editorial los derechos patrimoniales del material publicado. A su vez, los autores informan que el presente trabajo es inédito y no ha sido publicado anteriormente.
Todos los artículos están bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Internacional.
https://orcid.org/0000-0002-8354-6396
