Resumen
La presente investigación es un primer acercamiento para estudiar los factores que influyen en el alto índice de deserción estudiantil que ocurre en el proceso de nivelación implementado por el Sistema Nacional de Nivelación Estudiantil que lleva a cabo el gobierno de Ecuador. En este escenario, se toma como caso de estudio la Universidad Técnica Estatal de Quevedo, la cual consta con un registro de 5 periodos académicos que sustentan la base para un análisis inteligente de datos. Para este análisis, se emplean algunos algoritmos basados en arboles de decisión para encontrar un modelo matemático que sea capaz de obtener un alto grado de precisión en relación con la problemática. En este proceso se realiza un preprocesamiento de la información para obtener los mejores ajustes del modelo y se concluye que el algoritmo LMT es le mejor representación de problema obtiene, con una exactitud del 83% y una cantidad razonable de árboles y hojas.Citas
Bae, B. P. (2015). Using machine learning algorithms for housing price prediction: The case of Fairfax County, Virginia housing data. Expert Syst. Appl, 42(6), 2928–2934.
Fayyad. (1996). The KDD Process for Extracting Useful Knowledge from Volumes of Data.
Frank, I. H. (2000). Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann.
García, G. í. (2010). Minería de Datos en la Educación,” , 2010. Intel. en Redes Comun., 12--21.
Holte, R. C. (1993). Very Simple Classification Rules Perform Well on Most Commonly Used Datasets. Mach. Learn, 11(1), 63–90.
Witten, I. H., & Eibe Frank, L. T. (2007). Weka: Practical Machine Learning Tools and Techniques with Java Implementations. ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems., (págs. 192–196).