Resumen
El artículo tuvo como objetivo aplicar la clasificación por clusters para agrupar los datos reportados en relación con los volúmenes de ventas y exportación reportados para las empresas en el Catálogo Central de Datos de Ecuador. Se decidió para ello el empleo del Rapidminer para poder recomendar la utilización de este paquete en posibles situaciones de clases. Se realizó el agrupamiento por clústeres empleando el algoritmo de k-medias, para 2536 empresas en relación con los datos reportados por estas en cuanto a; ventas totales, ventas nacionales, total de exportaciones netas, total de empleados, total de empleados hombres y total de empleados mujeres. Los operadores empleados y presentes en Rapidminer hicieron factible: la fácil lectura del fichero, el empleo del algoritmo de k medias y la obtención de tablas de correlaciones entre las variables señaladas. La posibilidad de representación gráfica facilitó un análisis desde multiples perspectivas.
En relación con el aprendizaje de Rapidminer debe señalarse que este paquete presenta todo un conjunto de operadores que no son de fácil utilización para personal no especializado en estadística y en minería de datos. No obstante si se enfoca el aprendizaje de este en relación con aspectos específicos, como se realizó para el agrupamiento en clústeres y el establecimiento de correlaciones, si pudiera analizarse su posible aplicación en la docencia de las ciencias administrativas. A le vez las posibilidades gráficas que ofrece esta herramienta son muy atractivas para la presentación de resultados.Citas
González Alonso, J. A., et al.González, Y. P. (2015). Análisis de las revistas latinoamericanas de acceso abierto. El caso ecuador. Revista Publicando, 2(2), 12-23.
Hartigan, J. A. (1972). Direct clustering of a data matrix. Journal of the american statistical association, 67(337), 123-129.
Hernandez, A. B. (2015). La detección del fraude contable utilizando técnicas de minería de datos. Revista Publicando, 2(5), 103-113.
INEC. (2015). Estadisticas. Estadisticas Agropecuarias. Retrieved Febrero, 2016, de http://www.ecuadorencifras.gob.ec/estadisticas-agropecuarias-2/
Jain, A. K. (2010). Data clustering: 50 years beyond k-means. Pattern Recognition Letters, 31(8), 651-666.
Jungermann, F. (2009). Information extraction with rapidminer. Paper presented at the Proceedings of the GSCL Symposium”™Sprachtechnologie und eHumanities.
Kou, G., Peng, Y., et al.Wang, G. (2014). Evaluation of clustering algorithms for financial risk analysis using mcdm methods. Information Sciences, 275, 1-12.
Pazmiño Santacruz, M. R., et al.González Alonso, J. A. (2014). Análisis exploratorio sobre las publicaciones relacionadas con la comunicación organizacional en pymes. Revista Publicando, 1(1).
Punj, G., et al.Stewart, D. W. (1983). Cluster analysis in marketing research: Review and suggestions for application. Journal of marketing research, 134-148.
Sánchez, í. C. (2000). Aportaciones de la matemática a la metodología económica. Psicothema, 12(2), 103-107.
Sharma, A., et al.Lambert, D. M. (2013). Segmentation of markets based on customer service. International Journal of Physical Distribution & Logistics Management.