Clustering de datos de alta dimensionalidad mediante reducción de dimensionalidad no lineal
Palabras clave:
clustering, reducción de dimensionalidad, UMAP, aprendizaje no supervisado, análisis multivarianteResumen
El análisis de datos de alta dimensionalidad presenta limitaciones debido a la pérdida de capacidad discriminativa y la dificultad para identificar patrones estructurales. Este estudio tiene como objetivo evaluar la efectividad del clustering mediante técnicas de reducción de dimensionalidad no lineal. Se empleó un enfoque cuantitativo basado en aprendizaje no supervisado, utilizando datos provenientes de organismos nacionales e internacionales, los cuales fueron sometidos a procesos de depuración, normalización y transformación. Se aplicaron algoritmos como UMAP y t-SNE para la reducción de dimensionalidad, combinados con K-Means y DBSCAN para el agrupamiento, además de un modelo de ecuaciones estructurales para analizar relaciones latentes. Los resultados evidencian que la reducción no lineal mejora la calidad del clustering, destacando el mejor desempeño de la combinación UMAP + K-Means con mayores niveles de cohesión y separación entre grupos. Asimismo, se identificaron tres clústeres diferenciados asociados a niveles de madurez digital y capacidad científico-innovadora, lo que permitió una interpretación más clara de las estructuras latentes. Estos hallazgos confirman la relevancia de integrar técnicas avanzadas para optimizar el análisis de datos complejos.
Descargas
Referencias
Aguirre Sala, J. F. (2022). Modelos y buenas prácticas evaluativas para detectar impactos, riesgos y daños de la inteligencia artificial. Paakat: Revista de Tecnología y Sociedad, 12(23). https://doi.org/10.32870/Pk.a12n23.742
Cadena-Vargas, E., et al. (2021). La vulnerabilidad social en México: distribución espacial, patrones y clústeres. Estudios Demográficos y Urbanos, 36(3), 1–28.
Calderón-Vargas, C., Muñoz Castaño, J., Vargas Rincón, M., Rincón Acosta, V., & Mendieta Hernández, M. (2021). Aprendizaje profundo para escalas pronósticas en la prescripción médica. Ingeniería y Ciencia, 17(34), 7–22.
Castro Cáceres, M., Chávez Salazar, D., & Urbizagástegui-Alvarado, R. (2023). Minería de textos en editoriales políticos mediante técnicas de análisis de datos. Revista de Comunicación, 22(1), 71–87. https://doi.org/10.26441/RC22.1-2023-3025
Chambi Condori, P. (2023). Segmentación de mercado mediante machine learning en contextos de crisis. Industrial Data, 26(1), 275–301. https://doi.org/10.15381/idata.v26i1.23623
Chanchí-Golondrino, G., Ospina-Alarcón, M., & Saba, M. (2022). Sistema IoT para monitoreo climatológico con análisis de datos. Revista Científica, 44(2), 257–271. https://doi.org/10.14483/23448350.18470
Contreras-Contreras, G., Medina-Delgado, B., Acevedo-Jaimes, B., & Guevara-Ibarra, D. (2022). Metodología de agrupamiento de datos usando aprendizaje automático. Tecnura, 26(72), 42–58. https://doi.org/10.14483/22487638.17246
García-Ariza, J., et al. (2022). Aplicación del aprendizaje no supervisado en detección de enfermedades agrícolas. Inge CUC, 18(2), 89–100. https://doi.org/10.17981/ingecuc.18.2.2022.07
Grisales-Aguirre, A., & Figueroa-Vallejo, C. (2022). Modelado de tópicos y aprendizaje automático en revisiones sistemáticas. Revista de Investigación, Desarrollo e Innovación, 12(2), 279–292. https://doi.org/10.19053/20278306.v12.n2.2022.15271
Hermitaño Castro, J., et al. (2022). Machine learning aplicado al riesgo crediticio: revisión sistemática. Interfases, 15, 160–178. https://doi.org/10.26439/interfases2022.n015.5898
Lasso Cardona, L., et al. (2022). Big data y datificación en América Latina. Revista Latinoamericana de Comunicación Tecnológica, 14(2). https://doi.org/10.22335/rlct.v14i2.1594
Matute-Pinos, K., & Bojorque-Chasi, R. (2021). Sistemas expertos en gestión de talento humano. Ingenius, 26. https://doi.org/10.17163/ings.n26.2021.04
Norambuena, J., & Badilla-Quintana, M. (2022). Analítica de aprendizaje en educación superior. Linguagem e Tecnologia. https://doi.org/10.35699/1983-3652.2022.36310
Parra Sánchez, J., et al. (2023). Inteligencia artificial aplicada a la personalización educativa. Magis, Revista Internacional de Investigación en Educación. https://doi.org/10.15332/25005421.7904
Pérez Londo, N., Lema Londo, D., & Toapanta Yugcha, E. (2023). Clustering en modelos climáticos del Ecuador. Polo del Conocimiento, 8(8), 2169–2185. https://doi.org/10.23857/pc.v8i8.5962
Quintanar-Casillas, R., & Hernández-López, M. (2022). Modelos adaptativos en educación basados en datos. Revista Docentes 2.0, 15(1), 41–58. https://doi.org/10.37843/rted.v15i1.308
Ramírez, J., & Duque-Méndez, N. (2022). Evaluación de algoritmos no supervisados con datos climáticos. Ingeniería y Desarrollo, 40(2), 131–165. https://doi.org/10.14482/inde.40.02.622.553
Rosati, G. (2022). Integración de fuentes de datos en estudios territoriales. Quid 16, 17, 38–60.
Sánchez Grajales, J., Cuartas Arroyave, D., & Bucheli Guerrero, V. (2022). Clustering aplicado a vulnerabilidad poblacional. Investigación e Innovación en Ingenierías, 10(2), 7–24. https://doi.org/10.17081/invinno.10.2.5973
Zambrano Félix, F., et al. (2023). Machine learning en accesibilidad web: revisión metodológica. Minerva Journal. https://doi.org/10.47460/minerva.v2023iSpecial.121