Clustering de datos de alta dimensionalidad mediante reducción de dimensionalidad no lineal

Autores/as

Palabras clave:

clustering, reducción de dimensionalidad, UMAP, aprendizaje no supervisado, análisis multivariante

Resumen

El análisis de datos de alta dimensionalidad presenta limitaciones debido a la pérdida de capacidad discriminativa y la dificultad para identificar patrones estructurales. Este estudio tiene como objetivo evaluar la efectividad del clustering mediante técnicas de reducción de dimensionalidad no lineal. Se empleó un enfoque cuantitativo basado en aprendizaje no supervisado, utilizando datos provenientes de organismos nacionales e internacionales, los cuales fueron sometidos a procesos de depuración, normalización y transformación. Se aplicaron algoritmos como UMAP y t-SNE para la reducción de dimensionalidad, combinados con K-Means y DBSCAN para el agrupamiento, además de un modelo de ecuaciones estructurales para analizar relaciones latentes. Los resultados evidencian que la reducción no lineal mejora la calidad del clustering, destacando el mejor desempeño de la combinación UMAP + K-Means con mayores niveles de cohesión y separación entre grupos. Asimismo, se identificaron tres clústeres diferenciados asociados a niveles de madurez digital y capacidad científico-innovadora, lo que permitió una interpretación más clara de las estructuras latentes. Estos hallazgos confirman la relevancia de integrar técnicas avanzadas para optimizar el análisis de datos complejos.

Descargas

Los datos de descarga aún no están disponibles.

Referencias

Aguirre Sala, J. F. (2022). Modelos y buenas prácticas evaluativas para detectar impactos, riesgos y daños de la inteligencia artificial. Paakat: Revista de Tecnología y Sociedad, 12(23). https://doi.org/10.32870/Pk.a12n23.742

Cadena-Vargas, E., et al. (2021). La vulnerabilidad social en México: distribución espacial, patrones y clústeres. Estudios Demográficos y Urbanos, 36(3), 1–28.

Calderón-Vargas, C., Muñoz Castaño, J., Vargas Rincón, M., Rincón Acosta, V., & Mendieta Hernández, M. (2021). Aprendizaje profundo para escalas pronósticas en la prescripción médica. Ingeniería y Ciencia, 17(34), 7–22.

Castro Cáceres, M., Chávez Salazar, D., & Urbizagástegui-Alvarado, R. (2023). Minería de textos en editoriales políticos mediante técnicas de análisis de datos. Revista de Comunicación, 22(1), 71–87. https://doi.org/10.26441/RC22.1-2023-3025

Chambi Condori, P. (2023). Segmentación de mercado mediante machine learning en contextos de crisis. Industrial Data, 26(1), 275–301. https://doi.org/10.15381/idata.v26i1.23623

Chanchí-Golondrino, G., Ospina-Alarcón, M., & Saba, M. (2022). Sistema IoT para monitoreo climatológico con análisis de datos. Revista Científica, 44(2), 257–271. https://doi.org/10.14483/23448350.18470

Contreras-Contreras, G., Medina-Delgado, B., Acevedo-Jaimes, B., & Guevara-Ibarra, D. (2022). Metodología de agrupamiento de datos usando aprendizaje automático. Tecnura, 26(72), 42–58. https://doi.org/10.14483/22487638.17246

García-Ariza, J., et al. (2022). Aplicación del aprendizaje no supervisado en detección de enfermedades agrícolas. Inge CUC, 18(2), 89–100. https://doi.org/10.17981/ingecuc.18.2.2022.07

Grisales-Aguirre, A., & Figueroa-Vallejo, C. (2022). Modelado de tópicos y aprendizaje automático en revisiones sistemáticas. Revista de Investigación, Desarrollo e Innovación, 12(2), 279–292. https://doi.org/10.19053/20278306.v12.n2.2022.15271

Hermitaño Castro, J., et al. (2022). Machine learning aplicado al riesgo crediticio: revisión sistemática. Interfases, 15, 160–178. https://doi.org/10.26439/interfases2022.n015.5898

Lasso Cardona, L., et al. (2022). Big data y datificación en América Latina. Revista Latinoamericana de Comunicación Tecnológica, 14(2). https://doi.org/10.22335/rlct.v14i2.1594

Matute-Pinos, K., & Bojorque-Chasi, R. (2021). Sistemas expertos en gestión de talento humano. Ingenius, 26. https://doi.org/10.17163/ings.n26.2021.04

Norambuena, J., & Badilla-Quintana, M. (2022). Analítica de aprendizaje en educación superior. Linguagem e Tecnologia. https://doi.org/10.35699/1983-3652.2022.36310

Parra Sánchez, J., et al. (2023). Inteligencia artificial aplicada a la personalización educativa. Magis, Revista Internacional de Investigación en Educación. https://doi.org/10.15332/25005421.7904

Pérez Londo, N., Lema Londo, D., & Toapanta Yugcha, E. (2023). Clustering en modelos climáticos del Ecuador. Polo del Conocimiento, 8(8), 2169–2185. https://doi.org/10.23857/pc.v8i8.5962

Quintanar-Casillas, R., & Hernández-López, M. (2022). Modelos adaptativos en educación basados en datos. Revista Docentes 2.0, 15(1), 41–58. https://doi.org/10.37843/rted.v15i1.308

Ramírez, J., & Duque-Méndez, N. (2022). Evaluación de algoritmos no supervisados con datos climáticos. Ingeniería y Desarrollo, 40(2), 131–165. https://doi.org/10.14482/inde.40.02.622.553

Rosati, G. (2022). Integración de fuentes de datos en estudios territoriales. Quid 16, 17, 38–60.

Sánchez Grajales, J., Cuartas Arroyave, D., & Bucheli Guerrero, V. (2022). Clustering aplicado a vulnerabilidad poblacional. Investigación e Innovación en Ingenierías, 10(2), 7–24. https://doi.org/10.17081/invinno.10.2.5973

Zambrano Félix, F., et al. (2023). Machine learning en accesibilidad web: revisión metodológica. Minerva Journal. https://doi.org/10.47460/minerva.v2023iSpecial.121

Descargas

Publicado

2023-02-17