5 Metodologías de Minería de Datos
KDD se considera la primer metodología aceptada para Minería de Datos, pero existen otras tales como CRISP-DM y SEMMA las cuales explicaremos a continuación, que tienen características muy interesantes que deben ser tenidas en cuenta.
SEMMA
Sin entrar en la discusión sobre si SEMMA es o no una metodología podemos afirmar que SEMMA tiene una perspectiva más amplia respecto a los objetivos empresariales del proyecto, es más completa y flexible en cuanto a su relación con herramientas comerciales. Se enfoca en características técnicas del desarrollo del proceso, es muy limitada en cuanto a las herramientas ya que se encuentra muy ligada a productos SAS (vea el cuadrante mágico de Gartner en Herramientas de Minería de Datos).
CRISP-DM
Actualmente es la más usada en el desarrollo
de proyectos de Minería de Datos.
Técnicamente se compone de 4 niveles de abstracción, organizados de forma jerárquica en tareas que van desde el nivel más general hasta los casos más específicos (Chapman, 1999), consta de 6 etapas o fases, las cuales van iterando y adaptándose al resultado final que es en sí la toma de decisiones. Las fases son las siguientes:
-
Comprensión del negocio
-
Comprensión de los datos
-
Preparación de los datos
-
Modelado
-
Evaluación
-
Implantación o Distribución
Si te interesa profundizar en la comparación de metodologías te recomendamos que leas la siguiente publicación sobre "Estudio comparativo de metodologías para minería de datos"