top of page

5 Metodologías de Minería de Datos

KDD se considera la primer metodología aceptada para Minería de Datos, pero existen otras tales como CRISP-DM y SEMMA las cuales explicaremos a continuación, que tienen características muy interesantes que deben ser tenidas en cuenta.

SEMMA

semma1.png

Sin entrar en la discusión sobre si SEMMA es o no una metodología podemos afirmar que SEMMA tiene una perspectiva más amplia respecto a los objetivos empresariales del proyecto, es más completa y flexible en cuanto a su relación con herramientas comerciales. Se enfoca en características técnicas del desarrollo del proceso, es muy limitada en cuanto a las herramientas ya que se encuentra muy ligada a productos SAS (vea el cuadrante mágico de Gartner en Herramientas de Minería de Datos).

CRISP-DM

CRISP-DM.png

Actualmente es la más usada en el desarrollo
de proyectos de Minería de Datos.

Técnicamente se compone de 4 niveles de abstracción, organizados de forma jerárquica en tareas que van desde el nivel más general hasta los casos más específicos (Chapman, 1999), consta de 6 etapas o fases, las cuales van iterando y adaptándose al resultado final que es en sí la toma de decisiones. Las fases son las siguientes:

  1. Comprensión del negocio

  2. Comprensión de los datos

  3. Preparación de los datos

  4. Modelado

  5. Evaluación

  6. Implantación o Distribución

Si te interesa profundizar en la comparación de metodologías te recomendamos que leas la siguiente publicación sobre "Estudio comparativo de metodologías para minería de datos"

bottom of page