top of page

Una vez que hemos seleccionado correctamente el Dataset, tal como se vio en la página anterior,  procedemos a unir la salida del operador (out) con el resultado del Process Main (res) y hacemos click en el botón con la flecha azul o Run Process

rm7.PNG

3.2 Análisis y Exploración en RapidMiner

rapidminer.png

Podemos observar que la vista pasó del modo Diseño al modo Resultados.

A la izquierda se puede observar que nos aparece la pestaña Datos, que es la que podemos observar en esta imagen, pero debajo aparece Estadísticas, Visualizaciones y Anotaciones.

A la derecha en "Filter" se puede observar una serie de opciones de filtrado para el tratamiento de nuestros datos.

flechaabajo.png
rm8.PNG
flechaabajo.png
rm9.PNG

Si nos cambiamos a la pestaña de Estadísticas, podemos observar que nos aparecen todos los atributos para que hagamos un análisis visual de los mismos. Si  elegimos el atributo "type", podemos observar que nos aparece "Open visualizations"

rm10.PNG
flechaabajo.png

Al seleccionar esta opción, nos cambia automáticamente a la pestaña Visualizaciones y podemos observar un Diagrama de Barra del atributo type, lo cual nos indica el tipo de visualizaciones de lo que miran los espectadores. 

rm11.PNG
flechaabajo.png

Podemos elegir entre cualquiera de las visualizaciones que nos provee RapidMiner, solo a modo de ejemplo podríamos realizar un histograma por el atributo año de lanzamiento.

rm12.PNG

Estas Visualizaciones son quizás una de las herramientas mas interesantes de RapidMiner, ya que permiten obtener información importante de los atributos rápidamente y muchas veces o no son tenidas en cuenta o no se les asigna la importancia que debiera.

La aplicación de otros operadores y técnicas de Minería de Datos las estudiaremos en otros apartados.

Diagrama de Caja y Bigote

Un caso especial que merece un párrafo aparte es el Diagrama de Caja y Bigote, ya se explicó anteriormente el concepto del mismo.

Supongamos que para las visualizaciones eligiéramos release_year (o año de lanzamiento) y quisiéramos hacer un análisis y exploración gráfica del mismo, al posicionarnos sobre dicho gráfico podemos observar el valor de los cuartiles y de la mediana, esto nos ayudaría a detectar valores anómalos, como por ejemplo un año de lanzamiento igual a 2.119, el cual se encontraría por encima del cuartil máximo; lo cual nos da la pauta de que debemos realizar alguna acción para este tipo de situaciones.

diagramacaja.png
bottom of page