top of page

6 Herramientas de Minería de Datos

Existen múltiples herramientas con las cuales aplicar técnicas de DM, en general todos los años aparecen y desaparecen nuevas herramientas, o se posicionan de diferente forma en el mercado.

Los autores de la actual página web se especializan en la aplicación de técnicas de DM en Rapidminer y Python, solamente a modo de reseña (porque posteriormente estudiaremos los mismos con más detalle), daremos una pequeña explicación de los mismos:

Rapidminer

Software Open-Source para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores; esto significa que a través de una GUI (Interfaz Gráfica de Usuario) o de línea de comandos o a través de procesos batch (o de lotes) o desde otros programas a través de API de Java, permite realizar análisis estadístico, minería de datos y análisis predictivo.


Python

No es una herramienta de minería de datos, pero es un lenguaje de programación multiparadigma (soporta orientación a objetos, programación imperativa y programación funcional), interpretado, dinámico y multiplataforma. Sus principales aplicaciones son el desarrollo web, ciencia de datos (aprendizaje automático, el análisis de datos y la visualización de datos) y scripting

Hay un artículo que te puede resultar muy interesante, con algunos ejemplos, llamado "Comparación de las principales herramientas de DataMining" que te recomendamos que la leas.

Hay un portal llamado KDnuggets que se especializa en Data Science y Machine Learning que muestra cuales son los software mas usados estas ciencias desde el 2.017 al 2.019, y se puede observar que Python, RapidMiner y Lenguaje R son los que se mantienen entre los tres primeros durante tres años.

top-analytics-data-science-machine-learn

Adicionalmente y solo a modo de referencia, te mostramos el Cuadrante Mágico de Gartner, aunque en opinión de los autores de esta página a veces dicho cuadrante está supeditado por determinados intereses (debería incluir a Python y a R, tal vez no sean herramientas propiamente dichas pero son indudables sus aplicaciones en DM).

Cuadrante Mágico de Gartner 2.021 para Data Science And Machine Learning 

Este cuadrante permite definir como guía que posición ocupan las herramientas de Data Science y Machine Learning en el mercado actual teniendo en cuenta los siguientes cuadrantes:

  • Los jugadores de nichos específicos o Niche Players que se enfocan con éxito en un segmento de mercado específico, pero no tienen una visión global y carecen de grandes innovaciones

  • Los aspirantes o challengers que según la web de Gartner poseen una buena ejecución del negocio y dominan un gran segmento de mercado, pero no demuestran un real entendimiento de la dirección del mercado”.

  • Los líderes que desarrollan correctamente su negocio de acuerdo a la visión actual del mercado y están correctamente posicionados al futuro.

  • Los visionarios que entienden a donde va el mercado y tienen una idea las reglas y paradigmas, pero les falta algo para complicarlas con éxito.

bottom of page