Manejar la información es un proceso vital para la mayoría de las empresas. El no tenerla genera en ellas muchas deventajas, pero también, la sobrecarga informativa o lo que se conoce como Infoxicación, puede producir pérdidas económicas considerables. Para que este problema no ocurra, existe el concepto denominado Minería de Datos. El mismo es un conjunto de técnicas que se aplican para extraer información presente de manera implícita en los datos, pero que no se observa a simple vista, sino que es necesario prepararlos previamente para obtener este conocimiento.

Así pues, la Minería de Datos, del inglés Data Mining, es el proceso de extraer conocimiento útil y comprensible, previamente desconocido desde grandes cantidades de datos, convertidos en información y almacenados en distintos formatos. Esta herramienta predice futuras tendencias y comportamientos, permitiendo en las empresas la toma de decisiones.

Su origen se remonta a los años sesenta, cuando los estadísticos lo utilizaban para encontrar correlaciones sin una hipótesis previa. Para llevar a cabo esta explotación de datos, generalmente se realizan una serie de fases o procesos determinados, éstos son los siguientes:

 


Selección

A partir de un conjunto de datos, se realiza la Selección de éstos y se almacenan las variables dependientes y objetivo en un almacén de datos.

Preproceso

A continuación se realiza un Preprocesamiento de los datos, en el cual se analizan sus propiedades mediante histogramas, diagramas de dispersión o valores atípicos.

Transformación

Transformación de los datos con el objetivo de prepararlos para aplicar la técnica de minería que mejor se adapte a éstos.

Minería de Datos

Seleccionar y aplicar la técnica de minería de datos elegida, esta fase incluye seleccionar la tarea de descubrimiento a realizar y el algoritmo que se va a utilizar. Al aplicarse la minería, se buscarán patrones que puedan expresarse como un modelo de datos.

Interpretación y evaluación

Interpretación y evaluación del modelo de datos obtenido. Este modelo debe ser validado y verificado correctamente antes de ser utilizado. En tal sentido, es conveniete resaltar que existen dos modelos para aplicar la Minería de Datos, ellos son el Descriptivo y el Predictivo.

    1.- Modelo Descriptivo

Este tipo de modelo, trata de proporcionar información entre las relaciones de los datos y sus características, haciendo énfasis en los perfiles del dato que se quiere analizar, como por ejemplo los clientes.

    2.- Modelo Predictivo

Como su nombre indica, intenta predecir o responder a preguntas futuras en base a un estudio de su comportamiento pasado. Algunas de las preguntas que podrían responder con este tipo de modelo de datos son: ¿Qué tal se venderá el próximo año un producto X?, ¿X tipo de persona, qué producto comprará?, ¿Dónde se producirá el siguiente atentado terrorista?, ¿Qué riesgo tiene cierta persona de contraer una enfermedad X en base a sus características? o ¿Qué clientes tienen más riesgos de darse de baja de nuestra empresa?.

A continuación un video para una mejor comprensión de la Minería de datos.

Free Web Hosting