sin tiempo...
La minería de datos consiste en la extracción no trivial y objetiva de información que reside de manera implícita en los datos de un una base de datos(transaccional o repositorio de datos) . Las bases de la minería de datos se encuentran en todo un conjunto de técnicas encaminadas a la extracción del conocimiento procesable e implícito en las bases de datos.
Está regido de una serie de pasos a respetar,siendo estos:
El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
Lo que en verdad hace el data mining es reunir las ventajas de varias áreas como la estadística, la inteligencia artificial, la computación gráfica, las bases de datos y el procesamiento masivo, principalmente usando como materia prima las bases de datos. Una definición tradicional es la siguiente: "Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos": -Fayyad y otros,1996-. Desde el punto de vista empresarial , lo definimos como: "La integración de un conjunto de áreas que tienen como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisión"- Molina y otros, 2001.
La minería de datos es usada de diversas formas, dependiendo de la técnica usada. Puede ser usada desde la predicción a través de patrones y la asociación de datos (usando reglas de asociación ) en donde se determina cúal será el siguiente objeto a futuro dependiendo de los antecedentes históricos. Por ejemplo: si un cliente compra piqueos, lo más probable es que compre bebidas gaseosas. Otro de los usos más conocidos respecta a la publicidad dirigida, donde se determinan patrones de gustos mediante la visitas web o el simple hecho de ver videos . Estos puntos tan simples pueden indicar las preferencias de un potencial cliente. Tomando esto como apoyo, el cliente es bombardeado de publicidad relacionada a sus gustos.
Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos
de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data Mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está listo para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:
Como ya se ha comentado, las técnicas de la minería de datos provienen de la Inteligencia artificial y de la estadística , dichas técnicas, no son más que algoritmos , más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados.
Las técnicas más representativas son:
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):
El algoritmo de minería de datos es el mecanismo que crea un modelo de minería de datos. Para crear un modelo, un algoritmo analiza primero un conjunto de datos y luego busca patrones y tendencias específicos. El algoritmo utiliza los resultados de este análisis para definir los parámetros del modelo de minería de datos. A continuación, estos parámetros se aplican en todo el conjunto de datos para extraer patrones procesables y estadísticas detalladas.
El modelo de minería de datos que crea un algoritmo puede tomar diversas formas, incluyendo:
Un conjunto de reglas que describen cómo se agrupan los productos en una transacción.
Un árbol de decisión que predice si un cliente determinado comprará un producto.
Un modelo matemático que predice las ventas.
Un conjunto de clústeres que describe cómo se relacionan los casos de un conjunto de datos.
Siendo más específicos y a manera de lista, tenemos:
Algoritmos de clasificación, que predicen una o más variables discretas, basándose en otros atributos del conjunto de datos. Un ejemplo de algoritmo de clasificación es el Algoritmo de árboles de decisión de microsoft.
Algoritmos de regresión, que predicen una o más variables continuas, como las pérdidas o los beneficios, basándose en otros atributos del conjunto de datos. Un ejemplo de algoritmo de regresión es el Algoritmo de serie temporal de Microsoft.
Algoritmos de segmentación, que dividen los datos en grupos, o clústeres, de elementos que tienen propiedades similares. Un ejemplo de algoritmo de segmentación es el Algoritmo de clústeres de Microsoft.
Algoritmos de asociación, que buscan correlaciones entre diferentes atributos de un conjunto de datos. La aplicación más común de esta clase de algoritmo es la creación de reglas de asociación, que pueden utilizarse en un análisis de la cesta de compra. Un ejemplo de algoritmo de asociación es el Algoritmo de asociación de Microsoft.
Algoritmos de análisis de secuencias, que resumen secuencias o episodios frecuentes en los datos, como un flujo de rutas Web. Un ejemplo de algoritmo de análisis de secuencias es el Algoritmo de clústeres de secuencia de Microsoft.
https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
https://es.wikipedia.org/wiki/Reglas_de_asociaci%C3%B3n
https://es.wikipedia.org/wiki/Algoritmo_de_agrupamiento
https://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Mineria_Datos_Vallejos.pdf
https://www.sinnexus.com/business_intelligence/datamining.aspx
https://msdn.microsoft.com/es-es/library/bb510517%28v=sql.105%29.aspx
© 2010 Todos los derechos reservados.