Portada » Economía » Como aplicar mineria de datos
– Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza.
– Se detectó que se debía a que dicho día solían acudir a supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano.
– El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.
• Patrones de fuga.
– En muchas industrias (banca, telecomunicaciones, etc.) existe un comprensible interés en detectar cuanto antes aquellos clientes que puedan estar pensando en rescindir sus contratos para pasarse a la competencia. – A estos clientes se les podrían hacer ofertas personalizadas, ofrecer promociones especiales, etc., con el objetivo último de retenerlos.
– La minería de datos ayuda a determinar qué clientes son los más proclives a darse de baja estudiando sus patrones de comportamiento y comparándolos con muestras de clientes que, efectivamente, se dieron de baja en el pasado
• Blanqueo de dinero.
– Un caso análogo es el de la detección de transacciones de blanqueo de dinero o de fraude en el uso de tarjetas de crédito, servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco. – Generalmente, estas operaciones fraudulentas o ilegales suelen seguir patrones característicos que permiten, con cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así mecanismos para tomar medidas rápidas frente a ellas.
• Análisis del comportamiento de los visitantes.
– También es un área en boga el análisis del comportamiento de los visitantes (sobre todo, cuando son clientes potenciales) en una página de internet.– La utilización de la información (obtenida por medios más o menos legítimos) sobre ellos resulta altamente eficaz para ofrecerles propaganda adaptada específicamente a su perfil. – O para, una vez que adquieren un determinado producto, saber inmediatamente qué otro ofrecerle teniendo en cuenta la información histórica disponible acerca de los clientes que han comprado el primero.
Business Intelligence
• ¿Qué es?
– Alternativa tecnológica para manejar la información requerida por una organización para apoyar la toma de decisiones estratégica.
– Comprende desde la extracción de los datos de los sistemas existentes, hasta la explotación de la información por herramientas de análisis de datos.
• Extract, Transform and Load (ETL)
– “Extraer, transformar y cargar” es el proceso que permite a las organizaciones mover datos desde múltiples fuentes de origen (internas o externas a la organización), reformatearlos y limpiarlos, y cargarlos en otra base de datos, DataMart, o DataWarehouse para analizar y generar conocimiento, o en otro sistema operacional, para apoyar un proceso de negocio
.– Los procesos ETL también se pueden utilizar para la integración con sistemas heredados.
– El estado de la data de origen es fundamental para el estudio de implementación, ya que los procesos ETL no son mágicos.
• Extracción:
– La mayoría de los proyectos de almacenamiento de datos fusionan datos provenientes de diferentes sistemas de origen, donde cada sistema por separado puede usar una
organización diferente de los datos o formatos distintos.
– Una parte intrínseca del proceso de extracción es la de analizar los datos extraídos, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba, de no ser así, los datos son rechazados.
– Un requerimiento importante que se debe exigir a la tarea de extracción, es que ésta cause un impacto mínimo en el sistema origen, porque si los datos a extraer son muchos, el sistema de origen se podría ralentizar e incluso colapsar, provocando que éste no pueda utilizarse con normalidad para su uso cotidiano.
– Por esta razón, en grandes sistemas las operaciones de extracción suelen programarse en horarios o días donde este impacto sea nulo o mínimo, generándose una copia de la base de datos transaccional para, desde ahí, generar los procesos de extracción.
– Esto a su vez significa un aumento significativo de los costos, solo por mejorar el proceso de extracción de la información.
– La extracción convierte los datos a un formato preparado para iniciar el proceso de transformación.
• Transformación:
– Esta fase aplica una serie de reglas de negocio o funciones sobre los datos extraídos, para convertirlos en datos útiles para los procedimientos de análisis, que ser cargados en función del nuevo modelo de datos del sistema de BI (nueva estructura).
– La conversión y precálculo ahorran tiempo y capacidad procesamiento, ya que en general los sistemas de BI requieren de datos agregados desde su origen para el análisis de alto nivel, de manera de no tener que hacerla en tiempo de ejecución.
– Requiere un diseño del sistema de análisis muy detallado orientado a las exigencias de los usuarios, que permitan asegurar el éxito posterior del sistema.
– Las transformaciones son por ejemplo:
Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas con valores nulos no se carguen). Traducir códigos (p. ej., si la fuente almacena una «H» para Hombre y «M» para Mujer pero el destino almacena «1» para Hombre y «2» para Mujer). Codificar valores libres (p. ej., convertir «Hombre» en «H» o «Sr» en «1»). Obtener nuevos valores calculados (p. ej., total_venta = cantidad * precio).Unir datos de múltiples fuentes (p. ej., búsquedas, combinaciones, etc.).Calcular totales de múltiples filas de datos (p. ej., ventas totales de cada región).Transponer o pivotar (girando múltiples columnas en filas o viceversa). Dividir una columna en varias (p. ej., columna «Nombre: García López, Miguel Ángel»; pasar a dos columnas «Nombre: Miguel Ángel», «Apellido1: García» y «Apellido2: López»). La aplicación de cualquier forma, simple o compleja, de validación de datos, y la consiguiente aplicación de la acción que en cada caso se requiera