Portada » Economía » Metodología CRISP-DM para la Explotación de Información y Análisis de Datos
CRISP‐DM es una metodología de desarrollo de sistemas de
explotación de información.
Los datos deben ser extraídos, depurados y
Preparados para su uso e interpretación. Este método se divide en 6 fases:
Comprender desde una perspectiva de negocio. Equilibrar
Objetivos y restricciones. Investigar detalladamente todos los recursos y
Restricciones. Listar los recursos disponibles para el proyecto. Utilizar una
Terminología adecuada.
Obtener los datos. Elaboración de un informe sobre las
Bases de datos utilizadas. Evaluación de la calidad de los datos originales. Analizar
Los problemas de calidad en los datos. Analizar las propiedades de las
Variables más importantes. Incluir tablas y gráficos que describan las
Carácterísticas o puntos de interés.
Corrección
De errores en las variables. Describir las acciones realizadas en la depuración
De datos. Decidir los datos que van a ser finalmente utilizados en el análisis.
Ordenar la muestra de datos. Algunas variables deben ser previamente transformadas.
Realización de tareas de combinación de tablas. Base de datos espaciales: el
Campo índice sería el código provincial, municipal o de comunidad autónoma. Si
Se trata de una base de datos de empresas: campo numérico.
Registro de
Técnicas de modelización estadístico‐econométrica. ∙ Decidir las técnicas
Apropiadas. Conocimiento profundo de cada técnica de modelización. Tener en
Cuenta las restricciones técnicas, políticas o legales. Definición de un
Procedimiento para probar la calidad y validez de los resultados. Aplicar
Varios modelos posibles a un mismo conjunto de datos.
Evaluar el
Grado en que el modelo encuentra los objetivos de negocio. De qué modo el
Proyecto ha sido capaz de responder a los objetivos propuestos. Llevar a cabo
Una revisión del proceso anterior. El informe final: RESULTADOS = MODELOS +
CONCLUSIONES.
Estrategia para el desarrollo de los resultados en
El negocio. Supervisión y mantenimiento de la estrategia de desarrollo. Informe
Definitivo: 1.Resultados más importantes. 2.Presentación de técnicas y modelos.
3.Estrategia para el desarrollo de los objetivos. 4. Anexo metodológico.
Los ratios SABI de solvencia nos indican capacidad de endeudamiento de la empresa, informan de la capacidad de devolución de los recursos ajenos y la relación de fondos propios vs permanentes. //-La tasa
De variación acumulada determina el crecimiento anual del periodo considerado;
Aplicada sobre la suma de datos del periodo. //-Un gráfico de barras apiladas en
Porcentaje, proporciona información del peso relativo que cada elemento tiene
Sobre el total. //-Gráfico barras negras y blancas: se clasifica como grafico de
Cotizaciones en excel y sirve para recoger 4 series de valores en cada variable:
El valor actual / otra referencia, con su mínimo y su máximo en los extremos de
La línea vertical. //-Un gráfico de tipo radial proporciona información en más de
Dos ejes, según decida el analista. //-La tasa de variación anual permite ver la
Tendencia. //-El criterio que debe utilizarse en las variables de entorno a la
Empresa: las variables de entorno a la empresa son auténticos condicionantes de
La evolución presente y futuro, por eso se utilizan en el dafo, en los análisis
Directivos, y suelen ser variables muy relevantes a nivel socio económico
Empresarial publicadas en los medios. //-Los cuadrantes de una tabla dinámica se
Denominan: filtros, etiqueta fila, etiqueta columna, y valores. Elija la
Respuesta incorrecta para puntuar: El
Cuadrante de Valores (inferior derecha) permite ver los datos y configurar sí
Se presentan como suma o como promedio. El cuadrante filtro posiciona la
Variable por encima de la tabla dinámica, como una primera selección /
Segmentación del resto del contenido, aunque también puede dejarse vacío, según
Lo considere el analista.
El cuadrante de filas
Permite alojar más de una variable pero es relevante la posición en que se
Ubique dentro del cuadrante para que dicha variable aparezca antes o después en
La tabla resultante. //-El gráfico llamado dinámico solo puede generarse a partir
De una tabla dinámica, otra cuestión en que también se puede hacer un gráfico
Normal cuyos datos cambien si provienen del selector mediante importación de
Datos dinámicos. //-Según la fórmula dinámica de «importar datos dinámicos»,
El contenido de la celda que está asociado al formato condicional puede cambiar
De datos en función del selector indicadores. //-¿Por qué hay que preparar los
Datos en Ms.
Excel cuando vamos a aplicar “segmentación de datos” en una tabla
Dinámica? Porque cada dato debe ser único, único porque estará en la columna de
Su familia = datos, y porque estará haciendo match (identificándose) en la fila
Con su familia de indicador y su sujeto (empresa o regíón) según el reporting. //-Si el gráfico tiene un solo eje vertical común para los datos, usará el gráfico
Expresado en números índices lo que permite que aparezcan los datos en el mismo
Eje compartiendo la misma escala.