Este curso introduce en las técnicas de programación usadas por los analistas
para transformar datos brutos en un formato apropiado para la modelización
predictiva.
Aprenda cómo:
extraer datos relevantes.
transformar datos transaccionales o de sucesos.
usar datos no numéricos, incluyendo el control de los grados de libertad.
resolver excepciones y extremos.
Quiénes debieran asistir
Profesionales de data mining y de IT.
Prerrequisitos
Este curso supone alguna experiencia en data mining. Antes de asistir a este curso,
usted debiera tener experiencia en las técnicas comunes de modelización predictiva.
Contenido
Introducción:
Estructuras de datos brutos.
Estructuras de datos para modelización predictiva.
Revisión de los problemas principales en la preparación de datos.
Extracción de datos relevantes:
Dificultades con los datos.
Evaluación de los datos disponibles.
Acceso a los datos disponibles.
Extracción de una muestra representativa de targets.
Extracción de una muestra no contaminada de variables de entrada.
Transformación de datos transaccionales y de sucesos.
Ventajas y desventajas de los datos transaccionales.
Estructuras comunes de las transacciones.
Definición del horizonte temporal.
Métodos fijos y variables de horizonte temporal.
Implementación de transformaciones transaccionales comunes.
Uso de datos no numéricos:
Definiciones y dificultades de los datos no numéricos.
Detección de errores de codificación y multicodificación.
Control de grados de libertad.
Geocodificación.
Manejo de excepciones y valores extremos:
Dificultades con los valores extremos, valores faltantes y no aplicables.