Cómo implantar un Data Warehouse en tu empresa
Construir e implantar un Data Warehouse es un proceso en continuo crecimiento. Más importante que la elección de la mejor metodología, es realizar un control para asegurar el seguimiento de la misma.
En las fases que se establezcan en el alcance del proyecto es vital incluir una fase de formación en la tecnología utilizada para un máximo aprovechamiento de la aplicación.
Gracias a la implementación de un Data Warehouse, permitirá al negocio obtener resultados tangibles en un espacio corto de tiempo.
¿Qué es un Data Warehouse?
Un Data Warehouse es un sistema de recopilación, almacenamiento y gestión de un gran volumen de datos de un negocio, que proceden de diversas fuentes (por ejemplo de otras bases de datos, como las de un ERP o de un CRM, o de ficheros).
La información que se almacena en un Data Warehouse debe seguir un procedimiento para guardarla de forma fiable, segura, fácil de recuperar y fácil de administrar.
Ventajas de implantar un Data Warehouse
- Proporciona un gran poder de procesamiento de información.
- Proporciona información clave para la toma de decisiones empresariales.
- Mejora la calidad de las decisiones tomadas. Facilita la toma de decisiones en los negocios.
- Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos están claros.
- Muy útiles para el almacenamiento de análisis y consultas de históricos.
- Transforma los datos en información y la información en conocimiento.
- Permite planificar de forma más efectiva.
Inconvenientes de implantar un Data Warehouse
- No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir.
- Tienen un diseño complejo y multidisciplinar.
- Requiere de continua limpieza, transformación e integración de datos.
- Precisa de mantenimiento.
- Tienen un alto coste.
- En un proceso de implantación pueden encontrarse dificultades ante los diferentes objetivos que pretende una organización.
- Una vez implementado puede ser complicado añadir nuevas fuentes de datos.
- Requieren sistemas, aplicaciones y almacenamiento específico.
Fases de la implementación del Data Warehouse en tu empresa
- Gestión proyecto
- Definición de requerimientos
- Definición de objetivos
- Diseño y modelización
- Fases del proyecto
- Revisión
- Implementación
Definición de objetivos
Antes definir los objetivos es preciso vender internamente dentro de la empresa la idea de implantación de un Data Warehouse.
El motivo es el concepto novedoso y aún desconocido por muchas personas así como la creencia de “no necesidad”.
El mejor modo de comenzar un proyecto es comenzar con la implantación por fases, arrancando con un pequeño módulo, y testear los beneficios posteriores. Paulatinamente se van desplegando nuevos módulos, cada uno con un coste unitario cada vez más reducido, y con beneficios globales cada vez mayores.
La venta de esta idea se ha de realizar a la dirección pero también a otros niveles: a la dirección, gerencia e incluso al área de desarrollo.
Es el momento de definir el equipo de proyecto, su alcance y funciones que el Data Warehouse realizará como suministrador de información de negocio y estratégica para la empresa. Se definirán igualmente, los parámetros que permitan evaluar el éxito del proyecto.
Definición de los requerimientos de información
Como en todo proyecto que implica técnicas novedosas relativas al Data Warehouse, se debe analizar las necesidades y hacer exponer las ventajas que este sistema puede reportar.
Diseño y modelización
En esta fase se identifican las fuentes de los datos y las transformaciones necesarias para obtener el modelo lógico de datos del Data Warehouse. Este modelo permitirá resolver las necesidades de negocio de la organización.
El modelo lógico se convertirá en el modelo físico de datos que se almacenará en el Data Warehouse y que definirá la arquitectura de almacenamiento.
Implementación
La implantación de un Data Warehouse lleva implícitos los siguientes pasos:
Extracción de los datos y transformación de los mismos.
Carga de los datos validados en el Data Warehouse. Esta carga se planifica para ser ejecutada periódicamente según las necesidades de refresco detectadas durante las fases de diseño del nuevo sistema.
Estos procesos se realizan en el llamado ETL (Extracción, Transformación y Carga ”Load”) que veremos más adelante.
Los datos almacenados en el Data Warehouse son tratados y analizados mediante diversas técnicas en función del uso de los mismos y su fin: Queries SQL, On-line analytical processing (OLAP), Executive Information System (EIS), Decision Support Systems (DSS), Data Mining etc.
Los parámetros necesarios para mantener el control sobre los datos se almacena en lo que se conoce como Metadata (más allá del dato). Estos metadatos deberán ser accesibles por los usuarios finales que permitirán en todo momento modificarlos según varíen las necesidades de información.
Con la finalización de esta fase se obtendrá un Data Warehouse disponible para su uso.
Revisión
La construcción del Data Warehouse no finaliza con la implantación del mismo, sino que es una tarea en continua evolución modificando su alcance y aprendiendo de las experiencias anteriores.
Unos meses después de su implantación debería realizarse una revisión del Data Warehouse y redefinir cuáles serían los aspectos a mejorar o potenciar en función de la utilización que se haga del nuevo sistema.