Estructura de un data warehouse

En la estructura de un data warehouse encontraremos 4 niveles de esquematizacion los cuales forman la metadata, estos niveles se diferencian x el nivel de sisntesis o depuracion de informacion requerida por la empresa que lo usa. y son:

Detalle de datos actuales.- En gran parte, el interés más importante radica en el detalle de los datos actuales, debido a que:
  • Estos datos reflejan las ocurrencias más recientes, las cuales son de gran interés
  • Son voluminosos, ya que se almacenan al más bajo nivel de granularidad (no estan procesados).
  • Casi siempre se almacena en disco, al cual se tiene fácil acceso, aunque su administración sea costosa y compleja.
Detalle de datos antiguos (historicos).- Es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de almacenamiento.
  
Datos ligeramente resumidos.- Es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son:
  • Que la unidad de tiempo se encuentre sobre la esquematización hecha.
  • Qué contenidos (atributos) tendrá la data ligeramente resumida. 
Datos completamente resumidos.- El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles por lo general son indicadores que son usados con mas frecuencia para el analisis gerencial..


Metadata.- El componente final del data warehouse es el de la metadata. De muchas maneras la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
La metadata juega un rol especial y muy importante en el data warehouse y es usada como:
  • Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.
  • Una guía para el mapping de datos de cómo se transforma, del ambiente operacional al de data warehouse.
  • Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.
La metadata juega un papel mucho más importante en un ambiente data warehousing que en un operacional clásico.
A fin de recordar los diferentes niveles de los datos encontrados en el data warehouse, considere el ejemplo mostrado en la Figura N° 6.
El detalle de ventas antiguas son las que se encuentran antes de 1992. Todos los detalles de ventas desde 1982 (o cuando el diseñador inició la colección de los archivos) son almacenados en el nivel de detalle de datos más antiguo.

No hay comentarios:

Publicar un comentario