SlideShare una empresa de Scribd logo
1 de 52
1




MODELADO DE LA
DATA WAREHOUSE
Dr. Eduardo Castro, MSc
ecastro@simsasys.com

http://ecastrom.blogspot.com
http://comunidadwindows.org
http://tiny.cc/comwindows
Facebook: ecastrom
Twitter: edocastro
2




Objetivos

 • Discutir las estructuras de datos del ambiente data
   warehouse
 • Discutir las fases del diseño de la BD Data
   warehouse
   • Definir el modelo de negocios
   • Definir el modelo dimensional
   • Definir el modelo físico
3




Modelado Dimensional
4




Problemas de Modelado
• Diferentes tipos de Datos
• Muchas formas de usar los datos warehouse
• Muchas formas de estructurar los datos
• Múltiples técnicas de modelado
• Planificación de replicación
• Grandes cantidades de datos
5




Estructuras de Datos
• Tercera Forma Normal (3NF)
• Esquema Estrella
• Esquema de copo de nieve
6



Esquema Estrella
     Product Table           Store Table
     Product_id              Store_id
     Product_disc,...        District_id,...

                     Sales Fact Table
                     Product_id
                     Store_id
 Tabla de hechos                             Dimensiones
    centrales
                     Item_id                desnormalizadas
                     Day_id
                     Sales_amount
                     Sales_units, ...

     Time Table
     Day_id                    Item Table
     Month_id                  Item_id
     Year_id,...               Item_desc,...
7




Modelo de Copo de Nieve
                       Store Table
   Product Table                           District Table
                       Store_id
   Product_id                             District_id
                      Store_desc
  Product_desc                           District_desc
                     District_id
           Sales Fact Table
               Item_id
              Store_id
             Product_id
               Week_id
           Sales_amount
            Sales_units

  Time Table        Item Table       Dept Table      Mgr Table
   Week_id          Item_id           Dept_id        Dept_id
  Period_id        Item_desc         Dept_desc        Mgr_id
   Year_id          Dept_id            Mgr_id       Mgr_name
8




Modelo de Copo de Nieve (…Cont)
• De uso directo por algunas herramientas
• Más flexible al cambio
• Provee una carga más rápida de datos
• Puede volverse grande e inmanejable
• Degrada el rendimiento de la consulta
• Metadatos más complejos
    Country       State       County        City
9




Fases de Diseño
• Fase 1 
  Definir el modelo de negocios
• Fase 2 
  Definir el modelo dimensional
• Fase 3 
  Definir el modelo físico
10




Fase 1: Modelo de Negocio
• Realizar análisis estratégico
• Crear el modelo de negocio
• Documentar los metadatos
11




Análisis Estratégico
• Identificar los procesos cruciales del negocio
• Entender los procesos del negocio
• Prioriza y seleccionar los procesos de negocio a
 implementar


                    Alta


               Beneficios del
                  Negocio


                    Baja

                                Baja   Viabilidad    Alta
12




Crear el Modelo de Negocios
• Definir los requerimientos del negocio:
  • Identificar las medidas del negocio
  • Identificar las dimensiones
  • Identificar del grano
  • Identificar las definiciones del negocio y reglas
• Verificar las fuentes de los datos
13




Diseño de los procesos
• Entrada primaria:




                        Requirimientos
                         del Negocio
• Entrada secundaria:




  Metadatos Existentes Producción del Modelo ERD   Investigación
14




Identificar Medidas y Dimensiones

                       •El atributo varía
                       continuamente:
             Medidas
                        • Balance
                        • Unidades Vendidas
                        • Costo
                        • Ventas


       Elatributo se percibe como
       una constante o discreto:
         Producto                 Dimensiones
         Ubicación

         Tiempo

         Tamaño
15



Matriz de Procesos de Negocios

Dimensiones                    Proceso de Negocio
de Negocio        Ventas        Devoluciones      Inventario
Cliente
Fecha
Producto
Canal
Promoción

           Ejemplo de la matriz de procesos de negocio
16




Determinar Granularidad

   Anual?
     Por Cuatrimestre?
        Mensual?
            Semanal?
              Diario?
17




Identificar la Reglas de Negocio

        Ubicación                  Producto

       Proximidad         Tipo    Monitor     Estado
       Geográfica         PC       15 pulg    Nuevo
       0 - 1 millas       Servidor 17 pulg    Reconstr
       1 - 5 millas                19 pulg    Personali
       > 5 millas                  Ninguna


          Tiempo                   Almacén
   Mensual >                Almacén > Distrito >
   Cuatrimestre > Anual     Región
18




Documentación de Metadatos
• Documentación del diseño de los procesos
• Documentación del proceso de desarrollo
• Dar un registro de los cambios
• Mejoras en el tiempo de grabación
19




Enfoques de Documentación de Metadatos
• Automatizado
  • Herramientas de modelado de Datos
  • Herramientas ETL
  • Herramientas de usuario final
• Manual
20




Fase 2: Modelo Dimensional
• Identificar las tablas de hecho:
   • Traducir las medidas de negocio en tablas de hecho
   • Analizar la información fuente del sistema para medidas
     adicionales
• Identificar las tablas de dimensión
• Enlazar las tablas de hecho a las tablas de dimensión
• Modelar la dimensión temporal
21



Características

• Contiene métricas numéricas del negocio
• Puede contener grandes volúmenes de datos
• Puede crecer rápidamente
• Puede contener datos base, derivados y resumidos
• Son típicamente aditivos
• Unidos a las tablas de dimensión a través de llaves
 foráneas que hacen referencia a llaves primarias de las
 tablas de dimensión
22




Características de Tablas de dimensión
• Contiene información textual que representa los atributos
  del negocio
• Contiene datos relativamente estáticos
• Unidos a la tabla de hechos a través de refrencia de llave
  foránea
23


Características del Modelo Dimensional de
Estrella
• Fácil de entender para los usuarios
• Llaves primarias representan una dimensión
• Ninguna columna de llaves son valores
• Hechos usualmente son altamente normalizados
• Las dimensiones están completamente
  desnormalizadas
• Brinda respuesta rápida a las consultas
• Se mejora el rendimiento reduciendo los joins en las
  tablas
• Muchas herramientas dan soporte
24




Tiempo en Data warehouse
• Definición de estándares para el tiempo es crítico
• La agregación basada en el tiempo es compleja
25




Tiempo de Dimensión
• Una representación consistente del tiempo se requiere
 para la extensión




        Hechos de                           Tiempo de
          Ventas                            Dimensión

      ¿Dónde debería almacenarse el tiempo de dimensión?
26




Herramientas de Modelado de Datos
• Las herramientas que tienen GUI permiten definición,
  modelado y reportes
• Evitar una mezcla de técnicas de modelado, causadas
  por:
  • Presiones de desarrollo
  • Desarrolladores con falta de conocimiento
  • Sin estrategia
• Determinar una estrategia
• Escribir y publicar formalmente
• Ponerlo disponible electrónicamente
27




Fase 3: Modelo Físico
• Traducir el diseño dimensional en un modelo físico para
    implementación
•   Definir la estrategia de almacenamiento para tablas e
    índices
•   Realizar el dimensionamiento de la BD
•   Definir la estrategia inicial de indexado
•   Definir la estrategia de particionamiento
•   Actualizar el documento de metadatos con información
    física
28




Tareas de Diseño
• Definir los estándares de nombrado y Base de Datos
• Realizar el dimensionamiento de la BD
• Desarrollar un estrategia inicial de indexado
• Desarrollar un estrategia de particionamiento de
  datos
• Definir los parámetros de almacenamiento
• Usar el procesamiento en paralelo
• Definir datos de resumen
• Determinar la arquitectura del hardware
29




Convenciones de Nombres de BD
• Desarrollar una lista razonable de abreviaturas
• Listar los nombres de todos los objetos y trabajar con
  la comunidad de usuarios para definirlos
• Resolver las disputas de nombres
• Documentar los estándares de nombres en el
  documento de metadatos
• Plan para la denominación de normas para ser un
  documento activo
30




Requerimientos de Arquitectura

 Escalabilidad   Manejabilidad Disponibilidad Extensibilidad


             Flexibilidad                Integración




                     Usuario         Negocio

                 Presupuesto         Tecnología
31




Estrategia para Definir Arquitectura
• Obtener planes de arquitectura existentes
• Obtener planes de capacidad existentes
• Documentar las interfases existentes
• Preparar el plan de capacitación
• Preparar la arquitectura técnica
• Documentar los requerimientos del SO
• Desarrollar planes de recuperación
• Desarrollar planes de control y seguridad
• Crear la arquitectura
• Crear asesoramiento para riegos técnicos
32




Requerimientos de Hardware
• SMP
• Cluster
• MPP
• NUMA
• Híbridos (empleo de SMP y MPP)
33




La Elección Correcta
• Los requerimientos difieren según el SO
• Área Financiera:
  • Disponible para vendedores
  • Desarrollado por usted mismo
  • Uso de consultas realistas
• La escalabilidad es importante
34


Consideraciones de Almacenaje y
Rendimiento
• Dimensionamiento de la BD
• Particionamiento de la BD
  • Horizontal
  • Vertical
• Indexado
   • Árboles B
   • Bitmap
   • Bitmap-join
• Optimización de consultas estrella
  • Transformación estrella
35




Dimensionar la BD
• El tamaño influye en la capacidad de planeamiento y la
  administración del ambiente de sistemas
• El dimensionamiento no es una ciencia exacta
• La técnicas varían
36




Muestreo de Prueba de Carga
• Asegura que los reflejos de la muestra:
  • Pruebe cargas para diferentes periodos
  • Operaciones de día a día
  • Datos de temporada y los peores escenarios
  • Índices y Resúmenes
37




Particionamiento
• Romper los datos en unidades físicas separadas que
  se pueden manejar independientemente
• Provee la facilidad de:
 • Reestructurar
 • Reorganizar
 • Remover
 • Recuperar
 • Monitorear
 • Adminstrar
 • Archivar
 • Indexar
38




Particionamiento Horizontal
• Los datos de tabla e índices están divididos por:
   • Tiempo
   • Región de Ventas o persona
   • Geografía
   • Organización
   • Línea de negocios
• Las columnas candidatas aparecen en la cláusula WHERE
• El análisis determina requerimientos
39




Particionamiento Vertical
• Lo puede usar cuando:
   • Para acelerar la consulta y acciones de actualización
   • Los usuarios requieren acceso a columnas específicas
   • Algunos datos se cambian con poca frecuencia
   • Texto de dimensión descriptiva es mejor que se aleje de la misma
     dimensión
40




Métodos de Particionamiento
• Particionamiento de rango
• Particionamiento de lista
• Particionamiento hash
• Particionamiento Compuesto:
  • Particionamiento compuesto de rango hash
  • Particionamiento compuesto de rango de lista
• Particionamiento de Índice
41




Indexado
• Se usa por las siguientes razones:
  • Enorme ahorro de costos, gran mejoría de rendimiento y
    escalabilidad
  • Se puede sustituir un cuadro completo de exploración de una
    rápida lectura del índice, seguida de una lectura única de los
    bloques de disco que contienen los registros necesarios
42




Índice Árbol B
• Tipo más común de índice
• Usado por columnas de alta cardinalidad
• Diseñado para pocas filas devueltas
43




Índices Bitmap
• Da beneficios de desempeño y ahorros de
  almacenamiento
• Almacena valores como 1s y 0s
• Use en lugar de los índices árboles B cuando:
 • Las tablas son muy grandes
 • Las columnas tienen relativamente baja cardinalidad
44




Índices Bitmap-Join
• Para la unión de dos o más tablas:
  • Son nuevas en Oracle 9i
  • Proveen mejor desempeño y ahorro de almacenamiento
45




Optimización de la consulta Estrella
• Ajustar las consultas estrella
  • Debe construirse un índice bitmap sobre cada llave foránea en la
    tabla de hechos
  • STAR_TRANFORMATION_ENABLE debe estar en TRUE
  • El optimizador basado en el costo debe usarse
• Usar la transformación estrella
46




Transformación Estrella
• Funcionan bien para esquemas con tablas de hechos de
  números pequeños de dimensiones y densidad
• Dos fases:
 • La primera devuelve exactamente las filas necesarias de la tabla
   de hechos
 • La segunda fase, une este conjunto de resultados a las tablas de
   dimensión
47




Paralelismo

                       P1          P2         P3
   Tabla Ventas


   Tabla Clientes      P1          P2         P3




                    Servidores en Ejecución Paralela
48




Uso de Datos Resumidos
• Da los siguientes beneficios:
  • Brinda acceso rápido a datos preanalizados
  • Reduce el uso de E/S, CPU y memoria
49




Reescritura de Consultas – Oracle 9i
               Reescritura   Generar Plan



              Generar Plan



                               Elección
                             (Basada en el
                                costo)
                Ejecutar
50




Resumen
• Existen diferentes estructuras de datos de Data
  warehouse
• Existen tres modelos para esto:
  • Modelo de Negocios
  • Modelo Dimensional
  • Modelo Físico
51




Derechos de autor
• Esta presentación está basada en el contenido de
 Gerardo Brenes
52




MODELADO DE LA
DATA WAREHOUSE
Dr. Eduardo Castro, MSc
ecastro@simsasys.com

http://ecastrom.blogspot.com
http://comunidadwindows.org
http://tiny.cc/comwindows
Facebook: ecastrom
Twitter: edocastro

Más contenido relacionado

La actualidad más candente

Analisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A ObjetosAnalisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A Objetosyoiner santiago
 
Unidad 2.1 DiseñO De Sistemas
Unidad 2.1 DiseñO De SistemasUnidad 2.1 DiseñO De Sistemas
Unidad 2.1 DiseñO De SistemasSergio Sanchez
 
Modelo Entidad Relacion E-R
Modelo Entidad Relacion E-RModelo Entidad Relacion E-R
Modelo Entidad Relacion E-RRobert Rodriguez
 
SISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBDSISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBDIsabel C de Talamas
 
Modelo Del Negocio con RUP y UML Parte 2
Modelo Del Negocio con RUP y UML Parte 2Modelo Del Negocio con RUP y UML Parte 2
Modelo Del Negocio con RUP y UML Parte 2David Motta Baldarrago
 
Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)LPI ONG
 
Introducción a los modelos de datos
Introducción a los modelos de datosIntroducción a los modelos de datos
Introducción a los modelos de datosGalo Anzules
 
Diagrama de actividad
Diagrama de actividadDiagrama de actividad
Diagrama de actividadJose Arellano
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Desarrollo de un sistema con rup uml
Desarrollo de un sistema con rup umlDesarrollo de un sistema con rup uml
Desarrollo de un sistema con rup umlRudy Junior
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicojosecuartas
 
Introducción a Business Intelligence
Introducción a Business IntelligenceIntroducción a Business Intelligence
Introducción a Business IntelligenceJuan Azcurra
 
Diccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de informaciónDiccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de informaciónYaskelly Yedra
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5siusma
 
Diagrama de actividades
Diagrama de actividadesDiagrama de actividades
Diagrama de actividadesnoeliaaiza
 
Modelo Relacional (Base de Datos)
Modelo Relacional (Base de Datos)Modelo Relacional (Base de Datos)
Modelo Relacional (Base de Datos)Neguib Núñez
 
Funciones de un administrador de base de datos
Funciones de un administrador de base de datosFunciones de un administrador de base de datos
Funciones de un administrador de base de datosRodolfo Kuman Chi
 

La actualidad más candente (20)

Analisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A ObjetosAnalisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A Objetos
 
Unidad 2.1 DiseñO De Sistemas
Unidad 2.1 DiseñO De SistemasUnidad 2.1 DiseñO De Sistemas
Unidad 2.1 DiseñO De Sistemas
 
Data mart
Data martData mart
Data mart
 
Funciones del DBA, SA Y DA
Funciones del DBA, SA Y DAFunciones del DBA, SA Y DA
Funciones del DBA, SA Y DA
 
Modelo Entidad Relacion E-R
Modelo Entidad Relacion E-RModelo Entidad Relacion E-R
Modelo Entidad Relacion E-R
 
SISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBDSISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBD
 
Modelo Del Negocio con RUP y UML Parte 2
Modelo Del Negocio con RUP y UML Parte 2Modelo Del Negocio con RUP y UML Parte 2
Modelo Del Negocio con RUP y UML Parte 2
 
Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)
 
Introducción a los modelos de datos
Introducción a los modelos de datosIntroducción a los modelos de datos
Introducción a los modelos de datos
 
Diagrama de actividad
Diagrama de actividadDiagrama de actividad
Diagrama de actividad
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Desarrollo de un sistema con rup uml
Desarrollo de un sistema con rup umlDesarrollo de un sistema con rup uml
Desarrollo de un sistema con rup uml
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logico
 
Introducción a Business Intelligence
Introducción a Business IntelligenceIntroducción a Business Intelligence
Introducción a Business Intelligence
 
Diccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de informaciónDiccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de información
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5
 
Diagrama de actividades
Diagrama de actividadesDiagrama de actividades
Diagrama de actividades
 
Modelo Relacional (Base de Datos)
Modelo Relacional (Base de Datos)Modelo Relacional (Base de Datos)
Modelo Relacional (Base de Datos)
 
Funciones de un administrador de base de datos
Funciones de un administrador de base de datosFunciones de un administrador de base de datos
Funciones de un administrador de base de datos
 

Similar a Modelado de Data Warehouse

2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousingLuis
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Sistemas de Soporte a las Decisiones.pptx
Sistemas de Soporte a las Decisiones.pptxSistemas de Soporte a las Decisiones.pptx
Sistemas de Soporte a las Decisiones.pptxJosAlumno
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introductionandres hurtado
 
Bi4 Dynamics Catálogo
Bi4 Dynamics CatálogoBi4 Dynamics Catálogo
Bi4 Dynamics CatálogoColumbusSpain
 
Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ...
 Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ... Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ...
Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ...CLARA CAMPROVIN
 
Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Raul Martin Sarachaga Diaz
 
Gira Latam Gold 2021 - Mejores Prácticas de Modelado con Power BI
Gira Latam Gold 2021  - Mejores Prácticas de Modelado con Power BIGira Latam Gold 2021  - Mejores Prácticas de Modelado con Power BI
Gira Latam Gold 2021 - Mejores Prácticas de Modelado con Power BIdbLearner
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data EnvironmentJoseph Lopez
 
Inteligencia de negocios la informacin como factor crtico de exito
Inteligencia de negocios la informacin como factor crtico de exitoInteligencia de negocios la informacin como factor crtico de exito
Inteligencia de negocios la informacin como factor crtico de exitoMaurice Frayssinet
 
Implementación de un Sistema BI
Implementación de un Sistema BIImplementación de un Sistema BI
Implementación de un Sistema BIkualtus
 
Estrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analíticaEstrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analíticaSolidQ
 

Similar a Modelado de Data Warehouse (20)

2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Proyectos de BI Factibles Genexus XIX
Proyectos de BI Factibles Genexus XIXProyectos de BI Factibles Genexus XIX
Proyectos de BI Factibles Genexus XIX
 
Sistemas de Soporte a las Decisiones.pptx
Sistemas de Soporte a las Decisiones.pptxSistemas de Soporte a las Decisiones.pptx
Sistemas de Soporte a las Decisiones.pptx
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
 
Bi4 Dynamics Catálogo
Bi4 Dynamics CatálogoBi4 Dynamics Catálogo
Bi4 Dynamics Catálogo
 
Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ...
 Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ... Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ...
Lo que hay que saber si quieres migrar o actualizar tu versión de Microsoft ...
 
Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016
 
Gira Latam Gold 2021 - Mejores Prácticas de Modelado con Power BI
Gira Latam Gold 2021  - Mejores Prácticas de Modelado con Power BIGira Latam Gold 2021  - Mejores Prácticas de Modelado con Power BI
Gira Latam Gold 2021 - Mejores Prácticas de Modelado con Power BI
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data Environment
 
Inteligencia de negocios la informacin como factor crtico de exito
Inteligencia de negocios la informacin como factor crtico de exitoInteligencia de negocios la informacin como factor crtico de exito
Inteligencia de negocios la informacin como factor crtico de exito
 
Modelado
ModeladoModelado
Modelado
 
Implementación de un Sistema BI
Implementación de un Sistema BIImplementación de un Sistema BI
Implementación de un Sistema BI
 
Oracle bI(inteligencia de negocios)
Oracle bI(inteligencia de negocios)Oracle bI(inteligencia de negocios)
Oracle bI(inteligencia de negocios)
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
 
Entregable final
Entregable finalEntregable final
Entregable final
 
Datawarehouse2
Datawarehouse2Datawarehouse2
Datawarehouse2
 
Estrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analíticaEstrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analítica
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
 

Más de Eduardo Castro

Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL ServerEduardo Castro
 
Creando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerCreando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerEduardo Castro
 
Seguridad en SQL Azure
Seguridad en SQL AzureSeguridad en SQL Azure
Seguridad en SQL AzureEduardo Castro
 
Azure Synapse Analytics MLflow
Azure Synapse Analytics MLflowAzure Synapse Analytics MLflow
Azure Synapse Analytics MLflowEduardo Castro
 
SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022Eduardo Castro
 
Novedades en SQL Server 2022
Novedades en SQL Server 2022Novedades en SQL Server 2022
Novedades en SQL Server 2022Eduardo Castro
 
Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Eduardo Castro
 
Machine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceMachine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceEduardo Castro
 
Novedades en sql server 2022
Novedades en sql server 2022Novedades en sql server 2022
Novedades en sql server 2022Eduardo Castro
 
Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Eduardo Castro
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricksEduardo Castro
 
Pronosticos con sql server
Pronosticos con sql serverPronosticos con sql server
Pronosticos con sql serverEduardo Castro
 
Data warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsData warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsEduardo Castro
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Eduardo Castro
 
Introduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsIntroduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsEduardo Castro
 
Seguridad de SQL Database en Azure
Seguridad de SQL Database en AzureSeguridad de SQL Database en Azure
Seguridad de SQL Database en AzureEduardo Castro
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL ServerEduardo Castro
 
Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Eduardo Castro
 
Script de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesScript de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesEduardo Castro
 
Introducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesIntroducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesEduardo Castro
 

Más de Eduardo Castro (20)

Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
 
Creando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL ServerCreando tu primer ambiente de AI en Azure ML y SQL Server
Creando tu primer ambiente de AI en Azure ML y SQL Server
 
Seguridad en SQL Azure
Seguridad en SQL AzureSeguridad en SQL Azure
Seguridad en SQL Azure
 
Azure Synapse Analytics MLflow
Azure Synapse Analytics MLflowAzure Synapse Analytics MLflow
Azure Synapse Analytics MLflow
 
SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022SQL Server 2019 con Windows Server 2022
SQL Server 2019 con Windows Server 2022
 
Novedades en SQL Server 2022
Novedades en SQL Server 2022Novedades en SQL Server 2022
Novedades en SQL Server 2022
 
Introduccion a SQL Server 2022
Introduccion a SQL Server 2022Introduccion a SQL Server 2022
Introduccion a SQL Server 2022
 
Machine Learning con Azure Managed Instance
Machine Learning con Azure Managed InstanceMachine Learning con Azure Managed Instance
Machine Learning con Azure Managed Instance
 
Novedades en sql server 2022
Novedades en sql server 2022Novedades en sql server 2022
Novedades en sql server 2022
 
Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022Sql server 2019 con windows server 2022
Sql server 2019 con windows server 2022
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricks
 
Pronosticos con sql server
Pronosticos con sql serverPronosticos con sql server
Pronosticos con sql server
 
Data warehouse con azure synapse analytics
Data warehouse con azure synapse analyticsData warehouse con azure synapse analytics
Data warehouse con azure synapse analytics
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2
 
Introduccion a Azure Synapse Analytics
Introduccion a Azure Synapse AnalyticsIntroduccion a Azure Synapse Analytics
Introduccion a Azure Synapse Analytics
 
Seguridad de SQL Database en Azure
Seguridad de SQL Database en AzureSeguridad de SQL Database en Azure
Seguridad de SQL Database en Azure
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL Server
 
Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft Servicios Cognitivos de de Microsoft
Servicios Cognitivos de de Microsoft
 
Script de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure EnclavesScript de paso a paso de configuración de Secure Enclaves
Script de paso a paso de configuración de Secure Enclaves
 
Introducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure EnclavesIntroducción a conceptos de SQL Server Secure Enclaves
Introducción a conceptos de SQL Server Secure Enclaves
 

Último

Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxtjcesar1
 
Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)JuanStevenTrujilloCh
 
LINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptx
LINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptxLINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptx
LINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptxkimontey
 
La tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedadLa tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedadEduardoSantiagoSegov
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdfBetianaJuarez1
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024u20211198540
 
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armadob7fwtwtfxf
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptxHugoGutierrez99
 
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1ivanapaterninar
 
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Marketing BRANDING
 
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docxTALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docxobandopaula444
 
Actividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolarActividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolar24roberto21
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfFernandoOblitasVivan
 
Trabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointTrabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointValerioIvanDePazLoja
 
David_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDavid_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDAVIDROBERTOGALLEGOS
 
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosAlbanyMartinez7
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfedepmariaperez
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerenciacubillannoly
 

Último (20)

Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
 
Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)Análisis de los artefactos (nintendo NES)
Análisis de los artefactos (nintendo NES)
 
LINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptx
LINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptxLINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptx
LINEA DE TIEMPO LITERATURA DIFERENCIADO LITERATURA.pptx
 
La tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedadLa tecnología y su impacto en la sociedad
La tecnología y su impacto en la sociedad
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
 
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armado
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
 
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1
 
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
 
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docxTALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docx
 
Actividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolarActividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolar
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdf
 
Trabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointTrabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power Point
 
David_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptxDavid_Gallegos - tarea de la sesión 11.pptx
David_Gallegos - tarea de la sesión 11.pptx
 
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos Juridicos
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdf
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerencia
 

Modelado de Data Warehouse

  • 1. 1 MODELADO DE LA DATA WAREHOUSE Dr. Eduardo Castro, MSc ecastro@simsasys.com http://ecastrom.blogspot.com http://comunidadwindows.org http://tiny.cc/comwindows Facebook: ecastrom Twitter: edocastro
  • 2. 2 Objetivos • Discutir las estructuras de datos del ambiente data warehouse • Discutir las fases del diseño de la BD Data warehouse • Definir el modelo de negocios • Definir el modelo dimensional • Definir el modelo físico
  • 4. 4 Problemas de Modelado • Diferentes tipos de Datos • Muchas formas de usar los datos warehouse • Muchas formas de estructurar los datos • Múltiples técnicas de modelado • Planificación de replicación • Grandes cantidades de datos
  • 5. 5 Estructuras de Datos • Tercera Forma Normal (3NF) • Esquema Estrella • Esquema de copo de nieve
  • 6. 6 Esquema Estrella Product Table Store Table Product_id Store_id Product_disc,... District_id,... Sales Fact Table Product_id Store_id Tabla de hechos Dimensiones centrales Item_id desnormalizadas Day_id Sales_amount Sales_units, ... Time Table Day_id Item Table Month_id Item_id Year_id,... Item_desc,...
  • 7. 7 Modelo de Copo de Nieve Store Table Product Table District Table Store_id Product_id District_id Store_desc Product_desc District_desc District_id Sales Fact Table Item_id Store_id Product_id Week_id Sales_amount Sales_units Time Table Item Table Dept Table Mgr Table Week_id Item_id Dept_id Dept_id Period_id Item_desc Dept_desc Mgr_id Year_id Dept_id Mgr_id Mgr_name
  • 8. 8 Modelo de Copo de Nieve (…Cont) • De uso directo por algunas herramientas • Más flexible al cambio • Provee una carga más rápida de datos • Puede volverse grande e inmanejable • Degrada el rendimiento de la consulta • Metadatos más complejos Country State County City
  • 9. 9 Fases de Diseño • Fase 1  Definir el modelo de negocios • Fase 2  Definir el modelo dimensional • Fase 3  Definir el modelo físico
  • 10. 10 Fase 1: Modelo de Negocio • Realizar análisis estratégico • Crear el modelo de negocio • Documentar los metadatos
  • 11. 11 Análisis Estratégico • Identificar los procesos cruciales del negocio • Entender los procesos del negocio • Prioriza y seleccionar los procesos de negocio a implementar Alta Beneficios del Negocio Baja Baja Viabilidad Alta
  • 12. 12 Crear el Modelo de Negocios • Definir los requerimientos del negocio: • Identificar las medidas del negocio • Identificar las dimensiones • Identificar del grano • Identificar las definiciones del negocio y reglas • Verificar las fuentes de los datos
  • 13. 13 Diseño de los procesos • Entrada primaria: Requirimientos del Negocio • Entrada secundaria: Metadatos Existentes Producción del Modelo ERD Investigación
  • 14. 14 Identificar Medidas y Dimensiones •El atributo varía continuamente: Medidas • Balance • Unidades Vendidas • Costo • Ventas Elatributo se percibe como una constante o discreto:  Producto Dimensiones  Ubicación  Tiempo  Tamaño
  • 15. 15 Matriz de Procesos de Negocios Dimensiones Proceso de Negocio de Negocio Ventas Devoluciones Inventario Cliente Fecha Producto Canal Promoción Ejemplo de la matriz de procesos de negocio
  • 16. 16 Determinar Granularidad Anual? Por Cuatrimestre? Mensual? Semanal? Diario?
  • 17. 17 Identificar la Reglas de Negocio Ubicación Producto Proximidad Tipo Monitor Estado Geográfica PC 15 pulg Nuevo 0 - 1 millas Servidor 17 pulg Reconstr 1 - 5 millas 19 pulg Personali > 5 millas Ninguna Tiempo Almacén Mensual > Almacén > Distrito > Cuatrimestre > Anual Región
  • 18. 18 Documentación de Metadatos • Documentación del diseño de los procesos • Documentación del proceso de desarrollo • Dar un registro de los cambios • Mejoras en el tiempo de grabación
  • 19. 19 Enfoques de Documentación de Metadatos • Automatizado • Herramientas de modelado de Datos • Herramientas ETL • Herramientas de usuario final • Manual
  • 20. 20 Fase 2: Modelo Dimensional • Identificar las tablas de hecho: • Traducir las medidas de negocio en tablas de hecho • Analizar la información fuente del sistema para medidas adicionales • Identificar las tablas de dimensión • Enlazar las tablas de hecho a las tablas de dimensión • Modelar la dimensión temporal
  • 21. 21 Características • Contiene métricas numéricas del negocio • Puede contener grandes volúmenes de datos • Puede crecer rápidamente • Puede contener datos base, derivados y resumidos • Son típicamente aditivos • Unidos a las tablas de dimensión a través de llaves foráneas que hacen referencia a llaves primarias de las tablas de dimensión
  • 22. 22 Características de Tablas de dimensión • Contiene información textual que representa los atributos del negocio • Contiene datos relativamente estáticos • Unidos a la tabla de hechos a través de refrencia de llave foránea
  • 23. 23 Características del Modelo Dimensional de Estrella • Fácil de entender para los usuarios • Llaves primarias representan una dimensión • Ninguna columna de llaves son valores • Hechos usualmente son altamente normalizados • Las dimensiones están completamente desnormalizadas • Brinda respuesta rápida a las consultas • Se mejora el rendimiento reduciendo los joins en las tablas • Muchas herramientas dan soporte
  • 24. 24 Tiempo en Data warehouse • Definición de estándares para el tiempo es crítico • La agregación basada en el tiempo es compleja
  • 25. 25 Tiempo de Dimensión • Una representación consistente del tiempo se requiere para la extensión Hechos de Tiempo de Ventas Dimensión ¿Dónde debería almacenarse el tiempo de dimensión?
  • 26. 26 Herramientas de Modelado de Datos • Las herramientas que tienen GUI permiten definición, modelado y reportes • Evitar una mezcla de técnicas de modelado, causadas por: • Presiones de desarrollo • Desarrolladores con falta de conocimiento • Sin estrategia • Determinar una estrategia • Escribir y publicar formalmente • Ponerlo disponible electrónicamente
  • 27. 27 Fase 3: Modelo Físico • Traducir el diseño dimensional en un modelo físico para implementación • Definir la estrategia de almacenamiento para tablas e índices • Realizar el dimensionamiento de la BD • Definir la estrategia inicial de indexado • Definir la estrategia de particionamiento • Actualizar el documento de metadatos con información física
  • 28. 28 Tareas de Diseño • Definir los estándares de nombrado y Base de Datos • Realizar el dimensionamiento de la BD • Desarrollar un estrategia inicial de indexado • Desarrollar un estrategia de particionamiento de datos • Definir los parámetros de almacenamiento • Usar el procesamiento en paralelo • Definir datos de resumen • Determinar la arquitectura del hardware
  • 29. 29 Convenciones de Nombres de BD • Desarrollar una lista razonable de abreviaturas • Listar los nombres de todos los objetos y trabajar con la comunidad de usuarios para definirlos • Resolver las disputas de nombres • Documentar los estándares de nombres en el documento de metadatos • Plan para la denominación de normas para ser un documento activo
  • 30. 30 Requerimientos de Arquitectura Escalabilidad Manejabilidad Disponibilidad Extensibilidad Flexibilidad Integración Usuario Negocio Presupuesto Tecnología
  • 31. 31 Estrategia para Definir Arquitectura • Obtener planes de arquitectura existentes • Obtener planes de capacidad existentes • Documentar las interfases existentes • Preparar el plan de capacitación • Preparar la arquitectura técnica • Documentar los requerimientos del SO • Desarrollar planes de recuperación • Desarrollar planes de control y seguridad • Crear la arquitectura • Crear asesoramiento para riegos técnicos
  • 32. 32 Requerimientos de Hardware • SMP • Cluster • MPP • NUMA • Híbridos (empleo de SMP y MPP)
  • 33. 33 La Elección Correcta • Los requerimientos difieren según el SO • Área Financiera: • Disponible para vendedores • Desarrollado por usted mismo • Uso de consultas realistas • La escalabilidad es importante
  • 34. 34 Consideraciones de Almacenaje y Rendimiento • Dimensionamiento de la BD • Particionamiento de la BD • Horizontal • Vertical • Indexado • Árboles B • Bitmap • Bitmap-join • Optimización de consultas estrella • Transformación estrella
  • 35. 35 Dimensionar la BD • El tamaño influye en la capacidad de planeamiento y la administración del ambiente de sistemas • El dimensionamiento no es una ciencia exacta • La técnicas varían
  • 36. 36 Muestreo de Prueba de Carga • Asegura que los reflejos de la muestra: • Pruebe cargas para diferentes periodos • Operaciones de día a día • Datos de temporada y los peores escenarios • Índices y Resúmenes
  • 37. 37 Particionamiento • Romper los datos en unidades físicas separadas que se pueden manejar independientemente • Provee la facilidad de: • Reestructurar • Reorganizar • Remover • Recuperar • Monitorear • Adminstrar • Archivar • Indexar
  • 38. 38 Particionamiento Horizontal • Los datos de tabla e índices están divididos por: • Tiempo • Región de Ventas o persona • Geografía • Organización • Línea de negocios • Las columnas candidatas aparecen en la cláusula WHERE • El análisis determina requerimientos
  • 39. 39 Particionamiento Vertical • Lo puede usar cuando: • Para acelerar la consulta y acciones de actualización • Los usuarios requieren acceso a columnas específicas • Algunos datos se cambian con poca frecuencia • Texto de dimensión descriptiva es mejor que se aleje de la misma dimensión
  • 40. 40 Métodos de Particionamiento • Particionamiento de rango • Particionamiento de lista • Particionamiento hash • Particionamiento Compuesto: • Particionamiento compuesto de rango hash • Particionamiento compuesto de rango de lista • Particionamiento de Índice
  • 41. 41 Indexado • Se usa por las siguientes razones: • Enorme ahorro de costos, gran mejoría de rendimiento y escalabilidad • Se puede sustituir un cuadro completo de exploración de una rápida lectura del índice, seguida de una lectura única de los bloques de disco que contienen los registros necesarios
  • 42. 42 Índice Árbol B • Tipo más común de índice • Usado por columnas de alta cardinalidad • Diseñado para pocas filas devueltas
  • 43. 43 Índices Bitmap • Da beneficios de desempeño y ahorros de almacenamiento • Almacena valores como 1s y 0s • Use en lugar de los índices árboles B cuando: • Las tablas son muy grandes • Las columnas tienen relativamente baja cardinalidad
  • 44. 44 Índices Bitmap-Join • Para la unión de dos o más tablas: • Son nuevas en Oracle 9i • Proveen mejor desempeño y ahorro de almacenamiento
  • 45. 45 Optimización de la consulta Estrella • Ajustar las consultas estrella • Debe construirse un índice bitmap sobre cada llave foránea en la tabla de hechos • STAR_TRANFORMATION_ENABLE debe estar en TRUE • El optimizador basado en el costo debe usarse • Usar la transformación estrella
  • 46. 46 Transformación Estrella • Funcionan bien para esquemas con tablas de hechos de números pequeños de dimensiones y densidad • Dos fases: • La primera devuelve exactamente las filas necesarias de la tabla de hechos • La segunda fase, une este conjunto de resultados a las tablas de dimensión
  • 47. 47 Paralelismo P1 P2 P3 Tabla Ventas Tabla Clientes P1 P2 P3 Servidores en Ejecución Paralela
  • 48. 48 Uso de Datos Resumidos • Da los siguientes beneficios: • Brinda acceso rápido a datos preanalizados • Reduce el uso de E/S, CPU y memoria
  • 49. 49 Reescritura de Consultas – Oracle 9i Reescritura Generar Plan Generar Plan Elección (Basada en el costo) Ejecutar
  • 50. 50 Resumen • Existen diferentes estructuras de datos de Data warehouse • Existen tres modelos para esto: • Modelo de Negocios • Modelo Dimensional • Modelo Físico
  • 51. 51 Derechos de autor • Esta presentación está basada en el contenido de Gerardo Brenes
  • 52. 52 MODELADO DE LA DATA WAREHOUSE Dr. Eduardo Castro, MSc ecastro@simsasys.com http://ecastrom.blogspot.com http://comunidadwindows.org http://tiny.cc/comwindows Facebook: ecastrom Twitter: edocastro