junio 2010


Cada vez que un analista pretende realizar el estudio del comportamiento del negocio, es inherente encontrar que más de una perspectiva que contextualice los datos.

Esta situación es completamente normal, ya que son muchas las variables que afectan el entorno. Así se encuentra cliente, país, producto, tiempo, canal de distribución, cuenta contable, escenario, venta neta, impuesto, descuento, costo, y un infinito etcétera que es imposible enumerar acá.

De ahí surge el concepto de análisis multidimensional. El cual será definido como la capacidad de contextualizar una variable o más variables (medidas) a través del empleo de perspectivas (dimensiones). Las medidas generalmente serán numéricas y las dimensiones generalmente serán alfanuméricas. Sin embargo, pueden presentarse excepciones a esta regla.

En un mercado tan competitivo como el que enfrentas las organizaciones actuales, la información se ha convertido en el activo más importante. No solo como secreto comercial, sino como indicador clave para tomar las deciones adecuadas en los momentos oportunos. La época en que era necesario esperar el cierre contable a fin de periodo del ejecutivo reactivo ha quedado atrás.

De ahí que, las compañías exitosas, grandes o pequeñas, apoyan sus decisiones en información fundamentada en los datos que sus sistemas transaccionales generan día con día. No tiene que ser un empresa de ingresos anuales multimillonarios. El BI hoy día es una forma sencilla de democratizar la toma de decisiones en todos los niveles de la cadena de mando.

OLTP

Desde hace ya más de 20 años se ha difundido la automatización de actividades. Desde lo más simple hasta lo más complejo. Es cada vez más y más común encontrar procesos automáticos con la finalidad aumentar la productividad y mejorar el servicio. Estos sistemas son excelentes para resolver el día a día. Están optimizados para responder a miles de consultas por segundo. La concurrencia en actividades de lectura y escritura son la regla. Estos son los entornos que se denominan OLTP, del inglés Online Transaction Processing.

Sin embargo, estos ambientes ver frustrados sus inteciones cuando se enfrentan a una situación inevitable: reporteo y apoyo a la toma de decisiones. Si se le suma a ello la heterogeneidad de aplicaciones, genera un escenario mucho más complejo.

Por ejemplo, en cualquier organización es común encontrar los siguientes niveles:

  • Nivel Operacional: estos utilizan sistemas informatizados para monitorear las actividades y transacciones elementales de la organización.
  • Nivel de Conocimientos: este es el primer nivel de análisis. Es común encontrar a trabajadores especializados en funciones o áreas específicas de la corporación. Realizan captura masiva de datos y los tratan a través de tareas específicas.
  • Nivel de Administración: este nivel toma los datos del nivel de conocimiento, da seguimiento, control y toma decisiones.
  • Nivel Estratégico: tiene como objetivo realizar las actividades de planificación de largo plazo.

OLTP está diseñado para que el nivel operativo cumpla a cabalidad sus funciones. Con un poco de trabajo es posible que el nivel de conocimiento pueda realizar análisis con base en la información obtenida. Sin embargo, no permite al nivel de administración y estratégico tomar las decisiones en los tiempo de respuesta que es necesario brindar hoy.

OLAP

Derivado del témino inglés Online Analytical Processing es un enfoque que viene a complementar a OLTP y ofrecer las herramientas que los niveles de conocimiento, administración y estrategia requieren.

El paso desde modelos OLTP a OLAP se presenta diferente en cada situación. La clave del éxito es presentar a los niveles superiores la información en términos de negocio, no técnicos.

Por ejemplo, en los sistemas transaccionales (OLTP), la información de los productos se almacena en diferentes tablas. Esto mejora el rendimiento en los sistemas operativos. Sin embargo, a nivel de tomadores de decisiones, es indiferente si la información está en una o veinte tablas. Es más, no interesa si la información está en tablas o archivos o en la web. El tomador de decisiones ve el negocio en términos de entidades, así que la información que se manipula debe respetar esos criterios.

Es así como a través de procesos ETL (del inglés Extraction, Transformation & Load), se realizan con una frecuencia establecida los procesos de carga de datos desde cada origen disponible (sistemas transaccionales, hojas de cálculo, internet, aliados de negocio, etc), se procesa, estandariza y se generan las entidades de negocio que serán las perspectivas (dimensiones) o variables cuantitativas (medidas).

En el próximo módulo del curso, «Diseño OLAP» se profundizarán los aspectos mencionados y se introducirá el concepto de datawarehouse.

Dada la retroalimentación obtenida, se realizará una serie de artículos que abarcarán los conceptos básicos del business intelligence (BI).

No pretende ser exhaustivo, sino dejar claro conceptos básicos que deben ser dominados por quienes interactuan en este sitio. También se hace para servir como base de discusión de los demás artículos.

Los temas serán organizados en módulos y se describen a continuación:

Módulo #1: Introducción a BI

  • ¿Qué es business intelligence (BI)?
  • ¿Qué puede y qué no puede hacer BI?
  • Posibles escenarios para implantar soluciones de BI
  • Planeación de una estrategia de BI

Módulo #2: Modelo de Análisis Multidimensional

  • Sistemas transaccionales (OLTP)
  • Sistemas OLAP
  • ¿Cómo pasar de OLTP a OLAP vía ETL?
  • Transformación de estructuras de negocio a modelos de análisis

Módulo #3: Diseño OLAP

  • Datamart o datawarehouse, ¿por cuál comenzar?
  • Estructuras de implementación (copo de nieve, estrella)
  • Dimensiones, tablas de hechos y medidas

Módulo #4: Implementación

  • MOLAP, ROLAP, HOLAP, ¿cuál es la diferencia? ¿cuál emplear?
  • Definición de frecuencia de actualización
  • Particionamiento

Modulo #5: Reporteo

  • Reportes estándar
  • Reportes de propósito específico (ad hoc)
  • El negocio expresado como modelo para reportear.
  • Autoservicio

Módulo #6: Mantenimiento

  • Actualización del datawarehouse o datamart
  • Crecimiento de la iniciativa de BI dentro de la organización
  • BI como herramienta de toma de decisiones
  • Siguientes pasos
  • Conclusiones