Data Warehouse

Qué es y por qué es importante

Un data warehouse (o data warehouse empresarial) guarda grandes cantidades de datos que han sido recopilados e integrados de múltiples fuentes. Como las organizaciones dependen de estos datos para realizar análisis o reportes, los datos necesitan tener un formato coherente y ser de fácil acceso – dos cualidades que definen a los data warehousing y los hacen esenciales para las empresas de hoy.

Historia del data warehouse

En las décadas de 1970 y 1980, los datos comenzaron a proliferar y las organizaciones necesitaban una forma fácil de almacenar y acceder a esa información. El científico de computo Bill Inmon, quien es considerado el padre de los data warehouses, comenzó a definir el concepto en la década de 1970 y se le acredita haber adoptado el término “data warehouse”. Él publicó Building the Data Warehouse (Construcción del almacén de datos), libro aclamado como fuente fundamental de la tecnología de los almacenes de datos, en 1992. La definición del almacén de datos de Inmon utiliza un enfoque “descendente", donde primero se establece un repositorio centralizado, y luego se crean depósitos de datos – que contienen subconjuntos de datos específicos – dentro de ese repositorio.

Ralph Kimball, otro experto en tecnología que publicó The Data Warehouse Toolkit (Herramientas para almacenes de datos) a mediados de la década de 1990, empleó una táctica ligeramente diferente en torno al concepto de los data warehousing con su enfoque "ascendente", donde se integran depósitos de datos individuales para crear un data warehouse.

Los almacenes de datos siguen siendo relevantes en la actualidad, aunque están evolucionando conforme la industria cambia para acomodar el almacenaje en la nube y la analítica en tiempo real. Una herramienta para almacenamiento de datos emergente que es similar a un data warehouse es un data lake, que es consecuencia de tecnologías desestabilizadoras de bajo costo como Apache Hadoop. Los data lake s se utilizan a menudo junto con el streaming de datos sin restricciones y el almacenamiento sin esquemas de procesamiento o construcción.

Gestione sus datos más allá de las fronteras

¿Cómo puede obtener insights de la enorme cantidad de información en su base de datos? El experto en dominio de gestión de datos Matthew Magne describe un escenario donde usted puede transmitir, depurar y perfilar datos en su data lake – y luego extraer conocimientos en tiempo real.

¿Por qué son importantes los data warehouses?

Los datos son esenciales para las organizaciones que toman decisiones informadas, de modo que es razonable que los data warehouses sean tan importantes porque almacenan todos esos datos. Los data warehouses pueden:

  • Almacenar grandes cantidades de datos en una base de datos central – y en un formato estándar.
  • Integrar datos de diferentes fuentes y estandarizarlos, de modo que se faciliten el análisis y los reportes.
  • Conservar registros históricos, ya que pueden almacenar meses o incluso años de datos.
  • Mantener sus datos seguros almacenándolos en un sitio único. Se puede otorgar acceso sólo a aquellas personas que necesitan datos específicos.
  • Proporcionar acceso fácil y rápido a datos para hacer posibles decisiones de negocios más ágiles.

Data warehousing en el mundo actual

Un data warehouse significa a veces la diferencia entre decisiones informadas – y un caos de datos. Aprenda cómo afectan los data warehouses al mundo en que vivimos.

Modernización de los data warehouse

Los data warehouses siguen siendo relevantes cuando se trata de big data y analítica, pero la mayoría necesitan ser modernizados. Averigüe lo que necesita hacer y por qué es importante modernizarse.

Lea el resumen

Webcast

Hadoop, simplificado<br>

¿Qué se puede hacer con Hadoop – y cómo puede dar soporte a su almacén de datos empresarial? Aprenda cómo dar soporte a y extender su ecosistema de data warehouse.

Lea el resumen

Panorama de integración de datos

Deje a un lado un enfoque específico de la integración de datos y busque una solución más completa que pueda ejecutar diversos programas de integración de datos.

Lea el resumen

Déjà vu de integración de datos

Aprenda cómo ha evolucionado la integración de datos a lo largo de los años, qué puede haber en puerta para el futuro y cómo puede mantener actual su enfoque de la integración de datos.

Lea el resumen

Data warehouses vs. otros sistemas de almacenamiento

Aunque los data warehouses son una solución de almacenamiento común para datos, no es la única solución. Así es como se comparan los data warehouses con tipos de tecnología similares.

Data Warehouse

Almacenan una gran cantidad de datos empresariales que abarcan varias áreas temáticas.
Su construcción puede ser difícil.
Gran tamaño.
Los datos están estructurados y listos para usarse en análisis y reportes.

Data Mart

Almacena una menor cantidad de datos; los datos suelen comprender una única área temático y los utiliza un departamento, como marketing o ventas.
Más fácil y rápido de construir que un data warehouse.
Memoria limitada.
Los datos están estructurados y listos para usarse en análisis y reportes.

Data lake

Almacena una gran cantidad de datos crudos.
Los datos se mantienen en su estado inalterado hasta que se les necesita.
Permite a los usuarios consultar conjuntos de datos de menor tamaño, más relevantes y más flexibles.

Cómo funciona

Un data warehouse comienza con los datos mismos, los cuales se recopilan de fuentes internas y externas. Los datos se suelen guardar en un almacén de datos a través de un proceso de extracción, transformación y carga (ETL, por sus siglas en inglés), donde la información se extrae de la fuente, se transforma en datos de alta calidad y luego se cargan en un warehouse. Las empresas realizan este proceso con regularidad para mantener los datos actualizados y preparados para el paso siguiente.

Cuando una organización está lista para usar sus datos para realizar análisis o reportes, el enfoque cambia de herramientas de data warehousing de inteligencia de negocios. Se utilizan tecnologías como analítica visual y exploración de datos para ayudar a las empresas a obtener insights importantes de los datos.