Data Warehouse
Qué es y por qué es importante
Un data warehouse (o data warehouse empresarial) guarda grandes cantidades de datos que han sido recopilados e integrados de múltiples fuentes. Como las organizaciones dependen de estos datos para realizar análisis o reportes, los datos necesitan tener un formato coherente y ser de fácil acceso – dos cualidades que definen a los data warehousing y los hacen esenciales para las empresas de hoy.
Historia del data warehouse
En las décadas de 1970 y 1980, los datos comenzaron a proliferar y las organizaciones necesitaban una forma fácil de almacenar y acceder a esa información. El científico de computo Bill Inmon, quien es considerado el padre de los data warehouses, comenzó a definir el concepto en la década de 1970 y se le acredita haber adoptado el término “data warehouse”. Él publicó Building the Data Warehouse (Construcción del almacén de datos), libro aclamado como fuente fundamental de la tecnología de los almacenes de datos, en 1992. La definición del almacén de datos de Inmon utiliza un enfoque “descendente", donde primero se establece un repositorio centralizado, y luego se crean depósitos de datos – que contienen subconjuntos de datos específicos – dentro de ese repositorio.
Ralph Kimball, otro experto en tecnología que publicó The Data Warehouse Toolkit (Herramientas para almacenes de datos) a mediados de la década de 1990, empleó una táctica ligeramente diferente en torno al concepto de los data warehousing con su enfoque "ascendente", donde se integran depósitos de datos individuales para crear un data warehouse.
Los almacenes de datos siguen siendo relevantes en la actualidad, aunque están evolucionando conforme la industria cambia para acomodar el almacenaje en la nube y la analítica en tiempo real. Una herramienta para almacenamiento de datos emergente que es similar a un data warehouse es un data lake, que es consecuencia de tecnologías desestabilizadoras de bajo costo como Apache Hadoop. Los data lake s se utilizan a menudo junto con el streaming de datos sin restricciones y el almacenamiento sin esquemas de procesamiento o construcción.
Gestione sus datos más allá de las fronteras
¿Cómo puede obtener insights de la enorme cantidad de información en su base de datos? El experto en dominio de gestión de datos Matthew Magne describe un escenario donde usted puede transmitir, depurar y perfilar datos en su data lake – y luego extraer conocimientos en tiempo real.
¿Por qué son importantes los data warehouses?
Los datos son esenciales para las organizaciones que toman decisiones informadas, de modo que es razonable que los data warehouses sean tan importantes porque almacenan todos esos datos. Los data warehouses pueden:
- Almacenar grandes cantidades de datos en una base de datos central – y en un formato estándar.
- Integrar datos de diferentes fuentes y estandarizarlos, de modo que se faciliten el análisis y los reportes.
- Conservar registros históricos, ya que pueden almacenar meses o incluso años de datos.
- Mantener sus datos seguros almacenándolos en un sitio único. Se puede otorgar acceso sólo a aquellas personas que necesitan datos específicos.
- Proporcionar acceso fácil y rápido a datos para hacer posibles decisiones de negocios más ágiles.
Data warehousing en el mundo actual
Un data warehouse significa a veces la diferencia entre decisiones informadas – y un caos de datos. Aprenda cómo afectan los data warehouses al mundo en que vivimos.
Modernización de los data warehouse
Los data warehouses siguen siendo relevantes cuando se trata de big data y analítica, pero la mayoría necesitan ser modernizados. Averigüe lo que necesita hacer y por qué es importante modernizarse.
Hadoop, simplificado<br>
¿Qué se puede hacer con Hadoop – y cómo puede dar soporte a su almacén de datos empresarial? Aprenda cómo dar soporte a y extender su ecosistema de data warehouse.
Panorama de integración de datos
Deje a un lado un enfoque específico de la integración de datos y busque una solución más completa que pueda ejecutar diversos programas de integración de datos.
Déjà vu de integración de datos
Aprenda cómo ha evolucionado la integración de datos a lo largo de los años, qué puede haber en puerta para el futuro y cómo puede mantener actual su enfoque de la integración de datos.
Data warehouses vs. otros sistemas de almacenamiento
Aunque los data warehouses son una solución de almacenamiento común para datos, no es la única solución. Así es como se comparan los data warehouses con tipos de tecnología similares.
Data Warehouse
Almacenan una gran cantidad de datos empresariales que abarcan varias áreas temáticas.
|
Su construcción puede ser difícil.
|
Gran tamaño.
|
Los datos están estructurados y listos para usarse en análisis y reportes.
|
Data Mart
Almacena una menor cantidad de datos; los datos suelen comprender una única área temático y los utiliza un departamento, como marketing o ventas.
|
Más fácil y rápido de construir que un data warehouse.
|
Memoria limitada.
|
Los datos están estructurados y listos para usarse en análisis y reportes.
|
Data lake
Almacena una gran cantidad de datos crudos.
|
Los datos se mantienen en su estado inalterado hasta que se les necesita.
|
Permite a los usuarios consultar conjuntos de datos de menor tamaño, más relevantes y más flexibles.
|
Learn More About Industries Using This Technology
Cómo funciona
Un data warehouse comienza con los datos mismos, los cuales se recopilan de fuentes internas y externas. Los datos se suelen guardar en un almacén de datos a través de un proceso de extracción, transformación y carga (ETL, por sus siglas en inglés), donde la información se extrae de la fuente, se transforma en datos de alta calidad y luego se cargan en un warehouse. Las empresas realizan este proceso con regularidad para mantener los datos actualizados y preparados para el paso siguiente.
Cuando una organización está lista para usar sus datos para realizar análisis o reportes, el enfoque cambia de herramientas de data warehousing de inteligencia de negocios. Se utilizan tecnologías como analítica visual y exploración de datos para ayudar a las empresas a obtener insights importantes de los datos.
Lea más acerca de este tema
- Data quality management: What you need to knowData quality isn’t simply good or bad. Data quality management puts quality in context to improve fitness of the data you use for analysis and decision-making.
- The importance of data quality: A sustainable approachBad data wrecks countless business ventures. Here’s a data quality plan to help you get it right.
- Key questions to kick off your data analytics projectsThere’s no single blueprint for starting a data analytics project. Technology expert Phil Simon suggests these 10 questions as a guide.
- ¿Qué es un Data Lake y por qué es importante?Un Data Lake es un repositorio de almacenamiento que contiene grandes cantidades de datos en bruto en su formato nativo. Como contenedores de múltiples colecciones de datos en una ubicación conveniente, los Data Lakes permiten el acceso, la exploración y la visualización en modo autoservicio. Así, las empresas pueden ver y acceder a la nueva información más rápidamente.