Data Warehouse

O que é e qual sua importância?

Um data warehouse (ou armazém de dados) armazena grandes quantidades de dados que foram coletados e integrados de várias fontes. Como as organizações dependem desses dados para aplicar analytics ou criar relatórios, eles precisam ser formatados consistentemente, além de facilmente acessíveis – duas qualidades que definem o uso de data warehouses e os torna essenciais para as empresas de hoje.

História dos data warehouses

Nos anos 1970 e 1980, os dados começaram a proliferar e as empresas precisaram encontrar uma maneira fácil para armazená-los e acessá-los. O cientista da computação Bill Inmon, que é considerado o pai do armazenamento de dados, começou a definir o conceito nos anos 1970 e é o responsável pela criação do termo “data warehouse”. Em 1992, ele publicou um livro intitulado Building the Data Warehouse, tido como uma fonte fundamental para a tecnologia de armazenamento de dados. A definição de Inmon de data warehouse utiliza uma abordagem “de cima para baixo”, em que um repositório central é estabelecido primeiro e, depois, data marts – que contêm subconjuntos específicos de dados – são criados dentro desse repositório.

Ralph Kimball, especialista em tecnologia que publicou The Data Warehouse Toolkit em meados dos anos 1990, aplicou uma tática um pouco diferente ao conceito de data warehouse com sua abordagem “de baixo para cima”, na qual data marts individuais são desenvolvidos primeiro e, depois, integrados para criar um armazém.

O armazenamento de dados continua relevante hoje, e está evoluindo conforme a indústria se transforma para acomodar armazenamento em nuvem e análises em tempo real. Uma ferramenta de banco de dados emergente, similar a um data warehouse, é um data lake, que foi criada por tecnologias disruptivas de baixo custo como o Apache Hadoop. Data lakes são comumente usados em conjunto com fluxos de dados e armazenamento, ambos sem restrições, sem esquemas de construção ou processamento.

Esqueça as limitações na hora de gerenciar seus dados

Como você pode obter insights com o grande número de informações existentes no seu banco de dados? O especialista em gerenciamento de dados Matthew Magne descreve um cenário no qual você pode transmitir, limpar e classificar dados no seu data lake – e, então, extrair conhecimento em tempo real.

Qual a importância dos data warehouses?

Dados são essenciais para que organizações tomem decisões bem-informadas. Logo, é perceptível que data warehouses são tão importantes quanto os dados em si, uma vez que eles guardam todos os dados. Data warehouses podem:

  • Armazenar grandes quantidades de dados em um database central – e em um formato padrão;
  • Integrar dados de diversas fontes e padronizá-los, para que estejam prontos para serem analisados ou reportados;
  • Manter registros históricos, uma vez que data warehouses podem armazenar dados por meses ou mesmo anos;
  • Manter os dados seguros ao armazená-los em um único lugar. O acesso pode ser autorizado apenas àqueles que precisam de dados específicos;
  • Fornecer acesso rápido e fácil aos dados, permitindo tomadas decisões de negócio melhores e mais rápidas.

Armazenamento de dados no mundo de hoje

Um data warehouse muitas vezes significa a diferença entre decisões bem-informadas – e o caos. Saiba como data warehouses estão transformando o mundo em que vivemos.

Data Warehouse Modernization

Data warehouses remain relevant when it comes to big data and analytics, but most need modernization. Find out what you need to do, and why it's important to modernize.

Read summary

Webcast

Hadoop, Simplified

What’s possible with Hadoop – and how can it support your enterprise data warehouse? Learn how to support and extend your data warehouse ecosystem.

Read summary

Data Integration Landscape

Move away from an ad hoc approach to data integration and look for a more comprehensive solution that can execute a variety of data integration programs.

Read summary

Data Integration Déjà Vu

Learn how data integration has evolved over the years, what might be in store for the future and how you can keep your data integration approach current.

Read summary


SAS® Data Management

Dados armazenados em um data warehouse não entregam valor a menos que sejam bem-gerenciados. Com as tecnologias de gerenciamento de dados do SAS, você pode transformar big data em grandes oportunidades com soluções de data integration, data governance, event stream processing e data quality.

Descubra o SAS Data Management

Data warehouses vs. outros sistemas de armazenamento

Embora os data warehouses sejam uma solução de armazenamento de dados comum, eles não são a única solução. Veja como data warehouses se comparam a tipos de tecnologias similares.

Data Warehouse

Armazena uma grande quantidade de dados corporativos, abrangendo diversos assuntos.
Pode ser difícil de construir.
É grande em tamanho.
Os dados são estruturados e preparados para serem usados em análises ou relatórios.

Data Mart

Armazena uma quantidade menor de dados; os dados normalmente cobrem um assunto e são utilizados por um departamento, como marketing ou vendas.
Mais rápidos e fáceis de construir do que um data warehouse.
Memória limitada.
Os dados são estruturados e preparados para serem usados em análises ou relatórios.

Data Lake

Armazena uma grande quantidade de dados brutos.
Os dados permanecem inalterados até que seja preciso modificá-los.
Permite que os usuários consultem conjuntos de dados menores, mais relevantes e flexíveis.

Como funciona?

Um data warehouse começa com os dados em si, que são coletados de fontes internas e externas. Os dados são, normalmente, armazenados em um data warehouse através de um processo de extração, transformação e carregamento (ETL, na sigla em inglês), no qual informações são extraídas da fonte, transformadas em dados de alta qualidade e, então, carregados para um armazém. Empresas realizam esse processo regularmente para manter os dados atualizados e prontos para o próximo passo.

Quando uma organização está pronta para usar seus dados em análises ou relatórios, o foco passa do data warehouse para ferramentas de business intelligence. Tecnologias como visual analytics e data exploration são utilizadas para ajudar empresas a ganhar insights importantes com os dados.