Data Warehouse
O que é e qual sua importância?
Um data warehouse (ou armazém de dados) armazena grandes quantidades de dados que foram coletados e integrados de várias fontes. Como as organizações dependem desses dados para aplicar analytics ou criar relatórios, eles precisam ser formatados consistentemente, além de facilmente acessíveis – duas qualidades que definem o uso de data warehouses e os torna essenciais para as empresas de hoje.
História dos data warehouses
Nos anos 1970 e 1980, os dados começaram a proliferar e as empresas precisaram encontrar uma maneira fácil para armazená-los e acessá-los. O cientista da computação Bill Inmon, que é considerado o pai do armazenamento de dados, começou a definir o conceito nos anos 1970 e é o responsável pela criação do termo “data warehouse”. Em 1992, ele publicou um livro intitulado Building the Data Warehouse, tido como uma fonte fundamental para a tecnologia de armazenamento de dados. A definição de Inmon de data warehouse utiliza uma abordagem “de cima para baixo”, em que um repositório central é estabelecido primeiro e, depois, data marts – que contêm subconjuntos específicos de dados – são criados dentro desse repositório.
Ralph Kimball, especialista em tecnologia que publicou The Data Warehouse Toolkit em meados dos anos 1990, aplicou uma tática um pouco diferente ao conceito de data warehouse com sua abordagem “de baixo para cima”, na qual data marts individuais são desenvolvidos primeiro e, depois, integrados para criar um armazém.
O armazenamento de dados continua relevante hoje, e está evoluindo conforme a indústria se transforma para acomodar armazenamento em nuvem e análises em tempo real. Uma ferramenta de banco de dados emergente, similar a um data warehouse, é um data lake, que foi criada por tecnologias disruptivas de baixo custo como o Apache Hadoop. Data lakes são comumente usados em conjunto com fluxos de dados e armazenamento, ambos sem restrições, sem esquemas de construção ou processamento.
Esqueça as limitações na hora de gerenciar seus dados
Como você pode obter insights com o grande número de informações existentes no seu banco de dados? O especialista em gerenciamento de dados Matthew Magne descreve um cenário no qual você pode transmitir, limpar e classificar dados no seu data lake – e, então, extrair conhecimento em tempo real.
Qual a importância dos data warehouses?
Dados são essenciais para que organizações tomem decisões bem-informadas. Logo, é perceptível que data warehouses são tão importantes quanto os dados em si, uma vez que eles guardam todos os dados. Data warehouses podem:
- Armazenar grandes quantidades de dados em um database central – e em um formato padrão;
- Integrar dados de diversas fontes e padronizá-los, para que estejam prontos para serem analisados ou reportados;
- Manter registros históricos, uma vez que data warehouses podem armazenar dados por meses ou mesmo anos;
- Manter os dados seguros ao armazená-los em um único lugar. O acesso pode ser autorizado apenas àqueles que precisam de dados específicos;
- Fornecer acesso rápido e fácil aos dados, permitindo tomadas decisões de negócio melhores e mais rápidas.
Armazenamento de dados no mundo de hoje
Um data warehouse muitas vezes significa a diferença entre decisões bem-informadas – e o caos. Saiba como data warehouses estão transformando o mundo em que vivemos.
Data Warehouse Modernization
Data warehouses remain relevant when it comes to big data and analytics, but most need modernization. Find out what you need to do, and why it's important to modernize.
Hadoop, Simplified
What’s possible with Hadoop – and how can it support your enterprise data warehouse? Learn how to support and extend your data warehouse ecosystem.
Data Integration Landscape
Move away from an ad hoc approach to data integration and look for a more comprehensive solution that can execute a variety of data integration programs.
Data Integration Déjà Vu
Learn how data integration has evolved over the years, what might be in store for the future and how you can keep your data integration approach current.
SAS® Data Management
Dados armazenados em um data warehouse não entregam valor a menos que sejam bem-gerenciados. Com as tecnologias de gerenciamento de dados do SAS, você pode transformar big data em grandes oportunidades com soluções de data integration, data governance, event stream processing e data quality.
Data warehouses vs. outros sistemas de armazenamento
Embora os data warehouses sejam uma solução de armazenamento de dados comum, eles não são a única solução. Veja como data warehouses se comparam a tipos de tecnologias similares.
Data Warehouse
Armazena uma grande quantidade de dados corporativos, abrangendo diversos assuntos.
|
Pode ser difícil de construir.
|
É grande em tamanho.
|
Os dados são estruturados e preparados para serem usados em análises ou relatórios.
|
Data Mart
Armazena uma quantidade menor de dados; os dados normalmente cobrem um assunto e são utilizados por um departamento, como marketing ou vendas.
|
Mais rápidos e fáceis de construir do que um data warehouse.
|
Memória limitada.
|
Os dados são estruturados e preparados para serem usados em análises ou relatórios.
|
Data Lake
Armazena uma grande quantidade de dados brutos.
|
Os dados permanecem inalterados até que seja preciso modificá-los.
|
Permite que os usuários consultem conjuntos de dados menores, mais relevantes e flexíveis.
|
Veja como diferentes indústrias estão usando esta tecnologia
- Automotiva
- Bancária
- Bens de Consumo
- Defesa & Segurança
- Educação
- Ensino Superior
- Esportes
- Financeira
- Governo
- Hotelaria
- Life Sciences
- Manufatura
- Mídia
- Operadoras de Saúde
- Pequenas e Médias Empresas
- Petróleo & Gás
- Seguros
- Seguros de Saúde
- Tecnologia
- Telecomunicações
- Turismo & Transportes
- Utilities
- Varejo
Como funciona?
Um data warehouse começa com os dados em si, que são coletados de fontes internas e externas. Os dados são, normalmente, armazenados em um data warehouse através de um processo de extração, transformação e carregamento (ETL, na sigla em inglês), no qual informações são extraídas da fonte, transformadas em dados de alta qualidade e, então, carregados para um armazém. Empresas realizam esse processo regularmente para manter os dados atualizados e prontos para o próximo passo.
Quando uma organização está pronta para usar seus dados em análises ou relatórios, o foco passa do data warehouse para ferramentas de business intelligence. Tecnologias como visual analytics e data exploration são utilizadas para ajudar empresas a ganhar insights importantes com os dados.
Leia mais sobre este assunto
- Key questions to kick off your data analytics projectsThere’s no single blueprint for starting a data analytics project. Technology expert Phil Simon suggests these 10 questions as a guide.
- What is a data lake & why does it matter?As containers for multiple collections of data in one convenient location, data lakes allow for self-service access, exploration and visualization. In turn, businesses can see and respond to new information faster.
- 5 data management best practices to help you do data rightFollow these 5 data management best practices to make sure your business data gives you great results from analytics.
- Data lineage: Making artificial intelligence smarterLear how data lineage plays a vital role in understanding data, making it a foundational principle of AI.