Descomplicando o Big Data + Hadoop

O primeiro passo é compreender o que é realmente o Hadoop e quais os benefícios da sua utilização


Em um cenário de complexidade crescente as empresas precisam de ferramentas que lhes permitam ganhar vantagem competitiva frente à concorrência. Sempre estando atento a quantidade de dados a serem analisados, seu objetivo de negócio e a infraestrutura existente. Além do fato de que existem ferramentas que podem (e devem) ser utilizadas de forma complementar a análise de dados e gerar insights.

É o caso das análises avançadas e do Big Data. E, convém não esquecer, o Hadoop. Mas é nesse ponto onde geralmente surgem as dúvidas: Como as várias ferramentas poderão ser utilizadas em conjunto? Quais as condicionantes? E as vantagens?

E outras questões como: “a utilização do Hadoop tem impacto na visualização e nas análises?” ou “como posso preparar os dados em Hadoop?”, ou ainda “que tipo de técnicas analíticas estão disponíveis para analisar dados no Hadoop?” também são frequentes e preocupam os usuários de negócios. Foi pensando nisso que o SAS junto com a TDWI elaborou o paper “Eight Considerations for Utilizing Big Data Analytics with Hadoop”, que tem como objetivo elucidar a forma como todas estas ferramentas interagem. Uma espécie de check-list que pode e deve ser usada como ajuda na exploração da análise do big data.


Matthew Magne, Gerente de Marketing de Produto no SAS para as soluções de Data Management, fornece uma visão geral do SAS Data Loader para Hadoop.

O primeiro passo é compreender o que é realmente o Hadoop e quais os benefícios da sua utilização. De uma forma (muito) simplista o que o Hadoop faz é organizar as toneladas de dados existentes em múltiplas fontes. O mapeamento de dados permite a sua priorização e atribuição de relevância. Ou seja, quando combinado com ferramentas de análise torna-se um poderoso instrumento para os usuários de negócios.

Isto não significa que o Hadoop vai substituir o armazenamento de dados. Nada disso. É um complemento. Especialmente porque tem a capacidade de nutrir-se, alimentar-se, acessar diferentes fontes de dados (e de diferentes tipos).

Não há uma ferramenta que consiga fazer tudo o que hoje os usuários de negócios necessitam. Que armazene os dados, faça o seu mapeamento, priorize a sua importância, analise e visualize… É necessário utilizar diferentes ferramentas, garantindo a sua complementaridade.

O artigo “Eight Considerations for Utilizing Big Data Analytics with Hadoop” ajuda na definição das ferramentas que melhor se enquadram na infraestrutura e objetivos da sua organização, e dá resposta a muitas das dúvidas diárias com que os gestores (CIOs), se deparam no dia-a-dia.


Back to Top