O que é um cientista de dados?


O que é um Cientista de Dados?

Quem são, o que fazem e por que você quer ser um deles


Cientistas de dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos – e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.

Eles são parte matemáticos, parte cientistas da computação e parte analistas de tendências. E, por transitarem entre o mundo dos negócios e de TI, eles são muito procurados e bem pagos. Quem não gostaria de ser um?

Eles também são um sinal dos tempos modernos. Cientistas de dados não estavam no radar há uma década, mas sua popularidade repentina reflete como as empresas agora pensam sobre big data. Essa massa imensa de informações não estruturadas já não pode mais ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar receitas – contanto que haja alguém que escave e desenterre insights empresariais que ninguém havia pensado em procurar. Entra em cena o cientista de dados.

De onde eles vieram?

Muitos cientistas de dados começaram suas carreiras como estatísticos ou analistas de dados. Mas conforme o big data (e as tecnologias de armazenamento e processamento de big data, como o Hadoop) começaram a crescer e evoluir, esses papéis também evoluíram. Dados não são mais somente uma reflexão tardia para o departamento de TI cuidar. Eles são informações importantes que exigem análise, curiosidade criativa e um talento especial para traduzir ideias de alta tecnologia em novas maneiras de obter lucro.

O papel do cientista de dados também tem origens acadêmicas. Há alguns anos, as universidades começaram a reconhecer que os empregadores queriam programadores e pessoas que tivessem espírito de equipe. Professores ajustaram suas aulas para acomodar isso – e alguns programas, como o Institute for Advanced Analytics na North Carolina State University, preparam-se para produzir a próxima geração de cientistas de dados. Existem hoje mais de 60 programas semelhantes em universidades nos EUA.

 

Meus dias podem ser muito parecidos, mas o trabalho pode variar muito de semana a semana. Eu posso trabalhar durante algumas semanas em um projeto de mineração de texto, e depois disso eu posso criar um modelo de previsão voltado para o consumidor. Além disso eu faço reuniões com outras pessoas sobre analytics e como ela pode ajudar diferentes partes do negócio.

Alex Herrington
Cientista de dados para um grande varejista dos EUA
Leia a história (em inglês)

 

Mais sobre os cientistas de dados

Recursos para começar


Funções típicas dos cientistas de dados

Não há uma descrição de trabalho definitiva quando se trata de um cientista de dados. Mas aqui estão algumas coisas que você provavelmente terá de fazer:

  • Coletar grandes quantidades de dados “unruly” ou desafiadores e transformá-los em um formato mais prático.
  • Solucionar problemas de negócios com técnicas de orientação à dados.
  • Trabalhar com uma variedade de linguagens de programação, incluindo SAS, R e Python.
  • Ter uma sólida compreensão de estatísticas, incluindo testes estatísticos e distribuições.
      • Manter-se a par das técnicas analíticas, como a aprendizagem de máquinas, ou machine learning, a aprendizagem profunda, ou deep learning e análise de dados textuais, ou text analytics.
      • Comunicar-se e colaborar com TI e área de negócios.
      • Procurar por ordens e padrões nos dados, bem como detectar tendências que podem ajudar os resultados de uma empresa.

          O que um cientista de dados tem em sua caixa de ferramentas?

          Esses termos e tecnologias são comumente usados por cientistas de dados:

          • Visualização de dados: a apresentação de dados em um formato pictórico ou gráfico para que eles possam ser facilmente analisados.
          • Machine learning: ou aprendizagem de máquinas, é um ramo da inteligência artificial baseado em algoritmos matemáticos e automação, que permitam uma máquina a aprender e/ou aperfeiçoar seu desempenho em alguma tarefa.
          • Deep learning: ou aprendizagem profunda, uma área da pesquisa de machine learning que usa dados para modelar abstrações complexas.
          • Reconhecimento de padrões: a tecnologia que reconhece padrões nos dados (usada muitas vezes como sinônimo de aprendizagem de máquina).
          • Preparação de dados: o processo de conversão de dados brutos em um outro formato para que eles possam ser consumidos mais facilmente.
          • Text analytics: ou análise de dados textuais, é o processo de examinar dados não estruturados para reunir os principais insights de negócios.

           

          "Em um dia normal, eu faço uma sessão de brainstorming com minha equipe sobre como responder às perguntas que vêm para a empresa, eu reviso análises e recomendações feitas pela minha equipe e participo de uma variedade de reuniões."

          Kristin Carney
          Cientista de dados, World’s Foremost Bank
          Leia a história (em inglês)

           

          Como você pode se tornar um cientista de dados?

          Posicionar-se para uma carreira em ciência de dados pode ser uma jogada inteligente. Você terá muitas oportunidades de trabalho, além de ser uma chance de trabalhar no campo da tecnologia com espaço para a experimentação e criatividade. Então, qual é a sua estratégia?

          Se você é um estudante
          Escolher uma universidade que ofereça um diploma em ciência de dados, ou pelo menos, uma que ofereça aulas de ciência de dados e analytics é um primeiro passo importante. A Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University e Texas A&M são exemplos de faculdades com programas de ciência de dados.

          Se você é um profissional que deseja mudar de carreira
          Enquanto a maioria dos cientistas de dados trabalhou como analistas de dados estatísticos, outros vêm de campos não técnicos, como administração ou economia. Como profissionais de origens tão diversas podem acabar no mesmo campo? É importante olhar para o que eles têm em comum: um talento especial para a resolução de problemas, a capacidade de comunicação e uma curiosidade insaciável sobre como as coisas funcionam.

          Além dessas qualidades, você também precisará de um sólido conhecimento em:

          • Estatística e machine learning.
          • Linguagens de codificação, como SAS, R ou Python
          • Bancos de dados como MySQL e Postgres.
          • Visualização de dados e tecnologias de informação.
          • Hadoop e MapReduce.

          Se você não quiser aprender estas habilidades por conta própria, faça um curso on-line ou se inscreva em outros cursos. E depois, claro, você deve fazer contatos. Conecte-se com outros cientistas de dados na sua empresa, ou encontre uma comunidade online. Eles fornecerão informações importantes sobre o que os cientistas de dados fazem – e onde você poderá encontrar os melhores empregos.

          Quando uma empresa está pronta para contratar um cientista de dados?

          Antes de aceitar um cargo de cientista de dados, existem algumas coisas sobre a organização que você deve avaliar:

          • A empresa trabalha com grandes quantidades de dados e tem problemas complexos que precisam ser resolvidos? As organizações que realmente precisam de cientistas de dados têm duas coisas em comum: elas gerenciam enormes quantidades de dados e enfrentam questões importantes diariamente. Elas são geralmente empresas financeiras, governamentais e farmacêuticas.
          • A empresa valoriza estes dados? A cultura de uma empresa tem um impacto sobre sua decisão de contratar um cientista de dados. Ela tem um ambiente que suporta o uso de analytics? Ela tem um comprometimento executivo? Caso contrário, investir em um cientista de dados seria jogar dinheiro fora.
          • A empresa está pronta para mudar? Como um cientista de dados, você espera ser levado a sério, e parte disso significa ver seu trabalho concretizado. Você dedica seu tempo a encontrar maneiras para sua empresa funcionar melhor. Em resposta, uma empresa precisa para estar pronta e disposta para seguir os resultados de suas descobertas.

          A contratação de um cientista de dados para orientar as decisões empresariais com base em dados pode ser um salto no escuro para algumas organizações. Certifique-se que a empresa na qual você iria trabalhar tem a mentalidade certa – e está pronta para fazer algumas mudanças.


           

          Eu trabalho para uma empresa ágil, o que exige que eu seja flexível e me adapte às circunstâncias. Na semana passada, por exemplo, eu estava fazendo várias tarefas, incluindo a melhoria da pontuação de recomendação; sintonização da integração com o sistema de gerenciamento de conteúdo operacional; criação de novas variáveis transformadas com base no comportamento do consumidor para serem usadas em novos modelos de afinidade; e refatoração de relatórios / painéis analíticos de desempenho existentes.

          Manuel-David Garcia
          Cientista de dados para uma empresa de médio porte em Heidelberg
          Leia a história (em inglês)

          Tecnologias para o cientista de dados

          Quer mais insights?

          Data Management Insights

          Data Management

          Obtenha mais insights sobre gerenciamento de dados – artigos, pesquisas, vídeos e muito mais.

          Analytics Insights

          Analytics

          Conecte-se com os mais recentes insights sobre analytics por meio de artigos e pesquisas relacionadas.

          Marketing Insights

          Customer Intelligence

          Explore insights dos maiores líderes e inovadores do mundo do marketing em uma variedade de tópicos oportunos.

          Back to Top