O que é um Data Scientist?

Quem são, o que fazem e porque querem ser um

Os Data scientists são uma nova geração de peritos em dados analíticos que têm competências técnicas para resolver problemas complexos – e a curiosidade para explorar que problemas precisam de ser resolvidos.

São parte matemáticos, parte informáticos e parte observadores de tendências. E, porque se encontram tanto no mundo dos negócios como no das TI, são muito procurados e bem pagos. Quem não gostaria de ser um?

São também um sinal dos tempos. Os data scientists não estavam em muitos radares há uma década atrás, mas a sua súbita popularidade reflete a forma como as empresas agora pensam sobre big data. Essa enorme quantidade de informação não estruturada já não pode ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar as receitas - desde que haja alguém que investigue e encontre ideias comerciais que ninguém pensou em procurar anteriormente. Introduza o Data Scientist.

De onde é que eles vieram?

Muitos dos Data Scientists começaram as suas carreiras como profissionais de estatística ou analistas de dados. Mas à medida que o big data (e tecnologias de armazenamento e processamento de dados, como o Hadoop) começaram a crescer e a evoluir, esses papéis evoluíram também. Os dados já não são apenas uma reflexão de segundo plano para ser gerida por Tecnologias de Informação. É informação chave que requer análise, curiosidade criativa e um dom para traduzir ideias de alta tecnologia em novas formas de transformar um lucro.

O papel do Data Scientist também tem origens académicas. Há alguns anos, universidades começaram a reconhecer que os empregadores queriam pessoas que fossem programadores e jogadores de equipa. Os professores ajustaram as suas aulas para acomodar esta situação, tal como o Institute for Advanced Analytics na Universidade da Carolina do Norte, preparando-se para lançar a próxima geração de Data Scientists. Existem atualmente mais de 60 programas semelhantes em universidades de todo o país.

 

“Os meus dias podem ser muito similares, mas o trabalho de semana para semana pode variar muito. Durante algumas semanas posso estar a trabalhar num projeto de extração de texto, e depois disso, posso estar a criar um modelo preditivo sobre o cliente. A isto, juntam-se reuniões com terceiros sobre analytics e como podem ajudar diferentes partes do negócio.”

Alex Herrington
Data Scientist de um importante distribuidor dos EUA
Ler a história

 

Kirk Borne, doutorado, Diretor Data Scientist em Booz Allen Hamilton, refere a interpretação errada de que a ciência de dados é uma função de Tecnologias de Informação – e de como os Data Scientists podem ajudar na nova era de maiores e mais complexos dados.

Recursos para começar

Mais sobre Data Scientists


Funções típicas a desempenhar por um Data Scientist

Não há uma descrição definitiva quando se fala no trabalho de um Data Scientist. Mas aqui estão algumas coisas que provavelmente irá fazer:

  • Recolher grandes quantidades de dados desordenados e transformá-los num formato mais utilizável.
  • Resolver problemas relacionados com o negócio usando técnicas orientadas por dados.
  • Trabalhar com uma variedade de linguagens de programação, incluindo SAS, R e Python.
  • Ter uma compreensão sólida de estatísticas, incluindo testes estatísticos e distribuições.
      • Manter-se a par das técnicas de análises tais como machine learning, aprendizagem profunda e análises (dados analíticos) de texto.
      • Comunicar e colaborar tanto com as TI como com as empresas.
      • Procura de ordem e padrões nos dados, bem como detectar tendências que possam ajudar ao resultado final de um negócio.

          O que está na caixa de ferramentas de um Data Scientist?

          Estes termos e tecnologias são normalmente usados por Data Scientists:

          • Data visualization: a apresentação de dados em formato pictórico ou gráfico para poderem ser facilmente analisados.
          • Machine learning: um ramo da inteligência artificial baseado em algoritmos matemáticos e automação.
          • Deep learning: uma área de machine learning que usa dados para modelar abstrações complexas.
          • Pattern recognition: tecnologia que reconhece padrões em dados (muitas vezes usada de forma alternada com machine learning).
          • Data preparation: o processo de converter dados em bruto para outro formato para que possa ser consumido mais facilmente.
          • Text analytics: o processo de análise de dados não estruturados para recolher insights empresariais chave.

           

          "Num dia típico, faço uma sessão de brainstorming e resolvo problemas para responder a questões que vêm do negócio com a minha equipa, revejo análises e recomendações concluídas pelas minhas pessoas, e participo numa variedade de reuniões".

          Kristin Carney
          Data scientist, World’s Foremost Bank
          Ler a história

           

          Como pode tornar-se num Data Scientist?

          Posicionar-se para uma carreira em ciência de dados pode ser uma jogada inteligente. Terá imensas oportunidades de emprego, e também a oportunidade de trabalhar no campo da tecnologia com espaço para experimentação e criatividade. Então qual é a sua estratégia?

          Se for estudante
          A escolha de uma universidade que ofereça um diploma de ciências de dados - ou pelo menos uma que ofereça aulas de data science e analytics - é um primeiro passo importante. Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University e Texas A&M são todos exemplos de escolas com programas de data science.

          Se for um profissional que quer mudar de carreira
          Enquanto a maioria dos cientistas de dados têm antecedentes como analistas de dados ou estatísticos, outros vêm de campos não técnicos, tais como negócios ou economia. Como é que profissionais de áreas tão diversas podem acabar no mesmo campo? É importante olhar para o que têm em comum: um dom para resolver problemas, a capacidade de comunicar bem e uma curiosidade insaciável sobre como as coisas funcionam. Saiba como o SAS Academy for Data Science lhe dá as ferramentas para se tornar um data scientist certificado.

          Para além dessas qualidades, também irá precisar de uma compreensão sólida:

          • Estatísticas e machine learning
          • Bases de dados como MySQL e Postgres.
          • Visualização de dados e tecnologias de informação/comunicação (relatórios).
          • Hadoop e MapReduce.

          Se não quiser aprender estas competências por si próprio, faça um curso online ou inscreva-se numa formação. E depois deve, claro, trabalhar em rede. Conecte-se com outros data scientists na sua empresa, ou encontre uma comunidade online. Eles irão dar-lhe informação privilegiada sobre o que os data scientists fazem – e onde irá encontrar os melhores empregos.

          Quando é que uma empresa está pronta para contratar um Data Scientist?

          Antes de aceitar uma posição como Data Scientist, há algumas coisas sobre a organização, que deve avaliar:

          • Lida com grandes quantidades de dados e tem questões complexas que precisam de ser resolvidas? Organizações que realmente precisam de data scientists têm duas coisas em comum: Gerem enormes quantidades de dados, e enfrentam problemas de peso no dia-a-dia. Estão tipicamente em indústrias como a financeira, governo e farmácia.
          • Será que valoriza os dados? A cultura de uma empresa tem impacto sobre se deve contratar um data scientist. Será que tem um ambiente que apoia a análise? Tem uma participação executiva? Se não, investir num data scientist, seria deitar dinheiro fora.
          • Está pronto para mudar? Como data scientist, espera ser levado a sério, e parte disso implica ver o seu trabalho a ser levado a cabo. Dedica o seu tempo a encontrar formas de o seu negócio poder funcionar melhor. Em resposta, um negócio precisa de estar pronto - e disposto - a dar seguimento aos resultados das suas descobertas.

          Contratar um Data Scientist para orientar decisões empresariais baseadas em dados, pode ser um ato de fé para algumas organizações. Certifique-se que a empresa para a qual possa estar a trabalhar tem a mentalidade certa – e que está preparada para fazer algumas mudanças.


           

          "Trabalho para uma empresa ágil, o que exige que eu seja flexível e que me adapte às circunstâncias. Na semana passada, por exemplo, estava a fazer várias tarefas, incluindo melhorar as pontuações de recomendação; afinar a integração com o sistema de gestão de conteúdos operacionais; criar novas variáveis transformadas baseadas no comportamento do consumidor para serem utilizadas em modelos de afinidade; e fazer algum refactoring de relatórios de desempenho/ painéis de controlo analíticos existentes".

          Manuel-David Garcia
          Data Scientist para uma empresa de tamanho médio em Heidelberg, Alemanha
          Ler a história

          Tecnologias para o Data Scientist

          Want more insights?

          Data Management Insights

          Data Management

          Get more insights on data management – articles, research, videos and more.

          Analytics Insights

          Analytics

          Connect with the latest insights on analytics through related articles and research.

          Marketing Insights

          Customer Intelligence

          Explore insights from customer intelligence experts on a variety of timely topics.