photo of coworkers working together at a desktop computer

Data Scientists

Who they are and why they matter

What is a data scientist?

Data scientists are people who use their statistical, programming and industry domain expertise to transform data into insights. Put another way, data scientists are part mathematician, part computer scientist and part trendspotter. They use their IT smarts to help companies calculate risk and drive positive results.

Evolution of the data scientist role

On the most basic level, a data scientist is a new breed of analytical data expert who has the technical skills to solve complex known problems and the curiosity to explore what unidentified problems might need to be solved next.

Data scientists use data science to glean insights from untold amounts of data, both structured and unstructured. As automation and machine learning become increasingly important components in the IT strategies of large organizations, data analysis grows in stature. The reason? The enormous value practitioners can bring by translating mountains of data into insights that help businesses maximize their potential.

The role of the data scientist and the importance of data science itself took root and grew alongside the rise of big data. As data growth increased exponentially, it became apparent to many organizations that they were sitting on a gold mine, but they were not always positioned to reap the benefits and derive business value from their data. If data is indeed the gold of the information age, data scientists emerged as the ones who could deftly distinguish the real treasures from the fool’s gold.

When the COVID-19 pandemic swept the globe, it accelerated existing trends toward digital transformation, driving a higher-than-expected number of people online to work, shop and entertain themselves. This only made the role of the data scientist more prominent and their function more obviously relevant.

An October 2020 McKinsey study confirmed that the COVID crisis accelerated the digitization of customer interactions by several years. It makes sense, then, that a 2021 SAS survey found that 91% of data scientists believed their work was as important or more important than it was before the pandemic.

As tools like ChatGPT take off as code generators, some experts are asking, will generative AI replace data scientists? The simple answer is no. Instead, generative AI technologies may automate routine data tasks and help data scientists spend more time using their domain knowledge to explore data, build models and deliver results.

With the ripple effect of adaptations in processes, practices, operating parameters and assumptions, the role of the data scientist looks set to continue its growth trajectory for the foreseeable future. Staff shortages, supply chain disruptions and a surge in e-commerce and cloud services all point to that same conclusion.

Where will your data scientist skills take you?

For one data scientist, his love of analytics took him all the way to the NBA. Hear how David Bencs became the Director of Basketball Analytics for the Orlando Magic.

Data scientists in today’s world

Hear from data scientists about what they do, and discover what it takes to be a data scientist yourself.

The Data Science Experience

Read and watch personal stories of data scientists solving real-world problems. From tackling fraud to optimizing hospital resources, these complex problems require smart solutions from data scientists.

The SAS Data Science Blog

From digital twins and neural networks to computer vision models and regression trees – SAS data scientists talk about their latest projects and the technology behind them.

Data Literacy Training

The first step to being a data scientist is being data-literate. This course offers options for students and business professionals to improve their data literacy skills.

Data Scientists Developing Big Innovations

See how data scientists on global hackathon teams use AI and analytics to help build a better world.

Data scientist skills

Let’s look more closely at the life of the data scientist – their roles and responsibilities in the organization and the skills that help them excel. As previously mentioned, data scientists are primarily tasked with using software to organize and analyze data. They must also be adept at translating the findings of their analysis into terms that are easily understood by stakeholders who are likely to be a mix of techies and nontechies.

What do data scientists actually do on a day-to-day basis? This graphic from our SAS survey not only provides a window into how they spend their time, it also gives a fairly chronological view of their processes as well. Gathering data is an important first step here, but just one of many that are critical in transforming data into usable insight.

In the AI era, data scientists prepare and explore data, develop, train and deploy models, and contribute toward innovation and research. They're also experts at presenting complex analyses in a simplified visual manner. 

One note: Be sure not to mistake a data scientist, who tends to work with a long-term view, for a data analyst. Analysts support real-time and short-term decision making. Data scientists take a company or a department’s goals and look further down the road, creating prediction engines and optimization algorithms to drive efficiencies over the long haul.

What about skills? The best data scientists possess a mix of soft and hard skills in programming, quantitative analysis, intuition, communication and teamwork. And teamwork is growing in importance:

A 2022 SAS survey reveals an ongoing skills shortage for advanced data scientist skills. As many as 63% of decision makers don’t have enough employees with AI and ML skills, even though 54% use these technologies already and 43%-44% plan to do so over the next couple of years. 

Discussing data science work

Data scientist Robert Blanchard says he’s a coder by heart, and he loves to code, but he also sees the benefits of drag-and-drop models. Learn how he’s working with colleagues to combine SAS® and Python to deploy a computer vision model on a drone.

Where you’ll find data scientists

Without question, today’s AI technologies have the potential to transform entire industries. As a result, data scientists are increasingly being called on to solve complex problems and help companies better serve their customers. 

Data scientists in ...

Banking are helping people visualize the sustainability performance of portfolios.

Agriculture are helping model carbon offset data to encourage sustainable fertilizer production.

Academic research are modeling major risk factors affecting coral reef health and sharing them out to other conservationists.

Energy are helping predict the weather to maximize renewable energy sources such as wind and solar power.

Health care and life sciences are helping streamline processes to deliver more effective care and connect data sources to improve the lives of patients along with the effectiveness of providers and governments.

Insurance are helping providers assess risk, detect fraud and refine product offerings to drive more business and better serve customers.

Manufacturing are applying machine learning to anticipate machinery maintenance events or failures and keep the manufacturing line cranking.

Retail are using AI to help shoppers find the shortest line in the store.

Public sector are saving lives by helping coordinate traffic lights for first responders.

Telecom and media are helping to optimize networks and better tailor customer experiences.

Meet three data scientists

Pradnya Pethkar

An advanced degree, an internship and a certification led this data scientist to land her dream career in New Zealand.

Jessica Rudd

Driven, passionate and curious, data scientist Jessica Rudd earned a PhD so she can make an impact on the future of technology.

Timothy Bowtell

Bowtell's story proves it's never too late to change careers if you have enough ambition. Find out how – and why – he switched from engineering to data science.

How to become a data scientist

Looking to position yourself for a career in data science? You’re not alone. This discipline continues to gain relevance. The good news is that the market is nowhere near saturated for data scientist job roles. Here are a few thoughts on the education and training required to get into it.

Students looking to become data scientists

If you’re entering the job market straight from school, consider an undergraduate degree in data science or a related field, like statistics, computer science, computer engineering or information systems. Be sure to choose a university that offers a data science degree or, at least, classes in data science and analytics.

Examples of schools with data science programs include Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University and Texas A&M. In many cases, SAS skills are included in the data science curriculum.

Mid-career professionals looking to become data scientists

Many professionals are interested in making a career move into data science. While most data scientists have backgrounds in data analysis or statistics, others come from nontechnical fields in business or economics.

No matter your background, consider whether you possess the basic skills that help data scientists excel – namely, a knack for solving problems, an ability to communicate well and an insatiable curiosity about how things work.

Consider specializing in subtopics like artificial intelligence, research, database management or machine learning. Be prepared to have a solid understanding of:

  • Statistics and machine learning.
  • Coding languages such as SAS, R or Python.
  • Databases such as MySQL and Postgres.
  • Data visualization and reporting technologies.
  • Hadoop and MapReduce.

Note that a number of universities now offer a master's in data science. 

Career paths for data scientists

The top data scientist job in a large organization is the chief data officer, or CDO. The CDO oversees all data-related functions and is responsible for helping managers and executives derive business value from all that data. For ambitious go-getters, the path from a junior data scientist to CDO might look something like this:

  • Data analyst.
  • Midlevel data scientist.
  • Senior data scientist.
  • Data science manager.
  • Data science director.
  • Chief data officer.

You can learn the skills you need to become a data scientist on your own, through an online course or a boot camp. Networking helps, too. You can connect with other data scientists or find an online community. Finally, the SAS Academy for Data Science provides an opportunity for aspiring data scientists to master key skills with in-depth training and professional certifications in:

  • Data curation.
  • Advanced analytics.
  • AI and machine learning.

Next steps

If you want to learn data science, SAS is the place to do it.

Data science solutions

SAS® Viya® capabilities and offerings feature robust data management, visualization, advanced analytics and model management to accelerate data science at any organization.

SAS Visual Data Mining and Machine Learning enables you to solve the most complex analytical problems with a single, integrated, collaborative solution – now with its own automated modeling API.

SAS Visual Analytics provides you with the means to quickly prepare reports interactively, explore your data through visual displays and perform your analyses on a self-service basis.

These solutions and more are powered by SAS Viya, SAS’ market-leading data science platform that runs on a modern, scalable, cloud-enabled architecture.

Connect with SAS and see what we can do for you.

Os Data scientists são uma nova geração de peritos em dados analíticos que têm competências técnicas para resolver problemas complexos – e a curiosidade para explorar que problemas precisam de ser resolvidos.

São parte matemáticos, parte informáticos e parte observadores de tendências. E, porque se encontram tanto no mundo dos negócios como no das TI, são muito procurados e bem pagos. Quem não gostaria de ser um?

São também um sinal dos tempos. Os data scientists não estavam em muitos radares há uma década atrás, mas a sua súbita popularidade reflete a forma como as empresas agora pensam sobre big data. Essa enorme quantidade de informação não estruturada já não pode ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar as receitas - desde que haja alguém que investigue e encontre ideias comerciais que ninguém pensou em procurar anteriormente. Introduza o Data Scientist.

De onde é que eles vieram?

Muitos dos Data Scientists começaram as suas carreiras como profissionais de estatística ou analistas de dados. Mas à medida que o big data (e tecnologias de armazenamento e processamento de dados, como o Hadoop) começaram a crescer e a evoluir, esses papéis evoluíram também. Os dados já não são apenas uma reflexão de segundo plano para ser gerida por Tecnologias de Informação. É informação chave que requer análise, curiosidade criativa e um dom para traduzir ideias de alta tecnologia em novas formas de transformar um lucro.

O papel do Data Scientist também tem origens académicas. Há alguns anos, universidades começaram a reconhecer que os empregadores queriam pessoas que fossem programadores e jogadores de equipa. Os professores ajustaram as suas aulas para acomodar esta situação, tal como o Institute for Advanced Analytics na Universidade da Carolina do Norte, preparando-se para lançar a próxima geração de Data Scientists. Existem atualmente mais de 60 programas semelhantes em universidades de todo o país.

 

“Os meus dias podem ser muito similares, mas o trabalho de semana para semana pode variar muito. Durante algumas semanas posso estar a trabalhar num projeto de extração de texto, e depois disso, posso estar a criar um modelo preditivo sobre o cliente. A isto, juntam-se reuniões com terceiros sobre analytics e como podem ajudar diferentes partes do negócio.”

Alex Herrington
Data Scientist de um importante distribuidor dos EUA
Ler a história

 

Kirk Borne, doutorado, Diretor Data Scientist em Booz Allen Hamilton, refere a interpretação errada de que a ciência de dados é uma função de Tecnologias de Informação – e de como os Data Scientists podem ajudar na nova era de maiores e mais complexos dados.

Recursos para começar

Mais sobre Data Scientists


Funções típicas a desempenhar por um Data Scientist

Não há uma descrição definitiva quando se fala no trabalho de um Data Scientist. Mas aqui estão algumas coisas que provavelmente irá fazer:

  • Recolher grandes quantidades de dados desordenados e transformá-los num formato mais utilizável.
  • Resolver problemas relacionados com o negócio usando técnicas orientadas por dados.
  • Trabalhar com uma variedade de linguagens de programação, incluindo SAS, R e Python.
  • Ter uma compreensão sólida de estatísticas, incluindo testes estatísticos e distribuições.
      • Manter-se a par das técnicas de análises tais como machine learning, aprendizagem profunda e análises (dados analíticos) de texto.
      • Comunicar e colaborar tanto com as TI como com as empresas.
      • Procura de ordem e padrões nos dados, bem como detectar tendências que possam ajudar ao resultado final de um negócio.

          O que está na caixa de ferramentas de um Data Scientist?

          Estes termos e tecnologias são normalmente usados por Data Scientists:

          • Data visualization: a apresentação de dados em formato pictórico ou gráfico para poderem ser facilmente analisados.
          • Machine learning: um ramo da inteligência artificial baseado em algoritmos matemáticos e automação.
          • Deep learning: uma área de machine learning que usa dados para modelar abstrações complexas.
          • Pattern recognition: tecnologia que reconhece padrões em dados (muitas vezes usada de forma alternada com machine learning).
          • Data preparation: o processo de converter dados em bruto para outro formato para que possa ser consumido mais facilmente.
          • Text analytics: o processo de análise de dados não estruturados para recolher insights empresariais chave.

           

          "Num dia típico, faço uma sessão de brainstorming e resolvo problemas para responder a questões que vêm do negócio com a minha equipa, revejo análises e recomendações concluídas pelas minhas pessoas, e participo numa variedade de reuniões".

          Kristin Carney
          Data scientist, World’s Foremost Bank
          Ler a história

           

          Como pode tornar-se num Data Scientist?

          Posicionar-se para uma carreira em ciência de dados pode ser uma jogada inteligente. Terá imensas oportunidades de emprego, e também a oportunidade de trabalhar no campo da tecnologia com espaço para experimentação e criatividade. Então qual é a sua estratégia?

          Se for estudante
          A escolha de uma universidade que ofereça um diploma de ciências de dados - ou pelo menos uma que ofereça aulas de data science e analytics - é um primeiro passo importante. Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University e Texas A&M são todos exemplos de escolas com programas de data science.

          Se for um profissional que quer mudar de carreira
          Enquanto a maioria dos cientistas de dados têm antecedentes como analistas de dados ou estatísticos, outros vêm de campos não técnicos, tais como negócios ou economia. Como é que profissionais de áreas tão diversas podem acabar no mesmo campo? É importante olhar para o que têm em comum: um dom para resolver problemas, a capacidade de comunicar bem e uma curiosidade insaciável sobre como as coisas funcionam. Saiba como o SAS Academy for Data Science lhe dá as ferramentas para se tornar um data scientist certificado.

          Para além dessas qualidades, também irá precisar de uma compreensão sólida:

          • Estatísticas e machine learning
          • Bases de dados como MySQL e Postgres.
          • Visualização de dados e tecnologias de informação/comunicação (relatórios).
          • Hadoop e MapReduce.

          Se não quiser aprender estas competências por si próprio, faça um curso online ou inscreva-se numa formação. E depois deve, claro, trabalhar em rede. Conecte-se com outros data scientists na sua empresa, ou encontre uma comunidade online. Eles irão dar-lhe informação privilegiada sobre o que os data scientists fazem – e onde irá encontrar os melhores empregos.

          Quando é que uma empresa está pronta para contratar um Data Scientist?

          Antes de aceitar uma posição como Data Scientist, há algumas coisas sobre a organização, que deve avaliar:

          • Lida com grandes quantidades de dados e tem questões complexas que precisam de ser resolvidas? Organizações que realmente precisam de data scientists têm duas coisas em comum: Gerem enormes quantidades de dados, e enfrentam problemas de peso no dia-a-dia. Estão tipicamente em indústrias como a financeira, governo e farmácia.
          • Será que valoriza os dados? A cultura de uma empresa tem impacto sobre se deve contratar um data scientist. Será que tem um ambiente que apoia a análise? Tem uma participação executiva? Se não, investir num data scientist, seria deitar dinheiro fora.
          • Está pronto para mudar? Como data scientist, espera ser levado a sério, e parte disso implica ver o seu trabalho a ser levado a cabo. Dedica o seu tempo a encontrar formas de o seu negócio poder funcionar melhor. Em resposta, um negócio precisa de estar pronto - e disposto - a dar seguimento aos resultados das suas descobertas.

          Contratar um Data Scientist para orientar decisões empresariais baseadas em dados, pode ser um ato de fé para algumas organizações. Certifique-se que a empresa para a qual possa estar a trabalhar tem a mentalidade certa – e que está preparada para fazer algumas mudanças.


           

          "Trabalho para uma empresa ágil, o que exige que eu seja flexível e que me adapte às circunstâncias. Na semana passada, por exemplo, estava a fazer várias tarefas, incluindo melhorar as pontuações de recomendação; afinar a integração com o sistema de gestão de conteúdos operacionais; criar novas variáveis transformadas baseadas no comportamento do consumidor para serem utilizadas em modelos de afinidade; e fazer algum refactoring de relatórios de desempenho/ painéis de controlo analíticos existentes".

          Manuel-David Garcia
          Data Scientist para uma empresa de tamanho médio em Heidelberg, Alemanha
          Ler a história

          Tecnologias para o Data Scientist