Hvad er en data scientist?
Hvem de er, hvad de arbejder med, og hvorfor du vil kunne hvad de kan
Data scientists er en særlig type af eksperter i dataanalyse, der har de tekniske evner til at løse komplekse problemer – og nysgerrigheden til at undersøge, hvilke problemer der skal løses.
De er bl.a. matematikere, computervidenskabsfolk og trendspottere. Og fordi de løser opgaver inden for både forretnings- og it-verdenen, er de meget efterspurgte og vellønnede. Hvem vil ikke gerne være en af dem?
De repræsenterer også noget karakteristisk for vores tid. Data scientists var ikke på radaren hos mange for ti år siden, men deres stigende popularitet afspejler, hvordan virksomheder nu tænker om big data. Den uhåndterlige masse af ustrukturerede oplysninger kan ikke længere ignoreres og gå i glemmebogen. Disse data er nærmest en guldmine, der kan hjælpe med at øge omsætningen – så længe der er nogen, der graver efter og udvinder forretningsindsigt, som ingen tænkte på at kigge efter før. Her kommer data scientistsene ind i billedet.
Hvor kommer de fra?
Mange data scientists begyndte deres karriere som statistikere eller dataanalytikere. Men da big data (og teknologier til lagring og behandling af big data såsom Hadoop begyndte at vokse og udvikle sig, begyndte disse roller også at udvikle sig. Data er ikke længere bare noget, it-afdelingen skal håndtere som en efterrationalisering. Det er vigtige oplysninger, der kræver analyse, kreativ nysgerrighed og en evne til at omsætte højteknologiske idéer til nye måder at få en fortjeneste på.
Rollen som data scientist stammer også fra universitetsverden. For nogle år siden begyndte universiteterne at erkende, at arbejdsgiverne ønskede folk, der var programmører og teamorienterede. Professorer finjusterede deres kurser for at imødekomme dette behov – og nogle programmer som f.eks. Institute for Advanced Analytics på North Carolina State University gjorde sig klar til at være fødestedet for den næste generation af data scientists. Der er nu flere end 60 tilsvarende programmer på universiteter rundt om i landet.
“Det kan være svært at skelne den ene dag fra den anden, men set fra uge til uge kan arbejdet variere meget. I et par uger arbejdede jeg måske på et tekstudvindingsprojekt, og derefter kunne jeg så skabe en prædiktiv model baseret på en kunde. Oveni kommer møder med andre om analyse , og hvordan den del kan hjælpe forskellige dele af virksomheden.”
Alex Herrington
Data scientist hos en større amerikansk detailhandler
Læs historien
Kirk Borne, ph.d. og ledende data scientist hos Booz Allen Ferrari, har fokus på den misforståelse, at datavidenskab hører ind under it-afdelingen – og hvordan data scientists kan hjælpe til i en tid med større og mere komplekse datamængder.
More on data scientists
- Mød en data scientist: Interview with Kristin Carney.
- Download hvidbogen Getting Value From Your Data Scientists (Få værdi ud af dine data scientists).
Typiske arbejdsopgaver for data scientists
Der findes ikke en fast stillingsbeskrivelse, når det drejer sig om rollen som data scientist. Men her er et par ting, du formentlig arbejder med:
- Indsamle store mængder ustrukturerede data og omdanne dem til et mere brugbart format.
- Løse virksomhedsrelaterede problemer ved hjælp af datadrevne teknikker.
- Arbejde med en lang række programmeringssprog, herunder SAS, R og Python.
- Have et solidt greb om statistik, herunder statistiske test og fordelinger.
- Holde styr på analyseteknikker som maskinel indlæring, deep learning og tekstanalyse.
- Kommunikere og samarbejde med både it-afdelingen og forretningsdelen.
- Lede efter orden og mønstre i data samt spotte tendenser, der kan øge virksomhedens indtjening.
Hvilke værktøjer er der i en data scientists værktøjskasse?
Disse begreber og teknologier bruges almindeligvis af data scientists:
- Datavisualisering: præsentation af data i billedmæssigt eller grafisk format, så de nemt kan analyseres.
- Maskinel indlæring: en del af kunstig intelligens baseret på matematiske algoritmer og automatisering.
- Deep learning: et område inden for forskning i maskinel indlæring, der bruger data til at modellere komplekse abstraktioner.
- Mønstergenkendelse: teknologi, der genkender datamønstre (bruges ofte synonymt med maskinel indlæring).
- Dataklargøring: processen med at konvertere rådata til et andet format, så de lettere kan anvendes.
- Tekstanalyse: processen med at undersøge ikke-strukturerede data for at få adgang til vigtig forretningsindsigt.
“På en typisk dag brainstormer og løser jeg problemer med mit team for at besvare forretningsmæssige spørgsmål. Jeg gennemgår analyser og anbefalinger, som udføres af mine medarbejdere, og jeg er med til en række møder.”
Kristin Carney
Data scientist, World’s Foremost Bank
Læs historien
Hvordan kan du blive data scientist?
Det er et klogt træk at positionere sig selv til en karriere inden for datavidenskab. Du får masser af jobmuligheder, og du får mulighed for at arbejde inden for teknologiområdet med plads til eksperimenter og kreativitet. Hvad er din strategi?
Hvis du er studerende
Som det første er det vigtigt at vælge et universitet, der tilbyder en datavidenskabelig uddannelse – eller som minimum udbyder undervisning i datavidenskab og -analyse. Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University og Texas A&M er alle eksempler på universiteter, der har programmer inden for datavidenskab.
Hvis du er en fagperson, der ønsker at skifte karriere
Selvom de fleste data scientists har en baggrund som dataanalytiker eller statistiker, kommer en del fra ikke-tekniske felter som f.eks. erhvervs- eller økonomibranchen. Hvordan kan fagfolk med så forskellige baggrunde ende inden for det samme område? Det gælder om at se på, hvad de har til fælles: evnen til at løse problemer, evnen til at kommunikere godt og en umættelig nysgerrighed på, hvordan tingene fungerer. Lær, hvordan SAS Academy for Data Science giver dig værktøjerne til at blive certificeret data scientist.
Ud over disse egenskaber har du også brug for en solid forståelse af:
- Statistik og maskinel indlæring.
- Programmeringssprog som SAS, R eller Python.
- Databaser som MySQL og Postgres.
- Datavisualiserings- og rapporteringsteknologi.
- Hadoop og MapReduce.
Hvis du ikke vil lære disse færdigheder på egen hånd, kan du tage et onlinekursus eller tilmelde dig en boot camp. Og så skal du selvfølgelig netværke. Kontakt andre data scientists i din virksomhed, eller find et onlinefællesskab. De giver dig insiderinformation om, hvad data scientists arbejder med – og hvor du finder de bedste jobs.
Hvornår er en virksomhed klar til at ansætte en data scientist?
Før du vælger at indtræde i en stilling som data scientist, er der et par ting ved organisationen, som du skal evaluere:
- Beskæftiger den sig med store mængder data og har den komplekse problemer, der skal løses? Organisationer, der virkelig har brug for data scientists, har to ting til fælles: De håndterer enorme mængder data, og de står hver eneste dag over betydelige problemstillinger. De arbejder typisk inden for brancher som finans og lægemidler samt den offentlige sektor.
- Værdsætter den data? En virksomheds kultur har indflydelse på, om den bør ansætte en data scientist. Har den et miljø, der understøtter analysearbejde? Er ledelsen med på det? Hvis ikke, ville det være spild af penge at investere i en data scientist.
- Er den klar til at forandre sig? Som data scientist forventer du at blive taget alvorligt, og en del af dette indebærer, at dit arbejde skal bære frugt. Du dedikerer din tid til at finde ud af, hvordan din virksomhed kan fungere bedre. Til gengæld skal en virksomhed være klar – og villig – til at følge op på resultaterne af dine resultater.
For visse organisationer kan det være et spring ud i det uvisse at ansætte en data scientist, i tiltro til at denne kan sætte retningen for forretningsbeslutninger baseret på data. Sørg for, at den virksomhed, du arbejder for, har den rette mentalitet – og er klar til at gøre tingene anderledes.
“Jeg arbejder for en agil virksomhed, som kræver, at jeg er fleksibel og tilpasser mig forholdene. I sidste uge var jeg f.eks. i gang med flere opgaver, herunder forbedring af anbefalingsscorer, finindstilling af integrationen med det driftsmæssige system til indholdsstyring, frembringelse af nye transformerede variabler baseret på forbrugeradfærd, der skal bruges til affinitetsmodeller, og udførelse af noget refactoring af eksisterende præstationsrapporter/analysedashboards."
Manuel-David Garcia
Data scientist hos en mellemstor virksomhed i Heidelberg i Tyskland
Læs historien
Teknologier til data scientisten


Vil du have mere indsigt?
Dataadministration
Få mere indsigt i dataadministration – artikler, forskning, videoer og meget mere.
Customer Intelligence
Dyk ned i indsigt fra eksperter inden for Customer Intelligence inden for en række aktuelle emner.