Od SAS do Data Scientist

Rozmowa z Rafałem Wojdanem, zdobywcą tytułu SAS Student Ambassador 2014

Specjalista data science nie może czekać na gotowe dane i dopiero wtedy pokazywać jaką wiedzę może z nich wydobyć. Ważne jest by sam wychodził z inicjatywami, szukał źródeł danych, zależności między nimi i wyników, które przynoszą wartość dla firmy.

Data scientist to, zdaniem "Harvard Business Review", najbardziej seksowny zawód XXI wieku. Jak zdobyć ten zawód?

Data scientist musi posiadać wiele umiejętności z zakresu statystyki, matematyki, ekonometrii, machine learningu, programowania, narzędzi analitycznych, baz danych czy Hadoopa. Dodatkowo potrzebna jest wiedza i praktyka biznesowa, aby dobrze rozumieć specyfikę branży i konkretne potrzeby klienta oraz proponować analizy, które będą miały konkretne przełożenie na skuteczność prowadzonego biznesu. Te umiejętności coraz częściej agreguje się w 3 duże grupy: Hacking Skills, Math & Statistics Knowledge oraz Substantive Expertise, o czym mogliśmy usłyszeć podczas drugiej międzynarodowej konferencji "Advanced Analytics and Data Science" zorganizowanej w październiku przez Szkołę Główną Handlową w Warszawie (www.analytics-conference.pl). Jeden z prelegentów, Chuck Kincaid z firmy Experis, w swojej prezentacji "How to be a Data Scientist Using SAS" podkreślał, że jest niesłychanie trudno znaleźć osobę, która łączy w sobie wszystkie te umiejętności. Dlatego być może w przyszłości w ramach data science powstaną specjalizacje, takie jak np. data developer, data researcher, data creative, data businessperson. Innym pomysłem na spełnienie tych wysokich wymagań jest tworzenie zespołów składających się z osób o różnych umiejętnościach, które wspólnie są w stanie spełnić oczekiwania biznesu. Bo w praktyce to właśnie biznes będzie decydował o kształcie tego stanowiska.

Czy wykształcenie w tym zakresie można już zdobyć w Polsce?

Tak, jest to możliwe i bardzo w tym pomocne są działania takich firm, jak SAS Institute, które wspierają uczelnie wyższe w realizacji tego typu programów studiów, oferując nie tylko dostęp do najnowocześniejszych technologii, ale również do wiedzy dziedzinowej, doświadczeń i praktycznych przykładów zastosowań biznesowych. Warto dokonać jak najwcześniej selekcji umiejętności i certyfikatów, które nam pomogą w zrealizowaniu tego celu. W moim przypadku już na II roku studiów licencjackich w Szkole Głównej Handlowej w Warszawie miałem możliwość przystąpienia do realizacji zestawu przedmiotów analitycznych stanowiących podstawę do otrzymania Certyfikatu "Analityk Statystyczny SAS". Jest to program dydaktyczny realizowany od roku 2005 na podstawie umowy zawartej pomiędzy Szkołą Główną Handlową w Warszawie i SAS Institute Polska. Przedmioty wchodzące w skład certyfikatu pozwalają zdobyć wiele przydatnych umiejętności analitycznych a dodatkowo, certyfikaty realizowane we współpracy z SAS mają również swoją renomę za granicą, co jest niezwykle ważne w świecie współczesnej analityki. Wiedza uzyskana podczas realizowania certyfikatu jest również dobrym pierwszym krokiem w stronę uzyskania globalnych certyfikatów SAS. Po zdobyciu licencjatu zdecydowałem się na zmianę uczelni na Tilburg University i zmianę kierunku na biznesowy International Management ze specjalizacją marketing. Zmiana miała mi pozwolić lepiej zrozumieć problemy biznesu, poznać podejście do problemów osób różnych narodowości, by w przyszłości nie mieć trudności w komunikacji z biznesem i pracy w zróżnicowanych zespołach. Zrozumiałem wtedy, że większość problemów biznesowych mogę rozwiązać z pomocą narzędzi SAS. Dlatego po ukończeniu studiów w Holandii postanowiłem kontynuować naukę na SGH na studiach podyplomowych II stopnia "Akademia Analityka – Analizy Statystyczne i Data Mining w Biznesie", które pozwoliły mi poznać nowe narzędzia i dalej rozwijać umiejętności w obszarze zaawansowanej analityki.

Czego konkretnie można się nauczyć na tych studiach?

Jak sama nazwa wskazuje w ramach studiów uczymy się metod analizy statystycznej i data miningu, które w rzeczywistości używane są w biznesie. Studia skupiają się w dużej mierze na umiejętnościach praktycznych, nie zapominając jednak o teorii. Z pewnością fakt, że zajęcia są prowadzone zarówno przez osoby z biznesu, jak i nauczycieli akademickich pomaga w tym, by były zachowane odpowiednie proporcje pomiędzy teorią, poznaniem problemu od strony biznesowej i przećwiczeniem jego praktycznego rozwiązania. Program studiów oferuje dużo praktycznych zajęć opartych na przykładach konkretnych zastosowań zaawansowanej analityki w biznesie. Mnie najbardziej przypadły do gustu zajęcia dotyczące najnowszych metod analitycznych – takich, jak np. analiza sieci społecznościowych czy text analytics. Ale osoby interesujące się scoringiem kredytowym, missing data, zaawansowanym programowaniem, IML, czy też zastosowaniem modeli mieszanych i wielopoziomowych również znajdą tu coś dla siebie, gdyż oferta programowa jest bardzo szeroka.

Szkoła Główna Handlowa jest zatem przykładem uczelni, która podejmuje wyzwanie kształcenia specjalistów data science?

Zdecydowanie tak i najlepszym tego przykładem jest uruchamiany w tym roku akademickim przez SGH kierunek "Analiza Danych – Big Data". Studia realizowane będą przez Kolegium Analiz Ekonomicznych – SGH. Szkoła prowadzi również wiele innych działań promujących potrzebę kształcenia w obszarze statystyki czy zaawansowanych metod analizy danych oraz, co równie ważne, szerszej współpracy nauki z biznesem. Przykładem jest wspomniana już doroczna międzynarodowa konferencja "Advanced Analytics and Data Science", której druga edycja odbyła się 14 października 2014 roku. Było to wyjątkowe spotkanie dwóch światów: nauki i biznesu, których przedstawiciele mieli okazję, aby dzielić się wiedzą i dyskutować o wyzwaniach związanych z kształceniem specjalistów posiadających odpowiednie kompetencje analityczne, informatyczne i biznesowe dostosowane do zmieniających potrzeb współczesnej gospodarki.

W trakcie studiów podyplomowych został pan zaproszony przez polski oddział SAS do reprezentowania Polski i Szkoły Głównej Handlowej w konkursie SAS Student Ambassador. Dlaczego zdecydował się pan wziąć w nim udział?

Uczestnicząc w konkursie miałem szansę zrobić projekt stricte analityczny. W przypadku zwycięstwa dostawałem szansę na zaprezentowanie swoich umiejętności na forum międzynarodowym, ponieważ laureaci konkursu prezentują swoje projekty podczas międzynarodowej konferencji SAS Global Forum w USA. Była to zatem wyjątkowa okazja do praktycznej pracy z wykorzystaniem nowoczesnych technologii. Okazja do wymiany wiedzy ze specjalistami z całego świata, którzy mają dużo większe doświadczenie ode mnie. W ramach konkursu zrealizowałem pionierski projekt, gdzie w praktyce mogłem wypróbować wiedzę z zakresu data science zdobytą na studiach.

Czego dotyczył projekt?

Postanowiłem wykorzystać nowo zdobyte umiejętności w zakresie text minigu i sprawdzić czy jest możliwe zastosowanie technik text analytics do analizy sprzedaży. W mojej pracy inspirowałem się podejściem data science i przedstawiłem krok po kroku całą analizę od pobrania danych do analizy statystycznej. Wybierając metodę analizy, którą dopiero poznałem i decydując się na formułę learning-bydoing na pewno przysporzyłem sobie więcej pracy i czasem stresu, ale też satysfakcja po 2 miesiącach pracy i radzenia sobie z różnymi wyzwaniami była znacznie większa. Tym bardziej, że dostałem się do grona finalistów i zostałem zaproszony do zaprezentowania mojego projektu podczas konferencji SAS Global Forum w Waszyngtonie. (Forum co roku odbywa się w jednym z miast USA i gromadzi coraz większą liczbę uczestników. W 2014 r. było to ok. 3000 analityków oraz 1500 przedstawicieli kadry zarządzającej).

Duże wrażenie?

Oczywiście, bo był to mój pierwszy pobyt w USA. W przeddzień prezentacji pracy na konferencji odbyła się uroczysta ceremonia wręczenia laureatom nagród, a wręczał je założyciel i prezes SAS – dr James Goodnight. Następnego dnia zaprezentowałem swoją pracę w czasie jednej z sesji e-posterów. Wszystkie prezentacje w tej formule dają bardzo szerokie możliwości networkingowe i są okazją do wymiany wiedzy i doświadczeń w międzynarodowym gronie ekspertów i liderów biznesu. Nauczyłem się, czym rzeczywiście jest networking i jak z niego korzystać. Dzięki temu również po konferencji poznałem wiele inspirujących osób, umieszczając mój projekt na LinkedIn. Mój sukces w konkursie przyczynił się również do tego, że w maju rozpocząłem pracę w polskim oddziale SAS Institute.

Co, pana zdaniem, przede wszystkim pozwoliło odnieść sukces w konkursie?

Umiejętność poprowadzenia projektu badawczego, czego nauczyłem się na studiach licencjackich, biznesowe podejście do rozwiązywania problemów poprzez case'y oraz wyrażanie tego w zwięzły sposób po angielsku, czego nauczyłem się na studiach w Tilburgu, i przede wszystkim umiejętność posługiwania się narzędziami SAS. Dlatego bardzo cenię sobie studia podyplomowe na SGH, które bardzo poszerzyły moje horyzonty i pozwoliły na zdobycie umiejętności, dzięki którym mogłem podjąć się udziału w konkursie.

W jakim stopniu czuje się pan dziś data scientist?

Myślę, że jestem gdzieś w połowie drogi, ponieważ od data scientist wymaga się również praktycznego doświadczenia w analizach danych oraz dobrego zrozumienia wyzwań rynkowych, procesów i modeli biznesowych. To doświadczenie mogę zdobyć jedynie w pracy przy konkretnych projektach i wdrożeniach, dlatego praca w SAS jest dla mnie ogromną szansą na rozwój. Firma jest liderem rynku analityki biznesowej i prowadzi wiele innowacyjnych projektów w różnych sektorach rynku. SAS realizuje w Polsce pierwsze wdrożenia systemów Big Data, Enterprise Fraud Management, Enterprise Risk Management, Real-Time Integrated Marketing Management, Self-Service BI. To są wyzwania odpowiednie dla specjalistów data science.

Jak zatem zostać dobrym data scientist?

Podczas konferencji The Second International Workshop "Advanced Analytics and Data Science" przedstawiciele biznesu i nauki jednogłośnie przyznali, że zapotrzebowanie na pracowników zajmujących się zaawansowaną analizą danych zwiększa się z każdym rokiem. Jednak zatrudnienie kolejnego analityka musi przynieść firmie konkretną wartość dodaną, dlatego tak ważna jest ta wszechstronność dyscyplinarna, rozumienie wyzwań biznesowych oraz kreatywność. Specjalista data science nie może czekać na gotowe dane i dopiero wtedy pokazywać jaką wiedzę może z nich wydobyć. Ważne jest by sam wychodził z inicjatywami, szukał źródeł danych, zależności między nimi i wyników, które przynoszą wartość dla firmy. Wyniki analizy muszą być też zawsze odnoszone do zysku i dawać odpowiedź na pytanie ile zyskamy, gdy podejmiemy decyzje zgodne z wynikami analizy.

Artykuł został opublikowany w magazynie Manager

Informacja o autorze: