W ostatnich latach osoby zajmujące się Data Science to jedni z najbardziej poszukiwanych specjalistów na rynku pracy. Zapotrzebowanie na data scientist wykazują już nie tylko branże z obszaru IT, ale także firmy, które do tej pory nie miały do czynienia z analizą dużych zasobów informacji.
Jakie kompetencje powinien posiadać data scientist? Co powinno go charakteryzować? Czy są kompetencje, bez których nie można wykonywać tego zawodu? Najlepsi specjaliści opisywani są pewnymi cechami, które wyróżniają ich spośród tłumu zwykłych analityków.
Gdy myślimy o pracownikach z tej dziedziny zwykle patrzymy na kwalifikacje analityczne. O wiele rzadziej wspomina się o zdolnościach „miękkich”, których posiadanie także w tej branży jest niezwykle ważne. data scientist zanim rozpocznie pracę, musi opanować kilka istotnych umiejętności, bez których praca w tej interdyscyplinarnej dziedzinie nie byłaby możliwa.
Oto nasza (subiektywna) lista cech, które każdy dobry data scientist powinien posiadać, a zaczniemy ją trochę przewrotnie od czegoś, o czym raczej mało kto wspomina na początku od zdolności komunikacyjnych.
1. KOMUNIKACJA
W pracy data scientist niezwykle ważne jest umiejętne komunikowanie. Kluczem do sukcesu jest efektywna komunikacji podczas każdego etapu projektu. Specjalista musi trafnie porozumiewać się podczas definiowania problemu, analizowania go, w trakcie jego rozwiązywania, a także, jak się okazuje, tuż po jego rozwiązaniu –
w trakcie prezentacji innym członkom zespołu. Trzeba umieć rozmawiać zarówno z innymi data scientists, jak i osobami, które nie znają dobrze branży. Wyjaśnienie danych nieanalitycznym członkom zespołu to zwykle najbardziej skomplikowany etap procesu komunikacji podczas całego projektu – trzeba to robić zrozumiale
i używać niewyszukanego języka, tak aby członkowie zespołu bez przygotowania technicznego mogli przyswoić temat. Ważne jest, aby umieć tłumaczyć skomplikowane rzeczy w zrozumiały sposób. Data scientist musi pamiętać, aby dostosowywać sposób komunikacji do możliwości i potrzeb swojego odbiorcy.
2. ZNAJOMOŚĆ ALGORYTMÓW I METOD
Teoretyczna i praktyczna znajomość algorytmów to także solidne podstawy pozwalające na rozumienie i uczenie się nowych podejść. Naukowcy zajmujący się analizą danych powinni mieć łatwość w przyswajaniu nowych metod. Big data to temat, który właśnie przeżywa rozkwit i z pewnością odkryje przed nami jeszcze wiele swoich możliwości. To co znamy dziś, jutro może okazać się zdezaktualizowane przez nowe rozwiązania, dlatego efektywny data scientist powinien z łatwością wykorzystywać nowe, nieznane dotąd dla siebie metody i rozwiązania. Studiowanie i praktyczne wykorzystanie algorytmów rozwija intuicję, co przyczynia się do efektywniejszego rozwiązywania problemów.
3. UMIEJĘTNOŚCI PROGRAMISTYCZNE
Być może wydaje się to oczywiste, ale jest to podstawa, o której nie można zapomnieć, kompletując listę umiejętności data scientist. Konieczna jest dobra znajomość przynajmniej jednego języka programowania: R lub Python, a także, co ważne, posiadanie zdolność do szybkiego przyswajania nowych, uczenia się i wykorzystywania nieznanych do tej pory narzędzi. Branża data science szybko się rozwija, dlatego nie można przestawać się szkolić. Umiejętności programistyczne, które posiada data scientsit powinny stale się poszerzać. Świat narzędzi data science zmienia się wyjątkowo szybko. Dobry data scientist powinien mieć chęć ciągłego uczenia się i zdobywania nowych kwalifikacji.
Co więcej, jest to cecha wyróżniająca data scientist od zwykłego analityka. Swoje rozwiązania musi zaprogramować tak, aby działały w sposób automatyczny. Analizy ogromnych zasobów danych nie da zrobić się na kartce papieru, dlatego znajomość któregoś z języków programowania jest niezbędna, aby móc wykonywać pracę efektywnie.
4. ZNAJOMOŚĆ SQL
Kolejną cechą, powiązaną z poprzednią umiejętnością, jest znajomość języka zapytań SQL. Można się zastanawiać, czy nie powinno być to potraktowane po prostu jako jeden z języków programowania. Chcę jednak podkreślić jego szczególną rolę. Pomimo rozkwitu baz NoSQL
i różnorodnych alternatywnych sposobów przechowywania dużych zbiorów danych, to jednak SQL jest wciąż niezastąpiony w wielu rozwiązaniach. Stanowi najbardziej efektywnych sposób pobierania i przygotowania do dalszej pracy. Znajomość SQL jest to niezbędną kompetencją data scientist ze względu na częstą pracę z ogromnymi bazami danych.
5. CIEKAWOŚĆ
Data scientist musi być ciekawski, zadawać pytania i szukać odpowiedzi, kopać cały czas głębiej. Jego cechą powinna być otwartość na nowe doświadczenia i stałe poszukiwanie lepszych, nowocześniejszych rozwiązań. Branża data science zmienia się z dnia na dzień. Powstają coraz to lepsze rozwiązania i ciekawsze metody. Pracując w tym zawodzie, trzeba stale rozwijać swoje umiejętności, aby któregoś dnia nie okazało się, że przespaliśmy pewną innowację, bez znajomości której nie jesteśmy już tak wydajni, jak kiedyś. W branży liczy się efektywność, wydajność i prostota rozwiązań, dlatego niezaspokojona ciekawość to coś, co towarzyszy każdemu dobremu data scientist.
6. SCEPTYCYZM
Kolejnym elementem, który powinien cechować specjalistę od danych to zdrowy sceptycyzm. Prowadzi on do rygorystycznego podejścia do wykonywanych analiz, ich weryfikacji, dokładnego sprawdzenia czy dokonane „odkrycie” nie wynika z błędu w danych, w zastosowanej metodyce, czy interpretacji wyników. W życiu niczego nie można być pewnym, dlatego data scientist powinien skrupulatnie podchodzić do tego, co robi, a na wszystkie wyniki patrzeć z dystansem. Sceptycyzm pozwala na krytyczne podejście nawet do własnych efektów pracy, co może wyeliminować możliwość wystąpienia błędu.
7. PODEJŚCIE BIZNESOWE
Aby zrozumieć problem, który data scientist musi rozwiązać, dobrze jest mieć pojęcie o biznesie, którego zapytanie dotyczy. Zrozumienie szerszego kontekstu oraz uwarunkowań, w jakich działa biznes jest często konieczne do uzyskania najlepszego efektu. Bez tego trudno o dobranie odpowiedniej metody do rozwiązania problemu.
Podsumowując, efektywny data scientist musi łączyć w sobie umiejętności analityczne, programistyczne, biznesowe, a także kompetencje miękkie, takie jak łatwość komunikacji. Nie bez powodu, data scientist to najbardziej pożądani specjaliści na rynku pracy. Nie jest łatwo spełnić wszystkie wymagania, ale wielu z nich można nauczyć się w ciągłym doskonaleniu swojej pracy. Jeżeli jednak masz wszelkie predyspozycje do bycia data scientist, możesz przyczynić się do innowacyjnego rozwiązywania problemów w wielu branżach, a znalezienie ciekawej i rozwojowej pracy nie będzie stanowiło żadnego problemu.