2015.06.23

Data scientist – pan i władca na oceanie danych

Data scientist nazywany jest… najbardziej seksownym zawodem XXI wieku. Kim jest i czym zajmuje się mistrz danych, jak czasami tłumaczy się angielską nazwę tej profesji?

Data scientist – pan i władca na oceanie danych

Zawód na nowe czasy

Zawód określany mianem data scientist pojawił się wraz z nastaniem ery Big Data, czyli ogromnej liczby nowych danych zbieranych w niespotykanym dotąd tempie, oraz mediów społecznościowych i serwisów strumieniujących. Największe korporacje od dawna korzystają z ich usług - to dzięki „mistrzom danych” powstały takie algorytmy, jak facebookowe czy linkedinowe zasady podpowiadania znajomych oraz wyświetlania (lub nie) określonych rzeczy. To dzięki nim Netflix doskonale wie, kiedy statystycznie podczas odtwarzania filmu najczęściej naciskamy pauzę czy przewijamy film i co nam polecić na sobotni wieczór. To oni sprawili, że Spotify uczy się naszych muzycznych gustów i potrafi zaproponować nowych wykonawców albo dopasować muzykę do nastroju. I wreszcie to oni odpowiedzialni są za te nieszczęsne reklamy kontekstowe z amazon.com, pokazujące rzeczy, które już oglądaliśmy, a czasami nawet już kupiliśmy.

Z drugiej strony to także dzięki nim Google Maps pokazuje natężenie ruchu na ulicach i potrafi proponować objazdy, a w przyszłości to ich praca przyczyni się do bezwypadkowej jazdy samochodów autonomicznych zbierających i analizujących dane z otoczenia i przesyłających je do innych aut. To dzięki nim medyczne roboty przyszłości będą potrafiły bezbłędnie diagnozować choroby i przepisywać najskuteczniejszą kurację. Przyszłość należy do mistrzów danych.

Data scientist – człowiek-orkiestra

Data scientist to po trosze tradycyjny statystyk zawsze chcący uczyć się nowych sposobów analizy danych i nowych narzędzi, które mu do niej posłużą. W sporej części naukowiec i odkrywca-hacker podejmujący się wyzwań związanych z okiełznaniem danych przychodzących z różnych źródeł, ich analizy oraz znalezienia dla nich zastosowania. To także menadżer znający zarówno potrzeby klientów i konsumentów, jak i cele firmy. I wreszcie – to doradca i prezenter potrafiący w klarowny i przystępny sposób przedstawić swoje odkrycia oraz ich wpływ na biznes. Trzeba więc przyznać, że wymagania w tym zawodzie są duże, ale podobnie jest z zapotrzebowaniem na usługi mistrzów danych. Niemniej, jest to zawód, z którym warto wiązać przyszłość, bo wszystko wskazuje, że w najbliższych latach liczba danych, do których firmy będą miały dostęp, będzie nadal rosła w ogromnym tempie. I ktoś będzie musiał je opanować.

Jak zostać data scientist?

Od czegoś trzeba zacząć i jak wszędzie w zawodach związanych z danymi oraz programowaniem, będzie to matematyka. Rachunek różniczkowy wielu zmiennych i algebra liniowa to fundamenty, które pozwolą na późniejszą pracę z rachunkiem prawdopodobieństwa, macierzami, statystyką, heurystyką i uczeniem maszynowym, co jest chlebem powszednim w pracy jako data scientist. Niezbędne będą też umiejętności programowania, na pewno bardzo przyda się znajomość Pythona, jednego z języków programowania.

Nieodzwony w tym zawodzie jest naukowy angielski, bo wszystko w świecie data scientist dzieje się w języku Alana Turinga1. Z tymi podstawami można ruszyć na podbój ogromnej liczby bezpłatnych kursów i wykładów związanych z data science na Coursera, Khan Academy czy Harvardzie.

  • Khan Academy to platforma edukacyjna, na której znajdziemy filmy z takich dziedzin jak matematyka, fizyka, biologia, chemia, astronomia, informatyka czy finanse. Wykłady mają charakter uniwersalny i są skierowane do wszystkich - uczniów od podstawówki po studia, a także do dorosłych, którzy są sobie przypomnieć wiadomości, np. aby pomóc swoim dzieciom podczas odrabiania lekcji. Partnerem strategicznym programu jest Fundacja PKO Banku Polskiego.

To jednak tylko początek. Trzeba przecież znać tematykę baz danych SQL i NoSQL, analizować dane w R, wizualizować je np. w Tableau, obsługiwać oprogramowanie do data miningu, znać platformy do przetwarzania danych MapReduce i Hadoop. Niezbędna będzie też znajomość zachowań użytkowników, metody badawczej testu A/B, przetwarzania języka naturalnego, optymalizacji oprogramowania, analizy szeregów czasowych i tak dalej i dalej. Potem warto poszukać stażu, może wziąć udział w jakimś konkursie na Kaggle.com, śledzić blogi, spróbować dołączyć do szerokiej społeczności mistrzów danych czy wziąć udział w spotkaniu takim jak Big Data Technology Summit, które odbył się w lutym br. w Warszawie.

Żeby zostać data scientist nie trzeba być matematykiem lub informatykiem z wykształcenia, ale trzeba kochać dane. Te uporządkowane i nieuporządkowane. Można być po fizyce, astronomii, chemii, ważne żeby lubić i rozumieć statystykę, bo w Polsce nie ma jeszcze na uczelniach kierunków poświęconych data science. Kto by się jeszcze niedawno spodziewał, że to właśnie statystycy, kojarzący się dotychczas raczej niezbyt ekscytująco, staną się jedną z najbardziej rozchwytywanych profesji na globalnym rynku. Od wielkich korporacji do maleńkich start-upów - wszyscy szukają statystyków, którzy zostaną dla nich mistrzami danych.

1. http://pl.wikipedia.org/wiki/Alan_Turing

Marcin Sikora
Redakcja Bankomanii

Czytaj także:

Umiejętności cyfrowe – czy doceniamy ich rolę i znaczenie?

    • Bankofirma

      02019.07.04

      Okna, drzwi i bramy z Białegostoku. W Pafo-Bud stawiają na jakość

      Konkretny w rozmowie, skuteczny w biznesie. Taki jest Dariusz Matyszewski, udziałowiec firmy Pafo-Bud z Białegostoku, która od ponad 20 lat produkuje okna, drzwi i bramy. W swoich działaniach spółka stawia na jakość towaru i usługi przy zastosowaniu nowoczesnych rozwiązań technologicznych.

      więcej
    • Bankofirma

      02019.07.04

      Przejdź płynnie do faktoringu

      Po faktoring sięga coraz większa grupa przedsiębiorców. Nie wszyscy jednak jeszcze wiedzą, jakie mogą mieć korzyści z umowy faktoringu. Nie chodzi tylko o płynność finansową firmy – faktoring to również możliwość zabezpieczenia się przed nieuczciwymi partnerami i ich weryfikacja jeszcze przed rozpoczęciem współpracy.

      więcej
    • Bankofirma

      02019.07.01

      Maciejowy Sad – kiedy rodzinna pasja, staje się biznesem

      Maciejowy Sad to idealny przykład, jak rodzinną pasję przekuwać w rodzinny biznes. Przed laty Jerzy Karczewski na lutyńskiej ziemi w okolicach Wrocławia założył sad. Później opiekę nad gospodarstwem przekazał synowi Maciejowi. W 2010 r. postanowili zwiększyć dostępność tłoczonych soków, żeby szersze grono konsumentów mogło skosztować ich produktów.

      więcej
    • Bankofirma

      02019.06.28

      Pizza była mało znana. „Pruszynka” to zmieniła

      Kiedy Piotr Pruszyński w 1998 r. otworzył swoją pierwszą pizzerię „Pruszynka” w Białymstoku, wielu ludzi w regionie nie wiedziało, czym jest pizza i co po złożeniu zamówienia otrzymają na talerzu. Dziś przedsiębiorca posiada pięć lokali, które z powodzeniem zaspokajają apetyty mieszkańców miasta.

      więcej
    • Bankofirma

      02019.06.13

      Pensjonat i hotelik w mazurskim stylu. Goście przyjeżdżają nawet trzy razy w roku

      Goście z Europy Zachodniej zamiast dużych hoteli wolą mniejsze i kameralne obiekty, gdzie mają bezpośredni kontakt z właścicielami. Znajdują to u nas w Pensjonaciku Cyklada i Mazurskiej Chacie – przekonuje Jacek Jaworski, który wraz z żoną Izabelą prowadzi obiekty wypoczynkowe na uboczu Mikołajek w okolicach Jeziora Mikołajskiego. Małżeństwo przygotowuje właśnie Pawilon SPA z sauną i jacuzzi, bo ciągle chce rozwijać ofertę dla turystów.

      więcej
    • Bankofirma

      02019.06.11

      Let’s Fintech with PKO Bank Polski – rozumiemy potrzeby innowacyjnych firm

      PKO Bank Polski rozwija projekt Let’s Fintech, dzięki któremu współpracuje ze startupami i angażuje się w wyszukiwanie najbardziej perspektywicznych rozwiązań technologicznych dostępnych na rynku. O pracy zespołu, wdrożeniach i poszukiwaniu kolejnych projektów mówi Grzegorz Pawlicki, dyrektor Biura Innowacji w PKO Banku Polskim

      więcej
    Pokaż więcej
loaderek.gifoverlay.png