Gyurics Gergely lassan négy éve dolgozik adatelemzőként a CX-Ray Kft.-nél. A különlegesség ebben az, hogy mindezt pszichológusként teszi. Interjúalanyunk betekintést ad nekünk a pszichológia, a statisztika és a programozás eme határterületébe, a mérnöki gondolkodás hatásába, valamint eloszlatja tévképzeteinket a kérdőívek fejlesztéséről. Interjúnk.
Mesélne arról, mivel foglalkozik egy adatelemző, azaz data scientist?
A data scientist egy olyan interdiszciplináris munkakör, melynek célja különböző strukturált vagy strukturálatlan adatforrásokból valamilyen oksági kapcsolat kivonása. Egyik rokonterülete az adatbányászás, amely az adatok kivonása olyan forrásokból, mint például a hanganyag, gépelt szöveg, a hangulatjelek használata sms-ekben, gyakorlatilag bármi. A másik pedig a data engineering, ami ezen adatok tárolásával foglalkozik.
Pszichológusként hogyan került kapcsolatba az adatelemzéssel?
A pszichológiáról mindenki azt gondolja, hogy egy bölcsész szak, ami az iparban is egy elég erős előítéletet teremt. Ugyanakkor a pszichológus képzése minden félévében tanul statisztikát, méréselméletet, pszichometriát, mely szorosan kapcsolódik az adatelemzéshez. Vannak olyan részei az adatelemzésnek, melyeket önképző módon kell elsajátítani pszichológusként, például a komplexebb matematikai alapokat. Ennek ellenére rengeteg olyan információ van, amelyet pszichológusok tudnak a legjobban értelmezni, mert alapvető emberi viselkedések modellezésére szolgálhatnak. Ilyen például a felhasználói élmény, a telefonhasználat, valamint az útvonalválasztás például a tömegközlekedésben. Biciklibérlő cégeknél, amilyen hazánkban a Mol Bubi vagy Amerikában a Citi Bike, hatalmas pénzösszegek forognak akörül, hogy a megfelelő helyen megfelelő mennyiségű bicikli álljon rendelkezésre. Ezek olyan kihívások, ahol a pszichológia eszköztára segíthet a megfelelő módszertan kiválasztásában, a modell felállításban.
Milyen módszerekkel dolgozik egy adatelemző?
A data scientistnek megvan a saját eszköztára: vagy drága programokkal dolgozunk, mint például az SPSS programcsalád, a RapidMiner, vagy pedig egy nagyon magas szintű programnyelvvel, mint az R vagy a Python. Ezentúl az adatelemző eszköztára tanuló algoritmusokból és alkalmazott statisztikából áll. Mindig szükség lesz alkalmazott statisztikatudásra, valószínűségszámításra, és szükségszerű iparterület-specifikus tudás is. Mindemellett használunk olyan módszereket, melyeket a mesterséges intelligencia fejlesztésében is alkalmaznak, többek között döntési fákat és neurális hálókat.
Milyen pszichológiai dimenziók mérésével foglalkozik?
Munka- és szervezetpszichológiában dolgozom, melynek célja a humán munkaerő segítése, támogatása, hogy a legjobbat hozza ki a dolgozókból. A munkavállalóknak ez azért kedvező, mert könnyebbé teszi a munkaterhet, hatékonyabbak, boldogabbak és elégedettebbek lehetnek a munkahelyükön. A munkahely szemszögéből azért hasznos, mert elkerülhet bevételkiesést, vagy növelheti teljesítményét. A munkapszichológiai data science területekhez tartozik például az emberi kapcsolatok elemzése, munkafolyamat elemzés, információmegosztás, tudásmegosztás, az elégedettségi felmérések, teljesítménymérések, célértékelések stb.
Milyen kihívásokat rejt magában az adatelemzői hivatás?
Pszichológusként kihívás volt számomra elsajátítani egy programnyelvet. Majd szembesültem azzal, hogy egy átlag felhasználó pár hét alatt elég programozási alapelvet el tud sajátítani, hogy akár termékfejlesztésbe is bekapcsolódjon, ha vannak mellette mentorok. Alapvetően az a tapasztalatom, hogy a munka világában nagyon sokan örülnek annak, hogy látnak olyan pszichológust, aki adatelemző is. Sok középvezetőtől hallottam vissza, hogy az adatelemzés, kiegészítve más tudományterülettel, nagy jövő elé néz.
Az adatelemzés pszichológiával kiegészülve olyan hiányterület, ahol még sok ember találja meg magát a közeljövőben.
Visszatérve a kérdésre, szemléletmódváltás volt megtanulnom egyfajta mérnöki gondolkodást, hogyan osszak fel feladatokat nagyon apró és egzakt lépésekre, abba látsz bele, milyen apró részletekből épülnek fel a komplex rendszerek. A pszichológusok pedig inkább kész rendszerekkel dolgoznak, mint az emberi elme, és annak egyes tényezőit próbálják megváltoztatni, hogy az az egész rendszerre hatással legyen. Egy adatelemzőnek tudni kell apró lépésekből felépíteni egy rendszert, így a két szemléletmód ötvözése kifejezetten hasznos.
Más életterületeken hogyan hasznosítja az adatelemzői készségeit?
Tőlem elválaszthatatlanná vált a mérnöki gondolkodás, maga a racionalizálás, az apró darabokból rendszerek alkotása. Illetve az, hogy minden egyes beavatkozás, melyet végrehajtok munkám során, egy mérés-tervezés-beavatkozás-újramérés ciklusból áll, amely szinte minden területen jellemző lett rám. Azaz nem esek kétségbe, ha nagy és komplex probléma áll elő, mert van egy keretrendszerem, melyben gondolkodva cselekedni tudok. Ez elsőre megkötőnek tűnhet, de én sokkal inkább felszabadítónak élem meg.
Milyen típusú személyeknek ajánlaná az adatelemzői munkát?
Nem tudnám személyiségtípushoz kötni ezt a foglalkozást. A kíváncsiság és egy kicsit a monotóniatűrés is fontos ennél a hivatásnál, mivel a statisztika a lassú és pontos kérdések világa. Viszont aki szeret kérdezni, és szereti tudni, hogy a válaszok, amiket kap, jók, ahhoz passzol az adatelemzés. Azok számára, akik nem foglalkoznak adatelemzéssel, a statisztika száraznak tűnhet. Úgy tartom, a statisztika éppúgy egy nyelv, mint ahogyan az anyanyelvünk az. A tanuló algoritmusok és a statisztika arra való, hogy fel tudjunk tenni kérdéseket, úgy, hogy a válasz a lehető legközelebb legyen az igazsághoz. Aki elsajátítja, rájön, miként és hogyan ad válasz kérdésére egy egyenletrendszer.
Milyen tévképzeteink vannak az adatelemzéssel kapcsolatban?
Az én munkaterületem a munka- és szervezetpszichológia, ahol főleg különféle kérdőíveket használunk. Alapvetően csalóka a kérdőívek világa, ugyanis egy kérdőív nem feltétlen akkor jó, mint mikor számítanánk rá. Egy unalmas kérdőív látszólag ismétlődő kérdésekkel lehet sokkal jobb, mint egy látványos eredményt adó. Emellett sokan hiszik, hogy bárki tud kérdőívet alkotni, viszont a kérdőív készítésnek vannak olyan kihívásai, melyek elsőre nem szembetűnőek.
Tudna erre példát mondani?
Tegyük fel, hogy egy munkahelyi környezetben vagyunk. Szeretnénk, ha a csapatunk jobban működne, és úgy gondoljuk, ennek van valamilyen akadálya. Hogyan derítsük ki, hogy az akadály valóban létezik-e? A legegyszerűbb válasz az, hogy megkérdezzük a munkavállalókat. A probléma akkor kezdődik, amikor több ember van, mint akit meg tudunk kérdezni. Ekkor jönnek képbe a kérdőívek. Ha szabadon válaszolhatnak az emberek, például kifejtős kérdések formájában, rengeteg folyószöveg képződik, melyből hasznos információt kihozni rendkívül idő-és energiaigényes. Ilyenkor szoktunk likert skálát alkalmazni: felteszünk egy állítást, és a válaszadónak egy számsoron kell jelölnie, mennyire ért egyet azzal, azaz kérdésünket átfogalmaztuk egy számskálán megválaszolható kérdéssé.
Probléma abból szokott adódni, hogy nem ugyanazt értjük ugyanazon a kérdésen. A kérdező nincs ott, hogy lássa a félreértést. Azért kell több kérdésünknek lenni ugyanarra vonatkozóan, hogy biztosak lehessünk abban, hogy a több kérdés ugyanazt a témát járja körül. Ez már a faktoranalízis módszertana, ami összetett statisztikai módszer, és megértése tanulást igényel. A faktoranalízis garantálja nekünk, hogy a lehető legkevesebb kérdéssel a legnagyobb pontosságot érjük el, amikor egy adott téma után nyomozunk, segítségével láthatjuk, hogy a kérdéseink az adott témát járják-e körül. Ezután még további minőségvizsgálatokat kell végeznünk. Látható tehát, hogy
egy hatékony kérdőív kidolgozás hónapokig tartó, és nagyon nagy szakértelmet igénylő munka.
Hogyha én egy cég vagyok, és nagy összeget fizetek azért, hogy megkérdezzem az alkalmazottaimat, akkor szeretném, ha megtérülne ez a pénz. Hogyha pedig egy kitöltő vagyok, időt szántam a kérdőív kitöltésére, akkor szeretném, ha tényleg változna valami, a munkahelyem jobb lenne. Amennyiben egy kérdőív érvényes és megbízható, egzakt adatok alapján előrejelzéseket tudunk tenni arra vonatkozóan, mivel segíthetünk igazán a cégnek. Ez mind a vállalat és munkaerő közös érdekét szolgálja.