Hvernig á að fá þitt fyrsta starf í gagnavísindum?

Hvernig er hægt að fá fyrsta aðgangsstigið sitt sem gagnafræðingur eða gagnafræðingur? Ef þú flettir í gegnum gögnum vísindaráðs finnur þú margar spurningar um þetta efni. Lesendur gagnafræðibloggsins míns (data36.com) spyrja mig þess sama af og til. Og ég get sagt þér þetta algerlega gilt vandamál!

Ég hef ákveðið að draga saman svör mín við öllum helstu spurningum!

NÝTT! Ég hef búið til alhliða (ókeypis) vídeónámskeið á netinu til að hjálpa þér að koma þér af stað með Data Science. Smelltu hér til að fá frekari upplýsingar: Hvernig á að gerast gagnafræðingur.

Skráðu þig hér (frítt): https://data36.com/how-to-become-a-data-scientist/

# 1: Hver eru mikilvægustu færni og verkfæri gagnafræðinga? Og hvernig er hægt að ná þeim?

Góðar fréttir - slæmar fréttir.

Ég mun byrja á því slæma. Í 90% tilvika er kunnáttan sem þeir kenna þér við háskólana ekki mjög gagnleg í raunvísindaverkefnum. Eins og ég hef skrifað um nokkrum sinnum, í raunverulegum verkefnum er þörf á þessum 4 gagnakóðunarhæfileikum:

  • bash / stjórnunarlína
  • Python
  • SQL
  • R
  • (og stundum Java)
Heimild: KDnuggets

Hvaða 2 eða 3 þér finnst gagnlegast veltur raunverulega á fyrirtækinu ... En ef þú hefur lært það verður mun auðveldara að læra annað.

Svo fyrsta stóra spurningin er: hvernig er hægt að fá þessi tæki? Hér koma fagnaðarerindið! Öll þessi tæki eru ókeypis! Það þýðir að þú getur halað niður, sett upp og notað án þess að greiða eyri fyrir þá. Þú getur æft, smíðað gagnaáhugamál verkefni eða hvað sem er!

Ég skrifaði grein fyrir skref fyrir skref nýlega um hvernig eigi að setja þessi verkfæri upp á tölvunni þinni. Athugaðu það hér.

# 2: Hvernig á að læra?

Það eru 2 megin leiðir til að læra gagnafræðin á auðveldan og hagkvæman hátt.

1.: Bækur.

Kinda gamla skóla, en samt góð leið til að læra. Úr bókum er hægt að fá mjög einbeittar, mjög ítarlegar þekkingar um gagnagreiningar á netinu, tölfræði, gagnakóðun osfrv...

7 bestu bækurnar sem ég mæli með

2. mál: Vefrásir á netinu og myndbandanámskeið.

Námskeið í gagnavísindum á netinu koma með sanngjarnt verð ($ 10- $ 500) og þau fjalla um ýmis efni, allt frá gagnakóðun til viðskiptagreindar. Ef þú vilt ekki eyða peningum í þetta í byrjun, þá hef ég skráð ókeypis námskeið og námsefni í þessari færslu.

(3. flokkur: Námskeið Junior Data Scientist á fyrsta mánuði. Ég hef búið til 6 vikna námskeið í gagnafræðinni á Netinu til að leitast við að gagnavísindamenn geti æft og leyst raunveruleg verkefni á lífsgögnum gagnapakka: Fyrsti mánuður Junior Data Scientist .)

# 3: Hvernig á að æfa og hvernig á að fá reynslu af raunveruleikanum

Þetta er erfiður einn, ekki satt? Sérhvert fyrirtæki vill hafa fólk með að minnsta kosti smá reynslu af raunveruleikanum… En hvernig færðu reynslu af raunveruleikanum, ef þú þarft reynslu af raunveruleikanum til að fá þitt fyrsta starf? Klassískt afla-22. Og svarið er: gæluverkefni.

„Gæluverkefni“ þýðir að þú kemur með hugmyndaverkefni sem gerir þig spenntur. Svo byrjarðu einfaldlega að smíða það. Þú getur hugsað um það sem litla gangsetningu, en vertu viss um að halda áfram að einbeita þér að gagnavísindahluta verkefnisins og þú getur bara hunsað viðskiptahlutann. Hér eru nokkur gæluverkefni mín frá síðustu árum til að gefa þér nokkrar hugmyndir:

  • Ég smíðaði handrit sem fylgdist með fasteignavef og sendi mér tölvupóst um bestu tilboðin í rauntíma - svo ég gæti fengið þessi tilboð á undan öllum öðrum.
  • Ég smíðaði handrit sem var að toga allar greinar úr ABC, BBC og CNN og byggði á þeim orðum sem notuð voru, tengdu greinarnar sem voru um nákvæmlega sama efni á 3 mismunandi fréttagáttum.
  • Ég smíðaði sjálfsnámspjall í Python. (Það er þó ekki of snjallt - þar sem ég hef ekki þjálfað það ennþá.)

Vertu skapandi! Finndu gögnum vísindatengda gæluverkefni fyrir þig og byrjaðu að kóða! Ef þú lendir í veggnum við erfðaskrárvandamál - það getur gerst auðveldlega þegar þú byrjar að læra nýtt gagnamál - notaðu bara google og / eða stackoverflow. Eitt stutt dæmi um mitt - um hversu áhrifaríkt flæði er:

vinstri hlið: spurning mín - hægri hlið: svarið (eftir 7 mínútur)

Taktu eftir tímastimplinum! Ég hef sent inn eins konar flókna spurningu og ég fékk svarið til baka á 7 mínútum. Það eina sem ég þurfti að gera var að afrita og líma kóðann í framleiðslukóðann minn og búmminn, það virkaði bara!

(Athugið: Cross Validated er annar frábær vettvangur fyrir spurningar sem tengjast gagnavísindum.)

+1 uppástunga:

Jafnvel ef það er svolítið erfitt, reyndu að fá leiðbeinanda. Ef þú ert svo heppinn finnur þú einhvern sem vinnur í gagnafræðingi hlutverki hjá fallegu fyrirtæki og getur eytt 1 klukkustund vikulega eða vikulega með þér og rætt eða kennt hlutina.

# 4: Hvar og hvernig sendir þú fyrstu atvinnuumsókn þína?

Ef þér hefur ekki tekist að finna leiðbeinanda geturðu samt fundið þann fyrsta hjá fyrsta fyrirtækinu þínu. Þetta mun verða fyrsta starfið þitt sem tengist gagnavísindum, svo ég legg til að einblína ekki á stóra peninga eða á ofurfínt upphafsstemningu. Einbeittu þér að því að finna umhverfi þar sem þú getur lært og bætt þig.

Að taka fyrsta gagnavísindastarfið hjá fjölþjóðlegu fyrirtæki gæti ekki verið í samræmi við þessa hugmynd, vegna þess að fólk þar er yfirleitt of upptekið af hlutunum sínum, svo það hefur ekki tíma eða / og hvatningu til að hjálpa þér að bæta þig (auðvitað eru alltaf undantekningar).

Að byrja í pínulítilli gangsetningu sem fyrsta gagnafólk í teyminu er ekki heldur góð hugmynd í þínu tilviki, vegna þess að þessi fyrirtæki hafa ekki eldri gagna til að læra af.

Ég ráðlegg þér að einbeita þér að 50–500 stórfyrirtækjum. Það er gullna meðaltalið. Hátæknifræðingar eru um borð en þeir eru ekki of uppteknir við að hjálpa og kenna þér.

Allt í lagi, þú hefur fundið nokkur góð fyrirtæki ... Hvernig á að sækja um? Nokkur lögmál fyrir ferilskrána þína: varpa ljósi á kunnáttu þína og verkefni, ekki reynslu þína (þar sem þú hefur ekki of mörg ár til að setja á blað ennþá). Listaðu upp viðeigandi kóðunarmál (SQL og Python), þú notar og tengdu nokkur af github endurhverfum verkefnum þínum svo þú getir sýnt að þú hafir virkilega notað það tungumál.

Einnig, í flestum tilvikum, fyrirtæki biðja um fylgibréf. Það er auðvitað gott tækifæri til að láta í ljós áhuga þinn en þú gætir líka bætt við nokkrum hagnýtum upplýsingum eins og hvað myndir þú gera fyrstu vikurnar þínar ef þú yrðir ráðinn. (Td „Þegar litið er á skráningarflæðið þitt myndi ég giska á að vefsíðan ____ gegni mikilvægu hlutverki. Á fyrstu vikunum mínum framkvæmdi ég ___, ___ og ___ (sértækar greiningar) til að sanna þessa tilgátu og skilja hana betur. Það gæti hjálpað fyrirtækinu að bæta _____ og að lokum ýta á _____ KPI. “)

Vonandi lendir þetta í þér atvinnuviðtal, þar sem þú getur spjallað svolítið um gæluverkefnin þín, tillögur þínar um forsíðubréf, en það mun að mestu leyti snúast um persónuleikaþátttöku og líklega um grunnfagpróf. Ef þú hefðir æft nóg muntu fara framhjá þessu… en ef þú ert kvíðin og vilt æfa meira geturðu gert það á hackerrank.com.

Niðurstaða

Jæja, það er það. Ég veit að það hljómar auðveldara þegar þetta er skrifað, en ef þú ert virkilega staðráðinn í að vera gagnafræðingur mun það ekki vera neitt vandamál að láta það gerast! Gangi þér vel með það!

Ef þú vilt prófa, hvernig er það að vera yngri gagnavísindamaður við raunverulegan gangsetningu, skoðaðu 6 vikna námskeiðið mitt á netinu: Vísindamaður Junior Data Scientist!

Og ef þú vilt læra meira um gagnavísindi skaltu skoða bloggið mitt (data36.com) og / eða gerast áskrifandi að fréttabréfinu mínu! Og ekki missa af nýju kennsluþáttaröðinni minni: SQL til gagnagreiningar!

Takk fyrir að lesa!

Hafðirðu gaman af greininni? Vinsamlegast láttu mig vita með því að smella á hér að neðan. Það hjálpar líka fólki að sjá söguna!

Tomi Mester höfundur data36.com Twitter: @ data36_com