De ultieme gids om te slagen voor je volgende data science interview
Bijgewerkt in december 2023.
Data science is een interdisciplinair vakgebied dat statistiek, wiskunde, wetenschappelijke methoden, AI, gespecialiseerd programmeren, analyse en storytelling combineert om waarde uit gegevens te halen.
Een Data Scientist past statistische methoden toe en gebruikt een breed scala aan tools en technieken om gegevens te analyseren en voor te bereiden. Ze leggen ook de betekenis achter de resultaten uit aan verschillende belanghebbenden.
Gegevens kunnen bedrijven helpen hun doelen te bereiken en problemen op te lossen. Datawetenschap dient als brug tussen data en de directiekamer, en verbindt de zakelijke en technische wereld. Een ervaren datawetenschapper kan effectief communiceren met mensen op verschillende expertiseniveaus.
Deze gids is bedoeld voor beginnende datawetenschappers. Het biedt twee sporen om te verkennen: een technologietraject en een zakelijk traject. Je kunt ervoor kiezen om je op één verbeteringsgebied te richten of eenvoudig tussen de twee te wisselen. De gids biedt bruikbare inzichten om je te helpen bij het aanpakken van elk geval van datawetenschap.
Tech track 💻
Voordat we ingaan op de details van de data science-modules, hebben we twee alles-in-een data scientist-tracks opgesomd (een gratis, een betaalde). Zodra je deze onderwerpen hebt behandeld, kun je direct trainen op Kaggle.
Gratis optie
We raden twee zeer gerenommeerde cursussen aan op Coursera van de Universiteit van Michigan(Applied Data Science with Python | Coursera) en Stanford(Machine Learning by Stanford University | Coursera).
Betaalde optie ± €45/maand
Data Scientist in Python Carrièrepad - Dataquest
Deze track behandelt de meeste instapconcepten van data science (basispython, datamanipulatie, visualisatie, modellering, SQL-query's, git, commandoregel...).
Als een van de bovenstaande onderwerpen onduidelijk voor je is, of als je gewoon een specifieke vaardigheid wilt verbeteren, zijn hier de verschillende bronnen voor elke module die wij interessant vinden.
1. Gegevenswetenschap verkennen
Ongeacht je technische achtergrond, datawetenschap is voor iedereen toegankelijk als je enige interesse hebt in coderen en gegevensmanipulatie. We zetten hier bronnen op een rij waarmee je aan de slag kunt met de meest gebruikte programmeertaal, Python, en een beter begrip kunt krijgen van deze multidisciplinaire aanpak.
Boeken
Inleiding tot de codeerwereld: Automatiseer de saaie dingen met Python. Een geweldig boek om te beginnen met coderen met Python. Het begint met de basisconcepten van programmeren. Het is erg praktijkgericht en praktisch als je de oefeningen doet terwijl je het leest.
Basisopdrachten in Python: Data Science from Scratch Eerste beginselen met Python van Joel Grus. Dit boek is gericht op de introductie van de basisprincipes van Python en praktische coderingsconcepten van wat je dagelijks doet als Data Scientist.
Inleiding tot machinaal leren: Het Honderd Pagina's Machine Learning Boek van Andriy Burkov. Hoewel het uitgangspunt van het samenvatten van ML-kennis dubieus lijkt, geeft de auteur een uitstekend overzicht van wat ML inhoudt. Er zijn enkele wiskunde- en codeervoorbeelden en het bevat behoorlijk veel details voor zo'n kort boek.
YouTube: Python-tutorials
Een kanaal dat een scala aan zeer elementaire (python-installatie, datatypes enz.) tot meer complexe Python-onderwerpen behandelt (bijv. het bouwen van een webapp).
Autodidact (Probeer-fout-succes):
Verzamelt bronnen om een "open-source curriculum voor het leren van Data Science" te maken. Er zijn veel bronnen, allemaal open source (maar niet noodzakelijk gratis). Ze geven niet alleen aanbevelingen voor leermiddelen voor ML, wiskunde, data viz en Python, maar ze geven ook suggesties voor de volgorde waarin ze moeten worden behandeld.
De Open-Source Data Science Masters door datasciencemasters
2. Verbeter uw vaardigheden op het gebied van gegevenswetenschap
Als je een achtergrond hebt in wiskunde, statistiek en gegevensanalyse, dan zullen deze meer geavanceerde bronnen je helpen om je technische vaardigheden verder te verbeteren.
YouTube
Begrijp de essentie die schuilgaat achter de ingewikkelde formules die worden gebruikt in lessen over datawetenschap en geavanceerde statistiek.
Boeken
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow
Echte Bijbel over Machine Learning, met 2/3 van het boek gewijd aan Deep Learning. Het schuwt de wiskunde niet, maar blijft praktisch in zijn aanpak door gebruik te maken van de gebruikelijke data science Python bibliotheken. Naast concepten laat het ook tools en technieken zien.
The Data Science Interview Book
Zoals de naam al aangeeft, vind je hier een zeer nuttige samenvatting van een groot aantal technische aspecten van data science. Het is niet 100% volledig voor een Agilytic interview, omdat de zakelijke invalshoek ontbreekt. Hoe dan ook, een zeer gestructureerde en nuttige samenvatting.
3. Daag je datawetenschappelijke vaardigheden uit
Je hebt dus zoveel mogelijk informatie, concepten en technieken geabsorbeerd als menselijkerwijs mogelijk is. Het is tijd om je vaardigheden op de proef te stellen! Hier zijn een aantal plaatsen om je te helpen een duidelijker beeld te krijgen van wat je onder de knie hebt en wat er beter kan. Vergeet niet je werk te uploaden op GitHub. Dit zal al je vaardigheden op het gebied van datawetenschap aan het licht brengen in de hele digitale wereld.
Kaggle wedstrijden
Upload je werk op je GitHub profiel
Gebruik tools om de kwaliteit van code te verbeteren. Voor Python kun je hier beginnen: https://towardsdatascience.com/a-data-scientists-guide-to-improving-python-code-quality-21660ecea97d
4. Als je op zoek bent naar een meer gestructureerd leertraject
Als je de tijd hebt en een uitgebreide opleiding wilt volgen, overweeg dan om je in te schrijven voor een Data Science masteropleiding. Een master biedt je meer tijd voor diepgaande praktijkervaring, waardoor je statistische tools en machine learning-technieken beter leert kennen. Daarnaast biedt het aanvullen van je academische reis met een data science stage een uitstekende gelegenheid om je vaardigheden te verbeteren in een real-world omgeving.
Hieronder vind je een niet-uitputtende lijst van hoogwaardige Data Science masteropleidingen in België.
Gespecialiseerde Master in Big Data & Data Science (MS-BGDA) - ULB - 1 jaar
Voor dit masterprogramma moeten kandidaten een eerdere master hebben afgerond. Het is ontworpen voor mensen met een fundamenteel begrip van statistiek en codering die hun expertise willen uitbreiden en zich willen specialiseren in data science.
Binnen het mastercurriculum heb je de optie om een scriptie of een stage te kiezen. Deze keuze biedt een waardevolle mogelijkheid om de theoretische kennis die je in de cursussen hebt opgedaan toe te passen op uitdagingen in het echte leven.
Het is belangrijk om op te merken dat het masterprogramma toegang geeft tot data science-cursussen aan verschillende faculteiten, waaronder Engineering, Sciences en Solvay (Economics).
Master in Statistiek en Data Science - KUL - 2 jaar
Of je nu je bachelordiploma aan het afronden bent of je kennis na je master wilt vergroten, dit programma biedt een unieke tweejarige kans om je te verdiepen in datawetenschap en je codeervaardigheden te verbeteren. Houd er rekening mee dat ons masterprogramma geen gestructureerde stagecomponent bevat. Als je dit soort ervaring wilt opdoen, moet je dat zelfstandig doen naast je academische verplichtingen.
Zakelijk circuit 💼
1. Een probleem begrijpen / De doelstelling definiëren
Je belangrijkste doel als datawetenschapper is om bruikbare inzichten af te leiden uit gegevens. Om te voorkomen dat je onbeantwoordbare vragen najaagt die nergens toe leiden, is het belangrijk om te weten waar je naartoe gaat en hoe je daar gaat komen. Weten hoe je het probleem van een klant moet begrijpen en hoe je zijn bedrijfsdoelstelling moet definiëren, is een belangrijke troef. We raden het boek Cracked it! en raamwerken voor case-interviews aan:
Kraak het!: Hoe je grote problemen oplost en oplossingen verkoopt als top strategieconsultants.
Dit boek leert je hoe je elk uitdagend probleem efficiënt kunt aanpakken en de oplossing ervan kunt verkopen. Aan de hand van voorbeelden uit business cases laat het zien hoe je problemen benoemt, structureert en oplost en hoe je oplossings- en resultaatgericht te werk gaat.
Voor bedrijfssituaties raden we aan om een aantal zeer bekende bedrijfskaders te lezen (gebruikt door vooraanstaande adviesbureaus), alleen om je gedachten beter te structureren (leer ze niet uit je hoofd):
Kaders voor casusgesprekken: een uitgebreide gids - IGotAnOffer
Kaders voor casusgesprekken: Ultieme gids voor geraadpleegd management
2. Beheers uw sollicitatiegesprek
Je sollicitatiegesprek is jouw moment om echt te schitteren en jezelf te 'verkopen', terwijl je een eerste indruk geeft van je communicatieve vaardigheden. We hebben uitgebreide sollicitatietips verzameld die je kunnen helpen. Het is een cliché maar het is waar, zorg ervoor dat je oefent, oefent, oefent.
Wees voorbereid om vragen over datawetenschap te beantwoorden. Met name hoe je een probleem benadert, je structuur en hoe je conclusies trekt. Deze website biedt een aantal voorbeelden: OVER 100 vragen en antwoorden voor interviews met datawetenschappers! | door Terence Shin | Naar datawetenschap
3. Leer je inzichten met anderen te delen:
Wat nog belangrijker is dan de nieuwe oplossing, tool of het nieuwe model dat je hebt gemaakt, is hoe je het deelt met anderen. Datawetenschap gaat net zo goed over het werken aan de uitvoering van een nieuw project als over het communiceren van je bevindingen met klanten of collega's. Als je je presentatie- en verhaalvaardigheden onder de knie hebt, ben je in goede vorm. Als je je presentatie- en vertelvaardigheden onder de knie hebt, zit je goed.
We raden het lezen van het boek Storytelling with data - mandatory reading op Agilytic ten zeerste aan. We zien aanzienlijke verbeteringen in de kwaliteit van de visualisaties en presentaties van onze collega's nadat ze het hebben gelezen.
Verhalen vertellen met gegevens: Een handleiding voor datavisualisatie voor bedrijfsprofessionals.
Leuk om te hebben - Boost je CV ⚡
1. Werk samen met je datateam
Je hebt misschien het idee dat een datawetenschapper iemand is die lange tijd alleen werkt. Wij zijn hier om deze mythe te ontkrachten! Door de jaren heen hebben we keer op keer gezien dat de beste en nuttigste ideeën voortkomen uit samenwerking en discussie in teamverband. Om het bekijken van en voortbouwen op elkaars werk te vergemakkelijken, gebruiken we het altijd populaire GitHub.
Git en GitHub:
Het is mogelijk dat meerdere mensen aan dezelfde code werken. Voor de communicatie van de verschillende versies en verbeteringen van de code is het GitHub-platform in het leven geroepen om deze situatie in goede banen te leiden. Deze video toont in real-time het doel van GitHub met praktische voorbeelden. Te zien in x2.
Als geheugensteun is het interessant om deze website te raadplegen:
git - de eenvoudige gids - geen diepe shit! (rogerdudler.github.io)
2. Nieuwe BI-tools leren
Inzichten in business intelligence (BI) kunnen nuttig zijn om te leren van bestaande gegevens om beslissingen te onderbouwen en de huidige toestand van het bedrijf te beheren. Je hoort het misschien in vergelijking met business analytics, dat verwijst naar het gebruik van bedrijfsgegevens om te anticiperen op trends en resultaten. Microsoft Power BI en Tableau zijn de populairste tools voor het visualiseren, openen en analyseren van datasets, voornamelijk voor rapportagedoeleinden.
BI-software is erg nuttig voor rapportages, om bedrijven te helpen beter te begrijpen wat er binnen het bedrijf gebeurt en om beter te adviseren bij de dagelijkse besluitvorming.
Power BI-tutorial van beginner tot professional ⚡ Desktop tot dashboard in 60 minuten ⏰ - YouTube
Tableau is de oplossing die duizenden bedrijven tegenwoordig gebruiken om problemen met big data aan te pakken. Maak kennis met datavisualisatie met praktische oefeningen en slaag voor het examen Data Analist.
3. Ken uw computer
Dankzij de informatica kunnen we elke dag kwaliteitsanalyses maken en grote ontdekkingen doen. Begrijpen hoe een computer werkt, vooral wanneer er een onbegrijpelijke fout op het scherm verschijnt, kan je veel tijd en moeite besparen bij het configureren van sommige tools of zelfs bij het debuggen.
Video's MIT-tutorials: Een MIT Open Course verdeeld in 10 lezingen/online hoofdstukken, en je kunt diegene selecteren die je het meest interesseren. Een geweldige bron om te leren over onderwerpen die nuttig zijn voor ontwikkelaars, maar meestal niet aan bod komen in het formele onderwijs, zoals shell tools, editors (vim...), command-line, Git en debuggen.
4. Bekend zijn met cloudtechnologie
Op het gebied van datawetenschap is bekendheid met cloudtechnologie een must. Het biedt schaalbaarheid, toegankelijkheid en efficiëntie, waardoor datawetenschappers gegevens kunnen analyseren, modellen kunnen implementeren en naadloos kunnen samenwerken. Het beheersen van de cloud is cruciaal om concurrerend te blijven en impactvolle inzichten te leveren in de huidige datagestuurde wereld.
Als je slaagt voor een fundamentele certificering van een cloudprovider, begrijp je beter hoe cloudoplossingen werken(AWS Certified Cloud Practitioner, Microsoft Certified: Azure Fundamentals, ...)
Geïnteresseerd in een carrière in data science op Agilytic?
Wist je dat Agilytic momenteel vacatures heeft voor Data Scientist, Engineers en Managers?
We zijn altijd op zoek naar nieuwe collega's om onze data science en engineering praktijk naar het volgende niveau te brengen en bij te dragen aan het ondernemende project.
Meer informatie over de functie en de sollicitatieprocedure vind je hier.
Wij hechten veel waarde aan een werkomgeving waarin je geweldig werk kunt leveren, je vaardigheden op het gebied van datawetenschap kunt verbeteren en, het allerbelangrijkste, gelukkig kunt zijn terwijl je dat doet.
Klinkt dat interessant?