Projectbeheer voor succesvolle datawetenschap

Valkuilen vermijden en best practices volgen voor data science projectmanagement.


Het belangrijkste doel van elk data science-project is het oplossen van een probleem of het beantwoorden van een vraag. Zonder de juiste begeleiding, discipline en controle kunnen deze projecten echter van de gebaande paden afdwalen totdat ze uiteindelijk uitdoven en als mislukt worden beschouwd. Het toepassen van projectmanagementmethoden op data science-projecten zorgt ervoor dat ze succesvol en nuttig zijn.

Dit artikel bespreekt veelvoorkomende valkuilen tijdens het projectmanagementproces, een aantal best practices om te volgen en Agilytic's top 3 projectmanagementtips.

Kaders voor projectbeheer voor datawetenschap

Er is een overvloed aan raamwerken voor projectmanagement waar je uit kunt kiezen. Data science-teams hebben sommige frameworks uit verschillende industrieën aangepast (zoals Kanban), en sommige die in de loop der jaren enorm aan populariteit hebben gewonnen (zoals Scrum).

Niet alle raamwerken voor projectmanagement zijn echter geschikt voor datawetenschap vanwege hun iteratieve, voortdurend evoluerende aard, met een unieke aanpak voor elk nieuw project, elke nieuwe branche en elk nieuw probleem.

Dit maakt het ongelooflijk moeilijk om vast te houden aan een rigide systeem in datawetenschap. Daarom zie je vaak dat deze teams voor hybride benaderingen kiezen, afhankelijk van hun voorkeuren en de aard van een bepaald project. Deze hybride benaderingen worden ook vrij losjes toegepast, omdat je niet voor elk project een standaardsjabloon kunt volgen.

Het is echter wel handig om te weten dat er een levenscyclus of workflow op hoog niveau bestaat. Hoewel elk project uniek kan zijn in de oplossing en aanpak die nodig is om het probleem op te lossen, is het hebben van een set checklists voor projecten essentieel zodat kritieke stappen in het proces niet over het hoofd worden gezien of worden vergeten.

Een van de nuttigste projectmanagementraamwerken voor data science-teams is TDSP (Team Data Science Process), dat de basis vormt voor projectmanagement op Agilytic.

TDSP combineert Scrum en de CRISP-DM methodologieën in een raamwerk dat van beide de voordelen plukt en tegelijkertijd enkele van hun nadelen weglaat. Natuurlijk kan het beter, maar het biedt een uitstekende gids voor projectmanagement.

 

TDSP (Bron: Microsoft)

 

Veelvoorkomende valkuilen bij het beheren van Data Science projecten

Verwachtingen van klanten

Er is vaak een discrepantie tussen wat een klant verwacht en wat datawetenschappers realistisch gezien kunnen leveren voor een project. Zoals het oude gezegde luidt: "je weet niet wat je niet weet". Klanten (of belanghebbenden) komen naar je toe met een probleem en hebben misschien een idee van hoe ze willen dat de oplossing eruit ziet. Als datawetenschapper ben jij echter de expert. Jij weet waartoe datawetenschap in staat is op basis van de informatie en gegevens die je hebt voor het project. Dit is waar projectmanagement van vitaal belang wordt voor het succes van het project.

Voordat er met het werk wordt begonnen, moet het voor iedereen die bij het project betrokken is duidelijk zijn wat er precies gedaan gaat worden en wat het uiteindelijke resultaat zal zijn. Dit wordt samen met de klant ontwikkeld, zodat deze precies weet wat hij kan verwachten en het team precies weet hoe ze de uiteindelijke oplossing moeten leveren. Naarmate het project vordert, is het nog belangrijker om regelmatig contact op te nemen met de klant, zodat het project op koers blijft.

Omgaan met onzekerheid

Een van de meest beruchte problemen bij data science projecten is dat niets gegarandeerd is. Het is bijvoorbeeld onmogelijk om 100% nauwkeurigheid te garanderen in modellen voor machinaal leren en veel van het werk dat datawetenschappers kunnen doen hangt volledig af van de kwaliteit en kwantiteit van de gegevens.

Als er veel minder bruikbare gegevens zijn dan verwacht of als er meer gegevens moeten worden opgeschoond en voorbereid voordat het werk zelfs maar kan beginnen, zal dit de uiteindelijke oplossing, timing en kosten van het project ernstig beïnvloeden.

Dit is slechts één voorbeeld van onzekerheid tijdens een data science-project. Er zitten veel aspecten aan het ontwikkelen van een oplossing en elk aspect kan nog meer onzekerheid in het project brengen. Met effectief projectmanagement kun je echter tijdig risico's identificeren, mitigerende acties definiëren en deze risico's transparant communiceren naar het team en de klant.

Bereikkruip

Nadat je weken of maanden hebt besteed aan het ontwikkelen van een oplossing voor een project, kun je in een situatie terechtkomen waarin de klant iets wil waar je het aan het begin van het project niet mee eens was. Dit kan zijn omdat er nieuwe inzichten aan het licht kwamen toen de datawetenschappers de gegevens onderzochten, of omdat de klant van gedachten veranderde over de richting die hij op wilde.

In deze situaties is het belangrijk om enige flexibiliteit te hebben. Zoals we al hebben besproken, kunnen we geen garanties geven op het gebied van datawetenschap en deze projecten zijn voortdurend in ontwikkeling. De sleutel hier is echter om te begrijpen waar je de grens moet trekken. Stel bijvoorbeeld dat de wijzigingen een significante invloed hebben op het budget of het vermogen van het team om te leveren volgens de afgesproken tijdlijn. In dat geval moeten projectmanagers hier open en transparant over zijn.

Communicatie

Communicatie is een onderwerp dat vaak over het hoofd wordt gezien of zelfs geen prioriteit krijgt in data science-projecten. Gewoonlijk willen datawetenschappers zich storten op datgene waar ze gepassioneerd over zijn. Het is dus geen verrassing dat communicatie niet bovenaan hun to-do-lijstje staat.

Succesvolle data science-projecten zijn echter sterk afhankelijk van goede communicatie. Het is bijna onmogelijk om een oplossing te ontwikkelen als je geen idee hebt wat de klant wil of als de klant niet weet hoe jouw oplossing iets nuttigs of waardevols voor hen kan betekenen.

We kunnen dit allemaal oplossen met een paar goede communicatiepraktijken die de kern vormen van elke projectmanagementaanpak. Daarnaast is het een goed idee om een aparte projectmanager te hebben die deze werkwijzen volgt en handhaaft, zodat je datawetenschapsteams zich kunnen blijven concentreren op hun primaire taak.

Best practices voor datawetenschapsprojectbeheer

Een checklist maken

Hoewel de exacte details en de aard van elk data science project anders zijn, zijn er enkele gemeenschappelijke elementen. Elk project moet bijvoorbeeld beginnen met een planningsfase waarin voorstellen en scope-documenten worden opgesteld en naar de klant worden gestuurd. Daarna beginnen datawetenschappers hun werk met het extraheren en verkennen van de gegevens - het ontwikkelen van een goed begrip van de gegevens, het zoeken naar afwijkingen die ze moeten opschonen en aanpakken, enzovoort.

Het is handig om een checklist te maken met punten die veel voorkomen bij de meeste projecten die je team uitvoert. Deze checklist dient als leidraad zodat je nooit een stap overslaat. Natuurlijk hoef je deze checklist niet altijd strikt te volgen, maar hij kan wel een leidraad zijn en als basis dienen zodat je niet bij elk project helemaal opnieuw hoeft te beginnen.

Bepaal eerst de te leveren producten

Elk project moet beginnen met een planningsfase. Dit is het moment waarop het data science-team en de klant begrijpen wat het probleem of de vraag is die moet worden aangepakt en welke oplossing moet worden ontwikkeld.

Het meest kritieke element van de oplossing is echter de exacte oplevering van het project. Wat krijgt de klant aan het einde van het project en hoe helpt dit product de klant vooruit? Is het bijvoorbeeld een API die wordt geïntegreerd in hun product, waardoor de efficiëntie of verkoop verbetert? Of vergemakkelijkt het effectieve besluitvorming zodat de klant de volgende stap kan zetten in een reis naar een ander project?

Door meteen aan het begin van het project al heel specifiek te zijn over deze deliverable en het verwachte resultaat, begrijpen het team en de klant precies waar de doelpalen staan en wat er nodig is om daar te komen.

Een communicatiecadans instellen

Zoals we al hebben besproken, is communicatie de ruggengraat van elk succesvol data science-project. Het is dus geen verrassing dat bijna elk projectmanagementraamwerk zijn eigen regels of processen heeft om dit onderdeel aan te pakken. Elk raamwerk heeft echter een regelmatig en consistent communicatieproces gemeen.

Stel een communicatietempo in waar je team en de klant zich regelmatig aan kunnen houden en blijf consistent. Je moet op zijn minst één keer per week met de klant afspreken. Daarnaast zal een schriftelijke update over de voortgang van het project naar alle belanghebbenden de mondelinge communicatie aanvullen.

Naast het geven van regelmatige updates aan de klant, is het ook nuttig om terugkerende interne teamvergaderingen te houden. Deze worden in de traditionele 'scrum'-methodologie meestal aangeduid als 'stand-ups' met het format: wat heb je gisteren gedaan, wat ga je vandaag doen en welke risico's of problemen heb je ervaren.

Dankzij deze stand-ups kan iedereen op de hoogte blijven van elkaars vorderingen. Dit is ook een uitstekend moment om nieuwe ideeën uit te wisselen en iets belangrijks of inzichtelijks te ontdekken om het project vooruit te helpen. Het moet ook een veilige ruimte zijn voor teamleden om problemen aan te kaarten die het project aanzienlijk kunnen beïnvloeden.

Deze brainstormsessies hoeven niet alleen tijdens de stand-up plaats te vinden. Het kan ook helpen om op elk moment van de dag een stapje terug te doen en wat ideeën door te geven aan het team. Denk aan de kracht en waarde van gedeelde kennis.

Wees transparant

Wanneer je op enig moment tijdens het project een probleem ervaart of een potentieel risico identificeert, is het de beste gewoonte om dit zo snel mogelijk met de klant te bespreken en ter sprake te brengen.

Het verbergen van potentiële risico's of problemen voor de klant heeft een negatieve invloed op het vermogen van het team om de uiteindelijke oplossing te leveren en laat bij iedereen een vieze smaak achter. Daarom moet transparantie een kernethos zijn in projectmanagement.

Dit geldt ook voor wijzigingen die een klant wil aanbrengen en die afwijken van de oorspronkelijke scope van het project. Als een klant om wijzigingen vraagt, is het een goede gewoonte om duidelijk te communiceren wat je wel (en niet) zult bereiken door de wijziging.

AgilyticTop 3 projectmanagementtips

  • Projecten kosten altijd meer tijd en middelen dan je denkt. Ga er altijd van uit dat er zich onzekerheden en moeilijkheden zullen voordoen en plan dienovereenkomstig.

  • Zorg voor buffers in je agenda. Het toevoegen van kleine stukjes tijd tussen vergaderingen geeft je de tijd om te decomprimeren of de volgende snelle actie te ondernemen op een project direct na de vergadering.

  • Als je twijfelt, bedenk dan waarom je hier bent. Neem regelmatig een stapje terug in wat je aan het doen bent om te brainstormen met je team of om jezelf opnieuw af te stemmen op de doelen en richting van het project. Dit is vooral nuttig bij zeer complexe of intensieve taken. Het is gemakkelijk om vast te komen zitten in een konijnenhol en dan te ontdekken dat je al die tijd de verkeerde kant op bent gegaan.


Geschreven door Joleen Bothma

Vorige
Vorige

Hackathon 2023: Duurzame mobiliteit met ECF en Jabra

Volgende
Volgende

2022 in de achteruitkijkspiegel