De ontwikkelingen op het gebied van Kunstmatige Intelligentie gaan snel. Veel bedrijven en organisaties willen meedoen met deze nieuwe ontwikkelingen, maar toch blijkt uit onderzoek dat veel projecten niet verder komen de dan PoC fase. Waarom is dat, en hoe maken we projecten tot een succes?
Wat is Kunstmatige Intelligentie?
Het is moeilijk om beknopt uit te leggen wat Kunstmatige Intelligentie is. Volgens Wikipedia is het intelligentie vertoont door machines. Ook wordt de term gebruikt als machines “cognitieve” functies uitvoeren, zoals leren en het oplossen van problemen. Een belangrijk onderdeel, en iets wat veel mensen zien als kunstmatige intelligentie, is Machine Learning. Met Machine learning is het mogelijk om patronen in grote data-sets te vinden en daarvan te leren. Door deze patronen te leren kunnen we deze toepassen op andere data. Bijvoorbeeld om voorspellingen te doen of data te duiden.
Met deze techniek is het bijvoorbeeld mogelijk om de onderwerp van een e-mail te vinden. Bijvoorbeeld of de e-mail over een klacht gaat, of dat het gaat over een bestelling. Bij organisaties die veel mail krijgen kan het handig zijn om geautomatiseerd dit te herkennen. Bijvoorbeeld dat de juiste afdeling de mail krijgt of misschien kan ook al automatisch worden opgezocht wat de status van de mail is. Andere mogelijkheden zijn het tijdig detecteren van een aankomende storing in een machine of voorspellen of een klant binnenkort overstapt naar de concurrent.
Valkuilen
Veel bedrijven en organisaties beginnen met het toepassen van deze technieken omdat ze waarde uit hun data willen halen. Omdat andere organisaties en/of concurrenten hiermee bezig zijn willen bedrijven vaak snel starten, de urgentie om (te) snel te starten noemen we ook wel FOMO (Fear Of Missing Out). Het startpunt is vaak dat wordt gekeken naar de huidige data en aan Data-scientists wordt gevraagd om data om te zetten in waardevolle inzichten of voorspellingen.
Door deze “data eerst” aanpak krijg je vaak projecten die een lage impact hebben op de organisatie, en soms zelfs projecten waarbij Machine Learning niet noodzakelijk is. Data-scientists kijken immers na wat er mogelijk is met de data, en niet waar de grootste problemen zitten bij een bedrijf.
Er zijn nog meer redenen waarom projecten soms niet slagen:
Ontbreken van een goede business case
Een goede business case is cruciaal voor het slagen van data-science projecten. Een PoC kan technisch nog zo goed worden uitgevoerd maar als het geen waarde oplevert zal het project niet worden geïmplementeerd. Dit zorgt vaak voor teleurstelling, de data-scientist heeft iets gemaakt waar de business niet om vraagt en de business krijgt iets waar ze niks aan hebben. Als gevolg is iedereen teleurgesteld en is het vaak moeilijk om nieuwe projecten te starten.
Slechte communicatie
Voor een succesvol project is het belangrijk om goed te weten hoe een huidig proces verloopt, wie de stakeholders zijn, waarom bepaalde keuzes in het verleden zijn gemaakt en kennis van het domein. Vaak is het voor data scientists moeilijk om dit te achterhalen omdat zij minder interesse hebben in deze onderdelen. Toch is het belangrijk om goed te communiceren omdat dit cruciale stappen zijn in het project.
Ontbreken van goede data
Met goede data wordt niet alleen bedoeld veel data. Ook meta-data en labels zijn erg waardevol. Voor een succesvol project moet ook de data makkelijk kunnen ontsloten.
Samenstelling van het team
Voor een succesvol project heb je naast data-scientists meerdere disciplines nodig. Je hebt kennis van het bedrijf/proces nodig (domeinkennis), je hebt iemand nodig die goed een project kan leiden, iemand die je kan helpen om aan de juiste data te komen en afhankelijk van het project misschien wel iemand die kan helpen op het gebied van Risk en Compliance. Met alleen Data-Scientists krijg je wederom misschien een mooi algoritme of PoC maar is het niet wat de business nodig heeft.
Maar hoe dan wel
Vaak is het goed om eerst problemen in kaart te brengen. Gezamenlijk met medewerkers die al bezig zijn met die processen, want die weten vaak goed waar knelpunten zitten. Door gezamenlijk te kijken naar mogelijke projecten creëer je ook een breed draagvlak voor deze projecten. Vaak resulteert dit in projecten waarbij de business value voorop staat.
Problemen/kansen in kaart brengen
Startpunt is om kansen en problemen in kaart te brengen. Dit doe je gezamenlijk met mensen die dagelijks werken met deze processen, deze weten immers precies waarom bepaalde keuzes zijn gemaakt en wat er beter kan. Ook kunnen zij inschatten wat de waarde is van een mogelijke oplossing/verbetering. Na deze inventarisatie heb je als eindresultaat een lijst met projecten gesorteerd op business value.
Maar wat als de data ontbreekt?
Het kan natuurlijk zijn dat voor de verzamelde projecten de data ontbreekt. Toch is het vaak verstandiger om hier aandacht te besteden in plaats van om met een ander project met een lagere business value te beginnen. Om data op te slaan voor projecten is het goed om hier over na te denken , dus welke data heb ik nodig, hoe zit het met privacywetgeving, kan ik het makkelijk de data ontsluiten, ook als ik het real-time nodig heb? Een groot deel van data-science projecten is het verzamelen van data en dit in een geschikt formaat krijgen. Als dit al goed wordt gedaan tijdens het verzamelen kan veel tijd worden gewonnen.
Met het hele team
Omdat je met deze “probleem eerst” aanpak als doel hebt een project te beginnen die een hoge impact heeft is het waarschijnlijk ook eenvoudiger om een team samen te stellen die aan dit project wil werken. Hierdoor is het resultaat niet alleen een stuk code, of een elegant algoritme maar ook dat aan alle randvoorwaarden om deze oplossing te implementeren wordt voldaan. Hierbij kan je denken aan onderdelen als Risk, Compliance, IT en Marketing.