In veel data science trajecten is feature engineering nodig om uit ruwe data features te engineeren. De ruwe data is niet altijd geschikt om direct in een data science model te gebruiken, ofwel omdat het type data niet bruikbaar is, maar meestal omdat het losse datapunt niet zoveel zegt over de gewenste uitkomst. 

Lees verder onder de foto.

wat-is-feature-engineering

Zo is vaak transactionele data – iemand heeft iets gekocht op een bepaald tijdstip – niet goed bruikbaar voor data science modellen. Interessanter is het aantal transacties, de hoogte van de omzet in een bepaalde tijdsperiode of de verhouding tussen de omzet in twee periodes.

De transactionele data moet geaggregeerd worden volgens bepaalde regels, om het vervolgens in een model te gebruiken. 

Deze activiteit heet feature engineering en is in het ontwikkelen van machine learning modellen een essentiële activiteit.

Wil je ook een machine learning model ontwikkelen? Neem contact met ons op voor advies!