Le métier de Data Scientist ne disparaîtra pas
- Posted by Jonas Agbakou
- Categories Data Science
- Date 13 novembre 2022
- Comments 0 comment
Beaucoup de posts soulignant la disparition du métier du Data Scientist au profil de AutoML. Le métier de Data Scientist ne disparaîtra pas mais il va évoluer!!
D’abord c’est quoi l’AutoML?
L’AutoML est le processus d’automatisation des tâches d’application de l’apprentissage automatique aux problèmes du monde réel.
Un Data Scientist peut être remplacé par un AutoMl?
Dans la vie réelle, le métier du Data Scientist, c’est 75% du temps pour le prétraitement des données et le 25% du temps restant est souvent consacré pour l’entraînement, le déployement et le monitoring.
Je suis d’accord que la tâche consistant à entraîner un modèle de machine learning et choisir les bons paramètres peut être faite avec l’AutoML. D’ailleurs, cela se fait rapidement en trois lignes de code python et prend moins de 5 min.
Cependant, l’étape du prétraitement des données conssistant à preparer les donnés à passer en entrée des algorithmes de machine learning est très importante dans le processus d’un projet de la Data Science. L’échec de cette étape entraîne automatiquement l’échec de tout le project car Garbage in Garbage out. GIGO est le concept selon lequel des données d’entrée absurdes ou de mauvaises qualités produisent des sorties de mauvaises qualités. Ce qui peut impacter fortement le business et fait perdre beaucoup d’argent à l’entreprise.
C’est pour cette raison, il faut y consacrer beaucoup de temps et la faire rigoureusement. De plus, cette étape demande des connaissances du business de l’entreprise.
Pour cela, il faut un bon Data Scientist qui comprend bien le besoin d’affaire et les données de l’entreprise afin de les faire bien parler et preparer pour le machine learning. C’est là le rôle du Data Scientist d’aujourd’hui.
Ce n’est pas fini, une solution est bénéfique pour une entreprise lorsqu’elle est opérationnelle et rentable. Ça ne sert donc à rien de créer des modèles qui ne vont pas en production. Donc MLOps est un MUST.
Et pour cela, le métier de Data Scientist va évoluer, les anciennes compétences vont devenir obsolètes et de nouveaux apparaîtront. Un Data Scientist qui ne va pas s’adapter à ce changement va disparaître et non le métier.
Pour faire face a ce changement, un Data Scientist doit avoir l’expertise métier et bien comprendre la partie engineering.
Quelles sont les compétences d’un Data Scientist d’aujoudhui?
Pour avoir un profil adapté au besoin du marché de la Data Science d’aujoudhui, à part la connaissance des fondamentaux des algorithmes de machine learning, ces compétences valent de l’or et trés utiles :
- La connaissance du business : Pour bien faire parler les données et reussir efficacement l’étape du prétraitement;
- Le MLOps ( GIT, Docker, CT/CD) : Pour déployer efficacement les modèles ou collaborer avec l’équipe de developpement;
- Le CLOUD (AWS, Azure et GCP) : Le CLOUD est de nos jours trés en demande car il est plus bénéfique pour les entreprises que on-premise;
- La communication : Vous devez savoir communiquer, vulgariser vos résultats et faire des recommandations permettant d’avancer le business. Il faut toujours penser business et n’utiliser pas trop de termes techniques. N’utilisez pas trop des termes techniques comme Accuracy, f1-score etc. lorsqu’il s’agit de présenter vos résultats. Dites par exemple, que ce modèle permet d’attraper 80 cas de fraudes sur 100, par contre l’autre modèle permet d’attraper seulement 30. C’est plus parlant pour les non techniques.
|
Partagez l'article à vos réseaux: on Twitter on Facebook on LinkedIn
Je suis Jonas, un spécialiste passionné du Business Intelligence.
Je fais parler la donnée pour susciter des actions générant de la valeur pour le Business.
Je t'accompagne dans ton voyage vers l'excellence en Business Intelligence, en te transformant d'aspirant ou de débutant en expert BI.