Dans le domaine de la Data Science, plus précisément en Business Intelligence et l’Ingénierie de données, le processus ETL est le plus utilisé pour alimenter un Dashboard. Dans cet article, je vous explique le fonctionnement d’un ETL et les outils …
Data Warehouse et DataMart sont deux approches de stockages de données très utilisées dans le domaine de la Data Science. Elles sont utilisées plus particulièrement en Business Intelligence et l’Ingénierie des données. Dans cet article, je vous explique ces deux …
Actuellement, SQL est la vie. La plupart des bases de données comprennent le langage SQL. Vous pouvez interroger des bases de données NoSQL avec Presto. Presto utilise la syntaxe du langage SQL. La syntaxe du langage CQL utilisé par Cassandra …
Beaucoup de posts soulignant la disparition du métier du Data Scientist au profil de AutoML. Le métier de Data Scientist ne disparaîtra pas mais il va évoluer!! D’abord c’est quoi l’AutoML? L’AutoML est le processus d’automatisation des tâches d’application de …
1. Motivation Les commentaires Spams ont fortement augmenté ces dernières années sur les chaînes des créateurs YouTube.Plusieurs d’entre eux ont exprimé leur frustration face aux commentaires malveillants se faisant passer pour eux afin d’arnaquer leurs téléspectateurs.Cela devient donc un problème …
???????????????????????????? ???????? ???????????????????????????????????????????????????????????????????? ???????? ????????????????????è???????? Avant de commencer par écrire ton code, vous devez analyser profondément et contextualiser le problème que vous voulez résoudre. Il faut bien connaître vos données et discuter plus avec les parties prenantes pour comprendre le …
Motivation La Business Intelligence est aujourd’hui très utilisée en entreprise. Elle permet d’accélérer, d’améliorer et de faciliter la prise de décision et ainsi permettant d’augmenter les revenus de l’entreprise. Dans cet article, nous allons définir la Business Intelligence et expliquer …
Motivations En tant que Data scientist, vous avez peut-être déjà entraîné un modèle de machine learning et décidé de passer votre code à un ami ou un collègue de travail. À votre surprise, votre code ne fonctionne plus chez votre …
Une base de donnée de production est la base de donnée utilisée par les utilisateurs d’un système en temps réel. Toute mauvaise manipulation ou erreur grave sur cette base de donnée a des conséquences directes sur le système de l’entreprise. …
Après avoir entraîné un modèle de machine learning sur des données étiquetées,celui-ci est supposé fonctionner sur de nouvelles données. Toutefois, il est important de s’as-surer de l’exactitude des prédictions du modèle en production. Pour ce faire, il est nécessairede valider …