1. Motivation Les commentaires Spams ont fortement augmenté ces dernières années sur les chaînes des créateurs YouTube.Plusieurs d’entre eux ont exprimé leur frustration face aux commentaires malveillants se faisant passer pour eux afin d’arnaquer leurs téléspectateurs.Cela devient donc un problème …
???????????????????????????? ???????? ???????????????????????????????????????????????????????????????????? ???????? ????????????????????è???????? Avant de commencer par écrire ton code, vous devez analyser profondément et contextualiser le problème que vous voulez résoudre. Il faut bien connaître vos données et discuter plus avec les parties prenantes pour comprendre le …
Motivation La Business Intelligence est aujourd’hui très utilisée en entreprise. Elle permet d’accélérer, d’améliorer et de faciliter la prise de décision et ainsi permettant d’augmenter les revenus de l’entreprise. Dans cet article, nous allons définir la Business Intelligence et expliquer …
Motivations En tant que Data scientist, vous avez peut-être déjà entraîné un modèle de machine learning et décidé de passer votre code à un ami ou un collègue de travail. À votre surprise, votre code ne fonctionne plus chez votre …
Une base de donnée de production est la base de donnée utilisée par les utilisateurs d’un système en temps réel. Toute mauvaise manipulation ou erreur grave sur cette base de donnée a des conséquences directes sur le système de l’entreprise. …
Après avoir entraîné un modèle de machine learning sur des données étiquetées,celui-ci est supposé fonctionner sur de nouvelles données. Toutefois, il est important de s’as-surer de l’exactitude des prédictions du modèle en production. Pour ce faire, il est nécessairede valider …
Le Sous-Apprentissage et le Sur-Apprentissage sont deux concepts majeurs de l’appren-tissage automatique. Ces termes définissent la capacité d’un modèle à prédire les données.Par ailleurs, le Sous-Apprentissage et le Sur-Apprentissage sont les causes principales desmauvaises performances des modèles prédictifs générés par …
Le clustering K-means: Data Science Le Clustering consiste à partitionner les données en groupes (clusters) de sorte que les objets de chaque groupe partagent certaines caractéristiques communes entre eux. Dans le fond, l’algorithme trouve tout seul les cas de similarités …
Dans cet nouvel article, je vous explique l’importance du deep learning distribué, les différentes approches utilisées et enfin quelques outils disponibles sous python pour faire le deep learning distribué. Pourquoi le deep learning distribué Nous vivons à l’ère des données. …
Dans cet article, je vous présente de façon pratique comment détecter les fraudes bancaires avec un auto-encodeur en Keras . Le fonctionnement d’un auto-encodeur D’abord, je vous explique brièvement le fonctionnement d’un auto-encodeur. Vous pouvez également consulter mon article sur …