Dans le domaine de la Data Science, plus précisément en Business Intelligence et l’Ingénierie de données, le processus ETL est le plus utilisé pour alimenter un Dashboard. Dans cet article, je vous explique le fonctionnement d’un ETL et les outils …
Data Warehouse et DataMart sont deux approches de stockages de données très utilisées dans le domaine de la Data Science. Elles sont utilisées plus particulièrement en Business Intelligence et l’Ingénierie des données. Dans cet article, je vous explique ces deux …
Actuellement, SQL est la vie. La plupart des bases de données comprennent le langage SQL. Vous pouvez interroger des bases de données NoSQL avec Presto. Presto utilise la syntaxe du langage SQL. La syntaxe du langage CQL utilisé par Cassandra …
Motivation La Business Intelligence est aujourd’hui très utilisée en entreprise. Elle permet d’accélérer, d’améliorer et de faciliter la prise de décision et ainsi permettant d’augmenter les revenus de l’entreprise. Dans cet article, nous allons définir la Business Intelligence et expliquer …
Motivations En tant que Data scientist, vous avez peut-être déjà entraîné un modèle de machine learning et décidé de passer votre code à un ami ou un collègue de travail. À votre surprise, votre code ne fonctionne plus chez votre …
Une base de donnée de production est la base de donnée utilisée par les utilisateurs d’un système en temps réel. Toute mauvaise manipulation ou erreur grave sur cette base de donnée a des conséquences directes sur le système de l’entreprise. …
C’est quoi le Deep Learning Le Deep Learning est une technologie de pointe qui a récemment attiré l’attention du cercle informatique. Il permet de faire l’extraction, la transformation des caractéristiques et la prédiction. En effet, il est un réseau de …
Motivation Nous assistons actuellement au développement des technologies du numérique et des objets connectés. Ces changements engendrent la production des quantités de données. Les données personnelles et les informations sur les transactions financières sont considérées comme sensibles.L’exploitation de ces données …
Motivation Des quantités énormes de données sont produites chaque jour. La taille sera évaluée à 163 zettabytes en 2025. Ces données sont produites par les réseaux sociaux, les capteurs, les sites e-commerce (Amazon, Alibaba etc) et les transactions bancaires. Elles …
Dans cet article, je vous présente les avantages et quelques inconvenants du framework du Big Data Apache Storm. Définition Selon Wikipédia, Apache Storm est un framework de calcul de traitement de flux distribué, écrit principalement dans le langage de programmation …