Motivations En tant que Data scientist, vous avez peut-être déjà entraîné un modèle de machine learning et décidé de passer votre code à un ami ou un collègue de travail. À votre surprise, votre code ne fonctionne plus chez votre …
Une base de donnée de production est la base de donnée utilisée par les utilisateurs d’un système en temps réel. Toute mauvaise manipulation ou erreur grave sur cette base de donnée a des conséquences directes sur le système de l’entreprise. …
C’est quoi le Deep Learning Le Deep Learning est une technologie de pointe qui a récemment attiré l’attention du cercle informatique. Il permet de faire l’extraction, la transformation des caractéristiques et la prédiction. En effet, il est un réseau de …
Motivation Nous assistons actuellement au développement des technologies du numérique et des objets connectés. Ces changements engendrent la production des quantités de données. Les données personnelles et les informations sur les transactions financières sont considérées comme sensibles.L’exploitation de ces données …
Motivation Des quantités énormes de données sont produites chaque jour. La taille sera évaluée à 163 zettabytes en 2025. Ces données sont produites par les réseaux sociaux, les capteurs, les sites e-commerce (Amazon, Alibaba etc) et les transactions bancaires. Elles …
Dans cet article, je vous présente les avantages et quelques inconvenants du framework du Big Data Apache Storm. Définition Selon Wikipédia, Apache Storm est un framework de calcul de traitement de flux distribué, écrit principalement dans le langage de programmation …
Dans cet article, je vous présente les composants du framework Big Data Apache Storm. Description d’Apache Storm (Architecture logicielle) Il existe deux types de nœuds dans un cluster Storm, similaires à Hadoop, qui sont le nœud maître et les nœuds …
Dans cet article, je vais vous montrer l’importance du Spark par rapport à Hadoop MapReduce. En effet, je vais expliquer d’abord l’importance du traitement distribué et parallèle. Importance du traitement distribué et parallèle Nous vivons à l’ère des données ! …
De nos jours, les techniques de fraude évoluent sans cesse, et la fraude sur internet coûte cher aux entreprises. Le comportement des techniques de fraudes change régulièrement. Les systèmes de détection de fraudes par carte de crédit doivent être proactifs …
Pourquoi le traitement en temps réel L’explosion des quantités de données a évolué en même temps que la montée des analyses « Big Data ». Dans les domaines tels que : Les systèmes de détection d’intrusions ou de fraudes ; …