Meilleures techniques de machine learning pour la detection des fraudes bancaires
De nos jours, les techniques de fraude évoluent sans cesse, et la fraude sur internet coûte cher aux entreprises. Le comportement des techniques de fraudes change régulièrement. Les systèmes de détection de fraudes par carte de crédit doivent être proactifs pour constituer une solution efficace contre le caractère changeant des fraudes. De plus, ces systèmes doivent être rapides et en temps réel pour faciliter la prise de décision. En effet, les récents systèmes de détection de fraudes utilisent les techniques d’apprentissages supervisés et non supervisés.
La fraude par carte de crédit
La fraude par carte de crédit est commise sous deux formes: la fraude hors ligne et fraude en ligne ou la fraude via internet. La fraude hors ligne est commise en utilisant une carte physique volée. Dans ce cas, l’institution émettrice de la carte peut la verrouiller avant qu’elle ne soit utilisée de manière frauduleuse. En ce qui concerne la fraude en ligne, elle est commise via le Web, les achats par téléphone. Seuls les informations de la carte sont nécessaires pour dérober de l’argent dans ce cas.
Les différents problèmes liés à la detection de fraudes bancaire
L’un des plus gros problèmes dans la détection des fraudes est le manque de données réelles en raison de la sensibilité des données et du problème de confidentialité. Nombreux chercheurs ont effectué des recherches avec des données réelles de banque. Pour résoudre ce problème, de nombreux outils sont disponibles pour générer des données synthétiques. Le deuxième problème est le déséquilibre ou de distribution biaisée des données car le nombre de transactions frauduleuses est très inférieur à celui des transactions légitimes. Pour surmonter ce problème, des méthodes de suréchantillonnage de minage synthétique sont utilisées pour augmenter le nombre de données à faible incidence dans les Data Sets. Le chevauchement des données est un problème de plus, car certaines transactions ressemblent à des transactions frauduleuses, alors qu’en réalité ce sont des transactions légitimes. Il est également possible que les transactions frauduleuses semblent être des transactions normales (Krishna modi et al 2017).
Les techniques de detection de fraude par carte de crédit
Détection des valeurs aberrantes
Une valeur aberrante est une observation qui s’écarte des autres observations. Pour faire simple, les valeurs aberrantes sont des observations non standard qui peuvent être utilisées pour la détection de fraude. En effet, les techniques d’apprentissages supervisés et non supervisés peuvent être utilisées.
Habituellement, le résultat d’un apprentissage non supervisé est une nouvelle explication ou la représentation des données d’observation, qui peuvent aider pour la prise de décisions futures. L’apprentissage non supervisé ne nécessitent pas de connaissance préalable de fraude et les transactions non frauduleuses dans la base de données, mais plutôt détecte les changements de comportement ou les transactions inhabituelles. Ces méthodes modélisent une distribution de référence qui représente les comportements normaux, puis détectent les observations qui s’écartent de cette norme. En méthodes supervisées, les modèles sont entrainés pour faire la distinction entre un comportement frauduleux et non frauduleux afin que des nouvelles observations puissent être classées. Les méthodes supervisées nécessitent une identification précise des transactions frauduleuses dans une base de données historiques. Un avantage d’utiliser des méthodes non supervisées par rapport aux méthodes supervisées est d’agir de façon proactive pour détecter les fraudes non connues. De plus, les méthodes supervisées sont entrainées que pour faire la distinction entre les transactions légitimes et frauduleux déjà connues.