43842


Taille cible

 
Michel GROSBOST
Directeur Général
IMA
DO TANK DATA SCIENCE : DÉTECTION D'ANOMALIES DANS LES SÉRIES TEMPORELLES

Nous aurons 2 use cases de présentés sur le sujet :
Un use case de Natixis et un d'EDF


#datascience#datascience

Ludovic GIBERT
Data Science Leader @CA-CIB & Vice-Président @ IMA
CA-CIB
16H00
Introduction & IMA What's UP (Accueil)
Salle de Conférence

Christophe DEGOUY
Data Scientist specialised in Electricity Production Data
EDF
EDF
16H10
La détection d'anomalies : une méthode originale permettant d'alerter les opérateurs en cas de survenue d'une situation anormale (Use Case)
Salle de Conférence
Une anomalie jamais produite dans les données du processus peut générer un impact financier de l’ordre de plusieurs millions d’euros par jour, auquel peut s’ajouter un impact « image » non quantifiable. De la possibilité de ces évènements naît le besoin de disposer d’une méthode originale permettant d’alerter les opérateurs en cas de survenue d’une situation anormale.
Au départ sous la forme d’une innovation au sein d’un « Challenge Innovation interne », puis d’un POC et depuis 2021 sous la forme d’un projet, l’outil Jumoptim répond à ce besoin par une solution innovante aujourd’hui en production. Cette solution :
•        Collecte aujourd’hui plus de 30000 séries sur le premier use case (~10^9 points) 
Ce besoin nous a contraints à porter nos données sur des tables Hbase et Hive après plusieurs essais infructueux sur d’autres infrastructures (inadaptées en volumétrie ou complexité)
•        Combine de manière originale un calcul de features et de détecteurs innovants sur une infrastructure Big Data 
Pour répondre à des enjeux d’efficacité algorithmiques qui sont une vraie difficulté
•        Transmet via des newsletters une liste des séries les plus anormales en quasi temps réel 
génère une attente de disponibilité de notre service sur laquelle nous investissons régulièrement
•        Offre une possibilité de benchmark des méthodes de détection pour réduire le nombre de Faux Positifs 
nous avons beaucoup dépensé de temps et d’effort pour bâtir cette plateforme, les obstacles de vitesse de calcul restent d’actualité
•        Est construite et améliorée pour être capable de détecter des erreurs inconnues (non supervisée) 
nous avons l’ambition de réduire la durée de nos cycles de déploiement et avons beaucoup investi sur la qualité du code
L’outil est en service depuis le début d’année 2020 et a permis la détection de nombreuses erreurs opérationnelles. La majorité de ces erreurs correspond à des signaux faibles selon la théorie dite du triangle de Heinrich. Cette représentation établit une relation pyramidale entre le nombre d’incidents aux conséquences faibles (signaux faibles) situés à la base de la pyramide et les évènements les plus significatifs situés à son sommet. Identifier et partager ces signaux faibles contribue ainsi à la sûreté de l’ensemble.
Pour ne pas saturer les opérateurs, un volume maximum de 10 anomalies par envoi a été défini avec le métier, conduisant à « préfiltrer » les anomalies et créant un véritable risque d’écarter un Vrai Positif. Dans le but de réduire ce risque, le développement d’un environnement « R&D » permettant de développer facilement des algorithmes innovants est un élément capital. 
Chaque détection contribue à l’amélioration continue de la sûreté d’exploitation en agissant :
•        sur les impacts financiers et images de ces risques en permettant la détection précoce de l’erreur ou en limitant la durée
•        sur le risque de survenue par la détection régulière d’erreurs situées au bas de la pyramide des risques (signaux faibles) 
La disponibilité du service, la réduction du Volume de Faux Positifs (à iso-détection de Vrais Positifs) et l’extension du périmètre couvert sont les 3 priorités du projet Jumoptim.

Philippe FRAISSE
Expert Data Science
Natixis
Natixis
16H35
Projet de détection d’anomalie sur la distribution de produits financiers (Use Case)
Salle de Conférence
Comment implémenter une méthode rapide de détection des anomalies en parallèle sur des centaines de milliers de séries temporelles,
Tout en ayant une approche compréhensible par le métier et un time to market optimal.
 

S’inscrire S’inscrire : Les inscriptions sont closes
Les inscriptions à l'événement sont désormais closes.
Vous pouvez néanmoins suivre l'événement en direct et en totalité à partir de Lundi matin (27/05) 9h via notre livestream directement sur le site de l'IMA.

Il vous suffit pour cela de cliquer sur le lien suivant : Live Stream IMAgine Day 'Journée de la Data Science'

Si vous souhaitez en savoir plus sur nos événements et accéder au prochain IMAgine Day, ou si vous souhaitez faire une demande spécifique pour participer à cet événement exceptionnel, vous pouvez contacter : michel.grosbost@ima-dt.org

N'hésitez pas à nous contacter si vous avez la moindre question, l'IMA est à votre écoute !
L'équipe IMA
Les données personnelles qui vous sont demandées nous permettent de mieux vous connaître, de vous proposer les contenus qui vous intéressent et de vous mettre en relation avec des partenaires pertinents pour vos besoins et recherches
J’accepte les Conditions Générales d’Utilisation du site www.ima-dt.org
Conformément à notre politique générale en matière de données personnelles, vous disposez d’un droit d’accès vous permettant à tout moment de connaître la nature des données collectées vous concernant et leur durée de rétention, de demander leur rectification ou leur effacement. Ce droit s’exerce par simple envoi d’un email à contact@ima-dt.org. Pour tout savoir sur la manière dont l'IMA gère les données personnelles, vous pouvez vous reporter à notre Charte sur les Données Personnelles. Les données personnelles qui vous sont demandées nous permettent d’une part de partager avec vous les dernières solutions innovantes des partenaires de l'IMA, d’autre part de mieux vous connaître et enfin de vous proposer les contenus qui vous intéressent. L’accès aux contenus produits par les partenaires de l'IMA est gratuit. En contrepartie vos coordonnées personnelles prénom, nom, fonction, société, email seront transmises au partenaire ayant produit le contenu auquel vous voulez accéder.
Valider ma demande