Depuis plus de 30 ans, nos systèmes de contrôle qualité automatisés et nos bancs de test génèrent une très importante quantité de données. Certains de nos systèmes ont acquis des données de 100% de produits sortants des lignes de production de nos clients depuis plus de 10 ans. Nous voulons maintenant proposer de nouvelles fonctions mettant en valeur les données par exemple pour mieux comprendre les processus de production. Pour ce faire, il est nécessaire de centraliser toutes les données et de pouvoir faire des recherches intelligentes. Le Data Lake est l'outil idéal, nous avons donc engagé une démarche pour ajouter leur maitrise au portfolio de savoir-faire de QMT.
Logiciels QMTMesureUn data lake est un moyen de stockage de données de natures différentes dans leurs formats originaux. À l’échelle macro, il y a 3 types de données présentes dans un data lake :
La distinction entre les données structurées et non-structurées se fait par la caractéristique d’une donnée avec laquelle un utilisateur travaille. Sur une donnée structurée, il travaille sur la ou les valeurs de la donnée alors que pour la donnée non-structurée il travaille avec les informations sur cette donnée. Ces informations sont les métadonnées ou « Tags ».
A gauche : exemple de données structurées (un fichier Excel) ; A droite : une bibliothèque qui schématise un Data lake avec des données non-structurées mais reconnaissables avec leurs labels (« Tag »).
Amazon, Microsoft et Google sont les leaders sur les outils de data lake. Nous avons comparé AWS d’Amazon et Azure de Microsoft.
Amazon AWS
Microsoft Azure
Nous avons choisi la solution AWS pour standardiser nos solutions
Nous avons mis en place un Data Lake pour notre utilisation avec les éléments suivants :
Nous avons développé un outil logiciel qui s’intègre facilement à nos systèmes pour ajouter des labels aux données, les envoyer dans le data lake et de les retrouver avec l’Elastic search.
Les prochaines étapes sont de standardiser les labels (ou tags), d’adapter l’outil QMT à la gestion de catalogues standards de tags et de simplifier la recherche des Tags par notre outil.
Nous seront ainsi prêts pour appliquer des outils d’intelligence artificielle aux données afin d'étudier les corrélations entre les données.