Solutions logicielles de deep learning pour la vision

22 novembre 2022 | Lecture 3 min

MVTec est l'un des principaux partenaires de STEMMER IMAGING pour le développement de solutions logicielles de vision artificielle. À l'occasion de la sortie de HALCON 22.11, la dernière version du logiciel standard de MVTec pour la vision, nous avons rencontré M. Chady Elahmad, directeur régional des ventes pour l’Europe du Nord-Ouest. Il nous parle des dernières avancées de la vision industrielle et artificielle, telles que le deep learning et le big data par exemple, ainsi que de notre solide partenariat.

Chady Elahmad, Regional Sales Manager, MVTec

Les produits logiciels de MVTec offrent de nombreuses fonctions et méthodes utilisant des technologies telles que le deep learning. Quels sont les avantages du deep learning dans le traitement d'images ?

Pour nous, le deep learning est une sous-catégorie de l'apprentissage automatique (machine learning) qui utilise des réseaux de neurones artificiels. Dans l'approche traditionnelle, la partie exacte de la solution doit être décrite de façon explicite, étape par étape, pour pouvoir extraire les propriétés de l'image. La différence avec le deep learning réside dans le fait que les réseaux de neurones sont entraînés avec de grands ensembles de données d'images qui peuvent être utilisées pour identifier et évaluer les propriétés pertinentes de l'image.

Ainsi, cette approche permet de maîtriser des problèmes auparavant insolubles. Cependant, le deep learning reste une technologie complexe. Ce que nous faisons chez MVTec, c'est que nous nous concentrons sur la vision industrielle et faisons des recherches pour intégrer dans nos logiciels les technologies de deep learning telles que la classification, la détection d'anomalies, l’OCR profond, la détection d'objets, la segmentation, et ainsi de suite, pour qu’elles soient faciles à utiliser.

Quel rôle joue le big data dans l'essor du deep learning et de ses applications en vision industrielle ?

Quand on parle de deep learning, on parle toujours de données. Par nature, le deep learning a besoin d’un grand nombre d'images pour entraîner et évaluer ses réseaux de neurones. Ces données doivent être collectées et organisées avant que le développement réel de l'application ne commence. Cela signifie que les clients doivent disposer de l'infrastructure nécessaire pour acquérir et organiser une telle quantité de données.

Ce que nous constatons actuellement, c'est que très souvent, les clients souhaitant utiliser le deep learning ne disposent pas de suffisamment d'images. Les images de défauts notamment sont compliquées à obtenir. Pour les aider dans une telle situation, MVTec a développé une technologie appelée détection d'anomalies, disponible dans MVTec HALCON et MVTec MERLIC. Elle permet d'entraîner un réseau à partir d’un ensemble de seulement 20 à 50 images d’échantillons corrects.

Pouvez-vous nous donner quelques exemples d'application ?

Le deep learning est une bonne solution lorsqu'on travaille avec des produits naturels, comme des fruits ou des plantes, car le produit ne sera jamais le même, mais toujours très similaire.

Dans d'autres applications, par exemple dans l'industrie métallurgique (détection de défauts, de rayures, d'éraflures, etc.), l'inspection sans deep learning atteint 95 % de précision, tandis qu'avec le deep learning, on atteint des niveaux de précision de 99 %.

Le secteur de la production de batteries en est un bon exemple. Nous avons travaillé avec un client qui cherchait à réduire le coût de production et a donc choisi une approche de vision industrielle.

Selon le type de défauts, ils disposaient d'échantillons de 10 à 100 images seulement. Ce n’est pas suffisant lorsqu’on travaille avec des méthodes classiques. Au lieu de cela, ils ont donc utilisé la détection d’anomalies de MVTec, disponible dans nos produits logiciels.

Ils ont ainsi pu atteindre un taux de détection de 100 % pour l'application et ont même trouvé des défauts qui n'étaient pas clairement définis à l'avance. En effet, le concept de détection d'anomalies est de fournir des images de pièces correctes (ou « bons échantillons ») et de détecter tout ce qui diffère du modèle de « bon échantillon ».

La nouvelle version MVTec HALCON 22.11 propose de nouvelles fonctionnalités améliorées. Selon vous, quels secteurs bénéficieront le plus de ces nouveautés ?

HALCON et MERLIC sont tous deux des produits standard, ils ne sont donc pas destinés à des secteurs spécifiques. Mais regardons de près certaines nouvelles fonctionnalités de HALCON.

Vous avez, par exemple, la détection 3D des points de préhension (3D Gripping Point Detection) qui peut être utilisée pour détecter de manière fiable la surface de tout objet susceptible d'être saisi par aspiration. Comme il s'agit d'une approche sans CAO, il n’est pas nécessaire d’entraîner le système à reconnaître la surface des objets. De ce fait, les clients peuvent construire leurs applications de dévracage de manière beaucoup plus flexible.

HALCON 22.11 introduit également un nouveau type de données appelé « memory block » qui permet de stocker et de transférer des données binaires dans HALCON ainsi que de les traiter avec d'autres applications. Cela augmente la compatibilité du logiciel avec les protocoles de communication machine (OPC UA par exemple).

En outre, il existe une option pour crypter toutes les données qui peuvent être sérialisées. De cette façon, les modèles entraînés par deep learning peuvent désormais être protégés, étape importante pour sécuriser l'expertise et l'investissement de nos clients lors de la collecte des données et de la formation des modèles.

Une autre nouvelle fonctionnalité aide les clients à mieux comprendre la boîte noire du deep learning, car elle augmente la traçabilité des processus correspondants. La GradCam guidée fournit, sous la forme d'une carte thermique, des indices encore plus précis sur les régions de l'image pertinentes pour la décision prise par le réseau de deep learning. Cela permet par exemple aux utilisateurs d'étudier les erreurs de classification.

Quels sont, selon vous, les avantages de travailler avec un partenaire comme STEMMER IMAGING ?

En fait, ils sont nombreux ! MVTec et STEMMER IMAGING ont un partenariat très fort sur le long terme. Nous travaillons ensemble depuis plus de dix ans maintenant. Il est important pour nous d'avoir des partenaires commerciaux ayant un haut niveau de connaissance des systèmes de vision : des caméras aux optiques, de l'éclairage aux logiciels. Notre logiciel est assez complexe, nous avons donc besoin d’un partenaire capable de travailler avec ce haut niveau de complexité et qui dispose d'une large base de données clients sur différents marchés.

STEMMER IMAGING est une marque connue, avec un support technique garanti et une équipe de vente qui couvre l'ensemble du marché européen. De plus, nous avons la même volonté d'apporter de la valeur à nos clients en partageant nos connaissances, en les accompagnant avec des formations sur mesure, et en les aidant à évaluer les technologies et à réaliser des études de faisabilité. En définitive, nous préconisons l'utilisation de la technologie au profit de nos clients et nous accélérons leur mise sur le marché en les aidant à mettre en œuvre ces technologies.