Savoir-faire en vision

La polarisation,

pour réveler l’invisible >

Plus
The Imaging & Vision Handbook 2019/2020

La vision sur le bout des doigts

LE GUIDE DE REFERENCE

POUR LA VISION INDUSTRIELLE >

Nouvelle édition 2019/2020 – Commandez votre exemplaire !

Plus

Industrie de l’électronique >

nous vous aidons à garantir la qualité.

Plus

CVB Polimago : une solution plus simple aux tâches complexes de classification

Pour les tâches complexes de recherche et de classification en vision industrielle, l'outil de reconnaissance d'images CVB Polimago de STEMMER IMAGING apporte une solution d’apprentissage automatique plus simple et moins coûteuse que d’autres outils de deep learning. Moins d'images d'entraînement, un apprentissage plus rapide et une accélération des temps d'exécution sur une plateforme CPU standard permettent d'éviter certains inconvénients liés à la technique des réseaux de neurones convolutifs (CNN). La version CVB 2019 permet d’utiliser Polimago dans des applications embarquées.

CVB Polimago peut être utilisé dans de nombreuses applications similaires à celles des réseaux de neurones. Il fait partie de Common Vision Blox (CVB), la bilbliothèque d'outils de vision de STEMMER IMAGING. Il utilise une méthode d'apprentissage supervisé par régression, pour la recherche et la classification en vision industrielle. L'apprentissage supervisé signifie que l’utilisateur connaît au préalable les valeurs de sortie. Pour cela, il précise une région d’intérêt dans les images de formation pour marquer les exemples typiques de caractéristiques qui serviront à la classification. À partir de cela, l'algorithme de CVB Polimago génère une fonction qui permettra de produire la sortie souhaitée.

CVB Polimago n’a besoin en général que de 20 à 100 images pour s’entraîner, contrairement aux CNN qui peuvent nécessiter jusqu’à 500 images d’entraînement par catégorie, ainsi que 500 images correctes de référence. Par exemple, pour une application OCR utilisant les caractères alphanumériques de A à Z et de 0 à 9, un CNN peut avoir besoin de 36 x 500 = 18 000 images d’entraînement.

Utiliser un ensemble réduit d’images de formation est très avantageux, notamment en ce qui concerne la durée de la phase d’entraînement : CVB Polimago est ici bien plus rapide que les CNN, avec de 5 à 20 minutes d’apprentissage, contre plusieurs heures pour les autres outils. Si un processus de formation itératif est nécessaire pour évaluer différents paramètres, les CNN deviennent alors encore plus complexes.

CVB Polimago est conçu pour fonctionner sur une plateforme CPU et atteint des vitesses comparables à celles d'un CNN qui utilise une accélération GPU. Comme CVB Polimago n'a pas besoin de processeur graphique, il peut être utilisé sur un PC compact plutôt que sur un PC monté en rack 19". En général, CVB Polimago exécute la recherche en quelques millisecondes, vitesse comparable à celle des réseaux de neurones accélérés par GPU. Les tâches de classification pure sont quant à elles beaucoup plus rapides avec CVB, à une vitesse souvent inférieure à une milliseconde.

CVB Polimago est disponible à un coût nettement inférieur à celui de nombreux outils CNN et présente également l'avantage d'être disponible pour la première fois pour Linux (sur les plateformes Intel et ARM) dans la version CVB2019 (sortie prévue pour le troisième trimestre 2019). Ainsi, il peut aussi être utilisé dans des applications de vision embarquée.

Parmi les applications récentes de CVB Polimago figurent la reconnaissance optique de caractères (OCR), la détection de biscuits incomplets, le contrôle de l’enrobage complet de cacahuètes et la classification de boulons de taille et de forme similaires. Pour chacune de ces applications, des ensembles de 20 à 50 images d'apprentissage par catégorie ont été utilisés, avec des temps d'exécution d'environ 7 ms pour la classification. Dans le cas d'une application consistant à identifier des ailes, des cuisses, des pilons et des blancs de poulet, 14 images d'apprentissage seulement ont été nécessaires par ensemble de formation, à une vitesse de 1 ms pour la classification.