Comment les robots voient-ils ? Système de vision robotique

Par Jeremy Cook

« Comment les robots voient-ils ? » La réponse simple à cette question est la suivante : grâce à la vision industrielle ou aux systèmes de vision industrielle. Les détails sont beaucoup plus complexes. Dans cet article, nous allons nous poser cette question en nous focalisant sur les robots physiques qui accomplissent une tâche dans le monde réel, et non pas sur des applications logicielles utilisées pour filtrer des documents visuels sur Internet.

Les systèmes de vision industrielle capturent des images à l’aide d’une caméra numérique (ou de plusieurs caméras) et traitent ces données image par image. Le robot utilise ces données interprétées pour interagir avec le monde physique par le biais d’un bras robotique, d’un système agricole mobile, d’un dispositif de sécurité automatisé ou d’un grand nombre d’autres applications.

La vision par ordinateur s’est imposée dans la dernière partie du XXe siècle, en utilisant une série de critères codés en dur pour déterminer des faits simples sur des données visuelles capturées. La reconnaissance de texte est l’une de ces applications de base. L’inspection de la présence d’un composant x ou de la taille d’un trou y dans une application d’assemblage industriel en sont d’autres. Aujourd’hui, les applications de vision par ordinateur se sont considérablement développées grâce à l’intégration de l’IA et de l’apprentissage automatique.

L’importance de la vision par ordinateur

Si les systèmes de vision basés sur des critères spécifiques sont toujours utilisés, la vision par ordinateur est aujourd’hui capable de bien d’accomplir bien plus, grâce au traitement basé sur l’intelligence artificielle. Dans ce paradigme, les systèmes de vision robotique ne sont plus programmés explicitement pour reconnaître des conditions telles qu’un ensemble de pixels (un « blob ») dans la bonne position. Au lieu de cela, un système de vision robotique peut être entraîné à l’aide d’un ensemble de données de pièces, de conditions ou de scénarios bons ou mauvais, ce qui lui permet de générer ses propres règles. Ainsi équipé, il est capable de gérer des tâches telles que déverrouiller une porte pour les humains et non pour les animaux, arroser des plantes qui ont l’air de manquer d’eau ou déplacer un véhicule autonome lorsque le feu passe au vert.

Bien qu’il soit possible d’utiliser l’informatique Cloud pour entraîner un modèle d’IA, lorsqu’il s’agit de prises de décision en temps réel, le traitement en périphérie est généralement préférable. Le traitement local des tâches de vision robotique permet de réduire la latence et de ne pas dépendre de l’infrastructure Cloud pour les tâches critiques. Les véhicules autonomes illustrent parfaitement l’importance de cet aspect, car un retard d’une demi-seconde dans la vision industrielle peut causer un accident. En outre, personne n’a envie que son véhicule s’arrête si les ressources réseau cessent d’être disponibles.

Technologies de pointe en matière de vision robotique : multi-caméras, 3D, techniques d’IA

Alors qu’une seule caméra permet de capturer des informations visuelles en 2D, deux caméras fonctionnant de manière conjointe sont nécessaires pour percevoir la profondeur. Par exemple, la gamme de processeurs NXP i.MX 8 peut utiliser deux caméras d’une résolution de 1080P pour une entrée stéréo. Avec le matériel adéquat, il est possible d’intégrer plusieurs caméras et systèmes de caméras grâce à l’assemblage vidéo et à d’autres techniques. D’autres types de capteur, tels que le LIDAR, l’IMU et le son, peuvent être incorporés, donnant une image de l’environnement d’un robot dans l’espace 3D et au-delà.

La même catégorie de technologie qui permet à un robot d’interpréter des images capturées permet également à un ordinateur de générer de nouvelles images et des modèles 3D. L’une des applications de la combinaison de ces deux aspects de la vision robotique est le domaine de la réalité augmentée. Dans celui-ci, la caméra visuelle et les autres entrées sont interprétées, et les résultats sont affichés en vue d’une utilisation destinée aux humains.



Industrial engineer using tablet to manage automation in robot arms


Comment débuter avec la vision industrielle

Nous disposons aujourd’hui d’un large éventail d’options pour démarrer avec la vision industrielle. D’un point de vue logiciel, OpenCV constitue un excellent point de départ. Celui-ci est disponible gratuitement et peut fonctionner avec des modèles de vision industrielle basés sur des règles, ainsi qu’avec des modèles d’apprentissage profond plus récents. Vous pouvez commencer avec votre ordinateur et votre webcam, mais les équipements spécialisés dans les systèmes de vision industrielle, comme le kit de développement Jetson Nano ou la gamme de produits Google Coral sont bien adaptés à la vision et à l’apprentissage automatique. NVIDIA® Jetson Orin™ NX 16 Go offre 100 TOPS de performances en matière d’IA dans le facteur forme familier de Jetson.

Des sociétés comme NVIDIA disposent d’une gamme de logiciels, y compris des ensembles de données d’entraînement. Si vous souhaitez mettre en œuvre une application d’IA mais que vous ne souhaitez pas vous procurer les photos de personnes, de voitures ou d’autres objets dont vous avez besoin, ces ensembles de données peuvent vous donner une longueur d’avance. Ces ensembles de données devraient s’améliorer à l’avenir, grâce à des techniques d’IA de pointe telles que les transformateurs d’attention et de vision qui améliorent la façon dont nous les utilisons.

Algorithmes de vision robotique

Les robots voient par l’interprétation constante d’un flux d’images, en traitant ces données au moyen d’algorithmes codés par l’homme ou par l’interprétation d’un ensemble de règles générées par l’IA. Bien sûr, d’un point de vue philosophique, on pourrait inverser la question et demander : « Comment les robots se voient-ils ? » Étant donné notre capacité à pénétrer dans le code, aussi alambiqué que puisse être un modèle d’IA, cette question pourrait être plus simple à répondre que celle de savoir comment nous nous voyons nous-mêmes !

Liens vers les produits associés

Voir les produits connexes

MCIMX8M-EVK NXP Semiconductors Evaluation Kit

NXP Semiconductors Cartes et kits de développement de systèmes intégrés Afficher

Voir les produits connexes

Voir les produits connexes

945-13450-0000-100 | Jetson Nano Developer Kit

NVIDIA Cartes et kits de développement de systèmes intégrés Afficher

ArrowPerks-Loyalty-Program-Signup-banner-FR


Actualité

Sorry, your filter selection returned no results.

Nous avons mis à jour notre politique de confidentialité. Prenez un moment pour lire les changements. En cliquant sur "J'accepte", vous acceptez la clause de confidentialité d'Arrow Electronics ainsi que les conditions d'utilisation.

Notre site Internet place des cookies sur votre appareil pour améliorer votre expérience et pour améliorer notre site. Pour en savoir plus sur les cookies que nous utilisons et la façon de les désactiver, cliquez ici. Des cookies et des technologies de suivi peuvent être utilisés à des fins de marketing. En cliquant sur « Accepter », vous consentez au placement de cookies sur votre appareil et à notre utilisation de technologies de suivi. Cliquez sur « En savoir plus » pour de plus amples informations et instructions sur la façon de désactiver les cookies et les technologies de suivi. Même si l'acceptation des cookies et technologies de suivi est volontaire, leur désactivation peut entraîner un mauvais fonctionnement du site Internet et certaines publicités peuvent être moins pertinentes pour vous. Nous respectons votre confidentialité. Lisez notre politique de confidentialité ici.