La reconnaissance de gestes : Vision 3D avec deux caméra

Une caméra typique capture le monde comme une image bidimensionnelle. L’objectif unique dirige la lumière vers un capteur et un dispositif d’enregistrement capture les données. Bien que nous puissions déduire la distance ou la proximité d’un objet par rapport à la caméra en fonction de sa taille, nous ne pouvons pas vraiment distinguer une image tridimensionnelle d’un système de caméra bidimensionnel.
 
 
Cette limitation crée un problème avec les interfaces basées sur les gestes. Si vous vous tenez devant une caméra normale et agitez vos bras, l’appareil photo peut capturer le mouvement horizontal et vertical. Un ordinateur avec le logiciel approprié pourrait être capable d’interpréter ces mouvements comme des commandes. Mais qu’en est-il si vous rapprochez vos mains de l’appareil photo? Un système 2D ne peut pas interpréter ces mouvements. Et les systèmes bidimensionnels peuvent avoir du mal à faire la distinction entre un utilisateur et l’arrière-plan.
 
Alors, comment pouvez-vous apprendre à une caméra à voir en trois dimensions? Une façon consiste à ajouter une seconde caméra – c’est ce qu’on appelle un système de caméra stéréo. Chaque caméra capture des images dans le même espace physique. Les flux de données provenant des deux caméras se déplacent dans un seul ordinateur, qui compare les images et tire des conclusions sur la profondeur en fonction de l’information. Les deux caméras ne doivent pas nécessairement être côte à côte – vous pouvez en positionner une pour regarder une pièce en tête et la seconde caméra peut être positionnée en regardant le sol depuis le plafond.

D’une certaine manière, cela imite la façon dont les humains perçoivent la profondeur. Nous avons tendance à juger à quel point quelque chose nous vient de plusieurs indices visuels. L’un d’eux vient de la parallaxe. Cela fait référence à la façon dont les deux yeux perçoivent la même scène sous des angles légèrement différents. Si vous deviez tracer des lignes droites entre vos yeux et un objet dans votre cadre de vision, vous verriez les deux lignes converger. Nos cerveaux combinent l’information de nos yeux pour créer une image dans nos esprits.
 
 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *