WayToLearnX » Graphisme & vidéo » Les dimensions d’un système de reconnaissance 3D des gestes

Les dimensions d’un système de reconnaissance 3D des gestes

décembre 25, 2017février 10, 2020 Amine KOUIS Aucun commentaire

La Xbox Kinect utilise la lumière infrarouge pour projeter une grille devant la vue de la caméra. Les capteurs mesurent la grille lorsqu’elle se déforme et enregistrent les données sous forme de mouvement.

Vous pouvez diviser les parties d’un système vision 3D en deux catégories principales: matériel et logiciel. Ensemble, ces éléments interprètent vos mouvements et les traduisent en commandes. Vous pourriez être en mesure de faire sauter des zombies dans un jeu vidéo, naviguer dans les menus tout en cherchant le prochain blockbuster à regarder la nuit du film ou même travailler sur le prochain grand roman américain en se déplaçant.

Côté matériel, vous aurez besoin d’un système de caméra, d’un ordinateur et d’un écran. Le système de caméra peut intégrer des éléments supplémentaires pour détecter la profondeur – il est courant d’utiliser un projecteur infrarouge et un capteur infrarouge. L’ordinateur prend les données recueillies par la caméra et les capteurs, croque les chiffres et pousse l’image à l’écran afin que vous puissiez voir les résultats. L’affichage présente les données d’une manière qui vous permet de juger jusqu’à quel point vous devez vous déplacer pour manipuler ce qui se passe.

Du côté logiciel, vous aurez besoin d’applications qui convertissent réellement les informations collectées par le logiciel en résultats significatifs. Tous les mouvements ne deviennent pas une commande – parfois vous pouvez faire un mouvement accidentel que l’ordinateur prend pour une instruction. Pour éviter les commandes involontaires, le logiciel gestuel 3D possède des algorithmes de correction d’erreurs.

Pourquoi s’inquiéter de la correction d’erreur? Un geste peut devoir atteindre un seuil de confiance avant que le logiciel ne l’enregistre en tant que commande. Sinon, l’utilisation du système pourrait être un exercice de frustration. Imaginez que vous travaillez sur un dessin tridimensionnel important en bougeant vos mains pour changer sa taille et sa forme. Soudainement, vous éternuez et le travail délicat que vous avez fait jusqu’à présent est ruiné car vos actions involontaires provoquent une distorsion dramatique du dessin.

Les algorithmes de correction d’erreurs requièrent que vos actions associent les gestes pré-assignés à un certain niveau de confiance avant que l’action ne soit exécutée. Si le logiciel a détecté que vos mouvements n’ont pas atteint le niveau de confiance requis, il pourrait ignorer ces mouvements et ne pas les traduire en commandes. Cela signifie également que vous devrez effectuer un geste de manière très spécifique avant que le système ne le reconnaisse.

Certaines commandes peuvent ne pas être aussi sensibles que d’autres. Ceux-ci auraient un seuil de confiance beaucoup plus bas. Par exemple, basculer entre les images en déplaçant votre main vers la gauche ou la droite n’est pas vraiment une commande critique. Avec une exigence de confiance inférieure, le système acceptera les commandes plus facilement.