LES RESSOURCES DE LA VISION PAR ORDINATEUR.

L’INTELLIGENCE ARTIFICIELLE

IMPACTE LE SECTEUR.

La vision par ordinateur est un domaine aussi complexe que la reconnaissance vocale. La taille et la part du marché de l’intelligence artificielle, IA dans la vision par ordinateur passe de 15,05 milliards USD à 81,10 milliards USD d’ici 2028. Quels sont donc les impacts de l’IA sur les activités d’innovation de la vision numérique ? Désormais, le digital est omniprésent dans notre quotidien : chat sur Instagram, casques immersifs, réalité augmentée, réalité facilitée grâce aux assistants vocaux, Alexa, SiriOk, Google, appelle moi le Scrum Master… D’ailleurs aujourd’hui, il suffit de demander au grand public quelle case comporte un passage piéton ou des feux tricolores pour entraîner une IA généraliste dite forte.

Les ressources de la vision par ordinateur, une application IA de premier plan.

En 2019, l’Organisation Mondiale de la Propriété Intellectuelle, OMPI dans son rapport sur le dépôt de brevets technologiques, rapporte que 49% des brevets déposés dans le cadre de l’Intelligence Artificielle concernent justement la vision par ordinateur. De fait, c’est l’application I.A la plus populaire.

La vision numérique et l’intelligence Artificielle.

La vision par ordinateur, une branche très utile de l’IA. Au fur et à mesure, elle s’approche d’une petite révolution grâce aux progrès des systèmes d’étiquetage automatique. C’est donc la capacité d’un ordinateur à distinguer des informations visuelles. Ainsi, on équipe l’ordinateur de caméras vidéo et de programmes de traitement des signaux numériques, DSP, Digital Signal Processing.

Les ressources de la vision par ordinateur ou la vision numérique.

Par conséquent, la vision par ordinateur permet dès lors d’automatiser des tâches de contrôle visuel. L’humain peut donc se concentrer sur des tâches à haute valeur ajoutée. La vision par ordinateur est l’équivalent, en termes d’IA, des yeux humains et de la capacité de notre cerveau à traiter et analyser les images qu’il perçoit. Enfin, on peut définir la vision par ordinateur comme la science des machines, des robots, des systèmes informatiques et de l’intelligence artificielle qui analyse des images et des vidéos. Et qui reconnaît des objets et agit en conséquence.

L’œil humain.

En fait, nos yeux sont importants et l’information qu’ils traitent est volumineuse. Ils monopolisent ainsi un lobe entier de notre cerveau, le lobe occipital. L’œil humain est sensible à des longueurs d’ondes électromagnétiques. Elles vont de 390 à 770 nanomètres.

Environ 90% de l’activité de notre cerveau sert à traiter ce que nous regardons, de l’interprétation du signal à sa contextualisation dans l’environnement qui nous entoure.

Les ressources de la vision par ordinateur, l’œil numérique.

Par contre, les caméras vidéo détectent une plus grande plage de longueurs d’onde. C’est ainsi que certains systèmes de vision par ordinateur fonctionnent à des longueurs d’onde allant de l’infrarouge aux rayons X, en passant par les ultraviolets. La vision par ordinateur binoculaire en stéréo requiert un ordinateur puissant et un processeur de la dernière génération. En plus pour percevoir de la profondeur il faut des caméras de haute résolution, une grande quantité de mémoire vive et à une programmation en intelligence artificielle, IA. Aujourd’hui, les technologies de vision par ordinateur dépassent largement ce que l’humain peut faire en matière de validation à l’œil nu.

Les notions de sensibilité et de résolution.

Ce sont deux caractéristiques importantes d’un système de vision. La sensibilité est la capacité d’une machine à distinguer les formes dans des conditions d’éclairage médiocre ou à réperer de faibles impulsions sur des longueurs d’onde invisibles. Tandis que la résolution est la mesure dans laquelle une machine est capable d’opérer une distinction entre des objets. Généralement, la résolution est optimale dans un champ de vision est restreint. Et à valeurs constantes pour tous les autres facteurs, la sensibilité et la résolution sont inversement proportionnelles.

Les ressources de la vision par ordinateur, champs d’applications.

La vision par ordinateur, ou la vision artificielle ou encore la vision numérique concerne tout particulièrement, le secteur automobile, avec l’émergence des voitures autonomes, capables de reconnaître les images de la route, le cinéma, avec la motion capture, les systèmes de reconnaissance faciale des smartphones, la reconnaissance de signature, l’inspection de matériaux, l’inspection de la monnaie, l’analyse d’images médicales etc.

Quelles sont les applications de la computer vision ?

Ces dernières années, les plus grandes entreprises internationales, Google, Facebook, Amazon, Apple, investissent massivement dans le deep learning et dans la computer vision.

Tesla, le constructeur de véhicules autonomes investit depuis quelques années dans la vision artificielle. Car, par rapport à l’IoT, les caméras connectées capables de traiter l’information en temps réel sont plus fiables que les différents capteurs électroniques.

De même, Dahua Technology, spécialiste des solutions de sécurité, réadapte ses caméras pour détecter par computer vision les personnes ayant de la fièvre avec la crise du coronavirus.

Les ressources de la vision par ordinateur, la reconnaissance faciale.

Elle permet aussi de personnaliser l’expérience client et de bouleverser les logiques marketing actuelles. C’est ainsi que le groupe Alibaba, de son côté, met en place la reconnaissance faciale pour comprendre l’expérience d’achat chez Taobao. D’autre part, Uber met en place, dès fin 2019, un système de reconnaissance faciale pour renforcer la sécurité de ses clients. L’entreprise de VTC met en place un système de reconnaissance faciale, via lequel elle vérifie périodiquement l’identité des chauffeurs et livreurs. Ce dispositif sert aussi à lutter contre le phénomène des faux chauffeurs.

La robotique mobile.

Selon la Japan Robotics Association, JRA, le marché global de la robotique peut atteindre 66,4 milliards de dollars en 2025 dont près de 50 milliards de dollars iront à la robotique de service, robots assistants pour le grand public, robots d’aide à domicile, robotique médicale

La robotique mobile est une branche industrielle de la vision par ordinateur particulièrement dynamique. Surtout dans le contexte démographique actuel où la population vieillit fortement. Car, entre 2000 et 2050, la population japonaise de plus de 65 ans doit passer de 22 à 36 millions d’individus.

Les ressources de la vision par ordinateur, l’apprentissage automatique.

L’essentiel de la technique d’apprentissage profond par réseaux de neurones consiste à faire absorber à l’algorithme une très grande quantité de données. L’apprentissage automatique dont le deep learning, est une approche de l’intelligence artificielle qui part des données. Il fait ensuite émerger le Self-Supervised Learning, SSL ou apprentissage auto-supervisé. C’est aujourd’hui une méthode ,pour créer des modèles d’Intelligence Artificielle performants. D’ailleurs, en février 2021 dernier, Mark Zuckerberg, dit du SSL que c’est l’un des outils clés pour le développement du metaverse. Et à juste titre, l’intérêt du SSL réside dans sa capacité à se passer de la labellisation des données par les humains. Une étape coûteuse et chronophage, mais indispensable pour la méthode d’apprentissage la plus solide à l’heure actuelle : l’apprentissage supervisé. On annote des données , par exemple des images avec leur description, et on entraîne par dessus un modèle prédictif de reconnaissance visuelle.

Le Self-Supervised learning dans le traitement du langage.

Par ailleurs, le SSL est à l’origine de grands progrès dans le traitement du langage. Désormais il s’attaque au domaine visuel. Nous commençons à avoir de très bons résultats dans le traitement des images avec ces méthodes, se réjouit Laurent Charlin.

Les ressources de la vision par ordinateur, le bon sens.

L’introduction du bon sens, dans la vision par ordinateur permet à l’Intelligence Artificielle d’interpréter les scènes avec plus de précisions. Car grâce aux travaux des chercheurs du MIT, l’IA apprend à percevoir les objets du monde réel et à recouper les objets détectés avec les données d’entrée.

Extraire du texte à partir d’images.

La reconnaissance de caractères est l’une des nombreuses autres applications de la vision par ordinateur. Et en pratique, on extrait du texte à partir d’images. L’API Vision de Google Cloud fait partie de ce type d’application.

Les ressources de la vision par ordinateur, les perspectives du deep learning.

Cependant, le SSL n’est pas populaire dans l’industrie. Le développement d’algorithmes avec ce nouveau type d’apprentissage reste donc pour l’heure l’apanage de la recherche et des grands groupes, relève Françoise Soulié, la conseillère scientifique du Hub France IA. Néanmoins, avec la mise en open source de la plupart des algorithmes, il ne tient qu’aux industriels de s’emparer du SSL pour bénéficier de ses avantages.

Le Deepfake.

Cette technique de manipulation vidéo permet de truquer des vidéos de manière totalement réaliste. Donc, iI existe plusieurs techniques, comme le faceswap, pour trafiquer les vidéos. À Stanford, d’autre part, une équipe met au point un algorithme qui permet de modifier sur une vidéo les paroles d’une personne. Ainsi on copie, colle ; ajoute ou supprime des mots. On parle aussi de plus en plus de la start-up israélienne Canny spécialisée dans le doublage de contenus vidéos avec l’Intelligence Artificielle. Son applicatif est capable d’intervenir dans le contenu pour modifier le mouvement des lèvres des personnes ou des personnages qui s’y expriment.

Les ressources de la vision par ordinateur, dans les réseaux sociaux.

Et les deepfakes sont nombreux sur les plates formes des réseaux sociaux via la généralisation d’outils de fabrication à moindre coût. C’est l’exemple type de l’application mobile chinoise Zao. Elle met le deepfake à portée de tous. En plus avec la capacité de recréer des voix ou des visages avec précision. Enfin, l’Intelligence Artificielle et la vision par ordinateur facilitent les usurpations d’identité.

Ok de-MEDEIROS

SOURCES : https://www.gabonflash.com/systeme-de-vision-par-ordinateur-marche/, https://www.geekeries.com/les-chercheurs-de-mit-un-nouvel-algorithme-donnant-a-lia-une-vision-plus-precise-des-images/, https://afriquequigagne.ca/uncategorized/236405/etat-de-developpement-du-marche-de-la-vision-par-ordinateur-2022-microsoft-corporation-google-llc-playfulvision/, https://www.journaldunet.fr/web-tech/dictionnaire-de-l-iot/1489513-computer-vision-definition-et-applications-de-la-vision-par-ordinateur/, https://www.actuia.com/actualite/le-cnrs-accroit-sa-presence-au-canada-avec-la-creation-de-deux-nouveaux-laboratoires/, https://www.cio-online.com/actualites/lire-l-europe-a-la-traine-pour-les-brevets-autour-de-l-ia-14132.html, https://www.miroir-mag.fr/high-tech-news/intelligence-artificielle-cette-ia-de-deep-science-simule-des-economies-et-predit-quelles-startups-recevront-des-fonds/, https://www.zdnet.fr/actualites/du-machine-learning-quantique-pour-travailler-sur-des-vehicules-autonomes-39940739.htm, https://www.netcost-security.fr/actualites/91023/lavenir-est-autonome-bosch-parle-de-technologies-et-de-conduite-autonome/, https://www.lemagit.fr/definition/Vision-par-ordinateur-machine-vision-computer-vision, https://www.lesaffaires.com/blogues/hugues-foltz/la-vision-artificielle-et-les-limites-de-l-oeil-humain/624779, https://www.actuia.com/actualite/facebook-ai-annonce-deux-decouvertes-liees-a-la-vision-par-ordinateur-et-a-lapprentissage-supervise/, https://www.usinenouvelle.com/article/comment-l-apprentissage-auto-supervise-accelere-l-intelligence-artificielle.N1991622, https://www.fredzone.org/cette-intelligence-artificielle-confere-un-certain-bon-sens-aux-robots, https://www.marianne.net/societe/big-brother/exploration-spatiale-implants-cerebraux-comment-elon-musk-impose-sa-vision-du-progres-