Publié le 7 juin 2017
Recherche
Le deep learning ouvre de nouveaux horizons quant à l'analyse des événements sportifs

Grâce au deep learning, une équipe de chercheurs du CEA a pu élaborer un puissant outil permettant d’analyser et d’annoter les vidéos sportives en temps réel.

L’analyse, la reconnaissance et le classement du contenu des vidéos est un véritable défi. Avoir des annotations en temps réel est un vieux rêve pour les chaînes de télévision… qui pourrait bientôt devenir réalité.

Les réseaux de neurones révolutionnent l’informatique depuis déjà plusieurs années. Ils permettent aux machines de faire du deep learning, c’est-à-dire d’apprendre par elles-mêmes sans l’intervention d’un être humain. Smartphones, ordinateurs, analyse locale ou sur le cloud, ces réseaux s’incrustent de plus en plus dans notre vie de tous les jours.

Le Laboratoire de Vision et Ingénierie des Contenus, du CEA, travaille sur l’optimisation de ces réseaux de neurones dans le cadre de la Vision par Ordinateur. En partenariat avec France Télévisions, les chercheurs mettent à disposition un outil puissant, permettant d’analyser et d’annoter des vidéos en temps réel. Réalisé au départ pour Rolland Garros, cet outil reconnaît actuellement plus de 15 000 visages et une vingtaine de sports (voir la vidéo en fin d’article).

Un logiciel très efficace

Pour y parvenir, les chercheurs ont amélioré un réseau neuronal préexistant capable de reconnaître 2000 personnes. Ils ont poussé son apprentissage grâce à des photos de personnalités connues trouvées sur internet, montrant au passage que cet outil pouvait être enrichi à la demande. En fin de compte, le taux de reconnaissance des vidéo a pu atteindre 95 %. « Pour beaucoup d’usages, il n’est pas nécessaire d’avoir un résultat supérieur. », précise Bertrand Delezoide, responsable de l’équipe multimédia du LVIC qui porte ce projet. « Par exemple, le taux de reconnaissance des radars est de 40 %. »

Bien que ce logiciel ne soit aujourd’hui conçu que pour annoter les évènements sportifs, les chercheurs n’excluent pas la possibilité d’étendre ses capacités à l’analyse d’autres émissions. Par exemple, une variante de cet outil a déjà été utilisée pour reconnaître les visages et les pièces de l’émission Secret Story.

 

Pour en savoir plus :