1. Accueil
  2. Actu
  3. Tech
  4. LipNet, une intelligence artificielle capable de lire sur les lèvres avec 93% de réussite
1 min de lecture

LipNet, une intelligence artificielle capable de lire sur les lèvres avec 93% de réussite

Une université anglaise a mis au point une technologie permettant de considérablement faciliter la lecture sur les lèvres. Mais il reste quelques progrès à faire.

Benjamin Pierret
Benjamin Pierret

La technologie au service du handicap. La lecture sur les lèvres, l'unique moyen qu'ont les personnes atteintes de surdité pour comprendre leur entourage, pourrait connaître une véritable révolution. Cette science loin d'être exacte se trouve facilitée par un nouveau programme, baptisé LipNet. Une intelligence artificielle capable, selon ses développeurs, de lire sur les lèvres avec 93 % de réussite. L'humain, lui, n'en serait capable qu'avec 52 % de précision.

Cette technologie a été mise au point par une équipe de chercheurs de l'Université d'Oxford. Comme les scientifiques l'ont expliqué, dans un extrait relayé par Gizmodo, cette intelligence artificielle se distingue des précédents procédés mis au point par la manière dont elle analyse les mouvements des lèvres : "Les approches traditionnelles séparent le problème en deux étapes : l'enregistrement d'images et la prédiction. [...] Tous les travaux déjà existants ne s'intéressent qu'à la classification des mots, et pas à la prédiction de phrases entières. Des études ont prouvé que la lecture sur les lèvres faite par des humains était plus efficace lorsqu'il s'agit de longs mots." Ainsi, LipNet semble prendre en bloc les phrases au lieu d'analyser chaque mouvement des lèvres en les reliant à un son. 

Tout n'est pas gagné

Comme le rapporte Quartz, le système a été testé sur trois étudiants sourds de l'université. Face à 300 phrases similaires à celles présentées à la machine, leur taux d'erreur a été de 47.7 %, tandis que celui de l'Intelligence artificielle était de 6,6 %. Pourtant, tout est loin d'être gagné : le même site souligne que tous les tests effectués mettaient en scène des personnes de face, bien éclairées et répétant des phrases aux structures similaires (verbe, couleur, préposition, lettre, chiffre et adverbe). Ainsi, la prochaine étape consistera probablement à rendre l'Intelligence artificielle capable de décoder des phrases prononcées par des personnes dans des situations réelles.

La rédaction vous recommande

Commentaires

Afin d'assurer la sécurité et la qualité de ce site, nous vous demandons de vous identifier pour laisser vos commentaires.
Cette inscription sera valable sur le site RTL.fr.

Signaler un commentaire

En Direct
/