Reconnaissance vocale : la révolution est en marche

Actualité

La reconnaissance vocale n’échappera pas aux mains des Gafa, qui se sont lancés depuis plusieurs années dans une bataille acharnée pour développer la meilleure techno. Et si le marché américain semble réceptif à ce nouveau mode de communication, le compte à rebours est lancé pour le marché français.

Des airs de «Her ». Le 21 ème siècle pourrait bel et bien être celui de la reconnaissance vocale, ou pour les puristes, de la « reconnaissance de la parole ». (Larousse) Il est en tout cas celui de l’intelligence artificielle, ou plutôt, des intelligences artificielles qui abondent chaque année, aussi vite que de nouvelles startups voient le jour. Des intelligences artificielles qui contribuent à la prochaine révolution de nos maisons : la voix. « Ok Google » entrera dans le langage courant, et Alexa (Amazon) rejoindra aisément les repas de famille. Augmenter le chauffage, fermer ses volets ou éteindre la lumière : votre voix aura remplacé vos doigts.


Un taux inférieur au taux d’erreur par mot d’un humain


Selon une étude menée par le Digital Transformation Institute de Capgemini sur le « commerce conversationnel », une personne sur deux se servirait déjà de la reconnaissance vocale au quotidien. Et 25% posséderaient un assistant personnel tel que la Google Home ou Echo d’Amazon. Des chiffres qui s’expliquent notamment par les progrès technologiques réalisés par les Gafa sur la dernière décennie. D’après une étude réalisée par un groupe de chercheurs de Microsoft, le taux d’erreur par mot (WER : Word Error Rate), serait de 5,1%. 20 ans plus tôt, le meilleur logiciel de reconnaissance vocale affichait un taux d’erreur de 43%. « Ce chiffre, qui n’a rien de surprenant en soi, prend un autre sens quand on sait qu’il est inférieur au taux d’erreur par mot d’un humain (le taux d’erreur correspond aux fautes que peut faire un humain lors d’une retranscription, confondant par exemple un « the » anglais avec un « a ». », expliquait en août 2017 un article Numerama.


La machine, l’égal de l’humain ?


La machine serait donc l’« égal de l’humain », comme le soutient Xuedong Huang, responsable de la reconnaissance vocale chez Microsoft. Elle n’en reste pas moins effrayante pour une majorité de ménages, qui perçoivent comme premier frein un manque de confiance vis-à-vis de la sécurité de leurs données personnelles. Récemment, des chercheurs des Universités de Californie et Georgetown ont réussi à pirater des assistants vocaux en insérant des « bruits blancs », sons qui ne se détectent pas à l'oreille. Diffusé sur l’enceinte connecté, ce son permet d’activer la commande de l’assistant vocal pour se rendre sur un site e-commerce par exemple.

D’autres exemples ont par ailleurs démontré que ces systèmes étaient encore perfectibles. « Piratée, l’enceinte connectée Amazon Echo peut se transformer en micro de surveillance », titrait le Monde dans un article du 2 août 2017. Quant à la protection des données, le récent scandale dont Facebook a été à l’origine marque là aussi quelques interrogations. Comment les Gafa les exploitent-elles ? Et à quel point ? Si l’espionnage, le piratage ou le « vol » des données demeurent des enjeux majeurs, des progrès en matière de traduction des commandes en action restent également à faire. L’objectif n’étant plus de reconnaitre la voix, mais de comprendre que les ordres donnés sont des actions. Une révolution qui finira par nous laisser sans voix…

  • « Avec la reconnaissance faciale, tous les secteurs vont être impactés »

    Actualité

    À l’ère où les GAFA semblent mettre petit à petit la main sur les technologies de reconnaissance faciale, quid des limites de ces nouvelles intelligences ? Guillaume Ligneul, responsable R&D et Innovation chez Nexecur fait le point.

  • RGPD : une opportunité pour nos entreprises françaises [et européennes]

    Actualité

    Le 25 mai prochain, toutes les entreprises européennes devront être en conformité avec le nouveau règlement européen relatif à la protection des données personnelles des personnes physiques, sous peine de risquer de lourdes sanctions financières.