La voix au cœur de l’innovation

Depuis plusieurs années, les produits présentés lors des différents salons (CES, VivaTechnologie, ..) annoncaient la couleur : la tendance était à la concentration des interfaces vocales et visuelles en une seule et unique expérience transparente. Des écrans tactiles aux divers équipements IoT (les thermostats intelligents, les robinets, les frigos, etc.), les technologies autour de la voix étaient partout soit pour optimiser l’expérience utilisateur en unissant les capacités visuelles et vocales soit en intégrant le pilotage par la voix.

Selon le cabinet KPMG, les technologies qui utilisent la voix comme principale forme d’interaction vont jouer un rôle de plus en plus prépondérant dans les années à venir. Les principaux moteurs qui poussent les interfaces utilisateur vers le vocal sont :

  • Un niveau de confort plus élevé et une simplicité accrue,
  • L’évolution des comportements des consommateurs en particulier la génération Y et bientôt Z,
  • Et les dernières évolutions de l’intelligence artificielle et du machine learning.

De nombreux experts du secteur prédisent que presque toutes les applications du quotidien intégreront d'une manière ou d'une autre la technologie vocale au cours des 5 prochaines années. De plus en plus, cette volonté de favoriser le conversationnel et le vocal dans les usages apparaît désormais dans l’univers de l’entreprise :

  • Interroger son datalake à la voix
  • Doter son call center d’outils d’analyse sémantique de la conversation
  • Améliorer son SVI grâce aux call-bot / voice-bot
  • Intégrer un assistant virtuel d’entreprise pour décharger certaines équipes

Depuis longtemps les grands acteurs technologiques, notamment les Gafam, se positionnent sur ce secteur porteur qui demeure pour le moment avant tout orienté grand-public. De plus en plus d’éditeurs de solutions B2B intègrent le vocal comme une interface facilitatrice de saisie & de requêtage d’informations. askR.ia, Insight Advisor Chat avec Qlik Sense Bot, DataBlick pour Tableau et bien d’autres.

La crise sanitaire en cours rebat également les cartes au sujet des dispositifs à interactions tactiles du type bornes & écrans en orientant les interactions vers le vocal permettant de respecter les gestes barrières.

Ce n’est pas encore l’avènement de l’ère du « voice only » et même si le « voice first » n’est pas encore généralisé, la « voix » est de plus en plus présente à l'esprit des marques et des annonceurs lors de la conception et de l'élaboration d'une solution.

Et les tendances pour demain et au-delà

Les applications de cette technologie sont donc très nombreuses. Mais alors où nous mènera-t-elle en 2021 et au-delà ? Il est à noter qu’un certain nombre d'obstacles doivent encore être surmontés avant d’atteindre les niveaux de performances pour permettre aux applications vocales d’être adoptées en masse.

Pour créer une expérience de reconnaissance vocale robuste, l'intelligence artificielle doit encore relever certains défis : la compréhension et le rapport entre différentes thématiques au sein d’une même conversation, les accents, les tonalités de voix ou encore la gestion du bruit de fond. Mais les progrès technologiques rendent, chaque jour davantage, les assistants vocaux plus performants, en particulier dans l'IA, le traitement du langage naturel (NLP) et l'apprentissage automatique.

Parmi les dernières innovations, figurent :

  • Les conversations simplifiées : cette technologie permet une meilleure compréhension du langage naturel pour que ce soit encore plus pratique et naturel de converser avec nos assistants.
  • L’intégration des services vocaux dans les produits de consommation quotidien qui permet de créer des appareils personnalisés dont les fonctions spécifiques seront intégrées à l'assistant.
  • Des expériences vocales encore plus personnalisées : les assistants vocaux continueront également à offrir des expériences de plus en plus individualisées au fur et à mesure qu'ils amélioreront la différenciation des voix.
  • L’enrichissement des services apportés par les bots : Si aujourd’hui la plupart sont utilisés ou reconnus pour répondre à des questions, rares sont ceux qui prennent un rendez-vous, communique directement avec les marques résolvent un problème ou proposent de l’inspiration et font de la recommandation. Ces nouveaux services vocaux seront bien plus riches demain grâce à ce que l’on appelle le commerce conversationnel.

Et à plus long termes, des robots de plus en plus humains… 

Dans les années à venir, nous discuterons avec des bots dont la voix sera systématiquement synthétisée à partir d’une vraie personne par du clonage de voix via des technologies de réplication vocale. Le développement de la puissance de calcul banalise déjà la création de voix personnalisée. Demain, ces technologies rendront le discours du bot plus émotionnel et empreint de la bonne tonalité en fonction du discours. Le clonage vocal deviendra un outil indispensable pour les marques, les annonceurs et autres créateurs de contenus.

Par ailleurs, selon la société de recherche technologique Juniper Research, les revenus publicitaires basés sur la voix pourraient atteindre 19 milliards de dollars d'ici 2022, en grande partie grâce à la croissance des applications de recherche vocale sur les appareils mobiles. Cela inclus également l’approche multimodale et interopérable : Un assistant vocal qui pourrait « vivre » simultanément sur votre téléphone mobile, vos montres intelligentes, dans votre maison intelligente et votre téléviseur. "Un seul assistant pour tous les appareils". C’est ce que souhaite faire Amazon avec son programme «Voice Interoperability Initiative» qui vise à faire en sorte que différents assistants virtuels «fonctionnent de manière transparente les uns avec les autres sur un seul appareil». 

Un marché jusqu’ici très peu exploité 

De même, les paiements à la voix font partie des domaines explorés par de nombreuses start-ups qui travaillent sur l’authentification, le paiement et la gestion de la fraude par reconnaissance vocale. Les paiements vocaux deviendraient ainsi faisables car plus sûrs et plus pratiques. La vérification et l'identification du locuteur deviendront, par exemple, également primordiales pour l'accès à un service bancaire par téléphone.

La compréhension et l’adaptation aux émotions font partie des innovations à venir. L’analyse émotionnelle de la conversation permettra demain à l’IA vocale d’adapter sa réponse en fonction de l’état émotionnel de son interlocuteur. Ils seront capables de détecter des variations d’émotions qui les inciteront à s’adapter ou à rediriger son interlocuteur ce façon plus pertinente et personnalisée.

Les technologies autour de la voix vont venir soutenir l’explosion d’un marché jusqu’ici très peu exploité au potentiel exponentiel. L’adoption massive par le grand-public des produits intégrant ces technologies va sans aucun doute donner lieu au développement de nouvelles applications utilisées par les marques et les annonceurs. Cela étant, cette technologie, à l’instar du « tactile », va révolutionner nos réflexes intuitifs allant du gestuel à l’usage même des équipements en passant par leur conception. Nous devons donc tous nous préparer à entrer dans l’ère du « voice first ». 


Source link