Voice-as-user interface : Tout ce que vous devez savoir

La voice-as-user interface ou VUI ou interface utilisateur vocale permet d’utiliser la voix pour commander ou contrôler un appareil. Elle permet à l’utilisateur d’avoir les mains et les yeux libres au-cours de son utilisation.

Alexa, Google Assistant, Siri, ce sont des assistants qui se contrôlent par la voix. A la différence des interfaces graphiques, la VUI est plus facile à utiliser, notamment pour certaines personnes handicapées (malvoyants par exemple). Par ce fait, elle semble plus difficile à concevoir. La VUI doit ainsi traiter une énorme quantité d’informations et offrir des fonctionnalités précises. Dans ce dossier, on va donner les directives à suivre afin de créer une voice-as-user interface digne du nom. Avant cela, il convient de dire ce que c’est réellement, son fonctionnement ainsi que les différents types de VUI qui existent.

Qu’est-ce que la voice-as-user interface ?

Ces derniers temps, notamment avec l’essor d’Internet des objets, on passe de plus en plus notre temps sur l’écran. Ce qui fatigue les yeux plus rapidement. Voici donc l’alternative, la VUI, qui offre beaucoup d’avantages et s’utilise plus aisément.

Les enceintes connectés et les assistants vocaux sont des exemples typiques de VUI. En effet, lorsqu’on utilise la voix pour commander un appareil, il s’agit d’une voice-as-user interface (VUI) ou interface utilisateur vocale. La VUI est basée sur les technologies de reconnaissance vocale, ajoutées à celle du traitement de langage naturel. Le système s’occupe de transformer les paroles en texte, leur donnant ainsi du sens.

Avec une voice-as-user interface, plus besoin de regarder l’écran et de toucher n’importe quelle touche de l’appareil. Les GAFAM sont les plus connus dans cette technologie avec leurs assistants vocaux basés sur l’IA. Aujourd’hui, le marché dispose de nombreux appareils intelligents équipés d’une VUI à l’instar d’Amazon Echo, Google Home et Apple HomePod.

Comment cela fonctionne-t-il ?

Comme on l’a dit, une VUI fonctionne au moyen de l’intelligence artificielle. Il s’agit de la synthèse vocale, la reconnaissance vocale automatique et la reconnaissance d’entité nominative.

Pour cela, chaque fournisseur dispose d’un cloud privé où sont enregistrés l’infrastructure back-end et les éléments vocaux de la VUI. Le traitement des informations (voix et parole de l’utilisateur) s’effectue au sein du cloud. Ensuite, l’IA envoie une réponse à l’appareil qui effectue la tâche demandée.

En général, une VUI s’accompagne d’une interface graphique (GUI) et des effets visuels et  sonores. Cela permet d’améliorer l’expérience utilisateur. Cela étant, les effets visuels servent surtout à signaler à l’utilisateur que l’appareil est à l’écoute.

Les différents types d’interface utilisateur vocale

Les premières VUI s’appellent Interactive Voice Response ou SVI. Ce sont des systèmes permettant l’interaction entre les utilisateurs et le système téléphonique. Toutefois, ce système est beaucoup moins intelligent que les VUI actuelles. Il ne reconnaît que les chiffres.

Les séries de recherches ont ensuite permis de fabriquer des enceintes connectées. Celles-ci ont apporté une innovation à l’intérieur des salons modernes. Ces voice-as-user interfaces ont permis d’écouter de la bonne musique chez soi.

Outre les enceintes connectées, il y a également les assistants vocaux actuels. Plus sophistiqués et plus modernes, celles-ci peuvent traiter toutes sortes de langage naturel. Par ailleurs, nombreux appareils électroménagers sont maintenant équipés d’un système à commande vocale, bien que le nombre de commandes soit encore limité.

Il existe aussi des interfaces multimodales qui combinent différents types d’interfaces (voix, toucher, vision, tactile). Cependant, les appareils avec de telles interfaces ne sont pas à usage général. Dans ce cas, la commande vocale n’est pas destinée à toutes les tâches, mais à quelques-unes uniquement.

Voice-as-user interface : ses avantages

Comme tout autre type d’interface, la voice-as-user interface présente aussi bien d’avantages que d’inconvénients. Dans cette partie, on va voir quels sont ses avantages.

De toute évidence, commander un appareil par la voix est plus facile et rapide qu’avec la main. Quelques secondes suffisent pour dire ce qu’on veut, alors que frapper ces mots peut mettre plus de temps. Ce qui signifie que la voice-as-user interface est plus pratique par rapport à l’interface graphique.

Par ailleurs, la VUI est plus facile à utiliser. On n’a pas besoin de savoir lire ou écrire pour pouvoir en profiter. Tout le monde peut utiliser sa voix pour contrôler tel ou tel appareil. En outre, on peut exécuter d’autres tâches avec les mains tout en commandant l’appareil par la voix. On peut, par exemple, demander à l’Amazon Echo de jouer nos plus beaux morceaux tout en cuisinant.

Il en est de même pour les yeux. On peut rester concentré au volant tout en demandant à son iPhone de lire le message entrant ou le dernier courriel. On n’a plus besoin d’être cloué sur l’écran jusqu’à ce que les yeux se fatiguent.

Les inconvénients de la VUI

Bien que la VUI offre de merveilleuse expérience utilisateur, il y a quand-même un revers de la médaille.

Tout d’abord, la VUI ne peut pas assurer la vie privée de ses utilisateurs. En plus, certaines configurations sont floues et manquent de précision. Ce qui entraîne une difficulté pour l’appareil à répondre correctement à la demande de l’utilisateur.

Tous les contextes du langage ne peuvent pas être compris par le logiciel de reconnaissance vocale. C’est ce qui fausse parfois son interprétation de la commande.

On peut prendre l’exemple des homonymes. « La » et « là » sont deux termes homonymes, mais qui ont des significations différentes. Avec une telle confusion, la réponse envoyée peut s’avérer erronée. Dans ce cas, il importe de bien articuler, avec le ton qui convient.

De surcroît, on peut avoir du mal à commander un appareil par la voix lorsqu’on est en présence d’une foule. Les bruits peuvent perturber la réception et on peut se heurter à des problèmes de confidentialité.

Quelques exemples

Voici quelques exemples de voice-as-user interface :

Alexa d’Amazon

En Novembre 2014, Amazon a lancé Alexa. L’assistant vocal a intégré surtout les enceintes connectées Amazon Echo. Aujourd’hui, en dehors d’Amazon, Echo, on rencontre Alexa dans le système de nombreux appareils intelligents Android, iOS ou Fire OS.

Google Assistant

Google a aussi développé une voice-as-user interface intitulée Google Assistant. Cet assistant virtuel est présent dans divers systèmes domestiques et appareils intelligents. Cette VUI est surtout destinée aux appareils fonctionnant sous Android.

Siri d’Apple

Fournie exclusivement pour les appareils Apple, Siri a été déployée le 4 octobre 2011. Aujourd’hui, les derniers appareils intelligents de la marque disposent de cette fonctionnalité. Ce qui permet aux utilisateurs d’iPhones de dernières séries, Apple Watch et Apple TV de contrôler leur appareil à partir de la voix.

Cortana

Pour Microsoft, la VUI porte le nom de Cortana. Elle est associée à Bing, le moteur de Microsoft, dans le but de faciliter l’exécution de certaines tâches. Cortana permet ainsi de définir un rappel ou de répondre à des questions. Néanmoins, celle-ci reste peu utilisée comparée aux autres VUI.

voice as a user interface

Concevoir sa propre voice-as-user interface en quelques étapes

Concevoir une voice-as-user interface n’a rien de très compliqué, d’un point de vue global. Il suffit de suivre les principes. Mais pour que cela fonctionne, il faut suivre les principes de base de la conception d’une VUI. Bien évidemment, il faudra avoir les ressources nécessaires pour le mettre en place.

Principes de bases de la conception d’une voice-as-user interface

La conception d’une VUI repose sur quelques principes à savoir :

  • La voix est la base d’une VUI : La conception d’une VUI doit veiller à garder les mains et les yeux de l’utilisateur libres. Bien que l’appareil dispose d’un écran, les interactions vocales priment.
  • La conversation doit rester naturelle : Interagir avec la VUI est comme interagir avec une autre personne. De la sorte, la conversation doit rester naturelle. Le concepteur est alors invité à utiliser le langage familier pour faciliter l’interaction de l’utilisateur avec l’appareil.
  • La personnalisation : Chaque utilisateur doit être unique et la voice-as-user interface doit être en mesure de reconnaître les nouveaux utilisateurs tout comme les utilisateurs récurrents. La réussite de la personnalisation repose sur la qualité d’informations recueillies.
  • L’utilisation d’un ton à l’image de la marque : Il faut choisir une voix qui rappelle les valeurs de la marque pour donner un aspect spécifique à la VUI.
  • L’utilisation de la VUI : Avant de la concevoir, il faut spécifier le moment et l’endroit où l’utilisateur sera amené à utiliser la voice-as-user interface. Cela permet d’axer les différentes spécifications techniques sur les besoins de l’utilisateur.

Concevoir une VUI

La conception d’une voice-as-user interface est basée sur les interactions conversationnelles. Une telle interface ne requiert aucune capacité intellectuelle. Il suffit de savoir demander ce qu’on veut, contrairement à l’interface graphique. Cette dernière, pour fonctionner, nécessite d’autres supports tels que l’écran tactile, le clavier, etc.

En plus de cela, il faut soigner le visuel. Bien que le visuel ne soit pas primordial, il faut le soigner. En effet, l’aspect visuel de l’appareil compte beaucoup, surtout en matière de marketing. La commande se fait par la voix, certes. Mais l’appareil utilisant la voice-as-user interface doit aussi avoir une belle forme. D’ailleurs, une belle expérience multimodale ne peut s’obtenir qu’à partir d’un appareil conçu avec un bon aspect visuel.

Pour terminer avec la conception de la voice-as-user interface, il faut mettre l’accent sur le délai de synchronisation. La VUI a pour objectif d’exécuter des tâches en réponse à une commande vocale. Quand on combine la VUI avec une interface graphique, il ne doit y avoir aucune latence. En fait, la réponse à une commande doit être plus ou moins immédiate.

Il faut aussi veiller à utiliser une langue plus connue et plus utilisée. L’utilisateur ne doit pas avoir à apprendre d’autres langues pour pouvoir la maîtriser. En plus, la VUI doit être capable de répondre dans l’immédiat.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Pin It on Pinterest