Voix

Les trousses SDK pour les canaux Oracle Android, Oracle iOS et Oracle Web ont été intégrées avec la reconnaissance de la parole pour permettre aux utilisateurs de parler directement aux compétences et aux assistants numériques, et d'obtenir les réponses appropriées.

Lorsque la reconnaissance de la parole est activée, un bouton de microphone remplace le bouton d'envoi lorsque le champ d'entrée d'utilisateur est vide. Les utilisateurs touchent ce bouton pour commencer à enregistrer leur message vocal. Le message vocal est envoyée au serveur vocal pour reconnaissance et conversion en texte, puis il est envoyé à la compétence. Si le message vocal est reconnu partiellement, le résultat partiel s'affiche dans le champ d'entrée de l'utilisateur afin que celui-ci puisse corriger le texte avant l'envoi à la compétence.

Voir Prise en charge des fonctionnalités générales par langue pour une liste des langues avec prise en charge vocale.

Activer la voix pour le canal Oracle Android

Pour activer le microphone dans la vue de clavardage :
  • Créez le canal Oracle Android et activez-le.
  • Réglez l'indicateur de fonction enableSpeechRecognition à true. La rubrique Reconnaissance de la parole décrit cette fonction, ainsi que les autres propriétés et méthodes associées à la voix.

Activer la voix pour le canal Oracle Web

Pour activer le microphone dans le widget de clavardage affiché sur une page Web :
  • Configurez le canal Oracle Web et activez-le.
  • Réglez la propriété de configuration enableSpeech à true. La rubrique Reconnaissance de la parole décrit cette fonction, ainsi que les autres propriétés et méthodes associées à la voix.

Activer la voix pour le canal Oracle iOS

Pour activer le microphone dans la vue de clavardage iOS :
  • Configurez le canal Oracle iOS.
  • Réglez l'indicateur de fonction enableSpeechRecognition à true. La rubrique Reconnaissance de la parole décrit cette fonction, ainsi que les autres propriétés et méthodes de reconnaissance vocale.

Améliorer la fonction ASR grâce à la parole améliorée

Si les données d'entraînement de votre compétence contiennent beaucoup de mots ou d'expressions spécifiques à votre application, de jargon, de noms propres ou de mots à l'orthographe ou à la prononciation inhabituelles, alors vous pouvez augmenter la probabilité qu'ils soient reconnus et transcrits correctement grâce à un modèle de parole amélioré.
Note Vous ne pouvez utiliser la parole améliorée qu'avec des compétences en anglais (avec des données d'entraînement en anglais) qui sont destinées à un public anglophone.

Pour créer un modèle de parole améliorée :
  1. Sélectionnez Enable Enhanced Speech (Activer la parole améliorée) dans Settings (Paramètres).
  2. Entraînez de nouveau la compétence.
  3. Acheminez un canal client Oracle Web, iOS ou Android vers la compétence.

    Conseil :

    Les modèles de parole améliorée ne sont disponibles que pour les compétences développées avec les versions 20.12 ou ultérieures. Si vous souhaitez utiliser des modèles de parole améliorée, vous devez mettre à niveau la compétence vers 20.12.

Lorsque vous sélectionnez cette option, le système de reconnaissance vocale crée un modèle de parole améliorée basé sur les données d'intention et d'entité de la compétence : énoncés, valeurs d'entité, synonymes des valeurs d'entité personnalisées et dynamiques, et entités de système associées à des intentions. Le modèle de parole améliorée est mis à jour chaque fois que vous réentraînez votre compétence (ou, comme c'est le cas dans la version courante, lorsque la compétence est réentraînée après une demande de poussée finalisée à partir de l'API d'entité dynamique).

Lorsque les utilisateurs émettent une demande verbale au moyen des canaux clients Oracle Web, iOS ou Android, l'exécution de la parole extrait dynamiquement le modèle linguistique personnalisé pour la compétence acheminée vers le canal. Si le canal pointe vers un assistant numérique, il extraira les modèles linguistiques personnalisés pour chaque compétence où l'option Enable Enhanced Speech (Activer la parole améliorée) est définie. Vous pouvez activer et désactiver ce paramètre pour les compétences individuelles enregistrées auprès d'un assistant numérique.