Spécialités :

- Messages REPONDEURS/AUDIOTELS
- Vidéos INSTITUTIONNELLES
- Vidéos MOTION DESIGN
- PUB TV
- Audibooks ENFANTS
- Voix Dessins Animés CARTOON

13/09/2017

NOUVEAUTE AMAZON POLLY

Amazon Polly - Texte à parole dans 47 voix et 24 langues

par Jeff Barr 

Alors que je me préparais à écrire ce post, je pensais à mon enfance (largement passé à regarder la télévision) et à certaines des voix populaires des ordinateurs et des robots des années 1960 et 1970. En quelques minutes, des souvenirs agréables de HAL-9000 , B9 ( Lost in Space ), l' ordinateur Star Trek d' origine et Rosie (de The Jetsons ) sont venus à l'esprit. À cette époque, la plupart des gens s'attendaient à ce que la parole générée mécaniquement soit exacte, coupée et dépourvue d'émotion humaine.

Avancez rapidement de nombreuses années et nous voyons maintenant qu'il existe de nombreuses applications géniaux et des cas d'utilisation pour la parole générée par ordinateur, communément appelée Text-to-Speech ou TTS. Le divertissement, le jeu, les systèmes d'annonce publique, l'e-learning, la téléphonie, les applications et appareils fonctionnels et les assistants personnels ne sont que quelques points de départ. Beaucoup de ces applications sont très adaptées aux environnements mobiles où la connectivité est très bonne, mais la puissance de traitement locale et le stockage sont tellement au mieux.

Bonjour, Polly
Pour aborder ces cas d'utilisation (et d'autres que vous allez rêver), nous présentons Polly , un service en nuage qui convertit du texte en un discours réaliste que vous pouvez utiliser dans vos propres outils et applications. Polly prend actuellement en charge 47 voix masculines et féminines réparties dans 24 langues, avec des langues et des voix supplémentaires sur la feuille de route.

Polly a été conçu pour répondre à plusieurs des aspects les plus difficiles de la génération de la parole. Par exemple, considérez la différence dans la prononciation du mot «en direct» dans les phrases «Je vis à Seattle» et «Vivre à partir de New York». Polly sait que cette paire d'homographes est exprimée de la même manière, mais se prononce différemment. Ou, qu'en est-il de la «St.» Selon la langue et le contexte, cela pourrait signifier (et devrait être prononcé) comme «rue» ou «saint». Encore une fois, Polly sait ce qu'il faut faire ici. Polly peut également traiter des unités, des fractions, des abréviations, des devises, des dates, des horaires et d'autres composantes de la parole de manière sophistiquée et spécifique à la langue.

Pour ce faire, nous avons travaillé avec des locuteurs professionnels, natifs de chaque langue cible. Nous avons demandé à chaque orateur de prononcer une myriade de mots et de phrases représentatifs dans leur langue choisie, puis a démonté l'audio en unités sonores appelées diphones .

Polly travaille vraiment bien avec un texte sans imagination. Vous fournissez simplement le texte et Polly s'occupe du reste, en fournissant un fichier audio ou un flux qui représente le texte d'une manière précise, naturelle et réaliste. Pour des applications plus sophistiquées, vous pouvez utiliser SSML (Speech Synthesis Markup Language) pour fournir à Polly des informations supplémentaires. Par exemple, si votre texte contient des mots provenant de plus d'une langue (peut-être l'anglais avec un français mixte), vous pouvez le marquer pour être prononcé en tant que tel en utilisant SSML.

Les nouveauté arrivent ... 

Retour