Galerie d'échantillons vocaux Spark TTS
Découvrez les résultats impressionnants obtenus avec Spark TTS
Qu'est-ce que Spark TTS?
Technologie TTS basée sur LLM de nouvelle génération
Spark TTS représente une avancée dans la technologie de synthèse vocale. Basé sur le puissant fondement Qwen2.5, il offre une synthèse vocale remarquablement naturelle grâce à une approche innovante en flux unique. Notre méthode de tokens de parole découplés élimine le besoin de modèles acoustiques séparés, établissant de nouvelles normes en matière d'efficacité et de qualité.
- Clonage de voix Zero-Shot : Répliquez n'importe quelle voix avec un court échantillon audio
- Support bilingue : Synthèse fluide en chinois et en anglais
- Génération contrôlable : Ajustez le genre, la hauteur et le rythme de parole
- Architecture rationalisée : Reconstruction audio directe à partir des prédictions LLM
Commencer avec Spark TTS
Guide rapide d'utilisation de notre plateforme TTS
- Choisissez entre le clonage de voix ou le mode de génération contrôlée
- Téléchargez un échantillon audio de référence ou ajustez les paramètres vocaux
- Entrez votre texte pour la synthèse
Fonctionnalités clés de Spark TTS
Découvrez ce qui rend notre technologie TTS unique
Architecture Simplifiée
Construite entièrement sur Qwen2.5 sans modèles de génération supplémentaires comme le flux correspondance
Capacités Multilingues
Changez aisément entre le chinois et l'anglais avec une prononciation naturelle
Personnalisation de la Voix
Créez des intervenants virtuels en ajustant les paramètres de genre, de hauteur et de rythme de parole
Technologie soutenue par la recherche
Développée par des institutions de premier plan, dont HKUST, Mobvoi, et d'autres