Aller au contenu

Création de voix personnalisée

Ce guide API vous expliquera comment créer une voix personnalisée.


Démarrage rapide

Explorons comment créer une voix personnalisée à utiliser dans des modèles en masse et des demandes de vidéos en masse. 🎧✨

Créer une voix personnalisée

Une voix personnalisée est un clone personnalisé de la voix d'un utilisateur, adapté pour refléter son ton, son accent et ses modèles de parole uniques. Cela permet une expérience auditive plus personnelle et reconnaissable, adaptée à des applications allant de la stratégie de marque et des technologies d'assistance au divertissement et à l'utilisation personnelle. Cette API vous aide à créer une voix personnalisée. Dans la charge utile, la clé la plus importante est le fichier 'audio', qui doit être inclus conformément aux directives spécifiques. Le fichier audio doit durer entre 30 secondes et 10 minutes. Veuillez vous référer aux directives pour les exigences détaillées. Envoyez le fichier audio et d'autres informations dans l'API sous le nom multipart/form-data. Voir l'exemple curl ci-dessous pour le nom des clés. Dans la réponse, vous recevrez des informations sur la voix créée, notamment son identifiant, son nom, son sexe, son identifiant utilisateur et son statut. La qualité de la réponse vocale personnalisée dépend directement de la qualité du fichier audio fourni. Pour vérifier l'état de votre voix personnalisée, utilisez l'API audio status API

curl --request POST  \
     --url 'https://api.immersive-fox.com/v1/voice_generation/create_personalized_voice/'  \
     --header 'X-Api-Key: <your-api-key>'  \
     --header 'Content-Type: multipart/form-data' \
      -F 'audio_file=@my_audio.mp3' \
      -F 'gender=Male' \
      -F 'name=John Calm' \
{
    "id": 362,
    "name": "John Calm",
    "gender": "Male",
    "user": 31,
    "status": "Created",
}