Ir para o conteúdo

Criação de Voz Personalizada

Este guia de API instruirá você sobre como criar uma voz personalizada.


Início rápido

Vamos explorar como criar uma voz personalizada para usar em modelos em massa e solicitações de vídeo em massa. 🎧✨

Criar voz personalizada

Uma voz personalizada é um clone personalizado da voz de um usuário, adaptado para refletir seu tom, sotaque e padrões de fala exclusivos. Isso permite uma experiência auditiva mais pessoal e reconhecível, adequada para aplicações que vão desde branding e tecnologias assistivas até entretenimento e uso pessoal. Esta API ajuda você a criar uma voz personalizada. Na carga útil, a chave mais importante é o arquivo 'audio', que deve ser incluído de acordo com as diretrizes específicas. O arquivo de áudio deve ter entre 30 segundos e 10 minutos de duração. Consulte as diretrizes para obter requisitos detalhados. Envie o arquivo de áudio e outras informações na API como multipart/form-data. Veja o exemplo curl abaixo para o nome das chaves. Na resposta, você receberá detalhes sobre a voz criada, incluindo seu 'id', 'name', 'gender', 'user_id' e 'status'. A qualidade da resposta de voz personalizada é diretamente influenciada pela qualidade do arquivo de áudio fornecido. Para verificar o status da sua voz personalizada, use audio status API

curl --request POST  \
     --url 'https://api.immersive-fox.com/v1/voice_generation/create_personalized_voice/'  \
     --header 'X-Api-Key: <your-api-key>'  \
     --header 'Content-Type: multipart/form-data' \
      -F 'audio_file=@my_audio.mp3' \
      -F 'gender=Male' \
      -F 'name=John Calm' \
{
    "id": 362,
    "name": "John Calm",
    "gender": "Male",
    "user": 31,
    "status": "Created",
}