Saltar a contenido

Creación de voces personalizadas

Esta guía de API le indicará cómo crear una voz personalizada.


Inicio rápido

Exploremos cómo crear una voz personalizada para usar en plantillas masivas y solicitudes de video masivas. 🎧✨

Crear voz personalizada

Una voz personalizada es un clon personalizado de la voz de un usuario, adaptado para reflejar su tono, acento y patrones de habla únicos. Esto permite una experiencia auditiva más personal y reconocible, adecuada para aplicaciones que van desde la marca y las tecnologías de asistencia hasta el entretenimiento y el uso personal. Esta API le ayuda a crear una voz personalizada. En la carga útil, la clave más importante es el archivo 'audio', que debe incluirse según las pautas específicas. El archivo de audio debe tener una duración de entre 30 segundos y 10 minutos. Consulte las directrices para conocer los requisitos detallados. Envíe el archivo de audio y otra información en la API como multipart/form-data. Vea a continuación el ejemplo de curl para el nombre de las claves. En la respuesta, recibirás detalles sobre la voz creada, incluyendo su 'id', 'nombre', 'género', 'id_usuario' y 'estado'. La calidad de la respuesta de voz personalizada depende directamente de la calidad del archivo de audio proporcionado. Para comprobar el estado de tu voz personalizada, utiliza la API de estado de audio

curl --request POST  \
     --url 'https://api.immersive-fox.com/v1/voice_generation/create_personalized_voice/'  \
     --header 'X-Api-Key: <your-api-key>'  \
     --header 'Content-Type: multipart/form-data' \
      -F 'audio_file=@my_audio.mp3' \
      -F 'gender=Male' \
      -F 'name=John Calm' \
{
    "id": 362,
    "name": "John Calm",
    "gender": "Male",
    "user": 31,
    "status": "Created",
}