跳转至

个性化语音创建

本 API 指南将指导您如何创建个性化语音。


快速入门

让我们探索如何创建个性化语音以用于批量模板和批量视频请求。 🎧✨

创建个性化语音

个性化语音是用户语音的定制克隆,旨在反映其独特的语调、口音和语音模式。这可以提供更个性化和可识别的听觉体验,适用于从品牌和辅助技术到娱乐和个人用途等应用。此 API 可帮助您创建个性化语音。在有效载荷中,最重要的键是 'audio' 文件,应根据特定指南将其包含在内。音频文件的长度必须在 30 秒到 10 分钟之间。有关详细要求,请参阅指南。将音频文件和 api 中的其他信息作为 multipart/form-data 发送。有关键名称,请参阅下面的 curl 示例。在响应中,您将收到有关所创建语音的详细信息,包括其'id''name''gender''user_id''status'。个性化语音响应的质量直接受所提供音频文件质量的影响。要检查您的个性化语音的状态,请使用 音频状态 API

curl --request POST  \
     --url 'https://api.immersive-fox.com/v1/voice_generation/create_personalized_voice/'  \
     --header 'X-Api-Key: <your-api-key>'  \
     --header 'Content-Type: multipart/form-data' \
      -F 'audio_file=@my_audio.mp3' \
      -F 'gender=Male' \
      -F 'name=John Calm' \
{
    "id": 362,
    "name": "John Calm",
    "gender": "Male",
    "user": 31,
    "status": "Created",
}