SenseAudio 文本转语音(TTS)服务基于千亿参数大模型,将文字瞬间转化为自然流畅、情感丰富的语音。支持多种专业音色、精细化控制及流式输出,适用于各类智能交互与内容生产场景。
基于深度学习技术,提供接近真人的语音合成体验:
面向中文场景深度优化,确保发音准确自然:
专为实时交互设计的高性能架构:
提供丰富的参数调节,满足个性化需求:
| 参数 | 说明 | 范围 | 步进值 | 典型应用 |
|---|---|---|---|---|
| speed | 语速调节 | 0.5 - 2.0 | 0.01 | 0.8 (抒情) / 1.5 (快讯) |
| vol | 音量调节 | 0.01 - 10 | 0.01 | 环境适配 / 重点强调 |
| pitch | 声调调节 | -12 - 12 | 1 | 角色变声 / 情绪微调 |
支持多种主流音频格式与采样率,适配不同终端设备:
最简单的调用方式,快速体验 TTS 能力:
{
"model": "senseaudio-tts-1.5-260319-260319",
"text": "欢迎体验 SenseAudio 极致语音服务。",
"voice_setting": {
"voice_id": "male_0004_a" // 温柔御姐音色
}
}适用于实时对话场景,大幅降低等待时间:
{
"model": "senseaudio-tts-1.5-260319-260319",
"text": "这是一个流式输出的示例文本...",
"stream": true,
"voice_setting": {
"voice_id": "male_0004_a"
}
}