语音合成及音库定制
将输入的文字通过网络发送到服务器,通过深度学习技术,合成高音质、更饱满的音色效果,效果更接近人声,同时提供多种音色选择。
支持个性化、多语种、多音色的本地化部署,满足私有化、数据隐私需求。
领先的技术方案
基于Transformer机制的高音质语音合成,综合利用声学和语言学参数,达到更自然的韵律合成目的。
灵活的接入方式
支持SDK 、流式/非流式API 、MRCP协议等各种对接形式,接口同步/异步调用
多语种多音色
男声、女声以及童声,支持中文、英文、中英文混等多语种合成,音量、语速随意调节。
自然的听感
使用海量的音频合成数据训练,生成更真实饱满音质、抑扬顿挫、富有表现力,MOS评分达到业内领先水准。
个性化的调节
支持多音字标注,手动校对发音。支持语速停顿调节,满足不同场景实际的表现需要。
定制发音人
支持真人语音克隆,人机协同对话“以假乱真”
多种集成方式
SDK:终端设备集成
API:服务端调用集成
多种输入方式
WAV
MP3....
多种采样率
8K
16K
部署方式
公有云调度
本地化部署
语音支持
支持中文、英文、中英文混读
音色支持
语音调整
音量调节
采样率
合成模式
支持基础语音合成和实时语音合成两种模式
应用场景
智能客服
与智能语音识别、自然语言处理等模块联动,实现高品质高拟人度的机器人发声,并在人机协同场景中实现声音克隆,人机声音无缝无违和对接,使得语音交互流畅自然。
咨询播报
提供新闻资讯播报场景下的特色音库,脱离人工播音,让各种终端语音设备化身专业主播,随时随地为用户播报新鲜资讯。
有声阅读
将电子教材、小说、儿童故事等文本材料,以文本形式导入离线语音合成引擎,产生完整的可重复聆听的有声读物,方便用户随时取用。
预约远程演示
联系我们预约演示