TTS 是 Text to Speech(文本转语音)的首字母缩写词。 它是一种机器说话技术,或者说语音合成技术。 它是人机对话的一部分,让机器说话,旨在智能地将文本转换为自然语音。
文本转语音的步骤
-
文本处理
将文本转换为音素序列,并标注每个音素的起止时间、频率变化等信息,作为预处理的重要步骤,涉及词性区分、缩写处理等诸多值得研究的问题。 -
语音合成
基于神经网络将音素序列等信息转换为语音。
文本转语音的应用场景
-
机器人语音
在客服机器人、服务机器人等场景,可以结合语音识别、自然语言处理等模块,实现高品质的机器人语音,让人机交互更加流畅自然。 -
制作有声读物
将电子课本、小说等文本素材以文本文件的形式导入语音合成引擎,生成完整、可重复阅读的有声读物或有声小说,方便用户随时使用。 -
语音播报
在语音导航应用和新闻类APP中,语音合成可以快速生成高质量的广播音频,方便用户在走路或开车等不方便阅读消息时,利用音频及时获取信息。