1 概述
语音技术包括语音识别(speech recognition)、语音合成(speech synthesis)及文字转发音TTS(TextToSpeech)。目前,语音合成技术不管是在研究方面,还是在应用方面,都处在一个成熟的发展期,有的已经投入了实际的应用。以TTS技术为例,这种技术及相关产品得到了很多厂商的推广,如Microsoft推出的纯软件性质的TTS处理软件包(即SAPI SDK软件包);华邦电子推出的语音处理芯片WTS701及ISD系列语音处理产品等。
SD771D是台湾翔音科技公司推出的单芯片实时变音处理器,以真人发音为样本,可将输出的语音进行实时变调处理(如升高、降低),还可实时地将男女声的语音相互转换。利用它可以制作多样化的虚拟人物、创造多变的声讯环境、更好的娱乐效果。
2 SD771的特点及工作原理
2.1 SD771的特点
◇ 内建麦克风放大电路;
◇ 内建32 Ω喇叭驱动电路;
◇ 内建数字音量控制(15 levels)电路;
◇ 可选择数字或模拟输入模式来改变音调;
◇ 数字输入模式为15种音调变化;
◇ 模拟输入模式为180种音调变化;
◇ 内建16位ΔΣ A/D及D/A转换器;
◇ 内建抗噪声数字滤波器;
◇ 工作电压范围为DC+3.6~+6.0 V;
◇ 工作电流为25 mA;
◇ 能立即将说话者的声音转换成不同的声调输出(如音调变高、变低,男声与女声的相互转换)。
图1是SD771D的内部结构原理,BPF(Band Pass Filter)和LPF(Low Pass Filter)是抗噪声数字滤波器。图1中GAIN_INC是音量调高按钮,GAIN_DEC是音量调低按钮,PITCH_INC是音调升调按钮,PITCH_DEC音调降调按钮,ORIG是还原音调按钮,RESET是复位按钮。以上介绍的所有这些按钮均为低电平有效,每个键按下的持续时间必须大于10 ms,前后两个不同按钮按下的时间间隔必须大于60 ms,如图2所示。PITCH_VR是类比模式改变音调的输入端,XI和XO用于连接系统晶振电路的输入。
图1 SD771D的内部结构原理
图2 前后两次按键相隔时间的时序
2.2 SD771D工作原理及典型应用电路
(1) 改变声音定调的等级
从麦克风输入的声音经过SD771D处理后由DAC发送出去。SD771D同时发出两路信号,一路为数字信号,另一路为模拟信号,并用来改变声音定调的等级。当PITCH_VR的电平小于0.1 V时,即接通数字信号通道,断开模拟信号通道。数字信号通道和模拟信号通道声音定调等级的调控是相互独立的。
(2) 数字信号通道
数字信号通道是由PITCH_INC(音调的升调按钮)或PITCH_DEC(音调的降调按钮)来控制的。当PITCH_VR的电平小于0.1 V时,声音定调的等级就由PITCH_INC或PITCH_DEC控制。此时SD771D会反复检查PITCH_INC和PITCH_DEC的状态。当这两个按钮中的一个按钮有一个低电平脉冲出现时,SD771D马上会改变声音定调的等级。声音定调的等级有升调档和降调档各7等级,包括无键按下时的正常声调等级,共15级,如表1所列。
表1 声调的等级及音调变化比率对应表
(3) 模拟信号通道
SD771D内部有一个8位的模数转换器(ADC),输入的模拟信号电压通常由PITCH_VR端来进行声音定调的等级控制。如果PITCH_VR上的电压在0.3~2.2 V之间,那么,这个电压范围的值会被分成180个级别,并且每一个级别对应一个音调的比率。
图3是SD771D的典型应用电路。
图3 SD771D的典型电路
结语
SD771D可将输出的语音进行实时变调(如升高、降低),并对这种变调技术按声音定调的等级来进行处理,还可实时地将男女声的语音相互转换。