一种使用激励帧中固定间隔脉冲的语言编码,长期预报器用于建立精细结构模型(音调)。
基本介绍
- 中文名:规则脉冲激励长期预测
- 外文名:regular pulse excitation-long term prediction
- 缩 写:RPE-LTP
背景
近几十年来,语音编码技术发展非常迅速。高速发展的DSP技术为语音信号处理提供了强有力的工具,使得实时实现各种各样的複杂算法成为可能。针对不同的套用,国际标準组织制定了一系列的语音压缩编码标準。其中,RPE-LTP语音编码算法是由英国、芬兰、原西德、法国、义大利、荷兰、挪威及瑞典等国组成的语音编码专家小组从最初提交的20多种语音编码方案中优选6种进行了测试,最后以MPE-LTP和RPE-LTP两种为蓝本,制定的码速率为13kbit/s的、带有长时预测环节的规则脉冲激励线性预测编码器。随着超大规模积体电路技术上取得的突破进展,集成化的DSP数位讯号处理器具有体积小、功耗低和运算速度快等诸多优点,因此非常适用于语音信号的压缩处理。目前的DSP晶片以其强大的数据处理功能而在通信和其他信号处理领域得到广泛注意,并己成为开发套用的热点技术。
概念
GSM的语音讯号处理也是属于模型式欴压缩方法,也就是说,将人的声音模型化为一个气流激发源流过气管与嘴型变化后的变化,这种方法和CD压缩音乐方式是不同的。由于这种方法是专门针对语音信息,所以能够提供高压缩比但仍能得到可理解的语音讯号。当然,因为GSM已经算是蛮旧的技术了(虽然国内的市场才刚起飞),所以GSM中的RPE-LTP(RegularPulseExcitation-LongTermPrediction)其实压缩率只是还好而已。利用这种技术,语音数据可以压缩到13Kbps,约有十倍左右。压缩过程中包含了一些类似滤波的过程,再加上向量量化(VectorQuantization)中的字典搜寻步骤。基本上,所有的编码方式中,解码的过程通常都比编码要简单地多,但对手机来说,除了要收听对方说的话之外,也得传送自己讲的话,所以语音的编解码都得做在手机之中。
特点
抽样速率为8kHz。
帧长为20ms,160个样点。每帧分为4子帧,每子帧长5ms,40个样点。
每帧编码后为260bit。即纯比特率为13kbit/s。
编码后的语音比特分为两类。第一类含182bit,它们对误码是敏感的,即这些比特中发生差错会对语音质量产生严重影响。第二类含78bit,它们的出错对接收语音的质量敏感度较低,不受保护。
分配给编解码器的最大时延为30ms。端对端的最大时延在70ms左右,其中40多毫秒分配给时隙交织和信道编解码。
为了实现语音的间断传输,可套用话音激活检测器。
每个用户的语音总比特率为270.833(kbit/s)/8=33.85kbit/s,具体分配如下:
语音编解码为13.0kbit/s。
语音的差错保护为9.8kbit/s。
慢速随路控制信道SACCH占0.95kbit/s。
保护时间、同步和均衡等为l0.lkbit/s(约占总速率的30%)。
性能
对RPE-LTP编解码器实测结果为:在较好接收信噪比条件下,RPE-LTP编解码器的话音质量(MOS)为4,时延为22.65~28ms。