线性预测编码

来自EEWiki.

跳转到: 导航, 搜索

线性预测编码(LPC),是一种合成语音技术,通过分析原始语音来建立一个随时间变化的数字滤波器,并且以此来合成人类的语音。

从1978年,TI 研制出第一片语音信号合成芯片起,TI就凭借这一技术在该领域成为佼佼者。

线性预测编码(linear predictive coding,LPC)是一种非常重要的编码方法。从原理上讲,LPC是通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端使用LPC分析得到的参数,通过话音合成器重构话音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型。时变线性滤波器既当作预测器使用,又当作合成器使用。分析话音波形时,主要是当作预测器使用,合成话音时当作话音生成模型使用。随着话音波形的变化,周期性地使模型的参数和激励条件适合新的要求。

线性预测器是使用过去的P个样本值来预测现时刻的采样值 image:bk063726l-1.jpg

如图所示,预测值可以用过去P个样本值的线性组合来表示:

image:bk063726l-2.jpg

为方便起见,式中采用了负号。残差误差(residual error)即线性预测误差为

image:bk063726l-3.jpg

这是一个线性差分方程。

在给定的时间范围里,如

image:bk063726l-4.jpg

这样可使预测得到的样本值更精确。通过求解偏微分方程,可找到系数image:bk063726l-5.jpg的值。如果把发音器官等效成滤波器,这些系数值就可以理解成滤波器的系数。这些参数不再是声音波形本身的值,而是发音器官的激励参数。在接收端重构的话音也不再具体复现真实话音的波形,而是合成的声音。

image:bk063726l-6.jpg

个人工具箱
导航
支持单位