回声抑制/消除
来自EEWiki.
目录 |
背景:
与传统电话相比,因特网上进行语音的实时传输,有其致命的弱点,那就是语音质量较差,影响因特网语音质量的因素是多方面的,最关键的因素之一是回声的影响。因此,要提高因特网的语音质量,就必须在因特网的语音传输过程中进行消回声的处理,也就是说,IP电话网关作为因特网的语音接入设备,几须具有回声的消除功能。由于因特网的语音传输是采用分组交换技术实现的一种全新的电信业务,传送的语音信号要经过编码、压缩、打包等一系列处理,这不仅造成回声路径的延迟较大,而且延迟抖动也较大。因此,在因特网的语音传输过程中,回声问题显得尤其突出,并具有如下特点。
1、 回声源复杂
在传统电话系统中,存在着一种所谓的"电路回击"。该回声产生的主要原回是在系统中存在2-4线的转换。完成2-4转换的混合器因阻抗匹配,造成"泄漏",从而导致了"电路回声"。从因特网IP电话网关的连接方式可以看出,IP电话网关一端连接PSTN,另一端连接因特网。
尽管电路回声产生于PSTN中,但同样会传至于IP电话网关,是因特网语音传输中的回声源之一,因特网语音传输中的第二种回声源是所谓的"声学回声"。声学回声是指扬声器播放出来的声音被麦克风拾取后发回远端,这就使得远端谈话者能听到自己的声音。声学回声又分为直接回声和间接回声。直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风。这种回声延迟最短,它与远端说话者的语音能量,扬声器与话筒之间的距离、角度、扬声器的播放音量以及话筒的拾取灵敏度等因素相关。间接回声是指扬声器播放的声音经不同的路径一次或多次反射后进入麦克风所产生的回声集合。因为周围物体的变动,例如人的走动等,都会改变回声的返回路径,因为这种回声的特点是多路径、时变的。另外,背景噪声也是产生回声的因素之一。
2、 回声路径的延迟大
在因特网中的语音传输中,延迟来源有三种:压缩延迟、分组传输延迟和处理延迟。语音压缩延迟是产生回声的主要延迟,例如在G.723.1标准中,压缩一帧(30ms)的最大延迟是37.5ms。分组传输延迟也是一个很重要的来源,测试表明,端到端的最大传输延迟可达250ms以上。处理延迟是指语音包的封装时延及其缓冲时延等。
3、 回声路径的延迟抖动大
在因特网的语音传输过程中,由于回声路径、语音压缩时延、分组传输路由等存在诸多不确定因素,而且波动范围较大,一般在20~50ms之间。
发展情况:
随着消回声技术的发展,当前回声消除研究的重点,已由"电路回声"的消除,转向了"声学回声"。
互联网在全球的普及导致了创新和应用的爆炸性发展。这个趋势还将继续(主要由消费需求推动),因此电信运营商注定要在数据通信占主导的现代网络基础设施中支持话音业务。
尽管数据通信现在已经超过了话音业务,服务提供商的主要收入仍然来自传统的话音业务。为了保护这个收入来源,电信运营商必须保持当前话音业务的质量,并且创建支持各种新型数据业务的网络。下一代网络需要在这些新型业务到来时,能够利用这些业务的优点。
话音业务在无线、有线、电路交换以及分组交换网络中,均至关重要,而话音质量作为一个保持因素,是一项基本要求。
相关理论:
什么是回声?
回声是由于声波反射导致的声音重复。在电信网络中,如果说话人听到自己讲话的延迟后的声音,则存在回声问题。
呼叫者是否听到回声,依赖于电路中网络延迟的程度和回声幅度(音量)。端到端延迟(也称为"等待时间")是最重要的因素,它是从呼叫的一端产生声音到声音被另一端接收所经历的时间。往返延迟是回声反射所花费的时间,它大约是端到端延迟的两倍。 如果往返延迟超过10毫秒(ms),则人耳就会注意到回声的存在,因而导致话音质量下降。
回声源
在电信网络中存在两种类型的回声:电气回声和声学回声。
电气回声
电气回声是由于模拟本地环中的阻抗不匹配造成的。举例来说,如果使用了混合规格的电线,或者存在未使用的分接头和负载线圈(用于延长信号传输距离的装置),则会产生电气回声。在公共交换电话网(PSTN)中,电气回声主要是由于转换器造成的。 转换器将2线本地环分接成两对独立的线。一对用于发送路径,另一对用于接收路径。转换器传递了大部分信号。但是,2线环路与4线设备之间的差别导致了接收信号的一小部分"泄漏"到发送路径上。由于远端在接收信号的同时又返回了一部分信号,因此说话者听到自己说话的回声。
电气回声在本地呼叫上不成为问题,这是因为相对较短的路径不会产生严重的时间延迟。
在今天的数字网络中,2线分接成4线的位置通常也是模/数转换的位置。无论转换器或者模/数转换是在同一台设备还是两台不同设备中进行,2线-4线转换造成阻抗不匹配,因而导致回声。
声学回声
声学回声也称为"多径回声",它是由电话机扬声器与话筒之间的声学耦合问题导致的。在无线电话和有线电话,或者在扬声器电话的免提设备中都会出现这种回声。这些问题是由低质量的电话听筒、周围环境中的回声(例如在汽车、旅馆或工厂中)或者电话听筒串话造成的。
回声传播时间
如前面所讨论的,当话音电路的往返延迟大于20ms时,就会产生回声问题。在PSTN中,大部分延迟是由传输媒介的传播时间导致的,传输媒介也就是长途中继线中的传输设备和传输器件。这个延迟被称为"网络延迟"或"传播延迟"。 传输系统的速度是决定是否能感觉到回声的重要因素。这就是在本地PSTN呼叫中通常听不到回声的原因,尽管实际上本地呼叫确实存在由于转换器和其他因素导致的电气回声。
在分组网络话音的情况下,还有其他几种重要延迟(除了网络延迟之外)来源,包括:处理延迟(例如分组、压缩/解压等)、交换/路由选择延迟以及缓存延迟。由于存在这些附加的延迟来源,在电路交换网络中可能听不到的回声在等效的分组网络中会引人注意。因此,电路交换网络与分组网络之间的连接需要进行高质量的回声消除。 什么是回声消除?
回声消除器是一种在来自远端的信号在本地端设备发出回声后检测并消除其回声的装置。
在电路交换长途网络中,回声消除器位于与长途网络连接的大城市中心局。这些回声消除器消除由长途网络延迟造成的明显的电气回声。
当话音呼叫延迟超过可接受的界限(例如在一个长途呼叫中),电信运营商将在呼叫的两端提供两个回声消除器。每个消除器保护远端,防止其接收到在本地端产生并且通过网络返回的任何回声。
回声消除器"指向"回声源(转换器)的方向,并且远离从该回声消除器的工作中受益的一端。
回声消除器包含三个主要功能组件:
• 自适应滤波器 (AF)
• 非线性处理器 (NLP)
• 音调检测器
自适应滤波器由一个回声估计器和一个减法器构成。回声估计器监视接收路径并动态构建一个针对回声产生线路的数学模型。这个线路模型与接收路径上的话音流进行卷积。这样得到一个回声的估计值,并被输入给减法器。这就从发送路径线路中减去了回声的线性部分。当通过自适应滤波器建立一个线路估计时,回声消除器就"收敛"于回声。
图2描述了电路交换网络中一个典型的数字式回声消除器。当来自远端的话音通过其接收路径(从Rin 到 Rout)时,回声消除器监视该话音。它使用这些信息估计回声,并从发送路径(从Sin 到 Sout)中减去这个估计值。
回声控制需要具备对回声传播时间(反射持续时间)的判断能力以及处理不同回声长度的能力。尾部的长度主要依赖于回声消除器与回声发生点(称为"回声点")之间信号传输的端到端延迟,以及回声传播时间。剩余回声是信号通过自适应滤波器后残留的回声。
非线性处理器计算剩余回声,除去所有低于某个阈值的信号,并且用听起来如同没有回声的原始背景噪声的仿真背景噪声替代这些信号。
回声消除器还包含一个音调检测器,它使得用户设备可以使用特定音调关闭回声消除器。举例来说,在数据和传真传输过程中必须关闭回声消除功能。大家熟悉的在调制解调器开始连接时出现的高音调告诉回声消除器在该通信流中停止工作。
回声消除遇到的难题
设备必须解决下列难题才能进行稳固的回声消除:避免发散、处理含混话音(double talk)、防止削波以及避免烦人的背景噪声改变。
避免发散。发散是自适应滤波器的问题,如果在使用数学算法时没有找到合适的线路模型解决方案,就会出现发散。
在特定的线路条件下,某些算法可能发散以至于破坏信号,甚至在线路中添加回声。好的回声消除器能够在几乎所有线路条件下避免发散。


