`
wenzongliang
  • 浏览: 447790 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

音频编解码标准汇总及比较

 
阅读更多

PCM编码(原始数字音频信号流)

类型:Audio

制定者:ITU-T

所需频宽:1411.2 Kbps

特性:音源信息完整,但冗余度过大

优点:音源信息保存完整,音质好

缺点:信息量大,体积大,冗余度过大

应用领域:voip

版税方式:Free

备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的 WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数 bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。

 

 

WMA(Windows Media Audio)

类型:Audio

制定者:微软公司

所需频宽:320~112kbps(压缩10~12倍)

特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。

优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。

缺点:当Bitrate大于128K时,WMA音质损失过大。WMA标准不开放,由微软掌握。

应用领域:voip

版税方式:按个收取

备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质,再加上WMA有微软的Windows Media Player做其强大的后盾,所以一经推出就赢得一片喝彩。

                                                                                                           

 

PCMU(G.711U)

类型:Audio

制定者:ITU-T

所需频宽:64Kbps(90.4)

特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。

优点:语音质量优

缺点:占用的带宽较高

应用领域:voip

版税方式:Free

备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。如果网络带宽比较低,可以选用低比特速率的编码方法,如G.723或 G.729,这两种编码的方法也能达到传统长途电话的音质,但是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。如果带宽足够并且需要更好的语音质量,就使用PCMU 和 PCMA,甚至可以使用宽带的编码方法G722(64kbps),这可以提供有高保真度的音质。

                                                                                                             

 

PCMA(G.711A)

类型:Audio

制定者:ITU-T

所需频宽:64Kbps(90.4)

特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。

优点:语音质量优

缺点:占用的带宽较高

应用领域:voip

版税方式:Free

备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。如果网络带宽比较低,可以选用低比特速率的编码方法,如G.723或 G.729,这两种编码的方法也能达到传统长途电话的音质,但是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。如果带宽足够并且需要更好的语音质量,就使用PCMU 和 PCMA,甚至可以使用宽带的编码方法G722(64kbps),这可以提供有高保真度的音质。

                                                                                                           

 

ADPCM(自适应差分PCM)

类型:Audio

制定者:ITU-T

所需频宽:32Kbps

特性:ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:

       ①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;

       ②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。

优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)

缺点:声音质量一般

应用领域:voip

版税方式:Free

备注:ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对 16bit (或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的 16bit 数据以 4bit 存储, 所以压缩比 1:4. 而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。

                                                                                                              

 

LPC(Linear Predictive Coding,线性预测编码)

类型:Audio

制定者:

所需频宽:2Kbps-4.8Kbps

特性:压缩比大,计算量大,音质不高,廉价

优点:压缩比大,廉价

缺点:计算量大,语音质量不是很好,自然度较低

应用领域:voip

版税方式:Free

备注:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。如:线性预测编码(LPC)及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。

                                                                                                        

 

CELP(Code Excited Linear Prediction,码激励线性预测编码)

类型:Audio

制定者:欧洲通信标准协会(ETSI)

所需频宽:4~16Kbps的速率

特性:改善语音的质量:

       ① 对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量;

       ②用分数延迟改进基音预测,使浊音的表达更为准确,尤其改善了女性语音的质量;

       ③ 使用修正的MSPE准则来寻找 “最佳”的延迟,使得基音周期延迟的外形更为平滑;

       ④根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量;       ⑤ 使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。

       结论:

       ① CELP算法在低速率编码环境下可以得到令人满意的压缩效果;

       ②使用快速算法,可以有效地降低CELP算法的复杂度,使它完全可以实时地实现;

       ③CELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,尤其是背景噪声存在时更为重要。

优点:用很低的带宽提供了较清晰的语音

缺点:

应用领域:voip

版税方式:Free

备注:1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。CELP 码激励线性预测编码是Code Excited Linear Prediction的缩写。CELP是近10年来最成功的语音编码算法。

       CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。

       CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。CELP (Code-Excited Linear Prediction) 这是一个简化的 LPC 算法,以其低比特率著称 (4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。CELP是一种在中低速率上广泛使用的语音压缩编码方案。

                                                                                                          

 

G.711

类型:Audio

制定者:ITU-T

所需频宽:64Kbps

特性:算法复杂度小,音质一般

优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)

缺点:占用的带宽较高

应用领域:voip

版税方式:Free

备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

                                                                                                            

 

G.721

类型:Audio

制定者:ITU-T

所需频宽:32Kbps

特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1的压缩比。

优点:压缩比大

缺点:声音质量一般

应用领域:voip

版税方式:Free

备注:子带ADPCM(SB-ADPCM)技术。G.721标准是一个代码转换系统。它使用ADPCM转换技术,实现64 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换。

                                                                                                             

 

G.722

类型:Audio

制定者:ITU-T

所需频宽:64Kbps

特性:G722能提供高保真的语音质量

优点:音质好

缺点:带宽要求高

应用领域:voip

版税方式:Free

备注:子带ADPCM(SB-ADPCM)技术

 

G.723(低码率语音编码算法)

类型:Audio

制定者:ITU-T

所需频宽:5.3Kbps/6.3Kbps

特性:语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder。达到ITU-TG723要求的语音质量,性能稳定。可用于IP电话语音信源编码或高效语音压缩存储。

优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定。

缺点:声音质量一般

应用领域:voip

版税方式:Free

备注:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。 G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP电话等系统中。其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。

                                                                                                             

 

G.723.1(双速率语音编码算法)

类型:Audio

制定者:ITU-T

所需频宽:5.3Kbps(22.9)

特性:能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的。G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。

优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。

缺点:语音质量一般

应用领域:voip

版税方式:Free

备注:G.723.1算法是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法,其目标应用系统包括H.323、H.324等多媒体通信系统 。目前该算法已成为IP电话系统中的必选算法之一。

                                                                                                               

 

G.728

类型:Audio

制定者:ITU-T

所需频宽:16Kbps/8Kbps

特性:用于IP电话、卫星通信、语音存储等多个领域。G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。

优点:后向自适应,采用自适应后置滤波器来提高其性能

缺点:比其它的编码器都复杂

应用领域:voip

版税方式:Free

备注:G.728 16kb/s短延时码本激励线性预测编码(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP电话、卫星通信、语音存储等多个领域。16 kbps G.728低时延码激励线性预测。

       G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体。G.728是LD-CELP编码器,它一次只处理5个样点。对于低速率(56~128 kbps)的综合业务数字网(ISDN)可视电话,G.728是一种建议采用的语音编码器。由于其后向自适应特性,因此G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。

                                                                                                             

 

G.729

类型:Audio

制定者:ITU-T

所需频宽:8Kbps

特性:在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中,包括IP电话、无线通信、数字卫星系统和数字专用线路。

       G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。

       G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。

优点:语音质量良,应用领域很广泛,采用了矢量量化、合成分析和感觉加权,提供了对帧丢失和分组丢失的隐藏处理机制

缺点:在处理随机比特错误方面性能不好。

应用领域:voip

版税方式:Free

备注:国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。

                                                                                                               

 

G.729A

类型:Audio

制定者:ITU-T

所需频宽:8Kbps(34.4)

特性:复杂性较G.729低,性能较G.729差。

优点:语音质量良,降低了计算的复杂度以便于实时实现,提供了对帧丢失和分组丢失的隐藏处理机制

缺点:性能较G.729差

应用领域:voip

版税方式:Free

备注:96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。

                                                                                                       

 

GIPS

类型:Audio

制定者:瑞典Global IP Sound公司

所需频宽:

特性:GIPS技术可根据带宽状况自动调节编码码率,提供低码率高质量的音频。GIPS的核心技术(网络自适应算法,丢包补偿算法和回声消除算法)可很好地解决语音延迟与回声问题,带来完美音质,提供比电话还清晰的语音通话效果。

优点:很好地解决语音延迟与回声问题,带来完美音质,提供比电话还清晰的语音通话效果

缺点: 不是Free

应用领域:voip

版税方式:每年支付一笔使用权费用

备注:GIPS音频技术是由来自瑞典的全球顶尖的语音处理高科技公司--"GLOBAL IP SOUND"提供的专用于互联网的语音压缩引擎系统。GIPS技术可根据带宽状况自动调节编码码率,提供低码率高质量的音频。GIPS的核心技术(网络自适应算法,丢包补偿算法和回声消除算法)可很好地解决语音延迟与回声问题,带来完美音质,提供比电话还清晰的语音通话效果。

                                                                                                          

 

Apt-X

类型:Audio

制定者:Audio Processing Technology 公司

所需频宽:10Hz to 22.5 kHz,56kbit/s to 576 kbit/s(16 bit 7.5 kHz mono to 24-bit, 22.5kHz stereo)

特性:主要用于专业音频领域,提供高品质的音频。其特点是:

       ①采用4:1:4的压缩与放大方案;

       ②硬件低复杂度;

       ③极低的编码延迟;

       ④由单芯片实现;

       ⑤单声道或立体声编解码;

       ⑥只需单设备即可实现22.5kHz的双通道立体声;

       ⑦高达48kHz的采样频率;

       ⑧容错性好;

       ⑨完整的AUTOSYNC"编解码同步方案;

       ⑩低功率消耗

优点:高品质的音频,硬件复杂度低,设备要求低

缺点:不是Free

应用领域:voip

版税方式:一次性付费

备注:子带ADPCM(SB-ADPCM)技术

                                                                                                           

 

NICAM(Near Instantaneous Companded Audio Multiplex 准瞬时压扩音频复用)

类型:Audio

制定者:英国BBC广播公司

所需频宽:728Kbps

特性:应用范围及其广泛,可用它进行立体声或双语广播

优点:应用范围及其广泛,信噪比高,动态范围宽、音质同CD相媲美,故名丽音,因此NICAM又称为丽音

缺点:不是Free,频宽要求高

应用领域:voip

版税方式:一次性付费

备注:NICAM也称丽音,它是英文Near-Instantaneously Companded Audio Multiplex的缩写,其含义为准瞬时压扩音频复用,是由英国BBC广播公司开发研究成功的。

       通俗地说NICAM技术实际上就是双声道数字声技术,其应用范围及其广泛,最典型的应用便是电视广播附加双声道数字声技术,利用它进行立体声或双语广播,以充分利用电视频道的频谱资源。这是在常规电视广播的基础上无需增加许多投资就可以实现的。在进行立体声广播时,它提高了音频的信号质量,使其接近CD的质量。而且还可以利用NICAM技术进行高速数据广播及其他数据传输的增殖服务,这在当今的信息化社会中似乎就显得尤为重要了!

                                                                                                       

 

MPEG-1 audio layer 1

类型:Audio

制定者:MPEG

所需频宽:384kbps(压缩4倍)

特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。

优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)

缺点:频宽要求较高

应用领域:voip

版税方式:Free

备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:

--层1(Layer 1):编码简单,用于数字盒式录音磁带

--层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等

--层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍

                                                                                                             

 

MUSICAM(MPEG-1 audio layer 2,即MP2)

类型:Audio

制定者:MPEG

所需频宽:256~192kbps(压缩6~8倍)

特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。

优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)

缺点:

应用领域:voip

版税方式:Free

备注:同MPEG-1 audio layer 1

 

MP3(MPEG-1 audio layer 3)

类型:Audio

制定者:MPEG

所需频宽:128~112kbps(压缩10~12倍)

特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。MP3是在综合MUSICAM和ASPEC 的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。

优点:压缩比高,适合用于互联网上的传播

缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失

应用领域:voip

版税方式:Free

备注:同MPEG-1 audio layer 1

 

MPEG-2 audio layer

类型:Audio

制定者:MPEG

所需频宽:与MPEG-1层1,层2,层3相同

特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。

优点:支持5.1声道和7.1声道的环绕立体声

缺点:

应用领域:voip

版税方式:按个收取

备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。

                                                                                                      

 

AAC(Advanced Audio Coding,先进音频编码)

类型:Audio

制定者:MPEG

所需频宽:96-128 kbps

特性:AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道,以及15路数据。它可同时传送16套节目,每套节目的音频及数据结构可任意规定。

       AAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48 个主要音频通道,16 个低频增强通道,16 个集成数据流, 16 个配音,16 种编排。

优点:支持多种音频声道组合,提供优质的音质

缺点:

应用领域:voip

版税方式:一次性收费

备注:AAC于1997年形成国际标准ISO 13818-7。先进音频编码(Advanced Audio Coding--AAC)开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。

       在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地,这个标准是不兼容MPEG-1的,因此被称为MPEG-2 AAC。换句话说,从表面上看,要制作和播放AAC,都需要使用与MP3完全不同的工具。

                                                                                                            

 

Dolby AC-3

类型:Audio

制定者:美国杜比公司

所需频宽:64kbps

特性:提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。

优点:环绕立体声,信息损失很少,细节丰富,具有真正的立体声效果

缺点:

应用领域:voip

版税方式:按个收取

备注:杜比数字AC-3(Dolby Digital AC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。

                                                                                                           

 

ASPEC(Audio Spectral Perceptual Entropy Coding)

类型:Audio

制定者:AT&T

所需频宽:64kps

特性:音频质量获得显著改善,不过计算复杂度也大大提高,而且在回响、低码率时声音质量严重下降。

优点:音频质量获得显著改善

缺点:计算复杂度的提高。块边界影响、预计算复杂度的提高。回响、低码率时声音质量严重下降

应用领域:voip

版税方式:按个收取

备注:变换压缩技术

                                                                                                  

 

PAC(Perceptual Audio Coder)

类型:Audio

制定者:AT&T

所需频宽:64kps

特性:音频质量获得显著改善,不过在回响、低码率时声音质量严重下降。

优点:音频质量获得显著改善

缺点:块边界影响、预回响、低码率时声音质量严重下降

应用领域:voip

版税方式:按个收取

备注:变换压缩技术

                                                                                                   

 

HR

类型:Audio

制定者: 飞利浦

所需频宽:8Kbps

特性:以增加GSM网络容量为目的,但是会损害语音质量;由于现在网络频率紧缺,一些大的运营商已经在大城市密集地带开通此方式以增加容量。

优点:系统容量大

缺点:语音质量差

应用领域:GSM

版税方式:按个收费

备注:HF半速率,是一种GSM语音编码方式。

                                                                                                

 

FR

类型:Audio

制定者:飞利浦

所需频宽:13Kbps

特性:是一般的GSM手机的通信编码方式,可以获得达到4.1左右Qos的语音通信质量(国际电联规定语音通信质量Qos满分为5)

优点:语音质量得到了提高

缺点:系统容量降低

应用领域:GSM

版税方式:按个收费

备注:FR全速率,是一种GSM语音编码方式。

                                                                               

 

EFR

类型:Audio

制定者:飞利浦

所需频宽:13Kbps

特性:用于GSM手机基于全速率13Kbps的语音编码和发送,可以获得更好更清晰的语音质量(接近Qos4.7),需要网络服务商开通此项网络功能,手机才能配合实现。

优点:音质好

缺点:需要网络服务商开通此项网络功能,且系统容量降低

应用领域:GSM

版税方式:按个收费

备注:EFR增强型全速率,一种GSM网络语音的编码方式。

                                                                                                       

 

GSM-AMR(Adaptive Multi-Rate)

类型:Audio

制定者:飞利浦

所需频宽:8Kbps(4.75 Kbps~12.2 Kbps)

特性: 可以对语音进行替换和消音,平滑噪音,支持间断式传输,对语音进行动态侦查。能在各种网络条件下提供优质的语音效果。

优点:音质出色

缺点:

应用领域:GSM

版税方式:按个收费

备注:GSM-ASM是一种广泛使用在GPRS和W-CDMA网络上的音频标准。在规范ETSI GSM06.90中对GSM-AMR进行了定义。AMR语音编码是GSM 2+和WCDMA的默认编码标准,是第三代无线通讯系统的语音编码标准。GSM-AMR标准基于ACELP(代数激励线性预测)编码。它能在广泛的传输条件下提供高品质的语音效果。

                                                                                                  

 

EVRC(Enhanced Variable Rate Coder,增强型可变速率编码器)

类型:Audio

制定者:美国Qualcomm通信公司(即高通)

所需频宽:8Kbps或13Kbps

特性:支持三种码率(9.6 Kbps, 4.8 Kbps 和 1.2 Kbps),噪声抑制,邮件过滤。能在各种网络条件下提供优质的语音效果。

优点:音质出色

缺点:

应用领域:CDMA

版税方式:按个收费

备注:EVRC编码广泛使用于CDMA网络。EVRC标准遵循规范TIA IS-127的内容。EVRC编码基于RCELP(松弛码激励线性预测)标准。该编码可以以Rate 1(171bits/packet),Rate 1/2(80bits/packet)或是Rate 1/8(16bits/packet)的容量进行操作。在要求下,它也能产生空包(0bits/packet)。

                                                                                                        

 

QCELP(QualComm Code Excited Linear Predictive,受激线性预测编码)

类型:Audio

制定者:美国Qualcomm通信公司(即高通)

所需频宽:8k的语音编码算法(可工作于4/4.8/8/9.6Kbps等固定速率上,而且可变速率地工作于800Kbps~9600Kbps之间)

特性:使用适当的门限值来决定所需速率。QCELP是一种8k的语音编码算法(可以在8k的速率下提供接近13k的话音压缩质量)。这是一种可变速率话音编码,根据人的说话特性(大家应该能够体会我们日常的沟通和交流时并不是一直保持某种恒定的方式讲话,有间断、有不同的声音频率等都是人的自然表达)而采取的一种优化技术。

优点:话音清晰、背景噪声小,系统容量大

缺点: 不是Free

应用领域:CDMA

版税方式:每年支付一笔使用权费用

备注:QCELP,即QualComm Code Excited Linear Predictive(QualComm受激线性预测编码)。美国Qualcomm通信公司的专利语音编码算法,是北美第二代数字移动电话(CDMA)的语音编码标准(IS95)。这种算法不仅可工作于4/4.8/8/9.6kbit/s等固定速率上,而且可变速率地工作于 800bit/s~9600bit/s之间。QCELP算法被认为是到目前为止效率效率最高的一种算法,它的主要特点之一,是使用适当的门限值来决定所需速率。I‘1限值懈景噪声电平变化而变化,这样就抑制了背景噪声,使得即使在喧闹的环境中,也能得到良好的话音质量, CDMA8Kbit/s的话音近似GSM 13Mbit/s的话音。CDMA采用QCELP编码等一系列技术,具有话音清晰、背景噪声小等优势,其性能明显优于其他无线移动通信系统,语音质量可以与有线电话媲美。 无线辐射低。

分享到:
评论

相关推荐

    音频编解码汇总

    各种音频编解码总结,比较。包括pcm,sbc,MP3等有损无损编码的比较

    音频采集回放源代码汇总

    音频采集开发,不错的音频采集、编解码、回放程序。

    音视频编码格式汇总

    汇总互联网上所有主流的音频、视频编解码格式、音视频文件格式; 对常见音视频技术做简要介绍;

    RTE 2021 实时互联网大会演讲PPT汇总(38份).zip

    基于深度学习的音频编解码的实现与落地挑战 实时语音质量监控 十、Product channel论坛 声网云市场 & 实时互联网生态 直播场景如何解决 CDN 三大痛点 K 歌互动新玩法,再造 APP 增长动能 三行代码,任何应用高质量...

    javasnmp源码-awesome-go:一个专门收集GO语言相关的工具库

    awesome-go(GO相关资料的收集汇总) 2017-11-20 10:15:20 -0800 go awesome-go 一个GO资源列表,包括第三方库、框架和软件清单 目录 - 音频和音乐 Audio and Music 操作音频的库。 - 一款GO语言实现的本地FLAC解码器。...

    【4周年庆】STM32F746G-DISCO开发板一元购-电路方案

    SAI音频编解码器 音频线路输入和线路输出插座 立体声扬声器输出 两个ST MEMS麦克风 SPDIF RCA输入连接器 两个按钮(用户和复位) 128Mb四路-SPI闪存存储器. 128Mb SDRAM (可接受64Mb) 连接器, 用于微型SD卡. RF-EEPROM...

    NLP资源库.zip

    用来做中文OCR的Python3包、中文人物关系知识图谱项目、中文nlp竞赛项目及代码汇总、中文字符数据、speech-aligner: 从“人声语音”及其“语言文本”产生音素级别时间对齐标注的工具、AmpliGraph: 知识图谱表示学习...

    几乎最全的中文NLP资源库.zip

    用来做中文OCR的Python3包、中文人物关系知识图谱项目、中文nlp竞赛项目及代码汇总、中文字符数据、speech-aligner: 从“人声语音”及其“语言文本”产生音素级别时间对齐标注的工具、AmpliGraph: 知识图谱表示学习...

    数字机顶盒加自办节目 接收系统设计方案 .doc

    第九章、系统选用设备及价格汇总 一:协商价350---450每个频道(包含所有材料费及利润) 序号 名称及型号 数 量 单 价 金 额 产地及公司名称 1 四路固定调制器(SK-4860FM) 10 深圳鼎盛威 2 16路混合器(SK-16)...

    易语言模块大全汇总批量下载

    2005-10-21 15:30 14579 3539 易语言模块大全\Base64编解码.ec 2005-07-27 11:12 8525 2416 易语言模块大全\BASE64编解码模块.ec 2003-08-14 07:57 6687 2074 易语言模块大全\Bios信息.ec 2005-10-21 15:30 2264 905...

    Firefly-RK3288开发板资料汇总,附硬件/Android源代码/固件等等-电路方案

    Firefly-RK3288开发板拥有强大的多线程运算能力、图形处理能力以及硬件解码 能力,而且支持Android和Ubuntu双系统。Firefly-RK3288系列除了拥有强大性能外,还拥有丰富的外部接口:HDMI2.0、MIPI、LVDS、EDP、SPDIF、...

    1000个【易语言模块大全汇总批量下载】

    2005-10-21 15:30 14579 3539 易语言模块大全\Base64编解码.ec 2005-07-27 11:12 8525 2416 易语言模块大全\BASE64编解码模块.ec 2003-08-14 07:57 6687 2074 易语言模块大全\Bios信息.ec 2005-10-21 15:30 2264 905...

Global site tag (gtag.js) - Google Analytics