MP3 (和全“损失”数位压缩) 音频增强和复原技术

从数位压缩中恢复优质真空管声音

---------------
    BBE MP (最小化多项非线性饱和)技术通过数位压缩恢复和增强谐波损失,进而提高经数位压缩处理的音频(如MP3)音效。BBE MP从原始资料中再生声音,因而有效地恢复声音的温暖感、细腻感和细微差别。

    通过过取样技术,BBE MP将MP3/WMA档的高频段扩展到CD级频段,将CD的频段扩展到超级CD或DVD频段。
---------------

1. 产品适用面广

    MP3播放机、MD播放机、CD播放机、身历声耳机、微型组合音响、携带型身历声、车载身历声、TV、卫星无线设备 (XM、天狼星) 、网路电台、电话机等等。

2. 适用的技术

    全数位压缩(损失压缩) 音频和CD (PCM)、MPEG层音频(MP1、MP2、MP3)、MP3PRO、MPEG4音频、AAC、ATRAC (MD)、AC-3、DTS、天狼星、XM、IBOC、CD (PCM)、电话机等。

3. 增强

用数位压缩技术恢复和增强谐波损失。
恢复谐波的相位校准。
恢复经数位压缩後缩小的立体图像,恢复全立体性能。
展现音乐中精致、优美而有趣的细微情节。
恢复数位压缩处理後受损的声音的温暖感。
用过取样技术扩展高频段。

4. 解决方案

    很简单的数位软体(1/10-1/100的可比性)


BBE MP的工作原理

数位压缩

Wave Form: 波形
Level: 电平
Compression: 压缩
Original: 原声
Frequency: 频率
Frequency Spectrum: 频谱

    数位压缩主要是在频域内进行的。左上图所示的波形为示波器上显示的声波,在“A”点取样,其声谱以右上图所示的“原声”曲线表示。从本质上来说,这是个取样的过程。采集到的声谱看起来很复杂。校平这根复杂的曲线可以消除大部分(90%以上)声音、而不至於在很大程度上影响音质(如右上图示有“压缩”字样的光滑曲线所示,这正是数字压缩的核心所在),所以一般情况下还是可以接受的。

    系统以大约40 KHz的频率、在时域范围内继续取样,生成如下所示的频谱系列。

Time: 时间
Original audio spectrum: 原声声谱

    数位压缩在频域和时域内进行,以频域为主。频域压缩和时域压缩後产生的频谱如下图简化所示(注:为便於理解,我们将该图大大简化了。许多资讯因此被删除并永久丢失了,这也正是此类压缩被称为“损失”压缩的原因所在)。还有,MP3的取样率往往低於CD的取样率,导致某一频率(取样频率的一半)以上的音频资讯全部丢失(请注意下图所示高於某一频率的音频资讯的突然丢失)。这一特定频率因情况而异,取决於频谱范围。

Time: 时间
Digitally compressed audio spectrum: 经数位压缩处理的音频频谱

    由这种资料档案还原而来的声音音质不错,还是钢琴的声音,喇叭的声音也没变,但声音的细腻感、细微差别和音乐感却没了,声音也了无生趣。BBE可以发现和增强压缩後的谐波、纠正时间校准,进而恢复和增强音频。但是,全部丢失了的谐波只能重新生成了。

 

MP处理

    MP处理 (最小化多项非线性饱和) 可以有效地从“原声”生成如下图所示、标有“用MP处理生成的谐波”字样的谐波。将偶次谐波和奇次谐波融入原声时,偶次谐波产生的声音听起来比较和谐、温暖感较强、也很舒服;而适量的奇次谐波则使声音更为明快、更为强烈。这样处理的声音温暖感较强、较舒服,也比较出色(这种方式类似於真空管放大器,这种放大器也会生成偶次谐波和奇次谐波,因而真空管放大器的声音听起来比更为高级的固态放大器更温暖、更舒服)。

 

Fundamental: 基音
Generated harmonics by MP process: MP处理产生的谐波
Frequency: 频率
MP process: MP处理

    这种MP处理技术包括整个音频带宽,均匀地覆盖低频到高频的频段,但不能增强任何一个特定的频段、也不会改变该频段的颜色。下图所示为融入重新生成的谐波的频谱图。以较高速度取样的MP处理甚至能重新生成音频信号,因而补充了全部丢失了的高频音频。

Time: 时间
Frequency: 频率
BBE MP processed audio spectrum: 用 BBE MP处理的音频频谱


BBE MP处理过程

    以频率为基础按比例前移线性相位的BBE处理先於MP处理进行。MP处理能基於整个音频频段均匀地生成高次谐波。经 BBE处理的音频时间校准会逐渐减小(频率越高就越早),使生成的高次谐波的时间相位前移。BBE处理技术让电脑更容易分析声音,所需的谐波也比较少(与基音相比,时间相位前移了的谐波更便於电脑分析声音,这是心理声学的常识)。

Time advance: 时间相位前移
Time delay: 时延
Time: 时间
Frequency: 频率
BBE MP processed audio spectrum: 用BBE MP处理的音频频谱

    BBE处理能逐渐增强频率较高的声音。在MP处理生成的谐波中,高频成分比低频成分多。BBE处理增益能降低这种差异。

    BBE MP处理技术能将经数位压缩後受损的声音转化为温暖感较强、更丰富、更细腻、更清晰、更强烈的声音。

 

用MP处理技术扩展频率范围

MP3

    MP3档包含以可以接受的音质复制声音所需的最少资讯,但只保留1/20的原声资讯,剩馀的资讯则永久丢弃了(其实,您可以在同一张光碟上存储20倍的音乐)。压缩档大小的另外一种策略是缩小频率范围。很显然,MP3音乐的高频资讯比CD少,这一点很值得关注。经数位压缩处理的任何音频信号(包括WMA)都有这个问题。

 

 

Level: 电平
MP3 data: MP3数据
Sudden Cut-off at relatively low frequencies (cut-off frequency varies): 频率相对较低时的突然截止(截止频率不是固定不变的)
Frequency: 频率
MP3 frequency response: MP3频率回应

    BBE MP处理技术能恢复频段内的谐波;而且,如下图所示,借助48 KHz和96 KHz频点的过取样技术,它还能将高频带宽扩展到24 KHz或48 KHz。

Level: 电平
Generated harmonics by MP process: MP处理技术产生的谐波
High frequency expanded by MP process: MP处理技术扩展後的高频段
Frequency: 频率
MP3 frequency expansion by MP process: 用MP处理技术扩展MP3频率


    下图所示为戴安娜·克拉尔演唱的“我记得你”的部分频谱图,从中可以看出BBE MP处理技术的效果。上图表示频率在16 KHz以下的测试音频,在32 KHz的频点向下取样原始CD可以清除高频成分。如下图所示,可以用BBE MP处理技术再生频率受限制的测试音频16KHz以上的谐波(每个节拍刚开始时的效果都是很明显的)。下图中央部位为6 KHz-8 KHz频段产生的谐波,这类谐波的频率高於16KHz,数目也较多。

L-ch
R-ch
戴安娜·克拉尔演唱的“我记得你” CD,32 KHz频点向下取样,48 KHz频点重新取样,声音资源档案

L-ch
R-ch

    戴安娜·克拉尔演唱的“我记得你”,32 KHz向下取样,48 KHz频点用BBE MP处理技术处理,声音资源档案

 

 

    本页图片比上述图片更为详细。因为显示和/或列印质量欠佳,图片不是看得很清楚,即使这样,连下图比较暗的地方也能很精细地恢复整首歌曲的谐波。

 

 

 

 

    戴安娜·克拉尔演唱的“我记得你” CD,32 KHz向下取样,48 KHz频点重新取样,声音资源档案

    戴安娜·克拉尔演唱的“我记得你”,32 KHz向下取样,48 KHz频点BBE MP技术处理,声音资源档案
与上述图片对应的以下三幅图片表示相同时间点的频率分析。

    第一幅图片表示频率上限为22 KHz的原声CD的频率回应,第二幅图片表示音频频率均为16KHz以下、频率受到限制的测试材料。

    戴安娜·克拉尔演唱的“我记得你” 原声CD,48 KHz频点重新取样,声音资源档案

    戴安娜·克拉尔演唱的“我记得你” CD,32 KHz向下取样,48 KHz频点重新取样,声音资源档案
从下面第三幅图可以看出BE MP处理的结果:MP处理技术再生了频率在16 KHz以上的所有信号,从而将高频段扩展至24 KHz(这一频率甚至高於原声CD 22 KHz的频率上限)。从图中还可以看出,原声CD的频率回应也被精确复制了。

    戴安娜·克拉尔演唱的“我记得你”,32 KHz向下取样,声音资源档案,48 KHz频点BBE MP技术处理

    就效果而言,这种技术和MP3 PRO解码技术类似。两者的区别在於:MP3 PRO解码器只对其已编码的音频有效,而MP处理技术对MP3和MP3 PRO音频都有效。此外,MP处理技术也适用於各类数位音频格式,如WMA和AAC。

 

常规CD

    在一般的音频场合,常规CD的音质是很不错的。但是,新型超级CD或DVD的音质远远超过了CD,因为超级CD或DVD的取样速率比CD高(带宽比CD宽)、音频信号位元位元数也比CD多。

 

 

 

Level: 电平
Regular CD: 常规CD
Upper frequency limit of CD: CD的频率上限
Generated harmonics by MP process: 用MP处理技术生成的谐波
Extended upper frequency limit by over-sampling (96 KHz): 用96 KHz频点过取样技术扩展频率上限

    BBE MP将CD的高频回应扩展至超级CD或DVD的水平,这可以用过取样技术实现。如上图所示,96 KHz频点过取样技术将CD的频率上限由22 KHz扩展到48 KHz,处理後的声音流畅多了、也更细腻了。

    下一页的波形图为Emmylou Harris演唱的“我还想著别人”。上图所示为44 KHz频点对CD重新取样所得的声音资源档案,它是原声CD的精确复制;下图则为BBE MP处理技术在48KHz频点稍微过取样所得的结果。从图中可以看出,大波形图上面有很多高频成分(小振动),这些高频成分就是BBE MP处理产生的谐波。

    Emmylou Harris演唱的“我还在想著别人”,44 KHz频点对CD重新取样,声音资源档案

    Emmylou Harris演唱的“我还想著别人”,48 KHz频点用BBE MP处理技术处理,声音资源档案


电话机

    电话机的窄带宽(特别是相对较低的4 KHz频率限制,它会降低声音的清晰度)使各人在电话的声音互不相同。

Level: 电平
Generated harmonics by MP process: 用MP处理技术生成的谐波
High frequency expanded by MP process (16 KHz over-sampling): MP处理(16 KHz频点过取样)技术扩展後的高频段 Frequency: 频率

    MP处理通过过取样技术扩展4 KHz的频率上限。如上图所示:在16 KHz频点(不是通常的8 KHz频点)对信号重新取样後,频率上限由4 KHz扩展到8 KHz。将MP处理技术和BBE T2(电话技术)结合起来使用能将通常的300Hz % 4 KHz带宽扩展到300Hz % 8 KHz,信号的清晰度和可理解性也大大提高了。