Rockroll 版 (精华区)
发信人: like (离可), 信区: Rockroll
标 题: 数字音频基础
发信站: 哈工大紫丁香 (2002年03月03日15:42:19 星期天), 站内信件
数字音频基础
------------------------------------------------------------------------------
--
大家知道,无论现在的多媒体电脑功能如何强大,其内部也只能处理数字信息。而我们听
到的声音都是模拟信号,怎样才能让电脑也能处理这些声音数据呢?还有,究竟模拟音频
与数字音频有什么不同呢?数字音频究竟有些什么优点呢?这些都是我们下面所要介绍的
。
把模拟音频转成数字音频,在电脑音乐里就称作采样,其过程所用到的主要硬件设备便是
模拟/数字转换器(Analog to Digital Converter,即ADC)。采样的过程实际上是将通常
的模拟音频信号的电信号转换成许多称作“比特(Bit)”的二进制码0和1,这些0和1便构
成了数字音频文件。如下图,图中的正弦曲线代表原始音频曲线;填了颜色的方格代表采
样后得到的结果,二者越吻合说明采样结果越好。
(示意图1)
图中的横坐标便是采样频率;纵坐标便是采样分辨率。图中的格子从左到右,逐渐加密,
先是加大横坐标的密度,然后加大纵坐标的密度。显然,当横坐标的单位越小即两个采样
时刻的间隔越小,则越有利于保持原始声音的真实情况,换句话说,采样的频率越大则音
质越有保证;同理,当纵坐标的单位越小则越有利于音质的提高,即采样的位数越大越好
。有一点请大家注意,8位(8Bit)不是说把纵坐标分成8份,而是分成2^8=256份;同理
16位是把纵坐标分成2^16=65536份;而24位则分成2^24=16777216份。现在我们来进行一
个计算,看看一个数字音频文件的数据量到底有多大。假设我们是用44.1kHz、16bit来进
行立体声(即两个声道)采样,即采样成标准的CD音质(也称作红皮书音频)。那么就是
说,一秒钟内采样44.1千次,每次的数据量是16×2=32bit(因为立体声是两个声道)。
而大家知道,一个字节(Byte)含有8个位(Bit),那么一秒钟内的数据量便是44.1k×3
2bit /(8bit / Byte)=176.4 kByte。一个汉字在电脑里占用两个字节,那么176.4kB的
空间可以存储 176.4k / 2=88200个汉字,也就是说一秒钟的数字音频数据量与近九万个汉
字(一部中篇小说)的数据量相当。由此可见,数字音频文件的数据量是十分庞大的。
也许有人会问,为什么要把CD音质的采样频率规定成44.1kHz而不是其他的频率呢?这个问
题问得好。44.1kHz意味着每秒采样四万多下,这会不会太多了点呢?究竟每秒采样多少次
才算合理呢?大家请看下图。图中,上半部分表示原始音频的波形;下半部分表示录制后
的波形;红色的点表示采样点。
(示意图2)
大家可以发现,上下波形之所以不吻合,是因为采样点不够多,或严谨一点说,是采样频
率不够高。这种情况,我们称之为低频失真。
一个常见的低频失真的例子便是电影上车辆行驶时车轮转动的情况(一个典型的“马车轮
”效应的例子)。你也许早已发现,飞快转动的车轮有时看起来似乎是静止不动甚至会向
反方向转动(类似的情况也发生在直升飞机的翼片和螺旋浆上面)。
关于合理的采样频率这一问题在Nyquist(奈奎斯特)定理中早已有明确的答案:要想不产
生低频失真,则采样频率至少得是录制的最高频率的两倍(上图中,采样频率只是录制频
率的4/3倍)。这个频率通常称作Nyquist极限。
在正常的音乐中,最高的音符也只不过7kHz-8kHz,这似乎意味着16kHz的采样频率便已足
够。其实这7、8kHz仅仅表示基音的音高,还有大量的泛音未包括在内,故用这种方法来定
采样频率是十分不科学的。其实,所谓“不失真”,换句话说便是“人们听不到失真”。
人类的听力范围是20Hz-20kHz,所以采样频率至少得是20k×2=40kHz便可保证不产生低
频失真。CD音质的44.1kHz正是这样制定出来的(略高于40kHz是为了留有余地)。按照Ny
quist定理,这样的采样频率可以保证即使是22.05kHz的超声波也不会产生低频失真。而音
频的工业标准所规定的48kHz采样频率(如DAT,Digital Audio Tape)则有更高的Nyquis
t极限,满足更苛刻的要求。
那么数字音频又是如何播放出来的呢?首先,将这些由大量数字描述而成的音乐送到一个
叫做数/模转换器(Digital to Analog Converter,即DAC)的线路里。它将数字回变成一
系列相应的电压值,然后通过有助于稳定的保持线路,最后将信号由低通滤波器输出。这
样,比较平缓的具有脉动电压的模拟信号可继续发送至放大器和扬声器,电流经过放大再
转变成声音。
相对应的模拟音频又是怎样录制与播放的呢?首先,声波通过麦克风,空气分子的振动转
变为电信号的波动(数字录音也必需经过这一步)。录音磁头的电磁铁根据通过电流的大
小而产生大小不同的磁场,磁场的变化情况会相应的记录在磁带上(实际上是磁带上的磁
粉排列发生了变化),这样便完成录音过程。播放时,放音磁头读出印记在磁带上的磁场
大小变化的情况(即磁粉的排列位置),并转变为相应的电信号。之后的情况与数字音频
的播放完全类似,即这些波动的电信号(模拟信号)继续传送至放大器和扬声器,电信号
重新转变为声音(即空气分子的振动)。
说到这里,我们可以理解数字录音的好处了。首先,录制好的音乐是以数字来储存的,而
数字的传输错误率是相当低甚至是可以避免的,所以录制好的音乐可以多次复制而效果不
减(这在制作过程中十分重要)。而模拟信号则每传输一次就失真一次。而且,模拟录音
的本底噪音很大,要想满足严谨的录音要求则需要购买复杂而又昂贵的设备,操作也十分
繁琐。况且,处理数字信息是电脑的拿手好戏,只需面对显示器,所有的工作都可以弹指
一挥间完成。正是基于以上这些优点,使得建立一个家庭工作室(Home Studio)显得非常
具有吸引力,并且技术上也成为可能。
--
经过马路旁成堆的垃圾,经过积满污水的商用占地,
经过整夜痛苦的失眠与不安,跨入美丽辉煌的二十一世纪??
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 218.7.32.244]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:5.594毫秒