为什么音频信号的采样频率一般取44.1KHZ

发布网友 发布时间:2022-04-22 08:56

我来回答

5个回答

热心网友 时间:2023-06-26 02:44

通常我们采用脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。 \x0d\x0a\x0d\x0a  1、什么是采样率和采样大小(位/bit)? \x0d\x0a\x0d\x0a  频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。 \x0d\x0a\x0d\x0a  2、有损和无损 \x0d\x0a\x0d\x0a  根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。 \x0d\x0a\x0d\x0a  3、为什么要使用音频压缩技术 \x0d\x0a\x0d\x0a  要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2 Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样,在后面的文章中我们都会一一提到。有一点是可以肯定的,他们都压缩过。 \x0d\x0a\x0d\x0a  4、频率与采样率的关系 \x0d\x0a\x0d\x0a  采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。 \x0d\x0a\x0d\x0a  因为,根据耐奎斯特采样理论,你的采样频率必须是信号最高频率的两倍。例如,音频信号的频率一般达到20Hz,因此其采样频率一般需要40Hz。 而人耳收听的范围只能到23Khz以下,所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz. \x0d\x0a\x0d\x0a  5、流特征 \x0d\x0a\x0d\x0a  随着网络的发展,人们对在线收听音乐提出了要求,因此也要求音频文件能够一边读一边播放,而不需要把这个文件全部读出后然后回放,这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放,正是这种特征,可以实现在线的直播,架设自己的数字广播电台成为了现实。

热心网友 时间:2023-06-26 02:44

通常我们采用脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

  1、什么是采样率和采样大小(位/bit)?

  频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。

  2、有损和无损

  根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。

  3、为什么要使用音频压缩技术

  要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2 Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样,在后面的文章中我们都会一一提到。有一点是可以肯定的,他们都压缩过。

  4、频率与采样率的关系

  采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。

  因为,根据耐奎斯特采样理论,你的采样频率必须是信号最高频率的两倍。例如,音频信号的频率一般达到20Hz,因此其采样频率一般需要40Hz。 而人耳收听的范围只能到23Khz以下,所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz.

  5、流特征

  随着网络的发展,人们对在线收听音乐提出了要求,因此也要求音频文件能够一边读一边播放,而不需要把这个文件全部读出后然后回放,这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放,正是这种特征,可以实现在线的直播,架设自己的数字广播电台成为了现实。

热心网友 时间:2023-06-26 02:45

要知道答案,就得从最早期数码录音的历史说起了。
最早期的数码录音设备,就是一个PCM编码器加一部录像机!最早期,这样的数码录音设备是玩家级的,日本各大厂家都曾经出过,并且是当时主要的数码录音设备。后来SONY才推出了使用高稳定性高质素3/4专业录像机的编码解码系统PCM 1610(进化到PCM 1630)。录像机是采用旋转磁头螺旋磁迹纪录的,磁迹是按照视频信号结构安排的,是不连续的,每一条磁迹,只纪录了电视信号中的其中一条扫描线(有关电视视频信号的知识,在此不多说了)。用录像机做数码录音的前提,是不能改装改造录像机。因此编码器就必须将数码音频信号,转换成电视视频信号,这样录像机才能纪录。因此,编码器输出的信号必须迁就录像机的规格。也就是说,数码音频信号,必须拆分成不连续的,以电视行数码线为基础的数据流,才能让录像机完整纪录。
在当时,世界上的录像机主要有二大制式。就是欧洲的PAL制式和美国日本的NTSC制式。PAL制式,场频50Hz,行频15625Hz,每一场625条扫描线。NTSC制式,场频59.94Hz(接近但不是60Hz),行频15575Hz,每一场525条扫描线。(说到这儿,罗嗦几句。PAL制式比NTSC制式先进得多。千万别跟我说以前LD美版的日版的如何如何牛B。那是节目源的问题,因为你没看过真正好的欧洲版PAL制式的LD。以前日本的影像发烧友最推崇的DVD,不是美国1区版,不是日本自己2区版,而是欧洲版!!!受日本的影响,的发烧DVD玩家,也专门订购欧洲版DVD,我自己订购回来的法国版PAL制式《泰坦尼克号》的画质,比我自己的1区正版《泰坦尼克号》赢出一轮)。当时的CD,是SONY与PHILIPS合作的。
PHILIPS代表欧洲制式,SONY代表美日制式。因为世界上的大唱片公司都在欧洲,而且PHILIPS自己就是其中一个,在软件出版的地位是SONY无法抗衡的,因此,最终决定,即使是日本出品的PCM编码器,也只适用于PAL制式的录像机。适用于PAL制式录像机的编码器,其采样频率就是44.1kHz。适用于NTSC制式录像机的编码器,其采样频率就是44.056。早期,日本确有一些采用44.056kHz采用频率的数码录音,但后来统一到44.1kHz了。那么44.1和44.056kHz这二个数字是怎么来的呢?44,100=294 x 50 x 344,056=245 x 59.94 x 350Hz和59.94Hz分别是PAL和NTSC的场频,294和245是从PAL和NTSC的线数上来的,因为是隔行扫描的,所以扫描线数要除2。故此PAL的扫描线就变成312.5而NTSC则变成262.5。但在模拟电视时代,为确保电视画面内容完整,所以摄像机,录像机,电视机都采用过扫描技术,最上,最下,最左,最右的部分都给舍去了。因此,无论PAL还是NTSC制式的实际扫描线,都比625和525少。PAL制式下可用扫描线数是294线,而NTSC则是245线。至于x3,则是在一条视频扫描线的磁迹中,纪录三个数码音频数据块。于是,就有了上面的式子,就有了44.1kHz。44.1kHz这个数字,给后人留下了很多麻烦。
首先它不是整数,在SRC(采样频率变换)的时候,它不能简单地分频和倍频,这就给早期的电脑的AC97音频规格,带来了SRC转换质素的问题。当时的电脑声卡都要遵循AC97规格,只支持48kHz输出,用电脑播放CD或者CD抓轨的音频文件,都要加以转换。转换的过程会有损失,而其中创新的声卡的SRC程序特别的臭,所以创新声卡播放CD或者44.1kHz音频文件的音质,被广泛劣评。至于DAT,没有这个问题,因为它的44.1和48kHz采样频率,都是原生的,不是转换出来的。不转换就不会劣化。

热心网友 时间:2023-06-26 02:45

学过信号处理或者信号与系统后
采样定理
使得离散信号恢复成连续模拟信号不失真至少要让采样频率为 原始信号的2倍
耳机播放频率22KHz(一般标注0-20KHz)
所以音频记录文件要22×2=44KHz
为了保险起见要再多一点儿
人为规定44.1KHz

热心网友 时间:2023-06-26 02:46

居然还有这种想当然的回答,还多100赫兹余量,为什么不多200,300,或400呢。
网上有很专业的回答了,就是PAL和NTSC录像带记录音频必须按照视频的规范来写磁轨,就像录音磁带一样。最后就成了60*245*3 = 44100和50*294*3 = 44100。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com