WAV_标准数字音频文件 - 线报百科mbji.cn

WAV

标准数字音频文件

WAV是最常见的声音文件格式之一，是微软公司专门为Windows开发的一种标准数字音频文件，该文件能记录各种单声道或立体声的声音信息，并能保证声音不失真。但WAV文件有一个致命的缺点，就是它所占用的磁盘空间太大（每分钟的音乐大约需要12兆磁盘空间）。它符合资源互换文件格式（RIFF）规范，用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他压缩算法，支持多种音频位数、采样频率和声道，是PC机上最为流行的声音文件格式；但其文件尺寸较大，多用于存储简短的声音片段。

简述

WAV文件是在PC机平台上很常见的、最经典的多媒体音频文件，最早于1991年8月出现在Windows3.1操作系统上，文件扩展名为WAV，是WaveForm的简写，也称为波形文件，可直接存储声音波形，还原的波形曲线十分逼真。WAV文件格式简称WAV格式是一种存储声音波形的数字音频格式，是由微软公司和IBM联合设计的，经过了多次修订，可用于Windows，Macintosh，Linux等多种操作系统。WAV支持多种音频数字、取样频率和声道，标准格式化的WAV文件和CD格式一样，也是44.1kHz的取样频率，16位量化数字，因此声音文件质量和CD相差无几。WAV的特点如下：真实记录自然声波形，基本无数据压缩，数据量大。

一般来说，由WAV文件还原而成的声音的音质取决于声音卡采样样本的尺寸，采样频率越高，音质就越好，但开销就越大，WAV文件也就越大，

存储过程

声源发出的声波通过话筒被转换成连续变化的电信号，经过放大、抗混叠滤波后，按固定的频率进行采样，每个样本是在一个采样周期内检测到的电信号幅度值；接下来将其由模拟电信号量化为由二进制数表示的积分值；最后编码并存储为音频流数据。有的应用为了节省存储空间，存储前，还要对采样数据先进行压缩。

文件结构

在Windows环境下，大部分多媒体文件都是按照资源互换文件格式（Resources lnterchange File Format）存放信息，简称RIFF格式。构成RIFF文件的基本单位称之为块（chunk）。每个RIFF文档是由若干个块构成。每个块（chunk）由块标识、块长度及数据等三部分所组成。

其中，块标识保存的是由4个ASCII码字符组成的块名字。如不满4个字符则在右边以空格充填。块长度字段，

占4个字节，保存的是当前块数据的长度，不包括块标识和块长度字段。所以一个块的实际长度为块长度字段内的数值加8。RIFF格式规定，只有RIFF及LIST块可以含有子块，其它的块不允许包含子块。一个RIFF格式文档本身就是一个块。其前4个字节为文档标识“RIFF”，同时也是RIFF的块标识，标明该文档是一个有效的RIFF文档；第二部分为文件的数据长度，占4个字节，其数值为文件长度-8；第三部分为RIFF块数据，其中，前4个字节为文件格式类型标识，如：“WAVE”，“AVI”等，后面其它部分为RIFF块的子块。

WAV文件采用的是RIFF格式结构。至少是由3个块构成，分别是RIFF、fmt 和Data。所有基于压缩编码的WAV文件必须含有fact块。此外所有其它块都是可选的。块mt，Data及fact均为RIFF块的子块。WAV文件的文件格式类型标识符为“WAVE”。基本结构如表1。

编码

编码包括了两方面内容，一是按一定格式存储数据，二是采用一定的算法压缩数据。WAV格式对音频流的编码没有硬性规定，支持非压缩的PCM（Puls Code Modulation）脉冲编码调制格式，还支持压缩型的微软自适应差分脉冲编码调制Microsoft ADPCM（Adaptive Differential Puls Code Modulation）、国际电报联盟（International Telegraph Union）制定的语音压缩标准ITU G.711a-law、ITU G.711-law、IMA ADPCM、ITU G.723ADPCM（Yamaha）、GSM 6.10、ITU G.721 ADPCM编码和其它压缩算法。MP3编码同样也可以运用在WAV中，只要安装相应的Decode，就可以播放WAV中的MP3音乐。

PCM编码是直接存储声波采样被量化后所产生的非压缩数据，故被视为单纯的无损耗编码格式，其优点是可获得高质量的音频信号。基于PCM编码的WAV格式是最基本的WAV格式，被声卡直接支持，能直接存储采样的声音数据，所存储的数据能直接通过声卡播放，还原的波形曲线与原始声音波形十分接近，播放的声音质量是一流的，在Windows平台下被支持得最好，常常被用作在其它编码的文件之间转换的中间文件。PCM的缺点是文件体积过大，不适合长时间记录。正因为如此，又出现了多种在PCM编码的基础上经改进发展起来的编码格式，如：DPCM，ADPCM编码等。

影响因素

采样频率：每秒钟采集音频数据的次数。采样频率越高，音频保真度越高。计算机广泛配置的16位声卡，使用的采样频率通常包括11025Hz、22050Hz、44100Hz和48000Hz四种，其中，采用11025Hz采样的声音效果相当于电话声音的效果；采用22050HZ采样的声音效果相当于FM调频广播的效果；采用44100HZ采样的声音效果相当于CD声音的效果。

采样位数（振幅采样精度）：即采样值或取样值，是用来衡量声音波动变化的一个参数，也是声卡的分辨率。它的数值越大，分辨率也就越高，发出声音的能力越强。目前计算机中配置的16位声卡的采样位数包括8位和16位两种。

声道数：有单声道和立体声之分，单声道的声音只能使用一个喇叭发声（有的声卡也将单声道信息处理成两个喇叭同时输出），立体声的WAV可以使两个喇叭都发声（一般左右声道有分工），这样更能感受到音频信息的空间效果。显然，双声道数据还原特性更接近人们的听力习惯，但采集得到的数据量会增加1倍。

适用范围

一般来说，采样的样本尺度（信息量）越大，采样频率越高，音质就越好，但波形音频的开销就越大。由于一般讲话以8位11.025KHz采样就能较好地还原，因此，波形音频一般适用于以下几种场合：

1、播放的声音是讲话语音，音乐效果对声音的质量要求不太高的场合。

2、需要从CD-ROM 光盘驱动器同时加载声音和其他数据，声音数据的传输不能独占处理时间的场合。

3、需要在PC硬盘中存储的声音数据在1分以下以及可用存储空间足够的时候。

参考资料

王若钧, 何杉. WAV文件格式分析与详解[J]. 数字技术与应用, 2014, (3):93-94..超星.

郭兴吉. WAV波形文件的结构及其应用实践[J]. 微计算机信息杂志, 2005, 第21卷(8):114-116.超星.

最新修订时间：2023-12-21 15:15

条目作者

小编

资深百科编辑

概述

简述

参考资料