
有网友来信讯问,网络上的各种不同音频格式(mp3,APE等),究竟有什么区别。信中提到了5个问题,我先逐一解答,然后再做补充。
对于有损压缩和无损压缩的音频文件,比如mp3与APE
1)是否能一耳听出?
答:对于大多数人,不能。
2)是任何人都能听出区别?还是像你这样专门搞音乐的人才能听出?
答:很难讲,要看什么样的听音器材。即便高档器材,大多数人也未必听得出区别。
3)我是在电脑上听音乐,听不出区别,是不是要在专业音响器材上才能听出?
答:是的。准确的说是”监听器材“。
4)录音棚里用啥格式录制的音乐作品?原始音频格式是什么?
答:录音棚里要分不同的工作站软件,不同软件录制的格式是不同的,最原始的录音格式有WAV、SD2、AIFF、以及它们的变种。
5)您电脑里大部分音乐是啥格式?
答:我的工作文档基本都是WAV和AIFF。若是用于欣赏的其他音乐成品,那么CD和mp3各占一半。
好,问题回答完了,我再补充说明一下什么是有损压缩和无损压缩。
对音频文件进行压缩,其原理就等于将“1+1+1+1+1+1+1”直接写成“1×7”,等播放的时候再将这个算式还原成原始方式。但是,刚才这个算式其实是不存在的,因为音频采样点的实际数据比较复杂,会在小数点之后留下很多位数,就类似像“3.1415926535897932384626“这样,所以,以简化算式的方式来表达这些海量数值,其压缩效率并不高。比如说APE的压缩格式,虽然是无损的,但是压缩效率不够高。为了解决这个问题,后来就有人将小数点后进行四舍五入,变成了”3.14“,这就是有损压缩,也就是mp3、mp4等。当然,具体工作方式远比这个复杂,这里只是一个形象的例子。
那么,小数点以后的许多位数被舍弃了,具体到听觉上,究竟有多大损失呢?答案是:尚可接受!
人类的听觉毕竟是有限的,在原始高规格录音文件中,其实包含了大量人耳难以察觉的“无用”信息,有损压缩首先就是对这些信息下手,不让它们过分占用空间,然后,对那些人耳虽可以感受但相对比较迟钝的信息也会采取一些手段进行限制。由此可见,对于大多数普通听音乐的人,一般160K以上的mp3音频文件在实际听觉上损失并不大甚至根本难以察觉。其实,播放器材的损耗很可能大于有损压缩的损耗。当然,这里指的是普通听歌的人,对于专业人员,CD的音质都是不可接受的。
如果你只是普通爱好者,听音乐用的也是普通家用器材,我给你的建议是:不必为此烦心,128K或者160K甚至320K的mp3文件,绝对可以满足你,放一百个宽心。
如果你是中级爱好者,听音乐的器材也花了一两万了,我给你的建议是:高品质mp3依然很有意义,虽然CD碟是必须的。另外,别再为此花钱了,不要过多听信发烧友们的忽悠。除非你想做家庭影院。
如果你是高级爱好者,听音设备已经10万元以上,我给你的建议是:少听CD碟,要听至少DVD-AUDIO。最重要的是,该醒醒了,你在你的设备上听到的声音并不是我们在录音棚中最终想要达到的效果,尽管你可能认为它更好了(这是有可能的,HiFi器材更讨好耳朵),但它跟录音棚中的声音是不一样的。如果你真的想要跟录音棚里同样的声音,请使用监听器材而非HiFi器材。
最后,说几句关于音质好坏的不同思考。对于音乐的本质来讲,通常环境下,播放质量的高低与音乐的内涵没有直接的关系,如果一段音乐因为播放质量欠佳而失败,那么,毫无疑问,它原本就是一段失败的音乐。所以,作为听众,我希望你是一个听音乐的人,而不是一个听声音的人。当然,对于一些特殊专业的人,比如录音师、扩音师等,他们是靠声音吃饭的,他们连CD光碟的声音都是不能接受的,对于听音器材更是苛刻到“令人发指”。他们是对的,这是他们的职业使命。不过,作为普通听众,我不鼓励以他们的盲目的追求音质,那会让听音乐的乐趣大减。但话又说回来,毕竟音质是音乐欣赏的一个重要指标,首先摆正主次关系,做个懂音乐的人,追求音质才有意义,也才值得大力提倡。
补充:回答【水木莅临】在留言中提出的问题:
- 不同的播放软件解析声音的能力是不同的? 答:很不幸,是的,虽然理论上是不应该的,但事实上不同播放器并非都那么规范。民用播放器自不必说了,即便是录音棚专用的音频工作站,不同软件的播放声音也是不同的。
- 声卡好坏影响声音还原能力?好声卡好在哪些技术指标上呢?答:声卡对声音的影响取决于两个方面:硬件(芯片等)和软件(驱动),同一块声卡用不同版本的驱动,声音也会有区别。声卡的好坏,对声音还原能力的作用是关键性的。好声卡最大优势在于声音频响的平直,比如说就像一面好的镜子,照出人来没有任何变形,当然,这只是理论上的。另外一个关键指标是性能,由于最终输出到音箱的(电流)信号是模拟的而非数字的,这里面就存在很难人为控制的电气性能问题。对于专业级别的声卡,出了前面两项要达到苛刻的标准以外,还有一项重要性能指标:延迟。只是这项指标在民用领域没多大意义。对于大多数网友所用的板载AC97声卡,数字方面的技术指标倒也不是十分山寨,但电气性能指标却是相当令人沮丧的,只是它实在太便宜了,大家谁也不好意思说人家太多的不是。至于后来的AC97 HD,我没仔细研究过,印象中理论指标还是挺高的,但,电脑板载这种工作方式从根本上限制了它的电气性能指标,所以,不要奢望它会给你纯净的声音。不过,话又说回来,器材这个东西没有止境,一般情况下够用就好,除非你是烧友。在家一般用于上网、听歌、玩游戏,板载声卡也未必就是垃圾。我玩游戏的电脑用的就是AC97。不过,如果你已经开始注重音质问题了,这是好事,说明你听音乐又上了一个台阶。那么,选一块1000左右的声卡,配一对三五千元的音箱还是有必要的。
- “声音劈了”的专业解释
答:一般行内用语是说“破了”。数字音频承袭传统,用衰减方式来为音量做计量,最大音量为0db,超出0db的声音,就算是“破了”。专业术语叫做“过载”,就像摄影中说超出最亮的地方叫“过曝”。对于过载现象,不同的播放器应对方式是有区别的,有的反映强烈,有的则比较迟钝。迟钝一些的播放器可能会不易察觉,这也可以认为是软件对于过载的承受能力,当然,这也与声卡有关。在专业声卡上,对于过载的承受能力是板载声卡的十几倍甚至更高。当然,如果音频文件本身就已经是过载状态,那么其他任何手段都是无能为力的。
在问题原文中提到的关于《烟花三月》音乐中的过载现象,不排除由于压缩mp3的有损处理而造成的文件缺陷。
再一次更新:为什么0db是最大声音?
音频设备中用于控制音量的电路是一个衰减电路,所以,音量控制用的是衰减法,而不是增加法,“开大音量”实际上是在“减小衰减”,当衰减值成为0的时候,自然也就是最大了。这种表示方法是有别于声音分贝的计量方法的。(下图中红色箭头的例子)
![]()

继续补充,回复留言:
neturalyu留言写到:
博主似乎没有提到SACD? 个人认为听感上强过DVD-A许多 另外我觉得无损与有损是一种对待音乐的态度,即使当时设备有限,听不出细微的差别,但是用audition之类的软件查看光谱,很明显的会被削掉很多的高频,所以说总归是以后再编辑或是转换都会产生更大的损耗,心里也不舒服。 再者160kbps以下的mp3即使是普通家用设备也是明显能够听出差别来的,mp3我能接受的最低比特率为192kbps VBR(lame VBR V2).至于要听出无损与有损的差别来,也不需要几万的音响系统,几千块的耳机系统足矣。还有家庭影院的概念似乎和高保真音乐概念的出入也很大,个人觉得 不太合适把比方用在这里。
首先,谢谢参与讨论。如果这个话题不在我家,而是在其他网站,我会退出讨论的,但是,在自己家就不得不说了。
关于SACD的问题,事实上它在商业上已经是个失败的产品了,虽然技术上很出色。同时它的受众群是很窄的,所以不提也罢。
“我觉得无损与有损是一种对待音乐的态度”这句话我很赞同,不过,所谓“态度”的内容或许有所不同。你是强调的态度,而我是宽容的态度。至于说到audition这样的软件,专业录音领域是不会使用的,更不可能用有损压缩过的文件做任何编辑,进而再一次压缩编码。
至于192k以下的压缩音质已经不可接受,这个因人而异吧。每个人的听力都是不同的,就像每个人的视力不同一样。就说我吧,我的视力差不多是2.0,普通LCD对于我来讲,像素点看的清清楚楚,文字总是有锯齿,所以我一直追求超小点距的显示器。而事实上,极少会听到有人抱怨主流LCD的点距太大,即便在专业设计的领域,大多也是使用主流点距的显示器。所以,这个不太有代表性。
如果纯粹考虑音质问题的话。这应该是个老生常谈的“内容与形式”的关系问题啦。音质属于“形式”的范畴。比如欣赏一幅画作,我并不会因为印刷质量不够顶级而放弃欣赏它。对于大多数人来讲,既然没有机会去卢浮宫欣赏蒙娜丽莎原作,那么对于其印刷品的质量较真,也就适可而止的好。
把音乐进行录音,等同于将绘画进行翻拍,连赝品都够不上,所以我说适可而止。除非去看原作,或者科技进步到我们可以完美再现音乐厅听感。这也是前面我说“宽容”的由来。
说到用几千元的耳机能听出差别,其实,不用几千元,给我几百元的耳机就能听出,但是,耳机是不能作为监听标准的,虽然监听器材中有很多昂贵的监听耳机,但它只能是监听设备中的辅助器材。
最后说道高保真器材和家庭影院这两个概念,我提到了一两万这个数目,从价格上说明够不上高保真器材,只能是家用电器类的家庭影院,所以也不算是不合适吧。
说到这里,好像你说的每一条我都不同意,非也非也。追求完美无罪,追求完美音质更是我所希望的,只是,如果形式和内容不能两全,应以内容为先。不要因为在读一首诗的时候,因为上面字体不够工整而觉得诗歌本身失去了价值。你说是吧?!
其他朋友若有这方面疑虑,请留言发问。
22条留言 ......您可以马上发表自己的看法
我是听了月中天的曲子来的贵站,王老师对音乐的见解很独特,很欣赏。平时也喜欢业余录音玩玩,支持王老师!
愿王老师做出更多的好作品给大家!!!
谢谢支持!
博主似乎没有提到SACD? 个人认为听感上强过DVD-A许多
另外我觉得无损与有损是一种对待音乐的态度,即使当时设备有限,听不出细微的差别,但是用audition之类的软件查看光谱,很明显的会被削掉很多的高频,所以说总归是以后再编辑或是转换都会产生更大的损耗,心里也不舒服。
再者160kbps以下的mp3即使是普通家用设备也是明显能够听出差别来的,mp3我能接受的最低比特率为192kbps VBR(lame VBR V2).至于要听出无损与有损的差别来,也不需要几万的音响系统,几千块的耳机系统足矣。还有家庭影院的概念似乎和高保真音乐概念的出入也很大,个人觉得不太合适把比方用在这里。
谢谢你参与讨论,我已经回复在文章里了。
说无损(APE、FLAC)和MP3(320k)听不出来的人,
我想他无损音频听得很少。
一直在听无损音频的人对于有损音频一听便能分辨,
除了360K上的OGG!
看来仁兄听音乐已进入了很高境界了,我非常欢迎能有这样的读者和听众。希望常来!
王老师不愧是高手。这篇文章给很多喜欢在电脑上听音乐的人很大帮助,我可以转载您的吗?
当然
您的音乐太好了,很有情。制作精良。从哪里可以下载。我也是制作音乐的,很想学习学习。谢谢。
我想把一些ape转成flac,因为高清机只认FLAC一种无损,虽然可以用千千静听转mp3听,但毕竟下载的是无损所以还是想平转。估计要花不少时间,为避免白忙活,转之前我想问一下,听听您的意见:
1,无损转无损理论上有没有损失?(我知道听不出来但我想知道)
2,我是在网上找的一款小软件叫魅族v2.4,试转了一首觉得还行挺简便,但需要设置压缩等级1-8,verycd里有人留言认为8合适有认为5合适,您认为我压几合适?
还有几个问题我就写这不上网找了,提高效率,但麻烦您了:
1,cue可以用在整轨flac上么?比如cue里的这句”Celine.Dion.-.[The.Colour.Of.My.Love].专辑.(APE).ape” WAVE“,是否把里面的.ape改成.flac就成呢?如果不行,那用什么方法显示flac歌曲信息呢?
2,要是自己编cue,里面的起止时间只能自己听一遍然后记录下来?
3,foobar可以拆分flac么?可以的话我就研究研究,刚下载了foobar一点都不会用呢,网上好多人在推荐这个软件。
希望您能尽快回复,简单回答就行,否则这个周末浪费了。
呵呵,回答这些问题,我与你基本在同一条起跑线上,因为这已不是我的职业范围,所以不要作为最终答案。
1.理论上没有损失
2.这个我不知道
———————
1.可以直接修改来用
2.是的
3.可以,只要有cue
对于第二个问题,压缩等级不是很重要的东西,只会影响到flac的体积,无论是5还是8均可。
王老师真不好意思还要请教您一下,关于增益,困扰我好久了,因为影响到我欣赏音乐我不得不解决此问题。
还是举个例子,我最近常听一首萨克斯曲,属性里显示增益6.47db,和别的歌曲一起播放时他的声音偏小,我发现其他我觉得音量合适的歌曲增益一般都是负的,在-8至-10左右。我在播放时要么将就低音量要么高音量,反正怎么都不合适。我有时用Nero WaveEditor剪歌制作自己的手机铃音,只会基本功能大部分不会用,我用这个软件把这首曲子声音调高保存,结果音质变的很差。请问:
增益到底是什么?
我能否用Nero WaveEditor修改增益?怎么用?(菜单里的哪个功能?)
我增加音量保存是不是错的?
麻烦您在不忙的时候简单回答一下,谢谢了!
(好奇心不止,问题不止,怀念上学时有老师的时光,唉……)
每一张CD的平均音量都是不同的,这属于正常情况,一般称之为“响度”,近些年流行音乐的响度都很大,传统音乐则不是,所以,不同内容的音乐要调整不同的音量来听。
我前面说了,音量旋钮是一个衰减电路,但是,增益却是一个放大电路,将原波形进行放大,等于是在所有数值上统统加上一个数值。对于响度水平已经到达最大的0db的时候,增益是万万不可增加的,因为所有超出0db的波形都将会是“破音”,即便此时你调小音量旋钮也是无济于事,就如同一张过曝的照片,减低亮度是不会将已经变成纯白色的过曝区域的细节恢复。
一般市面上的专辑,为了充分利用有效响度,都已经竭力将波形做到0db了,此时,增益行为断不可取。不过,你说的增益我不知道是在哪里看到的。要说“-8至-10”,那应该称为“电平”(level)。
如果有的音频文件最大音量时并未达到0db,你可以用“标准化”(normalize)命令来处理,不过,Nero来处理音频我没用过,处理单个音频文件,我习惯用Soundforge。
这个问题说起来会比较啰嗦,我不知道有多少人会在自己电脑上经常处理音频文件,如有必要,我就写个教程,说说平时在家如何正确处理数字音频文件。
更正一下:
《烟花三月》中的《古琴乐段》1:35–1:38用winamp播放是正常的,没有杂音,开到最大音量也没有。
千千静听确实有杂音,开到很小音量也有“嗞啦、嗞啦”的杂音,持续2、3秒。知识所限很难判断出是过载或压缩缺失或其它什么原因造成。
音乐压缩感觉其中好像很有学问或说很有技巧,很爱听李娜的《走进西藏》,一直听的是一个3.47M版本的mp3,此版本可能才是真正的过载,我用电脑里的所有播放器听都一样,从头到尾都是“劈的”,说来可笑,一直以为是李娜的音太高才这样,凑合听吧……看了您的文章去百度找了个3.61M版本的,声音正常了(反正我听不出毛病)。但明显感觉此版本比原来版本“发闷”,没有了“通透、敞亮”感,歌曲要描绘的西藏高原的高贵圣洁、与天同在的意境打了折扣。
是不是压缩音域范围宽的作品有一定难度呢?
这个问题本身问的有点问题,“音域宽”是指的什么呢?人声的音域吗?
人声的音域在整个音乐中其实只占很窄的一部分。而且这仅仅是针对音高部分而不是频响。
对这个没研究 不过看了 觉得还是模糊的懂了一点
“最大音量为0db”
是零分贝的意思么?没有写错?真成“大音希声”了,能解释一下么?
王老师的讲解既专业又通俗易懂,连我想到没写出的问题都回答了,真应了一句俗语“有一桶水才能给人一杯水”,佩服您的学识阅历,也赞同您的务实精神,如果您讲课的话应该是非常精彩的!
对于播放器,那首作品如果有“软件对于过载的承受能力”的原因,那借此也可判断win media player的软件制作水平好于千千静听,其实我用winamp听也“破了”。呵呵,这倒是测试软件的一个土办法。
网上发烧友对极品音乐的评论和追求经常让外行人不知真假,经常奇怪说得那么好的音质我怎么就听不出来呢?……看完您的文章,哈哈,原来如此。
作品好是根本,经典作品用老唱片听都那么有滋有味。
此文解答了初级音乐爱好者关于音频格式的常识问题、常见困惑,同时表达了您的观点,很有价值的一篇好文,先谢谢了!
我从您网站下载的《烟花三月》中的《古琴乐段》,此曲高潮部分(就是三声高音连续喷薄而出的那段)我用“千千静听”、mp3播放器接音箱听时声音都是劈的!非常难以忍受,而用windows media player 11却没有劈。就这个现象,想问几个问题:
1,不同的播放软件解析声音的能力是不同的?
2,声卡好坏影响声音还原能力?好声卡好在哪些技术指标上呢?
3,“声音劈了”的专业解释??(我理解是不是瞬间频率太高就是劈了,丢音太多?)
期待您的讲解。
不错,备哥说的很实在,要听音乐而不是声音,当然声音也不能太次了。顶。
APE的听起来要脆一些