本节更详细地介绍了电子声音生成和处理的一般原理,包括参考 Summit的相关设施。如果您不熟悉模拟声音合成,建议仔细阅读本章。熟悉此主题的用户可以跳过本节,直接阅读下一节。
为了了解合成器如何产生声音,了解构成声音的组成部分(包括音乐和非音乐)会很有帮助。
声音被感知的唯一方式是空气以规律的周期性方式振动耳膜。大脑会非常准确地将这些振动解读成无数种不同类型的声音。
值得注意的是,任何声音都可以用三个属性来描述,并且所有声音都具备这三个属性。它们是:
一种声音与另一种声音的区别在于声音最初呈现的三种属性的相对大小,以及这些属性在声音持续时间内如何变化。
借助音乐合成器,我们特意对这三个属性进行精确控制,尤其是在声音的“生命周期”内如何改变它们。这些属性通常被赋予不同的名称,例如,音量可能被称为振幅,响度或电平,音高被称为频率,有时音色被称为音调。
如上所述,声音是通过空气振动耳膜来感知的。声音的音调取决于振动的速度。对于成年人来说,感知到的最慢振动频率约为每秒二十次,大脑会将其解读为低音;最快的振动频率为每秒数千次,大脑会将其解读为高音。
如果计算两个波形(振动)的峰值数量,B 波的峰值数量恰好是 A 波的两倍。(B 波的音高实际上比 A 波高一个八度。)给定周期内的振动次数决定了声音的音高。这就是音高有时被称为频率的原因。在给定时间段内计算出的波形峰值数量定义了音高或频率。
音乐由几个同时出现的不同且相关的音高组成。最低的音高被称为“基音”,对应于声音的感知音符。构成声音的其他音高,如果与基音之间存在简单的数学比率关系,则称为谐波。每个谐波相对于基音响度的相对响度决定了声音的整体音调或“音色”。
想象一下,两件乐器,比如羽管键琴和钢琴,在键盘上以相同的音量演奏同一个音符。尽管音量和音高相同,但两件乐器的声音仍然截然不同。这是因为两种乐器不同的音符生成机制产生了不同的泛音;钢琴音色中的泛音与羽管键琴音色中的泛音不同。
音量,通常指声音的振幅或响度,由振动的强度决定。简单来说,在一米外听钢琴的声音,会比在五十米外听钢琴的声音大。
我们已经展示了仅三个元素就能定义任何声音,现在必须在音乐合成器中实现这些元素。因此,合成器的不同部分会“合成”(或创造)这些不同的元素,这合乎逻辑。
合成器的一部分, 振荡器,生成原始波形信号,这些信号定义了声音的音高及其原始谐波含量(音调)。然后,这些信号在一个称为 混合器然后将得到的混合物送入一个称为 筛选这会通过消除(过滤)或增强某些谐波来进一步改变声音的音调。最后,滤波后的信号被输入到 放大器,它决定了声音的最终音量。
附加合成器部分 - 低频振荡器 和 信封 - 通过与 振荡器, 筛选 和 放大器,使声音的特性随时间而变化。因为 低频振荡器' 和 信封' 的唯一目的是控制(调制)其他合成器部分,它们通常被称为“调制器”。
振荡器部分是合成器的核心。它产生电子波(最终馈送到扬声器时产生振动)。该波形以可控的音高产生,音高最初由键盘上弹奏的音符或接收到的 MIDI 音符信息决定。波形的独特音调或音色实际上是由波形的形状决定的。
许多年前,音乐合成领域的先驱们发现,仅仅几种独特的波形就包含了产生音乐声音的许多最有用的谐波。这些波形的名称反映了它们在示波器上观察到的实际形状,它们是:正弦波、方波、锯齿波、三角波和噪声。每种波形 Summit的振荡器部分可以生成所有这些波形,也可以生成非传统的合成器波形。(请注意,噪声实际上是独立生成的,并与混音器部分中的其他波形混合在一起。)
每个波形(噪声除外)都有一组特定的与音乐相关的谐波,可以通过合成器的其他部分进行操纵。
下图展示了这些波形在示波器上的表现,并说明了它们谐波的相对电平。记住,波形中各个谐波的相对电平决定了最终声音的音调特征。
方波/脉冲波仅包含奇数谐波,其音量与锯齿波中的奇数谐波相同。
方波在“高”状态和“低”状态所占的时间相等。这个比率称为“占空比”。方波的占空比始终为 50%,这意味着它在一半周期内处于“高”状态,另一半周期处于“低”状态。 Summit 可让您调整基本方波的占空比(通过 形状 控制)来产生形状更接近“矩形”的波形。这些波形通常被称为脉冲波形。随着波形越来越接近矩形,会引入更多偶次谐波,波形的特性也会发生变化,听起来会更像“鼻音”。
脉冲波形的宽度(“脉冲宽度”)可以通过调制器动态改变,从而导致波形的谐波含量不断变化。当脉冲宽度以中等速率改变时,可以使波形具有“饱满”的音质。
无论占空比是 40% 还是 60%,脉冲波形听起来都一样,因为波形只是“反转”的,而且谐波含量完全相同。
环形调制器是一种声音发生器,它从两个振荡器获取信号并有效地将它们“相乘”。 Summit的环形调制器使用振荡器 1 和振荡器 2 作为输入。最终输出取决于两个振荡器信号中各自的频率和谐波含量,并由一系列和频、差频以及原始信号中的频率组成。
另一种将两个信号源合并的方法是调频(FM)。在这种技术中,一个振荡器的频率(有时称为“载波”)会围绕其标称“中心”值动态变化,变化量与第二个振荡器信号的瞬时幅度相对应。 Summit 面板上有一组专用于添加 FM 效果的控件。
精确的声音结果取决于每个振荡器的波形、它们的相对音高以及调制信号的最大振幅: Summit 后一个参数可以手动控制,并且可以通过 LFO 和 Envelope 进一步改变。
频率调制的结果是产生一系列附加谐波(实际上理论上是无限的),这些谐波既高于被调制振荡器的音调,也低于被调制振荡器的音调。在调频(FM)语言中,这些谐波通常被称为边带。“有效”边带的数量与调制信号的幅度成正比,与载波和调制器之间的频率差成反比。如果调制器本身就富含谐波,例如,并非简单的正弦波,则每个谐波都会产生一组自己的边带,从而进一步丰富结果的频谱内容。
Summit 是一个 减法 合成器。 减法 意味着在合成过程中的某个地方减去了部分声音。
振荡器提供具有大量谐波内容的原始波形,滤波器部分以受控的方式减去一些谐波。
有三种基本过滤器类型,均可用于 Summit:低通、带通和高通。合成器上最常用的滤波器类型是低通滤波器。低通滤波器会选择一个“截止频率”,低于该频率的任何频率都会通过,而高于该频率的频率则会被滤除或移除。
设置 滤波频率 参数指定了高于该值的频率将被移除。从波形中移除谐波的过程会改变声音的特性或音色。当频率参数达到最大值时,滤波器完全“打开”,原始振荡器波形中不会移除任何频率。
实际上,低通滤波器截止点以上的谐波音量会逐渐(而非突然)减小。这些谐波音量随着频率超过截止点而减小的速度取决于滤波器的 坡 参数。斜率以“每八度的音量单位”来衡量。由于音量以分贝为单位,因此斜率通常表示为每八度的分贝数 (dB/oct)。数值越高,截止点以上的谐波抑制效果越强,滤波效果也越明显。 Summit的滤波器部分具有 12 dB/oct 的斜率,但两个相同类型的滤波器部分可以级联(串联放置)以产生 24 dB/oct 的斜率。 Summit 还允许将两种不同类型的滤波器级联,甚至可以“并联”放置,这样混频器的输出就可以由两者处理。
滤波器的另一个重要参数是共振。通过提高滤波器的 谐振 控制。这对于强调声音的某些谐波很有用。
随着共振的增加,通过滤波器的声音会带有类似哨音的音质。当共振设置为非常高的水平时,每当信号通过滤波器时,共振实际上会导致滤波器自振荡。产生的哨音实际上是纯正弦波,其音高取决于 频率 控制(滤波器的截止点)。如果需要,这种共振产生的正弦波实际上可以用作某些声音的附加声源。
下图显示了典型低通滤波器的响应。截止点以上的频率音量会降低。
除了传统的低通滤波器类型外,还有高通和带通类型。 Summit,滤波器类型通过 形状 转变 。
高通滤波器与低通滤波器类似,但工作原理相反,因此截止点以下的频率会被滤除。截止点以上的频率则通过。当滤波器 频率 参数设置为最小值,滤波器完全打开,并且不会从原始振荡器波形中删除任何频率。
带通滤波器只允许以截止点为中心的窄带频率通过。高于和低于该频带的频率均会被滤除。这类滤波器无法完全打开,让所有频率都通过。
通过组合使用上述类型的简单过滤器,可以获得音量和频率之间更复杂的关系。 Summit 允许您将两个不同类型的滤波器“级联”,从而创建“串联”组合。由于两个滤波器都是减法滤波器,因此这种组合通常会比单个滤波器部分去除更多频率。但是,如果两个滤波器的截止频率不同,则可能会产生有趣的结果。
只会将非常高的频率传递到高通滤波器,高通滤波器会滤除其中一部分,从而在两个滤波器的截止频率之间留下一个窄带。这个窄带的宽度取决于两个截止频率之间的差值,或者说“间隔”。
相同的滤波器并联使用会产生截然不同的结果,因为两个部分的响应实际上是叠加在一起的。低频将通过低通滤波器,高频将通过高通滤波器,导致两个截止频率之间的响应出现下降或凸起。
在前面的段落中,我们描述了声音的音高和音色的合成。合成教程的下一部分将介绍如何控制声音的音量。乐器产生的音符的音量通常会随着音符的持续时间而变化很大,具体取决于乐器的类型。
例如,当按下琴键时,风琴上弹奏的音符会迅速达到最大音量。它会一直保持最大音量,直到松开琴键,然后音量立即降至零。
按下琴键后,钢琴音符的音量会迅速达到最大,但即使按住琴键,几秒后音量也会逐渐降至零。
弦乐部分模拟只有在按下琴键时才会逐渐达到最大音量。按住琴键时,音量会保持最大,但一旦松开琴键,音量就会相当缓慢地降至零。
在模拟合成器中,音符持续时间内发生的声音特征变化由称为包络发生器的部分控制。其中一个(放大器环境) 总是与放大器相关,放大器控制音符的振幅,也就是演奏时声音的音量。在 Summit每个包络发生器都有五个主要参数,这些参数决定了包络的形状;这些被称为 AHDSR 参数,或包络“相位”。
您会注意到,该图还包含一个额外的初始阶段,即延迟。这是按键敲击后,启动时间(以及整个 AHDSR 序列)所需的时间。这是另一个包络阶段,在其他合成器上通常不存在,但在 Summit。添加延迟时间后,我们将包络序列重命名为 DAHDSR,以确保完整性(尽管许多用户将继续使用更传统的术语 ADSR 来指代它)。
大多数现代合成器可以生成多个包络。 Summit 有三个包络发生器: 放大器环境 拥有一组专用的硬件 ADSR 滑块控制(延迟和保持功能可通过菜单单独控制),并始终应用于放大器,以调节每个演奏音符的音量,如上所述。两个调制包络(修改环境 1 和 修改环境 2) 共享一组相同的控制键,并通过分配开关选择要控制的包络。调制包络可用于在每个音符的生命周期内动态地改变合成器的其他部分。 Summit的 模式环境 例如,发生器可用于修改滤波器截止频率或振荡器方波输出的脉冲宽度。
与包络发生器类似,合成器的 LFO(低频振荡器)部分也是一种调制器。它并非声音合成器本身的一部分,而是用于改变(或调制)合成器的其他部分。例如,LFO 可以用来改变振荡器的音高、滤波器的截止频率以及许多其他参数。
大多数乐器发出的声音,其音量、音高和音色都会随时间而变化。有时,这些变化可能非常细微,但仍然对最终声音的特质产生重大影响。
包络用于控制单个音符生命周期内的一次性调制,而低频振荡器 (LFO) 则使用重复的循环波形或模式进行调制。如前所述,振荡器产生恒定的波形,其形状可以是重复的正弦波、三角波等。低频振荡器 (LFO) 以类似的方式产生波形,但通常频率过低,无法产生人耳能够直接感知的声音。与包络一样,LFO 产生的波形可以馈送到合成器的其他部分,以创建所需的声音随时间的变化(或“运动”)。
想象一下,将这种低频波施加到振荡器的音高上。结果是振荡器的音高在其原始音高上下缓慢上升和下降。这可以模拟例如小提琴手在拉弦时用手指上下移动乐器的音高。这种微妙的音高上下运动被称为“颤音”效果。