圖/Yapei
文/原禾香
當聽到自己被錄下的「聲音」,人們常常會覺得驚訝:「這真的是我的聲音嗎?」人耳能聽到語音、音樂與自然聲音,而且「錄音」可以把那時的聲音保存下來,甚至在未來重新播放。從19世紀開始的「聲跡」紀錄,到今日石墨烯微型麥克風,錄音技術一路演進。
錄音,一句話總結,就是一場把聲音(空氣振動)變成電訊號、再變成數據的物理學應用技術。
聲音的原理是「空氣被推擠出的小波浪」。當我們說話時,聲帶震動,推動空氣形成縱波(longitudinal wave),一前一後壓縮與稀疏,在空氣中做有節奏的起舞。
這些壓力變化可用一個數學公式表示:
Lp = 20 log10(p/20uPa)
● Lp:聲壓級 (單位:dB)
● p:實際聲壓(單位:帕,Pa)
● p0 = 20 uPa:參考聲壓,也就是人耳剛能聽見的最小聲壓。
這個公式是計算「聲壓級」,若數據是0dB,代表是人類「剛好能聽見的聲音」,而平常說話約60dB,搖滾樂可能衝破110dB。
聲壓轉換 需要翻譯
那麼到底如何「錄音」?這件事的本質就是「抓住」空氣的波動。而這個「捕聲」任務,需交給一個翻譯官「麥克風」。它的用途是把「聲壓」變成「電壓」,這樣的「空氣波」才能被數位設備解讀。早期到如今的麥克風大約分有3種:
● 動圈式麥克風:是一片薄膜帶動線圈,在磁場中切割磁力線。根據法拉第電磁感應,產生電壓。它的耐摔,最適合搖滾歌手用來「摔麥」。
● 電容式麥克風:結構是以振膜與背板之間形成一個可變電容器。聲波讓距離改變,電容也隨之變化,透過電源輸出信號。特質是靈敏細膩,屬於高貴等級。
● 石墨烯MEMS麥克風:到了2024年,研究者把「翻譯官」變成奈米級小祕書。石墨烯只有7奈米厚,直徑300微米的小振膜,靈敏度高到能偵測你呼吸裡的嘆息。
聲音變成電壓之後,電腦才登場,需要進行數位化的「取樣」與「量化」。
錄音技術 經驗取勝
一場好的錄音往往要靠錄音師豐富經驗。例如錄音師先選好地點,太空曠會回音、太密閉又悶。接著會決定麥克風距離,例如唱歌需距離15公分,錄吉他則為30公分,不然共鳴箱會變低音砲。之後設定電平,讓訊號維持在適當大小 ,防止「爆音」。錄好後進數位音訊工作站剪接、混音、壓縮、母帶。最後輸出成WAV、FLAC,或串流界愛用的MP3。
而錄音技術進步,常有工程師、發明家與錄音師的獨特故事與創意。例如1860年法國發明家Scott,用一種機械裝置錄製了最早的人聲波形,卻因為當時無法播放被歷史忽略,直到2008年,一群音頻研究者用掃描與「虛擬筆尖」技術把那段聲音轉成音檔,我們才「聽到」那段來自160多年前的歌聲。Les Paul身為爵士與搖滾吉他手,他從1945年起嘗試在同一台錄音機上疊錄,後續促成專業多軌錄音機的發展,被譽為「多軌錄音之父」。Ray Dolby在1960年代開發Dolby降噪系統,讓磁帶錄音時的沙沙聲顯著降低,使卡匣與錄音磁帶在一般等級也能達到不錯音質。到了英國搖滾樂團披頭四(The Beatles)希望主唱出多重人聲很麻煩,工程師Ken Townsend在1966年發明一種方法:用兩部同步播放機,稍微延遲一部複製聲道,來模擬二重人聲效果,成為錄音史上的經典技巧。
而今天的錄音技術,已經走進微奈米與AI的世界。石墨烯麥克風、光纖感測、Ambisonics空間音訊,甚至能讓未來在VR裡「轉頭就能聽見聲音變化」。
錄音的原理看似簡單:從聲波到電壓、到數據、最後到聲音。但真正被「錄下」的,其實不是聲音,而是當下那個人、那句話、那個空氣裡的「波動」情緒。