久草久热,国产三级理论片,国产精品欧美日韩视频一区,热热色国产,91av视频网站,日韩国产欧美视频一区二区三区,婷婷五月五

DAV首頁
數(shù)字音視工程網(wǎng)

微信公眾號(hào)

數(shù)字音視工程網(wǎng)

手機(jī)DAV

null
null
null
卓華,
招商,
null
null
null
null
null

我的位置:

share

關(guān)于語言清晰度(可理解性)的深入洞察(二)

來源:同創(chuàng)音頻        編輯:ZZZ    2024-06-18 09:42:23     加入收藏

在語音中,共振峰是另一個(gè)重要的概念。它們是通過聲道中空腔的共振“調(diào)諧”而產(chǎn)生的,

  在上一期的探討中,我們深入了解了語音產(chǎn)生的原理,并分享了關(guān)于錄擴(kuò)音的實(shí)用建議。本期,我們將繼續(xù)這一旅程,聚焦于語音頻譜、共振峰以及影響語言清晰度的關(guān)鍵因素,以期為大家呈現(xiàn)更全面的語言清晰度(可理解性)洞察。

 

  語音頻譜

  語音的頻譜覆蓋了可聽頻譜的廣泛區(qū)域,其中元音輔音 構(gòu)成了語音的基本元素。元音 由聲帶振動(dòng)產(chǎn)生,經(jīng)過聲腔的精細(xì)過濾,賦予聲音獨(dú)特的音色。而輔音 則是由空氣在喉嚨和口腔中的流動(dòng),特別是舌頭和嘴唇的精細(xì)操作產(chǎn)生的。

  元音的特征,即使是在講悄悄話中也能被識(shí)別,這是因?yàn)樾纬刹煌舻目涨唤Y(jié)構(gòu)依然影響著空氣的流動(dòng)。男性復(fù)雜語音音調(diào)的基頻通常在100-120 Hz之間,女性則高出一個(gè)八度,而兒童則更高。輔音則通常位于500 Hz以上的高頻區(qū)域,對(duì)語音的清晰度至關(guān)重要。

 

  共振峰

  在語音中,共振峰是另一個(gè)重要的概念。它們是通過聲道中空腔的共振“調(diào)諧”而產(chǎn)生的,

  如果你聽兩個(gè)人以相同的音高說或唱同一個(gè)元音,那么在這兩種情況下,元音可能是相同的。然而,任何兩種聲音都不一定產(chǎn)生完全相同的頻譜。共振峰為元音提供了可感知的特征,每個(gè)人獨(dú)特的聲道結(jié)構(gòu)使得共振峰具有個(gè)體差異,這也是我們能夠區(qū)分不同說話者聲音的原因。

 

  影響語言清晰度的關(guān)鍵因素

  一、輔音的重要性:

  在漢語、泰語等聲調(diào)語言中,語調(diào)或基本頻率承載著意義。而在非聲調(diào)語言中,如英語、西班牙語和日語,元音和輔音的變化則是區(qū)分單詞的關(guān)鍵。其中,輔音的重要性尤為突出。輔音主要位于高頻區(qū)域,對(duì)于語言的清晰度具有決定性作用。

  二、頻率的重要性:

  西方語音中,頻率的重要性如下圖所示:

  在圖中我們可以看到,2kHz左右的頻帶是感知清晰度方面最重要的頻率范圍。因?yàn)榇蠖鄶?shù)輔音都在這個(gè)頻帶中。

  (Ref: N.R. French & J.C. Steinberg: Factors governing the intelligibility of speech sounds. JASA vol. 19, No 1, 1947).

  對(duì)語音信號(hào)進(jìn)行高通或低通濾波的實(shí)驗(yàn)也驗(yàn)證了這一點(diǎn)。使用20 Hz的高通濾波器,語音可以100%被理解,這是因?yàn)橥暾恼Z音頻譜并未被過濾。當(dāng)高通濾波器切斷500Hz以下的信號(hào)時(shí),因?yàn)榧词挂徊糠终Z音能量被刪除,語音的可理解性僅降低5%;但當(dāng)低通濾波器在1kHz處切斷時(shí),可理解性已大幅下降至40%以下。這再次強(qiáng)調(diào)了1kHz至4kHz頻率范圍對(duì)語音清晰度的重要性。

  三、背景噪聲:

  背景噪聲是影響語音清晰度的另一重要因素。在語音系統(tǒng)中,除了語音本身之外的所有信號(hào)都可以被認(rèn)為是噪聲。因此,在禮堂或教室里,空調(diào)和其他嘈雜的設(shè)備運(yùn)行時(shí)都會(huì)使語音變得不那么清晰。此外,其他人的存在也會(huì)產(chǎn)生噪音。在電視或電影音效中,對(duì)白的電平與背景音樂或氛圍聲音電平之間的關(guān)系問題也是非常重要的。

  在這個(gè)圖表中,語音可理解度是根據(jù)信噪比(S/N)繪制的。較低的曲線表明,即使信噪比為負(fù),也就是說噪聲比語音水平高10 dB,語音仍然可以在一定程度上被理解。但在任何情況下,最佳的感知語音水平約為60 dB或20 μPa。

  通過大量的研究,總的來說結(jié)果表明:

  1. 當(dāng)背景噪音低于40dBA時(shí),最佳語音電平不變。

  2. 當(dāng)背景噪聲電平大于40 dB(A)時(shí),最佳語音電平或信噪比保持在+15 dB(A)左右的電平。

  3. 在信噪比足夠好的情況下,聽力可理解性的難度隨著語音電平的增加而增加,使可理解性接近完美。

  此外,1kHz-4kHz的頻率范圍應(yīng)該“保持清晰”。例如,當(dāng)添加音樂在影視作品中作為背景時(shí),參量均衡器在該頻率范圍內(nèi)衰減音樂5-10 dB,這樣將會(huì)提高語音對(duì)白的可理解性。

  四、混響:

  在談?wù)撜Z音清晰度時(shí),混響也被視為一種“噪音”。雖然輕微的混響可以支持講話,但一旦輔音被抹去,可理解性將大幅下降。因此,在錄音和擴(kuò)聲過程中,需要仔細(xì)控制混響的影響。

  通過深入了解語音頻譜、共振峰以及影響語言清晰度的關(guān)鍵因素,我們可以更好地掌握如何確保在各種場(chǎng)景下維持高質(zhì)量的語音清晰度。無論是面對(duì)面交流還是通過擴(kuò)聲系統(tǒng)傳播聲音,這些洞察都將為我們提供寶貴的指導(dǎo)。

免責(zé)聲明:本文來源于同創(chuàng)音頻,本文僅代表作者個(gè)人觀點(diǎn),本站不作任何保證和承諾,若有任何疑問,請(qǐng)與本文作者聯(lián)系或有侵權(quán)行為聯(lián)系本站刪除。
掃一掃關(guān)注數(shù)字音視工程網(wǎng)公眾號(hào)

相關(guān)閱讀related

評(píng)論comment

 
驗(yàn)證碼:
您還能輸入500