淺談數(shù)字混音技術
來源:數(shù)字音視工程網(wǎng) 作者:cofee 編輯:數(shù)字音視工程 2011-01-19 00:00:00 加入收藏
現(xiàn)場討論是數(shù)字會議系統(tǒng)最主要的功能之一,公司針對現(xiàn)場討論應用中的實際聲學特征,在深入研究各種主流數(shù)字混音算法的基礎上,提出了一系列具有自主知識產(chǎn)權的實時語音混音算法,該系列算法可以在高質(zhì)量重現(xiàn)原始聲場效果的前提下,避免現(xiàn)有混音系統(tǒng)中由于線性疊加產(chǎn)生的數(shù)據(jù)溢出,而產(chǎn)生噪音和語音不連續(xù)的現(xiàn)象,有效提高聲音的辨識度,同時具有極低的聲音延遲和穩(wěn)定的實時計算性能。
飛利信公司的數(shù)字混音技術利用了人耳的掩蔽域效應,即一個較弱的聲音(被掩蔽音)的聽覺感受被另一個較強的聲音(掩蔽音)影響的現(xiàn)象,由于人耳的掩蔽域效應,使得當大的語音信號(能量強的語音信號)與小的語音信號(能量弱的語音信號)同時存在時,小的語音信號無法被人耳有效地識別,因此,在實際的會議系統(tǒng)中,當多人同時發(fā)言時,通常只有少部分音量大的聲音可以被人耳有效地識別。
該系列數(shù)字混音算法正是基于實際會議系統(tǒng)工作條件下的上述聲學特性,進行多路聲音處理而實現(xiàn),通過使原始輸入的聲音能量較強的幾路語音數(shù)據(jù)在進行混音時被相對強化,而使其他各路語音數(shù)據(jù)被相對弱化,從而在保持與現(xiàn)場實際聲場效果相一致的前提下,更好地重現(xiàn)在實際會議過程中能夠被人耳有效識別的語音。
飛利信公司基于該項技術提出的"混音裝置、混音方法及利用該混音裝置的會議系統(tǒng)"發(fā)明專利申請已進入實質(zhì)審查程序。
評論comment