本文件涉及可包括聲場(chǎng)表示信號(hào)的沉浸式音頻信號(hào),確切來(lái)說(shuō)涉及高保真度體聲立復(fù)制信號(hào)。確切來(lái)說(shuō),本文件涉及提供使得能夠位速率高效方式及/或以高感知質(zhì)量傳輸及/或存儲(chǔ)沉浸式音頻信號(hào)的編碼器及對(duì)應(yīng)解碼器。
背景技術(shù):
1、可使用高保真度立體聲響復(fù)制信號(hào)描述處于收聽位置的收聽者的收聽環(huán)境內(nèi)的聲音或聲場(chǎng)。高保真度立體聲響復(fù)制信號(hào)可被視為多聲道音頻信號(hào),其中每一聲道對(duì)應(yīng)于收聽者的收聽位置處的聲場(chǎng)的特定方向性圖案??墒褂萌S(3d)笛卡兒坐標(biāo)系描述高保真度立體聲響復(fù)制信號(hào),其中坐標(biāo)系的原點(diǎn)對(duì)應(yīng)于收聽位置,x軸指向前,y軸指向左且z軸指向上。
2、通過(guò)增加音頻信號(hào)或聲道的數(shù)目且通過(guò)增加對(duì)應(yīng)方向性圖案(及對(duì)應(yīng)平移函數(shù))的數(shù)目,可增大描述聲場(chǎng)的精確性。舉例來(lái)說(shuō),一階高保真度立體聲響復(fù)制信號(hào)包括4個(gè)聲道或波形,即:w聲道,其指示聲場(chǎng)的全向分量;x聲道,其描述具有與x軸對(duì)應(yīng)的偶極方向性圖案的聲場(chǎng);y聲道,其描述具有與y軸對(duì)應(yīng)的偶極方向性圖案的聲場(chǎng);及z聲道,其描述具有與z軸對(duì)應(yīng)的偶極方向性圖案的聲場(chǎng)。二階高保真度立體聲響復(fù)制信號(hào)包括9個(gè)聲道,所述9個(gè)聲道包含一階高保真度立體聲響復(fù)制信號(hào)(也被稱為b格式)的4個(gè)聲道加上不同方向性圖案的5個(gè)額外聲道。一般來(lái)說(shuō),l階高保真度立體聲響復(fù)制信號(hào)包括(l+1)2個(gè)聲道,所述(l+1)2個(gè)聲道包含(l-1)階高保真度立體聲響復(fù)制信號(hào)的l2個(gè)聲道加上額外方向性圖案的[(l+1)2-l2]個(gè)額外聲道(當(dāng)使用3d高保真度立體聲響復(fù)制格式時(shí))。在l>1情況下的l階高保真度立體聲響復(fù)制信號(hào)可被稱為高階高保真度立體聲響復(fù)制(hoa)信號(hào)。
3、hoa信號(hào)可用于獨(dú)立于用于呈現(xiàn)hoa信號(hào)的揚(yáng)聲器的布置而描述3d聲場(chǎng)。揚(yáng)聲器的實(shí)例性布置包括耳機(jī)或擴(kuò)音器一或多種布置或者虛擬現(xiàn)實(shí)呈現(xiàn)環(huán)境。因此,將hoa信號(hào)提供到音頻呈現(xiàn)器以允許音頻呈現(xiàn)器靈活地適應(yīng)揚(yáng)聲器的不同布置可以是有益的。
4、聲場(chǎng)表示(sr)信號(hào)(例如高保真度立體聲響復(fù)制信號(hào))可與音頻對(duì)象及/或多聲道(試驗(yàn)臺(tái))信號(hào)互補(bǔ)以提供沉浸式音頻(ia)信號(hào)。本文件解決以帶寬高效方式在高感知質(zhì)量下傳輸及/或存儲(chǔ)ia信號(hào)的技術(shù)問(wèn)題。通過(guò)獨(dú)立技術(shù)方案解決技術(shù)問(wèn)題。所附權(quán)利要求書中描述優(yōu)選實(shí)例。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)一方面,描述一種對(duì)多聲道輸入信號(hào)進(jìn)行編碼的方法。所述多聲道輸入信號(hào)可以是沉浸式音頻(ia)信號(hào)的一部分。所述多聲道輸入信號(hào)可包括聲場(chǎng)表示(sr)信號(hào),確切來(lái)說(shuō)一階或高階高保真度立體聲響復(fù)制信號(hào)。所述方法包括從所述多聲道輸入信號(hào)確定多個(gè)降混聲道信號(hào)。此外,所述方法包括對(duì)所述多個(gè)降混聲道信號(hào)實(shí)行能量壓縮以提供多個(gè)經(jīng)壓縮聲道信號(hào)。另外,所述方法包括基于所述多個(gè)經(jīng)壓縮聲道信號(hào)且基于多聲道輸入信號(hào)確定聯(lián)合譯碼元數(shù)據(jù)(確切來(lái)說(shuō),空間音頻分辨率重構(gòu)spar元數(shù)據(jù)),其中聯(lián)合譯碼元數(shù)據(jù)使得其允許將所述多個(gè)經(jīng)壓縮聲道信號(hào)升混成多聲道輸入信號(hào)的近似值。所述方法進(jìn)一步包括對(duì)所述多個(gè)經(jīng)壓縮聲道信號(hào)及所述聯(lián)合譯碼元數(shù)據(jù)進(jìn)行編碼。
2、根據(jù)另一方面,描述一種從指示多個(gè)經(jīng)重構(gòu)聲道信號(hào)的經(jīng)譯碼音頻數(shù)據(jù)且從指示聯(lián)合譯碼元數(shù)據(jù)的經(jīng)譯碼元數(shù)據(jù)確定經(jīng)重構(gòu)多聲道信號(hào)的方法。所述方法包括對(duì)所述經(jīng)譯碼音頻數(shù)據(jù)進(jìn)行解碼以提供所述多個(gè)經(jīng)重構(gòu)聲道信號(hào)且對(duì)所述經(jīng)譯碼元數(shù)據(jù)進(jìn)行解碼以提供所述聯(lián)合譯碼元數(shù)據(jù)。此外,所述方法包括使用所述聯(lián)合譯碼元數(shù)據(jù)從所述多個(gè)經(jīng)重構(gòu)聲道信號(hào)確定所述經(jīng)重構(gòu)多聲道信號(hào)。
3、根據(jù)另一方面,描述一種軟件程序。所述軟件程序可適于在處理器上執(zhí)行且當(dāng)在處理器上施行時(shí)實(shí)行本文件中所概述的方法步驟。
4、根據(jù)另一方面,描述一種存儲(chǔ)媒體。所述存儲(chǔ)媒體可包括適于在處理器上執(zhí)行的軟件程序及當(dāng)在所述處理器上施行時(shí)實(shí)行本文件中所概述的方法步驟。
5、根據(jù)另一方面,描述一種計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序可包括當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí)實(shí)行本文件中所概述的方法步驟的可執(zhí)行指令。
6、根據(jù)另一方面,描述一種用于對(duì)多聲道輸入信號(hào)及/或沉浸式音頻(ia)信號(hào)進(jìn)行編碼的編碼單元或編碼裝置。所述編碼單元經(jīng)配置以從多聲道輸入信號(hào)確定多個(gè)降混聲道信號(hào)。此外,所述編碼單元經(jīng)配置以對(duì)所述多個(gè)降混聲道信號(hào)實(shí)行能量壓縮以提供多個(gè)經(jīng)壓縮聲道信號(hào)。另外,所述編碼單元經(jīng)配置以基于所述多個(gè)經(jīng)壓縮聲道信號(hào)且基于多聲道輸入信號(hào)確定聯(lián)合譯碼元數(shù)據(jù),其中所述聯(lián)合譯碼元數(shù)據(jù)使得允許將所述多個(gè)經(jīng)壓縮聲道信號(hào)升混成多聲道輸入信號(hào)的近似值。所述編碼單元進(jìn)一步經(jīng)配置以對(duì)所述多個(gè)經(jīng)壓縮聲道信號(hào)及所述聯(lián)合譯碼元數(shù)據(jù)進(jìn)行編碼。
7、根據(jù)另一方面,描述一種用于從指示多個(gè)經(jīng)重構(gòu)聲道信號(hào)的經(jīng)譯碼音頻數(shù)據(jù)且從指示聯(lián)合譯碼元數(shù)據(jù)的經(jīng)譯碼元數(shù)據(jù)確定重構(gòu)多聲道信號(hào)的解碼單元或解碼裝置。所述解碼單元經(jīng)配置以對(duì)經(jīng)譯碼音頻數(shù)據(jù)進(jìn)行解碼以提供所述多個(gè)經(jīng)重構(gòu)聲道信號(hào)且對(duì)所述經(jīng)譯碼元數(shù)據(jù)進(jìn)行解碼以提供所述聯(lián)合譯碼元數(shù)據(jù)。此外,所述解碼單元經(jīng)配置以使用所述聯(lián)合譯碼元數(shù)據(jù)從所述多個(gè)經(jīng)重構(gòu)聲道信號(hào)確定所述經(jīng)重構(gòu)多聲道信號(hào)。
8、應(yīng)注意,本專利申請(qǐng)案中所概述的方法、裝置及系統(tǒng)(包含其優(yōu)選實(shí)施例)可單獨(dú)使用,或者與本文件中所揭示的其它方法、裝置及系統(tǒng)組合使用。此外,可任意地組合本專利申請(qǐng)案中所概述的方法、裝置及系統(tǒng)的所有方面。確切來(lái)說(shuō),技術(shù)方案的特征可彼此任意地組合。
1.一種用于對(duì)多聲道輸入高保真度立體聲響復(fù)制信號(hào)進(jìn)行編碼的方法,其中所述方法包括: