信號處理設備、方法和程序

信號處理設備、方法和程序

信號處理設備、方法和程序是由山本優樹 知念徹 畠中光行 發明開發。

描述了一種用于處理編碼音頻信號的方法、系統和計算機程序產品。在一個示例性實施例中,系統接收編碼的低頻范圍信號和編碼的能量信息,該編碼的能量信息用于對編碼的低頻范圍信號進行頻移。對低頻范圍信號進行解碼,并且對解碼信號的能量凹陷進行平滑。對平滑后的低頻范圍信號進行頻移,以生成高頻范圍信號。然后組合低頻范圍信號和高頻范圍信號并輸出。

[0001] 本公開內容涉及一種信號處理設備和方法以及程序。更具體地,實施例涉及一種被配置成使得在對編碼音頻信號進行解碼的情況下獲得較高音頻質量的音頻的信號處理設備和方法以及程序。

背景技術

[0002] 傳統上,HE-AAC(高效MPEG(運動圖像專家組)4 AAC(高級音頻編碼))(國際標準ISO/IEC 14496-3)等公知為音頻信號編碼技術。利用這樣的編碼技術,使用稱為SBR(頻帶復制,Spectral Band Replication)的高頻帶特性編碼技術(例如,參見PTL1)。

[0003] 對于SBR,當對音頻信號進行編碼時,音頻信號的編碼低頻帶分量(下文中指定為低頻帶信號,即,低頻范圍信號 ) 與 SBR 信息一起輸出,以生成音頻信號的高頻帶分量 ( 下文中指定為高頻帶信號,即,高頻范圍信號)。利用解碼設備,對編碼低頻帶信號進行解碼,此外,通過解碼獲得的低頻帶信號和 SBR 信息用于生成高頻帶信號,并且獲得包括低頻帶信號和高頻帶信號的音頻信號。

[0004] 更具體地,假設圖1所示的低頻帶信號SL1是例如通過解碼獲得的。這里,在圖1中,水平軸表示頻率,并且垂直軸表示音頻信號的各個頻率的能量。另外,圖中的垂直虛線表示比例因子(scalefactor)帶邊界。比例因子帶是給定帶寬的、以多個捆綁(bundle)子帶的帶,即,QMF(正交鏡像濾波器)分析濾波器的分辨率。

[0005] 在圖 1 中,包括在低頻帶信號 SL1 的圖的右側的七個連續比例因子帶的帶作為高頻帶。通過對SBR信息進行解碼來獲得高頻帶側的每個比例因子帶的高頻帶比例因子帶能量E11至E17。

[0006] 另外,使用低頻帶信號 SL1 和高頻帶比例因子帶能量,并且生成每個比例因子帶的高頻帶信號。例如,在生成比例因子帶Bobj的高頻帶信號的情況下,來自低頻帶信號SL1的比例因子帶Borg的分量被頻移到比例因子帶Bobj的帶。通過頻移而獲得的信號被調整增益并且作為高頻帶信號。此時,進行增益調制,以使得通過頻移獲得的信號的平均能量變為與比例因子帶Bobj中的高頻帶比例因子帶能量E13相同的幅值。

[0007] 根據這樣的處理,圖 2 所示的高頻帶信號 SH1 被生成作為比例因子帶 Bogj 分量。這里,在圖2中,相同的附圖標記給與對應于圖1中的情況的部分,并且省略或減少其描述。

[0008] 以此方式,在音頻信號解碼側,低頻帶信號和 SBR 信息用于生成不包括在編解碼的低頻帶信號中的高頻帶分量并且對帶進行擴展,從而使得可以回放較高音頻質量的音頻。

[0009] 引用列表

[0010] 專利文獻

[0011] PTL1:日本未審查專利申請公布(PCT申請的翻譯)第2001-521648號。

內容

[0012] 公開了一種用于處理音頻信號的計算機實現方法。該方法可包括接收與音頻信號對應的編碼低頻范圍信號。該方法還可包括對信號進行解碼,以產生具有形狀包括能量凹陷的能量譜的解碼信號。另外,該方法可包括對解碼信號執行濾波處理,該濾波處理將解碼信號分離成低頻范圍帶信號。該方法還可包括對解碼信號執行平滑處理,該平滑處理對解碼信號的能量凹陷進行平滑。該方法還可包括對平滑后的解碼信號執行頻移,頻移從低頻范圍帶信號生成高頻范圍帶信號。另外,該方法可包括組合低頻范圍帶信號和高頻范圍帶信號,以生成輸出信號。該方法還可包括輸出該輸出信號。

[0013] 還公開了一種用于處理信號的裝置。該裝置可包括:低頻范圍解碼電路,被配置成接收與音頻信號對應的編碼低頻范圍信號,以及對編碼信號進行解碼以產生具有形狀包括能量凹陷的能量譜的解碼信號。另外,該裝置可包括:濾波處理器,被配置成對解碼信號執行濾波處理,該濾波處理將解碼信號分離成低頻范圍帶信號。該裝置還可包括:高頻范圍生成電路,被配置成對解碼信號執行平滑處理,該平滑處理對能量凹陷進行平滑,并對平滑后的解碼信號執行頻移,該頻移從低頻范圍帶信號生成高頻范圍帶信號。該裝置另外可包括:組合電路,被配置成組合低頻范圍帶信號和高頻范圍帶信號以生成輸出信號,并且輸出該輸出信號。

[0014] 還公開了一種包括指令的有形呈現的計算機可讀存儲介質,該指令當由處理器執行時,執行用于處理音頻信號的方法。該方法可包括接收與音頻信號對應的編碼低頻范圍信號。該方法還可包括對信號進行解碼以產生具有形狀包括能量凹陷的能量譜的解碼信號。另外,該方法可包括對解碼信號執行濾波處理,該濾波處理將解碼信號分離成低頻范圍帶信號。該方法還可包括對解碼信號執行平滑處理,該平滑處理對解碼信號的能量凹陷進行平滑。該方法還可包括對平滑后的解碼信號執行頻移,頻移從低頻范圍帶信號生成高頻范圍帶信號。另外,該方法可包括組合低頻范圍帶信號和高頻范圍帶信號,以生成輸出信號。該方法還可包括輸出該輸出信號。技術問題

[0015] 然而,在用于生成高頻帶信號的低頻帶信號 SL1 中存在洞的情況下,即,在存在用于生成高頻范圍信號的、具有形狀包括能量凹陷的能量譜的低頻范圍信號 ( 如圖 2 中的比例因子帶 Borg) 的情況下,所獲得的高頻帶信號 SH1 的形狀非??赡軐⒆兂膳c原始信號的頻率形狀大大不同的形狀,這成為聽覺退化的原因。這里,低頻帶信號中存在洞的狀態指的是如下狀態:其中,給定帶的能量顯著低于相鄰帶的能量,其中低頻帶功率譜 ( 各個頻率的能量波形)的一部分在圖中向下突出。換言之,其指的是如下狀態: 其中,帶分量的一部分的能量下陷,即,形狀包括能量凹陷的能量譜。

[0016] 在圖2的示例中,由于凹陷存在于用于生成高頻帶信號(即,高頻范圍信號)的低頻帶信號 ( 即,低頻范圍信號 )SL1 中,因此凹陷還出現在高頻帶信號 SH1 中。如果凹陷以此方式存在于用于生成高頻帶信號的低頻帶信號中,則不再能夠精確地再現高頻帶分量,并且在通過解碼獲得的音頻信號中會出現聽覺退化。

[0017] 另外,對于SBR,可以進行稱為增益限制和內插的處理。在一些情況下,這樣的處理會使得凹陷出現在高頻帶分量中。

[0018] 這里,增益限制是如下處理:其將包括多個子帶的受限帶內的增益的峰值抑制到該受限帶內的增益的平均值。

[0019] 例如,假設圖3所示的低頻帶信號SL2是通過對低頻帶信號進行解碼而獲得的。這里,在圖3中,水平軸表示頻率,而垂直軸表示音頻信號的各個頻率的能量。另外,圖中的垂直虛線表示比例因子帶邊界。

[0020] 在圖 3 中,包括在低頻帶信號 SL2 的圖的右側的七個連續比例因子帶的帶作為高頻帶。通過對SBR信息進行解碼,獲得高頻帶比例因子帶能量E21至E27。

[0021] 另外,包括從Bobj1至Bobj3的三個比例因子帶的帶作為受限帶。此外,假設使用低頻帶信號 SL2 的比例因子帶 Borg1 至 Borg3 的各個分量,并且生成高頻帶側的比例因子帶Bobj1至Bobj3的各個高頻帶信號。

[0022] 因此,當生成比例因子帶 Bobj2 中的高頻帶信號 SH2 時,基本上根據低頻帶信號SL2的比例因子帶Borg2的平均能量與高頻帶比例因子帶能量E22之間的能量差G2來進行增益調整。換言之,通過對低頻帶信號 SL2 的比例因子帶 Borg2 的分量進行頻移并且將作為結果獲得的信號乘以能量差G2來進行增益調整。這作為高頻帶信號SH2。

[0023] 然而,對于增益限制,如果能量差 G2 大于受限帶內的比例因子帶 Bobj1 至 Bobj3的能量差 G1 至 G3 的平均值 G,則與頻移后的信號相乘的能量差 G2 將作為平均值 G。換言之,將向下抑制比例因子帶Bobj2的高頻帶信號的增益。

[0024] 在圖 3 的示例中,低頻帶信號 SL2 的比例因子帶 Borg2 的能量與相鄰的比例因子帶Borg1和Borg3的能量相比變小。換言之,在比例因子帶Borg2部分出現了凹陷。

[0025] 相比之下,比例因子帶 Bobj2( 即,低頻帶分量的施加目的地 ) 的高頻帶比例因子帶能量E22大于比例因子帶Bobj1和Bobj3的高頻帶比例因子帶能量。

[0026] 為此,比例因子帶Bobj2的能量差G2變得高于受限帶內的能量差的平均值G,并且通過增益限制向下抑制比例因子帶Bobj2的高頻帶信號的增益。

[0027] 因此,在比例因子帶Bobj2中,高頻帶信號SH2的能量變得顯著低于高頻帶比例因子帶能量 E22,并且所生成的高頻帶信號的頻率形狀變為顯著不同于原始信號的頻率形狀的形狀。因此,在通過解碼最終獲得的音頻中發生聽覺退化。

[0028] 另外,內插是對除每個比例因子帶之外的每個子帶執行頻移和增益調整的高頻帶信號生成技術。

[0029] 例如,如圖4所示,假設使用低頻帶信號SL3的各個子帶Borg1至Borg3,生成高頻帶側的子帶 Bobj1 至 Bobj3 中的各個高頻帶信號,并且包括子帶 Bobj1 至 Bojb3 的帶作為受限帶。

[0030] 這里,在圖 4 中,水平軸表示頻率,并且垂直軸表示音頻信號的各個頻率的能量。另外,通過對SBR信息進行解碼,獲得每個比例因子帶的高頻帶比例因子帶能量E31至E37。

[0031] 在圖 4 的示例中,低頻帶信號 SL3 中的子帶 Borg2 的能量與相鄰子帶 Borg1 和Borg3的能量相比變小,并且在子帶Borg2部分中出現了凹陷。為此,并且與圖3中的情況類似,低頻帶信號 SL3 的子帶 Borg2 的能量與高頻帶比例因子帶能量 E33 之間的能量差變得高于受限帶內的能量差的平均值。因此,通過增益限制向下抑制子帶 Bobj2 中的高頻帶信號SH3的增益。

[0032] 結果,在子帶Bobj2中,高頻帶信號SH3的能量變得顯著低于高頻帶比例因子帶能量 E33,并且所生成的高頻帶信號的頻率形狀可變為顯著不同于原始信號的頻率形狀的形狀。因此,與圖3中的情況類似,在通過解碼獲得的音頻中發生了聽覺退化。

[0033] 如以上,對于 SBR,存在如下情況:其中,由于用于生成高頻帶信號的低頻帶信號的功率譜的形狀(頻率形狀),因此在音頻信號解碼側無法獲得高音頻質量的音頻。

[0034] 本發明的有益效果

[0035] 根據實施例的方面,可以在對音頻信號進行解碼的情況下獲得較高音頻質量的音頻。

技術要求書

1.一種用于處理音頻信號的計算機實現方法,所述方法包括:接收與所述音頻信號對應的編碼低頻范圍信號;對所述編碼信號進行解碼,以產生具有形狀包括能量凹陷的能量譜的解碼信號;對所述解碼信號執行濾波處理,所述濾波處理將所述解碼信號分離成低頻范圍帶信號;對所述解碼信號執行平滑處理,所述平滑處理對所述解碼信號的所述能量凹陷進行平滑;對平滑后的解碼信號執行頻移,所述頻移從所述低頻范圍帶信號生成高頻范圍帶信號;組合所述低頻范圍帶信號和所述高頻范圍帶信號以生成輸出信號;以及輸出所述輸出信號。

2. 根據權利要求 1 所述的計算機實現方法,其中,所述編碼信號還包括所述低頻范圍帶信號的能量信息。

3. 根據權利要求 2 所述的計算機實現方法,其中,基于所述低頻范圍帶信號的所述能量信息執行所述頻移。

4. 根據權利要求 1 所述的計算機實現方法,其中,所述編碼信號還包括所述音頻信號的高頻范圍帶的頻帶復制SBR信息。

5.根據權利要求4所述的計算機實現方法,其中,基于所述SBR信息執行所述頻移。

6. 根據權利要求 1 所述的計算機實現方法,其中,所述編碼信號還包括所述低頻范圍帶信號的平滑位置信息。

7. 根據權利要求 6 所述的計算機實現方法,其中,基于所述低頻范圍帶信號的所述平滑位置信息對所述解碼信號執行所述平滑處理。

8. 根據權利要求 1 所述的計算機實現方法,還包括:對頻移后的平滑解碼帶信號執行增益調整。

9. 根據權利要求 8 所述的計算機實現方法,其中,所述編碼信號還包括所述低頻范圍帶信號的增益信息。

10.根據權利要求9所述的計算機實現方法,其中,基于所述增益信息對頻移后的解碼信號執行增益調整。

11.根據權利要求1所述的計算機實現方法,還包括:計算所述低頻范圍帶信號的平均能量。

12.根據權利要求1所述的計算機實現方法,其中,對所述解碼信號執行平滑處理還包括:計算多個低頻范圍帶信號的平均能量;通過計算所述多個低頻范圍帶信號的平均能量與所選擇的低頻范圍帶信號的能量的比率,計算所述低頻范圍帶信號中所選擇的一個的比率;以及通過將所選擇的低頻范圍帶信號的能量乘以算出的比率,執行平滑處理。

13.根據權利要求1所述的計算機實現方法,其中,對所述編碼信號進行多路復用。

14. 根據權利要求 13 所述的計算機實現方法,還包括:對多路復用后的編碼信號進行解復用。

15.根據權利要求1所述的計算機實現方法,其中,使用高級音頻編碼AAC方案對所述編碼信號進行編碼。

16.一種用于處理音頻信號的裝置,所述裝置包括:低頻范圍解碼電路,被配置成接收與所述音頻信號對應的編碼低頻范圍信號,以及對所述編碼信號解碼,以產生具有形狀包括能量凹陷的能量譜的解碼信號;濾波處理器,被配置成對所述解碼信號執行濾波處理,所述濾波處理將所述解碼信號分離成低頻范圍帶信號;高頻范圍生成電路,被配置成:對所述解碼信號執行平滑處理,所述平滑處理對所述能量凹陷進行平滑;以及對平滑后的解碼信號執行頻移,所述頻移從所述低頻范圍帶信號生成高頻范圍帶信號;以及組合電路,被配置成組合所述低頻范圍帶信號和所述高頻范圍帶信號以生成輸出信號,并且輸出所述輸出信號。

說明書附圖

圖1

圖2

圖3

圖4

圖5

圖6

圖7

圖8

圖9

圖10

圖11

圖12

圖13

圖14