低帶寬條件下的語言傳輸方法及語言傳輸系統

低帶寬條件下的語言傳輸方法及語言傳輸系統

低帶寬條件下的語言傳輸方法及語言傳輸系統是由李新明 劉斌 發明開發。

本發明涉及一種低帶寬條件下的語言傳輸方法及語言傳輸系統,所述方法包括:通過語音識別技術將原始語音信息轉換成文本信息;通過語音合成技術將所述文本信息轉換成機器語音信息;通過聲紋識別技術,將所述機器語音信息轉換成特定人的語音信息。所述語言傳輸系統包括語音應用接口模塊、客戶端模塊、及服務器模塊。本發明通過語音識別技術、語音合成技術及聲紋識別技術,解決在特定區域和特定環境下的溝通和交互障礙,提高交互和溝通效率。

[0001] 本發明涉及一種低帶寬條件下的語言傳輸方法及語言傳輸系統。

背景技術

[0002] 當今時代,通訊技術正在迅猛發展,語音通信在通訊技術中扮演著重要的地位。但無論是有線傳輸還是無線傳輸,信道帶寬資源都相對寶貴,再如在一些特定的領域內,可用于數據傳輸的帶寬資源是很低的,且這些帶寬資源可分配給通信傳輸的帶寬是更低的,如何能在低帶寬的條件下實現高品質的語音質量及語音傳輸是必須解決的問題。目前的難點主要如下:1、語音在經過壓縮后數據大小仍會達到十幾到幾十KB級別,這大大超過了某些領域可用于通信的帶寬資源。2、為滿足低帶寬條件,語音數據在經過壓縮及解壓后,質量得不到保證。

[0003] 目前在解決低帶寬語音傳輸方面,市面上并沒有太多可靠的解決方案,大多公司采用的是優化壓縮算法,將采樣后的語音數據壓縮至更小數據量級,但仍然不能滿足某些領域低帶寬的傳輸條件。

內容

[0004] 本發明的目的在于提供一種解決在特定區域和特定環境下的溝通和交互障礙、提高交互和溝通效率的低帶寬條件下的語言傳輸方法及語言傳輸系統。

[0005] 為達到上述目的,本發明提供如下技術方案:一種低帶寬條件下的語言傳輸方法,所述方法包括:

[0006] 通過語音識別技術將原始語音信息轉換成文本信息;

[0007] 通過語音合成技術將所述文本信息轉換成機器語音信息;

[0008] 通過聲紋識別技術,將所述機器語音信息轉換成特定人的語音信息。

[0009] 進一步地,所述“通過語音識別技術將原始語音信息轉換成文本信息”具體包括:

[0010] 所述語音識別技術識別單次原始語音信息并轉換成文本信息或者所述語音識別技術識別多次連續的原始語音信息并轉換合成文本信息,然后進行網絡交互。

[0011] 進一步地,所述方法還包括:

[0012] 在進行網絡交互前,對語音信息進行音頻壓縮。

[0013] 進一步地,所述文本信息為字符編碼格式的文本信息,所述字符編碼格式包括GB18030、UTF-8及其他字符編碼格式。

[0014] 進一步地,所述“通過語音合成技術將所述文本信息轉換成機器語音信息”具體包括:接收所述文本信息并將之轉換成機器語音信息,并對所述機器語音信息進行有效語音信息檢測,以從所述機器語音信息中分離出有效的語音信息并輸出。

[0015] 進一步地,所述方法還包括:

[0016] 用戶上傳錄音文件,所述聲紋識別技術提取用戶的聲紋特征,并對提取內容進行質量檢查,將符合聲紋采集標準的音頻及聲紋數據存入聲紋數據庫;

[0017] 所述聲紋數據庫提供一分布式存儲系統,所述分布式存儲系統包括若干個存儲節點及讀取器,將采集到的音頻及聲紋數據存入至所述存儲節點,所述讀取器讀取所述采集到的音頻及聲紋數據并進行驗證識。

[0018] 進一步地,所述聲紋數據庫整合Web前端組件實現通過HTTP下載和試點的負載均衡,并配合分布式計算引擎實現快速的數據存取。

[0019] 進一步地,所述采集到的音頻及聲紋數據包括若干個二進制聲紋、特征及語音的音頻文件。

[0020] 本發明還提供了一種語言傳輸系統,所述語言傳輸系統包括語音應用接口模塊、客戶端模塊、及服務器模塊;

[0021] 所述客戶端模塊接收用戶所發出的原始語音信息并將所述原始語音信息轉換成文本信息,所述語音應用接口模塊接收所述文本信息,將所述文本信息再轉換成機器語音信息并進行聲紋處理以轉換成特定人的語音信息后發送至所述服務器模塊。

[0022] 進一步地,所述語言傳輸系統還包括基礎支撐模塊,所述基礎支撐模塊接收所述機器語音信息并進行網絡交互,然后將網絡交互后的機器語音信息傳輸至所述服務器模塊。

[0023] 本發明的有益效果在于:通過語音識別技術,不直接將原始語音信息進行傳輸,而是將原始語音信息轉換成文本信息再將文本信息進行傳輸,可以大大降低傳輸帶寬的占用率,從而滿足低帶寬條件下的傳輸問題;

[0024] 通過語音合成技術,將文本信息轉換成對應的機器語音信息返回給用戶,有效提高了傳輸效率及準確度;

[0025] 通過聲紋識別技術,從機器語音信息中提取出代表不同說話人身份的相關固有特征,識別出說話人身份再返回給用戶,解決了交互障礙,提高了溝通效率。

[0026] 上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,并可依照說明書的內容予以實施,以下以本發明的較佳實施例并配合附圖詳細說明如后。

技術要求書

1.一種低帶寬條件下的語言傳輸方法,其特征在于,所述方法包括:通過語音識別技術將原始語音信息轉換成文本信息;通過語音合成技術將所述文本信息轉換成機器語音信息;通過聲紋識別技術,將所述機器語音信息轉換成特定人的語音信息。

2.如權利要求1所述的低帶寬條件下的語言傳輸方法,其特征在于,所述“通過語音識別技術將原始語音信息轉換成文本信息”具體包括:所述語音識別技術識別單次原始語音信息并轉換成文本信息或者所述語音識別技術識別多次連續的原始語音信息并轉換合成文本信息,然后進行網絡交互。

3.如權利要求2所述的低帶寬條件下的語言傳輸方法,其特征在于,所述方法還包括:在進行網絡交互前,對語音信息進行音頻壓縮。

4.如權利要求2所述的低帶寬條件下的語言傳輸方法,其特征在于,所述文本信息為字符編碼格式的文本信息,所述字符編碼格式包括GB18030、UTF-8及其他字符編碼格式。

5.如權利要求1所述的低帶寬條件下的語言傳輸方法,其特征在于,所述“通過語音合成技術將所述文本信息轉換成機器語音信息”具體包括:接收所述文本信息并將之轉換成機器語音信息,并對所述機器語音信息進行有效語音信息檢測,以從所述機器語音信息中分離出有效的語音信息并輸出。

6.如權利要求1所述的低寬帶條件下的語言傳輸方法,其特征在于,所述方法還包括:用戶上傳錄音文件,所述聲紋識別技術提取用戶的聲紋特征,并對提取內容進行質量檢查,將符合聲紋采集標準的音頻及聲紋數據存入聲紋數據庫;所述聲紋數據庫提供一分布式存儲系統,所述分布式存儲系統包括若干個存儲節點及讀取器,將采集到的音頻及聲紋數據存入至所述存儲節點,所述讀取器讀取所述采集到的音頻及聲紋數據并進行驗證識。

7.如權利要求6所述的低寬帶條件下的語言傳輸方法,其特征在于,所述聲紋數據庫整合Web前端組件實現通過HTTP下載和試點的負載均衡,并配合分布式計算引擎實現快速的數據存取。

8.如權利要求6所述的低寬帶條件下的語言傳輸方法,其特征在于,所述采集到的音頻及聲紋數據包括若干個二進制聲紋、特征及語音的音頻文件。

9.一種語言傳輸系統,其特征在于,所述語言傳輸系統包括語音應用接口模塊、客戶端模塊、及服務器模塊;所述客戶端模塊接收用戶所發出的原始語音信息并將所述原始語音信息轉換成文本信息,所述語音應用接口模塊接收所述文本信息,將所述文本信息再轉換成機器語音信息并進行聲紋處理以轉換成特定人的語音信息后發送至所述服務器模塊。

10.如權利要求9所述的語言傳輸系統,其特征在于,所述語言傳輸系統還包括基礎支撐模塊,所述基礎支撐模塊接收所述機器語音信息并進行網絡交互,然后將網絡交互后的機器語音信息傳輸至所述服務器模塊。

說明書附圖

圖1

圖2

圖3

圖4