[其他]語音識別無效
| 申請號: | 86100298 | 申請日: | 1986-01-20 |
| 公開(公告)號: | CN86100298A | 公開(公告)日: | 1986-08-06 |
| 發明(設計)人: | 馬修·倫寧;保羅·默梅爾斯坦;維謝瓦·納思·古普達 | 申請(專利權)人: | 北方電信有限公司 |
| 主分類號: | G10L9/06 | 分類號: | G10L9/06;G10L9/04 |
| 代理公司: | 中國專利代理有限公司 | 代理人: | 匡少波 |
| 地址: | 加拿大魁北克省*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 | ||
本發明是關于語音識別方面的一項發明。
在已知的各種語音識別器中,語音一般經過脈沖編碼調制(PCM)的格式編碼后,再經過預處理,使之變換為一種與人類聽覺系統領悟語音的方式有更為密切關系的樣式。例如,可以將語音加以處理,給出濾波器組的各通道能量、倒譜、嘜耳(mel)-頻率倒譜或線性預測系數。將各個識別單元,如字語或音節,與一系列代表各有效單元的各基準樣型音中的每一個樣型音進行比較,判認最相匹配的那一個樣型音為未知的單元,並在輸出端送出相應于該樣型音的單元標志。
雖然這類識別器對于一些應用來說是合適的,但是,由于在于某些應用方面,特別是在要求與說話人無關、進行電話交談或具有大詞匯量的應用方面,這類識別器會產生令人不能接受的差錯率,因而效果並不完全令人滿意。其原因據認為是普通的表示法並不足以準確地模仿人類聽覺系統的響應特性。
根據本發明,用以識別語音的設備包括:
(?。┯糜趯⑽粗恼Z言發音表示為一個參數幀序列的裝置,每一參數幀代表上述語音的一個相應的時間幀;
(ⅱ)用于提供許多基準樣型音的裝置,每一樣型音包含有一個參數幀序列,並用與第一點提及的參數幀相同的各種參數予以表示。
第一點提及的一個參數幀序列(未知的)和第二點提及的一個參數幀序列(基準的)中的每一參數幀均包含一組一次參數和一組二次參數。每一個二次參數表示在相對應的各參數幀(即導出各不同時間幀的各參數幀)內各相應一次參數之間帶符號的差數;以及
(ⅲ)用于將一個未知語言的參數幀序列與每個基準樣型音相比較,並確定哪個基準樣型音與之最相匹配的裝置。
每一參數幀包含有一組根據所用的表示類型加以選定的參數,例如各濾波器組的各通道的能量、倒譜、嘜耳-頻率方式倒譜或線性預測系數。
所說的各不同時間幀的中心之間的時間差應優選為20ms至200ms,最好選為50ms左右。二次參數通常由前面和后面的一次參數導出,例如由±25ms或者±兩幀的一次參數導出。
最好再引入一個表示幅度變化或聽覺響度變化的分量,該分量既作為未知語音又作為基準樣型音的一個二次參數。這樣的響應分量通常不用于一次參數,因為絕對幅度或絕對響應對于區分各種字詞語音是不起作用的。
因此,本發明一般來說包括用一組動態二次參數擴充增強的一組通常用以識別語音的一次短時間靜態參數,其中一次參數用于語音識別,其中二次參數表示每個一次參數在一段短的時間間隔(例如20至200ms)中的變化。除了一次參數之外,述采用動態二次參數,這正與其他諸如非相關性、聽覺差別等參數相反,會使可用以區別講話聲音的距離測量或概率密度函數變得對語音差別更加靈敏。
任何一種短時間譜的表示都可以用作一組一次參數。這類表示的例子有濾波器組各通道能量、倒譜、嘜耳-頻率倒譜、線性預測系數等等。這些表示的每一種均是借助于少數的參數(一般取為3到80之間)在一個時間幀(一般為2到50ms)中估算音量大小或功率譜。
若Pt是在時間t時計算得到的各一次參數的矢量,則時間編移a和b應選為:
20ms≤a+b≤200ms
並且動態參數矢量△Pt定義為矢量差:
△Pt=Pt+a-Pt-b
本發明是利用各參數Pt與△Pt一起的合成效果表示時間t附近的語音信號。于是,概率密度函數和間距是利用同時包含靜態(一次)和動態(二次)參數的這一擴增的參數組予以定義的。
另一方面上面的推導可以用幀數來表示。若△t=相鄰幀間的時間差,並若Pi=第i幀內的一次參數矢量,則動態矢量△Pi可以定義為矢量差:
△Pi=Pi+〔a/△t〕-Pi-〔b/△t〕
選用的參數最好是嘜耳頻率方式的倒譜系數,在這種情況下,各一次參數C1……,Cn表示功率譜的形狀而各二次參數△C1……,△Cn表示在規定時間間隔內的功率譜的形狀的變化。此外,在這組二次參數中可以包含有△Co,用以表示響度或幅度的變化。
下面僅以一個例子,並參照附圖,對本發明的一個實施方案進行描述,在附圖中:
圖1是一種語音識別器的一般原理方框圖;
圖2是表示該語音識別器的濾波器裝置特性的圖形。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方電信有限公司,未經北方電信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://m.szxzyx.cn/pat/books/86100298/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光導纖維
- 下一篇:自適應恒定勻漿機強度控制系統





