摘要
中文是一種聲調語言,不同聲調之間的差異,可以由基頻軌跡來決定。在擷取基頻軌跡的過程中,常常會擷取到半頻或倍頻的情況,造成基頻軌跡不連續,以致在聲調辨識上的錯誤。本論文將以傳統方法(Auto-Correlation Function (ACF)、Average Magnitude Difference Function (AMDF)與Correlation Function (CF))作為基礎,提出一種時域上基頻軌跡的演算法來改良中文之聲調辨識。其方法主要是利用解強調與一階差分兩種濾波器,使語音訊號之波形能夠更具有週期性,來降低語音受到雜訊的影響,並且利用半頻、基頻與倍頻之間的頻率特性,來擷取出音框最有可能的基頻值,再利用分群的方式以及線性迴歸的方法,對音框做修正與平滑的動作。最後以本實驗室所錄製語料做測試,語料內容為中文聲調一到四聲,不考慮輕聲,共1331個中文單字。由實驗結果發現,本論文之改良方法在中文之聲調辨識上,最高可達95.54%的辨識率,比傳統方法之辨識率提高約兩成,也比UPDUDP方法之最高辨識率95.03%還高,雖然兩者辨識率差異不大,但是在半頻與倍頻的錯誤率,UPDUDP為3.04%比本論文之改良方法(錯誤率為0.19%)高出約3%的錯誤率,尤其是中文聲調為一聲時,UPDUDP之倍頻錯誤率高達8.28%,而本論文則為0.1%,因此本論文之改良方法能夠有效的改善中文聲調之辨識。
貢獻的翻譯標題 | On the Modified Algorithm of Pitch Contour Detection in Time Domain |
---|---|
原文 | 中文 |
頁(從 - 到) | 129-165 |
頁數 | 37 |
期刊 | Journal of Data Analysis |
卷 | 7 |
發行號 | 6 |
DOIs | |
出版狀態 | 已發佈 - 2012 |
對外發佈 | 是 |
Keywords
- 聲調語言
- 基頻軌跡
- 音框