時域上基頻軌跡演算法的改良與探討

吳俊甫, 張國清, 李宗寶, 江翠蓮, 黃湘玲

研究成果: 雜誌貢獻文章同行評審

摘要

中文是一種聲調語言,不同聲調之間的差異,可以由基頻軌跡來決定。在擷取基頻軌跡的過程中,常常會擷取到半頻或倍頻的情況,造成基頻軌跡不連續,以致在聲調辨識上的錯誤。本論文將以傳統方法(Auto-Correlation Function (ACF)、Average Magnitude Difference Function (AMDF)與Correlation Function (CF))作為基礎,提出一種時域上基頻軌跡的演算法來改良中文之聲調辨識。其方法主要是利用解強調與一階差分兩種濾波器,使語音訊號之波形能夠更具有週期性,來降低語音受到雜訊的影響,並且利用半頻、基頻與倍頻之間的頻率特性,來擷取出音框最有可能的基頻值,再利用分群的方式以及線性迴歸的方法,對音框做修正與平滑的動作。最後以本實驗室所錄製語料做測試,語料內容為中文聲調一到四聲,不考慮輕聲,共1331個中文單字。由實驗結果發現,本論文之改良方法在中文之聲調辨識上,最高可達95.54%的辨識率,比傳統方法之辨識率提高約兩成,也比UPDUDP方法之最高辨識率95.03%還高,雖然兩者辨識率差異不大,但是在半頻與倍頻的錯誤率,UPDUDP為3.04%比本論文之改良方法(錯誤率為0.19%)高出約3%的錯誤率,尤其是中文聲調為一聲時,UPDUDP之倍頻錯誤率高達8.28%,而本論文則為0.1%,因此本論文之改良方法能夠有效的改善中文聲調之辨識。
貢獻的翻譯標題On the Modified Algorithm of Pitch Contour Detection in Time Domain
原文中文
頁(從 - 到)129-165
頁數37
期刊Journal of Data Analysis
7
發行號6
DOIs
出版狀態已發佈 - 2012
對外發佈

Keywords

  • 聲調語言
  • 基頻軌跡
  • 音框

指紋

深入研究「時域上基頻軌跡演算法的改良與探討」主題。共同形成了獨特的指紋。

引用此