Title: Formant extraction from group delay function
Abstract: This paper presents an approach based on the properties of group delay functions for extracting formants from speech signals. The algorithm is similar to the cepstral smoothing approach for formant extraction using homomorphic deconvolution. The significant differences are (i) the logarithmic operation is replaced by ()r operation and (ii) the additive and high resolution properties of group delay function are expolited to emphasize formant peaks. The group delay function (or the negative derivative of the Fourier transform phase) is derived for a signal which in turn is derived from the Fourier transform magnitude of the speech signal. If a suitable value of r is used, this method gives highly consistent estimates of formants compared to both the cepstral approach and the model-based linear prediction (LP) approach for smoothing the magnitude spectrum. The effects of the parameters, exponent r and window width p, on the proposed technique for formant extraction are studied. Dieser Beitrag stellt eine Methode zur Messung der Formantfrequenzen vor welche die Eigenschaften der Gruppenlaufzeitfunktionen ausnützt. Der Algorithmus ist der kepstralen Methode zur spektralen Abrundung ähnlich. Die zwei wichtigsten Underschiede sind (1) der Logarithmus wird durch einen ()r Operator ersetzt und (2) die additiven Eigenschaften und das gute Auflösungsvermögen der Gruppenlaufzeitfunktionen werden ausgenutzt um die Scheitelpunkte der Formanten hervorzuheben. Die Gruppenlaufzeitfunktionen (oder die negative Ableitung der Phase Fourierspektrums) wird abgeleitet für ein Signal welches seinerseits von der Magnitude des Fourierspektrums des Sprachsignals abgeleitet wird. Wenn ein passender Wert für r gebraucht wird, dann ergibt die Methode Schätzwerte für die Formanten welche vergleichbar sind mit denen welche mit der kepstralen Methode oder mit der linearen Prädiktion gewonnen werden. Die Auswirkung des Exponenten r sowie der Länge des Analysefensters auf die Ergebnisse werden ebenfalls untersucht. Ce papier présente une technique fondée sur les propriétés des fonctions retard de groupe afin d'extraire les formants des signaux de parole. L'algorithme est semblable au lissage cepstral utilisant la déconvolution homomorphique. Les différences significatives sont les suivantes: (a) le logarithme est remplacé par un opérateur ()r et (b) les propriétés additive et de haute résolution des fonctions retard sont exploitées pour accentuer les crêtes des formants. La fonction retard de groupe (ou la dérivée négative de la phase de la transformée de Fourier) est dérivée pour un signal qui, à son tour, est dérivé de l'amplitude de la transformée de Fourier du signal. Si une valeur convenable de r est utilisée, cette méthode donne des estimations formantiques très cohérentes comparées à celles obtenues par la technique cepstrale ou par la prédiction linéaire. Les effets de l'exposant r et de la largeur de la fenêtre sur la technique proposée ont été étudiés.
Publication Year: 1991
Publication Date: 1991-08-01
Language: fr
Type: article
Indexed In: ['crossref']
Access and Citation
Cited By Count: 96
AI Researcher Chatbot
Get quick answers to your questions about the article from our AI researcher chatbot