Sobre a Estimação de Pulso Glotal: Nova Abordagem e Próximos Passos

[bibshow file=ref.bib]

Continuando o trabalho desenvolvido no estudo da a estimação de pulso glotal e influenciados por um aprofundamento na literatura existente, pensamos em uma nova abordagem para os próximos passos do trabalho. Dessa maneira, procuramos estudar os métodos já existentes, por meio da leitura dos artigos, implementação e observação das vantagens e desvantagens desses métodos. Propomos também o uso de um diferente modelo de pulso glotal padrão, para a síntese de voz e para a análise de resultados.

“Novo” Modelo de Pulso Glotal

Será utilizado o modelo de Liljencrants-Fant (modelo LF) [1] no lugar do modelo de Rosenberg [2]. A decisão pela mudança do modelo de pulso glotal levou em conta os seguintes fatores:

  • • Os resultados apresentados por Fujisaki e Ljungqvist [3], que apontam o modelo LF como um modelo simples dentre os mais adequados para a modelagem1;
  • • O maior uso do modelo LF na literatura, que vai nos permitir fazer uma comparação mais direta de resultados.
  • • A praticidade que se ganha ao unir o efeito da radiação ao pulso glotal, usando um modelo diferencial do pulso glotal2;

 

Ora pois, o modelo LF para o pulso glotal derivativo é dado pela a equação 1,  e encontra-se representado na Figura 1. Num próximo relatório iremos detalhar melhor o modelo LF, para um melhor entendimento.

(1)   \begin{equation*} g_{LF}(t) = \begin{cases} E_0e^{\alpha t}\sin(\omega_gt),\ 0\leq t<T_e\\-\frac{E_e}{\epsilon T_a}\left( e^{-\epsilon(t-T_e)}-e^{-\epsilon(T_c-T_e)}\right),\ T_e\leq t<T_c\end{cases} \end{equation*}

Figura 1 – Modelo do Pulso Glotal Derivativo de Liljencrants-Fant

Próximas Etapas

Na continuidade da pesquisa, estamos nos propondo a refazer a síntese de sinais de voz aos moldes do que foi apresentado em um dos relatórios anteriores. Posteriormente, esses sinais serão utilizados para a avaliação dos resultados obtidos pelos métodos que serão implementados. Inicialmente, será implementada paralelamente os métodos apresentados em [4], [5] e [6], e avaliando a implementação de outros métodos em seguida.

 

 

References

  1. Gunnar Fant and Johan Liljencrants and Qi-guang Lin (1985): A four-parameter model of glottal flow. Em: STL-QPSR, vol. 4, não 1985, pp. 1–13, 1985.
  2. Aaron E Rosenberg (1971): Effect of glottal pulse shape on the quality of natural vowels. Em: The Journal of the Acoustical Society of America, vol. 49, não 2B, pp. 583–590, 1971.
  3. Hiroya Fujisaki and Mats Ljungqvist (1986): Proposal and evaluation of models for the glottal source waveform. Em: ICASSP’86. IEEE International Conference on Acoustics, Speech, and Signal Processing, pp. 1605–1608, IEEE 1986.
  4. Baris Bozkurt and Boris Doval and Christophe d’Alessandro and Thierry Dutoit (2005): Zeros of z-transform representation with application to source-filter separation in speech. Em: IEEE signal processing letters, vol. 12, não 4, pp. 344–347, 2005.
  5. Sandra Dias and Anıbal Ferreira (2014): Glottal pulse estimation–a frequency domain approach. Em: Unpublished, 2014.
  6. Alan O Cinnéide and David Dorran and Mikel Gainza and Eugene Coyle (2010): Exploiting glottal formant parameters for glottal inverse filtering and parameterization. Em: Eleventh Annual Conference of the International Speech Communication Association, 2010.

 

 

  1. O LF teve um desempenho muito melhor que o modelo de Rosenberg
  2. O que não acontece no modelo de Rosenberg
Comentários

Uma resposta para “Sobre a Estimação de Pulso Glotal: Nova Abordagem e Próximos Passos”

  1. […] como prometido em nosso último relato, traremos aqui uma apresentação mais detalhada do modelo de Liljencrants-Fant (LF) [1]. Ora, o […]

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Mais Posts