[bibshow file=ref.bib]

Objetivos

Analisar os resultados das implementações realizadas do algoritmo IAIF, do método de estimação utilizando análise-pela-síntese e pulso glotal de Rosenberg (apresentado por Jugurta, no último relatório) e da implementação original do IAIF (disponível em um toolbox, denominado Aparat). Utilizando um sinal sintetizado, os parâmetros temporais dos sinais estimados para cada implementação serão comparados com os parâmetros do sinal original. Com isso, será observar a precisão dos resultados obtidos para cada implementação.

Metodologia

Modelo de Rosenberg para o pulso glotal

O modelo para o pulso glotal de Rosenberg [bibcite key=rosenberg1971effect] é dado pela seguinte expressão [bibcite key=Rabiner1978]:

(1) $\begin{equation*} g[n]=\begin{cases} \frac{1}{2}\left(1-cos\left(\frac{\pi n}{N_1} \right) \right), & 0\leq n \leq N_1\\\\ cos\left(\frac{\pi\left(n-N_1\right)}{2 N_2} \right), & N_1\leq n \leq N_1+N_2\\ 0, & \text{para os demais casos} \end{cases} \end{equation*}$

em que $N_1$ e $N_2$ modelam o tempo de abertura e de fechamento da glote. Comumente, na literatura, $N_1>N_2$ . Para averiguar os resultados, os valores de $N_1$ e $N_2$ serão comparados.

Síntese do Sinal

O processo para a síntese do sinal utilizou o pulso glotal de Rosenberg como fonte glótica e ajustou o trato vocal para as formantes correspondentes à vogal /a/, de acordo com a metodologia apresentada no Relatório nº2.

IAIF

O IAIF [bibcite key=alku1991analysis] foi implementado de acordo com a metodologia apresentada no Relatório nº1 e ilustrado na Figura 1.

Resultados Obtidos

Para o teste dos três métodos(IAIF do Aparat, análise-pela-síntese e o algoritmo IAIF implementado) foram utilizados dois sinais sintetizados, cujos parâmetros para a síntese foram: $f_0=300$ Hz, $N_1=19$ , $N_2=18$ para o sinal 1 e $f_0=205$ Hz, $N_1=36$ , $N_2=18$ para o sinal 2. Os principais parâmetros utilizados para a análise foram o N1 e o N2, visando encontrar o método que melhor estima o pulso glotal que se aproxima do pulso de rosenberg utilizado na síntese. A ordem dos preditores lineares no algoritmo implementado do IAIF, foram $v=12$ e $g=4$ , para o sinal 1, este método estimou corretamente o $N_1$ e o $N_2$ , porém, para o sinal 2, o $N_1$ e $N_2$ encontrados foram 32 e 22, respectivamente. As configurações utilizadas no Aparat foram $g=2$ , número de formantes igual a 3, coeficiente da radiação dos lábios igual a 0.99, para o sinal 1 foram encontrados $N_1=22$ e $N_2=15$ , e para o sinal 2, $N_1=32$ e $N_2=22$ . A análise-pela-síntese estimou $N_1=24$ e $N_2=13$ para o sinal 1, e $N_1=36$ e $N_2=18$ para o sinal 2.

Conclusão e Próxima Etapa

Os testes se mostraram inconclusivos, pois para o sinal 1 o algoritmo implementado do IAIF apresentou o melhor resultado enquanto o método de análise-pela-síntese foi o pior, porém para o sinal 2 a situação foi a inversa, isto é, análise-pela-síntese apresentou o melhor resultado e o algoritmo IAIF foi o pior. O Aparat obteve resultados ruins em ambos os sinais, mas isso pode ser devido as configurações utilizadas no programa. Assim, é necessário realizar mais testes com os três métodos, fazendo algumas modificações para encontrar as configurações que melhor estimam o pulso glotal do sinal sintetizado. Vale ressaltar que o IAIF implementado possui alguns bugs que tornam os resultados obtidos por este método não confiáveis.

[/bibshow]

Sobre o Autor

Jônatas Cruz Santos

jonatascrs@live.com | CV Lattes

Mestrando em Engenharia Elétrica e Bacharel em Engenharia Eletrônica pela Universidade Federal de Sergipe. Interessado nas áreas de Modelagem Computacional, Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões. Atualmente desenvolve pesquisa no estudo de modelos computacionais dos mecanismos de produção vocal.

Áreas de Pesquisa: Modelagem Computacional, Processamento Digital de Sinais, Reconhecimento de Padrões, Processamento de Sinais de Voz e Fala, Qualidade Vocal.

Sobre o Autor

João Marcus Silveira

johnnymarcus7@gmail.com | CV Lattes

Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Áreas de interesse são Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões.

Sobre o Autor

Vitor Magno Bezerra

CV Lattes

Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Interessado nas áreas de Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões

Biochaves

Comparação dos Parâmetros Temporais dos Métodos de Estimação de Pulso Glotal

Objetivos

Metodologia

Modelo de Rosenberg para o pulso glotal

Síntese do Sinal

IAIF

Resultados Obtidos

Conclusão e Próxima Etapa

Jônatas Cruz Santos

João Marcus Silveira

Vitor Magno Bezerra

Deixe uma resposta Cancelar resposta

Posts recentes

Categorias

Se inscreva na nossa Newsletter!