[bibshow file=ref.bib]
Objetivos
Estimar, de maneira síncrona, o pulso glotal de Rosenberg [1] que melhor aproxima temporalmente o pulso do sinal de voz, utilizando um banco de pulsos glotais e comparando o espectro de cada um dos pulsos com o espectro de um sinal de voz. Assim, é feito o uso de sinais de voz sintetizados, de acordo com a metodologia apresentada no relatório anterior, para a verificação dos resultados. Espera-se que o pulso glotal seja estimado perfeitamente para esses sinais sintetizados.
Metodologia
Modelo de Rosenberg para o pulso glotal
O modelo para o pulso glotal de Rosenberg [2] é dado pela seguinte expressão [3]:
(1) ![Rendered by QuickLaTeX.com \begin{equation*} g[n]=\begin{cases} \frac{1}{2}\left(1-cos\left(\frac{\pi n}{N_1} \right) \right), & 0\leq n \leq N_1\\\\ cos\left(\frac{\pi\left(n-N_1\right)}{2 N_2} \right), & N_1\leq n \leq N_1+N_2\\ 0, & \text{para os demais casos} \end{cases} \end{equation*}](https://www.biochaves.website/wp-content/ql-cache/quicklatex.com-10c19d44da46b7f50a20a4f0d8d286ae_l3.png)
em que
e
modelam o tempo de abertura e de fechamento da glote, respectivamente, como ilustrado na Figura 1. Comumente, na literatura,
.

Estimação de frequência fundamental por autocorrelação
Para a estimação de frequência fundamental (
) baseada na autocorrelação do sinal, dado um sinal digitalizado
, a função de autocorrelação empírica
de um sinal pode ser definida como segue [4]:
(2) ![]()
em que se pode inferir que o valor máximo da função de autocorrelação é atingido quando
. Também se faz notável que, para sinais periódicos, a função de autocorrelação do sinal apresenta a propriedade de manter-se periódica, com o mesmo período do sinal. Isso indica que para
(em que
é o período e
é um número inteiro qualquer),
, sugerindo, assim, que a cada ciclo o valor máximo da função de autocorrelação é atingido. Assim, a estimação de
é feita por meio dessas propriedades para encontrar o período
do sinal e, consequentemente, a frequência fundamental do sinal.
Método para a estimação do pulso glotal
O processo proposto para a estimação do pulso glotal utiliza a frequência fundamental do sinal analisado, obtida por meio da autocorrelação do sinal, para gerar o banco de pulsos. Com o valor estimado da
foi possível determinar o tamanho do pulso, em amostras,
(
). Assim o banco de pulsos foi então gerado assumindo, empiricamente, que
,
e
.
Calculando os espectros por FFT (Fast Fourier Transform) [5], o espectro de cada pulso do banco é comparado ao espectro do sinal de entrada por meio do erro quadrático médio. Levando em conta a resposta espectral do pulso de Rosenberg, espera-se que o pulso que apresentar o menor erro indicará o que melhor aproxima o pulso real.
Verificação dos resultados
Para verificar a acurácia do método implementado, foram utilizados sinais sintetizados de acordo com a metodologia proposta no relatório anterior. Assim, foi feita a comparação entre o pulso estimado e o pulso utilizado para a síntese.
Resultados
A implementação do método proposto ainda não está completa, de forma que existem alguns problemas a serem resolvidos. Os resultados preliminares se mostraram inadequados, como pode ser observado na Figura 2.

Conclusão e Próxima Etapa
Uma averiguação mais detalhada da implementação é necessária para que seja possível a obtenção de bons resultados com o método proposto. Assim, a próxima etapa dará continuidade a esse método, buscando solucionar os problemas encontrados. Caso os resultados com os sinais sintetizados se apresentem adequados, será feita, também, a comparação com sinais reais de voz que possuam seus respectivos sinais eletroglotográficos [6].
References
- (1971): Effect of glottal pulse shape on the quality of natural vowels. Em: The Journal of the Acoustical Society of America, vol. 49, não 2B, pp. 583–590, 1971.
- (): . .
- (1978): Digital processing of speech signals. Prentice-Hall, 1978, ISBN: 0-13-213603-1.
- (1978): Digital processing of speech signals. Prentice-Hall, 1978, ISBN: 0-13-213603-1.
- (2003): Signal Processing First. Pearson/Prentice Hall, 2003, ISBN: 9780130909992.
- (2001): Speech science: an integrated approach to theory and clinical practice. Allyn & Bacon, 2001.


Deixe um comentário