[bibshow file=ref.bib format=ieee]
Objetivos
Realizar a estimação do pulso glotal utilizando o Iterative Adaptative Inverse Filtering(IAIF) [1], método clássico para estimação baseado em filtragem inversa, e realizar uma análise subjetiva dos resultados obtidos, considerando o formato de onda comum de um sinal de pulso glotal.
Metodologia
Predição Linear
A predição linear consiste na estimação do valor de uma amostra
do sinal a partir das
amostras anteriores, como representado a seguir:
(1) ![Rendered by QuickLaTeX.com \begin{equation*} x[n]={\sum_{m=1}^{k}{a_mx[n-m]}}+ {r[n]} \end{equation*}](https://www.biochaves.website/wp-content/ql-cache/quicklatex.com-25e8aa91267558515ca4b6ff65859f83_l3.png)
em que
representa a perturbação aleatória independente do sinal
e
é a ordem do filtro.
Assim, cada elemento de
pode ser representado como uma combinação linear entre
elementos anteriores, a menos de um erro de predição. O ajuste dos coeficientes é realizado de acordo com o método dos míinimos quadrados, utilizando pseudo-inversão.
Com os coeficientes encontrados, a partir de (1) por meio da transformada Z, chega-se à seguinte função de transferência:
(2) ![]()
em que os polos permitem estimar o contorno espectral do sinal.
Filtragem Inversa
A função de transferência em (2) pode representar um filtro digital. O processo de filtragem inversa consiste em filtrar o sinal
, removendo as influências dos polos de
, utilizando um filtro
que pode ser representado como segue:
(3) ![]()
Iterative Adaptative Inverse Filtering
O IAIF é um método que emprega predição linear e filtragem inversa utilizando uma estrutura iterativa para estimar o pulso glotal. Esse método consiste em realizar uma filtragem passa-altas em um sinal de voz,
, e aplicar, no sinal resultante, o procedimento ilustrado na Figura 1. Primeiramente é realizada a estimação da contribuição glotal,
, obtida por predição linear de ordem 1, seguida pela remoção dessa por meio de filtragem inversa. Em seguida é estimada a contribuição do trato vocal,
, utilizando predição linear de ordem
, sendo essa removida por filtragem inversa, seguida da eliminação do efeito da radiação dos lábios por meio de um integrador estimando assim o pulso glotal. Por fim, esse procedimento é executado mais uma vez, utilizando, entretanto, ordem
na estimação da contribuição.

Resultados
Na Figura 2 encontram-se representados um sinal
utilizado como exemplo e seu pulso glotal estimado
, utilizando
e
(escolhidos de acordo com a percepção subjetiva dos autores), de acordo com o procedimento descrito anteriormente. Pode ser observado um comportamento coerente com o esperado, de acordo com as representações de pulso glotal na literatura. Entretanto, não é possível garantir a acurácia da estimação, sem que haja a comparação com uma representação válida do sinal glotal.

e seu pulso glotal estimado ![Rendered by QuickLaTeX.com G[n]](https://www.biochaves.website/wp-content/ql-cache/quicklatex.com-ed90c4a49b56a54fdaa421b459c79fb3_l3.png)
Na Figura 3 encontram-se representadas as contribuições espectrais do pulso glotal e trato vocal estimados nas duas iterações realizadas pelo IAIF em azul, e em vermelho o contorno espectral do processo de filtragem inversa. Nela, a estimação final da contribuição do trato vocal é representada por
.

Conclusão e Próxima Etapa
O IAIF é um método de simples implementação e seus resultado apresentaram-se, aparentemente coerentes, de acordo com o referencial teórico. Entretanto, a escolha dos parâmetros da predição linear são ajustados de maneira subjetiva, sendo necessário um método de ajuste mais objetivo, para garantir melhores resultados. Também se faz necessário realizar a comparação dos sinais glotais estimados com um sinal glotal confiável, para assegurar a acurácia do método.
Na próxima etapa do trabalho, pretende-se realizar a síntese de um sinal de voz, utilizando um pulso glotal e um trato vocal conhecidos, permitindo, assim, a comparação entre o sinal glotal estimado e o utilizado para a síntese. Também serão realizados testes de ajuste do modelo de Liljencrants-Fant [2] à derivada do sinal glotal estimado, analisando o erro e os parâmetros ajustados, de acordo com metodologia proposta por Strik e Boves [3].
References
- (1991): Analysis of glottal waveform in different phonation types using the new IAIF-method. Em: Proc. 12th Int. Congress Phonetic Sciences, pp. 362–365, 1991.
- (1985): A four-parameter model of glottal flow. Em: STL-QPSR, vol. 4, não 1985, pp. 1–13, 1985.
- (1992): On the relation between voice source parameters and prosodic features in connected speech.. Em: Speech Communication, vol. 11, não 2-3, pp. 167–174, 1992.


Deixe um comentário para Revisitando o IAIF ou (A Inesperada Virtude do Método Ignorado) – Biochaves Cancelar resposta