[bibshow file=ref.bib format=ieee]

Objetivos

Realizar a estimação do pulso glotal utilizando o Iterative Adaptative Inverse Filtering(IAIF) [bibcite key=alku1991analysis], método clássico para estimação baseado em filtragem inversa, e realizar uma análise subjetiva dos resultados obtidos, considerando o formato de onda comum de um sinal de pulso glotal.

Metodologia

Predição Linear

A predição linear consiste na estimação do valor de uma amostra $x[n]$ do sinal a partir das $k$ amostras anteriores, como representado a seguir:

(1) $\begin{equation*} x[n]={\sum_{m=1}^{k}{a_mx[n-m]}}+ {r[n]} \end{equation*}$

em que $r[n]$ representa a perturbação aleatória independente do sinal $x[n]$ e $k$ é a ordem do filtro.
Assim, cada elemento de $x$ pode ser representado como uma combinação linear entre $k$ elementos anteriores, a menos de um erro de predição. O ajuste dos coeficientes é realizado de acordo com o método dos míinimos quadrados, utilizando pseudo-inversão.
Com os coeficientes encontrados, a partir de (1) por meio da transformada Z, chega-se à seguinte função de transferência:

(2) $\begin{equation*} H(z) = \frac{z^k}{z^k-a_1z^{k-1}-...- a_{k-1}z-a_k} \end{equation*}$

em que os polos permitem estimar o contorno espectral do sinal.

Filtragem Inversa

A função de transferência em (2) pode representar um filtro digital. O processo de filtragem inversa consiste em filtrar o sinal $x[n]$ , removendo as influências dos polos de $H(z)$ , utilizando um filtro $G(z)$ que pode ser representado como segue:

(3) $\begin{equation*} G(z)={H(z)}^{-1} \end{equation*}$

Iterative Adaptative Inverse Filtering

O IAIF é um método que emprega predição linear e filtragem inversa utilizando uma estrutura iterativa para estimar o pulso glotal. Esse método consiste em realizar uma filtragem passa-altas em um sinal de voz, $s[n]$ , e aplicar, no sinal resultante, o procedimento ilustrado na Figura 1. Primeiramente é realizada a estimação da contribuição glotal, $H_g(z)$ , obtida por predição linear de ordem 1, seguida pela remoção dessa por meio de filtragem inversa. Em seguida é estimada a contribuição do trato vocal, $H_v(z)$ , utilizando predição linear de ordem $v$ , sendo essa removida por filtragem inversa, seguida da eliminação do efeito da radiação dos lábios por meio de um integrador estimando assim o pulso glotal. Por fim, esse procedimento é executado mais uma vez, utilizando, entretanto, ordem $g$ na estimação da contribuição.

**Figura 1** – Diagrama de blocos do IAIF

Resultados

Na Figura 2 encontram-se representados um sinal $s[n]$ utilizado como exemplo e seu pulso glotal estimado $G[n]$ , utilizando $g=4$ e $v=20$ (escolhidos de acordo com a percepção subjetiva dos autores), de acordo com o procedimento descrito anteriormente. Pode ser observado um comportamento coerente com o esperado, de acordo com as representações de pulso glotal na literatura. Entretanto, não é possível garantir a acurácia da estimação, sem que haja a comparação com uma representação válida do sinal glotal.

**Figura 2** – Sinal de voz $s[n]$ e seu pulso glotal estimado $G[n]$

Na Figura 3 encontram-se representadas as contribuições espectrais do pulso glotal e trato vocal estimados nas duas iterações realizadas pelo IAIF em azul, e em vermelho o contorno espectral do processo de filtragem inversa. Nela, a estimação final da contribuição do trato vocal é representada por $H_{v2}$ .

**Figura 3** – Contornos espectrais estimados para a contribuição glotal e a contribuição do trato vocal, no decorrer das etapas do IAIF

Conclusão e Próxima Etapa

O IAIF é um método de simples implementação e seus resultado apresentaram-se, aparentemente coerentes, de acordo com o referencial teórico. Entretanto, a escolha dos parâmetros da predição linear são ajustados de maneira subjetiva, sendo necessário um método de ajuste mais objetivo, para garantir melhores resultados. Também se faz necessário realizar a comparação dos sinais glotais estimados com um sinal glotal confiável, para assegurar a acurácia do método.
Na próxima etapa do trabalho, pretende-se realizar a síntese de um sinal de voz, utilizando um pulso glotal e um trato vocal conhecidos, permitindo, assim, a comparação entre o sinal glotal estimado e o utilizado para a síntese. Também serão realizados testes de ajuste do modelo de Liljencrants-Fant [bibcite key=fant1985four] à derivada do sinal glotal estimado, analisando o erro e os parâmetros ajustados, de acordo com metodologia proposta por Strik e Boves [bibcite key=strik1992relation].
[/bibshow]

Sobre o Autor

Jônatas Cruz Santos

jonatascrs@live.com | CV Lattes

Mestrando em Engenharia Elétrica e Bacharel em Engenharia Eletrônica pela Universidade Federal de Sergipe. Interessado nas áreas de Modelagem Computacional, Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões. Atualmente desenvolve pesquisa no estudo de modelos computacionais dos mecanismos de produção vocal.

Áreas de Pesquisa: Modelagem Computacional, Processamento Digital de Sinais, Reconhecimento de Padrões, Processamento de Sinais de Voz e Fala, Qualidade Vocal.

Sobre o Autor

João Marcus Silveira

johnnymarcus7@gmail.com | CV Lattes

Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Áreas de interesse são Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões.

Biochaves

Estimação de Pulso Glotal com o IAIF

Objetivos

Metodologia

Predição Linear

Filtragem Inversa

Iterative Adaptative Inverse Filtering

Resultados

Conclusão e Próxima Etapa

Jônatas Cruz Santos

João Marcus Silveira

1 thought on “Estimação de Pulso Glotal com o IAIF”

Deixe uma resposta Cancelar resposta

Posts recentes

Categorias

Se inscreva na nossa Newsletter!