Relatório 3 – Biochaves

Luiz Miranda Cavalcante Neto

 

Antes de qualquer coisa, olhe para a Figura 1 e me diga o que você vê (dê um zoom).

Figura 1. É isso aí

 

Nos episódios anteriores… (Recapitulando): Nos primeiros estágios deste trabalho modelei artistas musicais a partir das suas sequências de acordes usando uma cadeia de Markov de ordem 3. Em seguida estudei métodos de redução de dimensões e falei um monte de coisa que não pareceu fazer sentido (mas faz!) na respectiva reunião.

 

E essa Figura 1 aí?

 

Pois é, lembram que eu falei na última reunião (umas 4 vezes, por sinal) que o próximo passo do trabalho era plotar cada artista como um ponto em um gráfico e tentar clusterizar (agrupar) eles para ver se dava bom? Não? Tudo bem, agora você sabe. Então, esse é o resultado do plot para os 100 artistas com os arquivos mais pesados na base da letra A. Que base é essa? Leia o relatório 1 que lá explica.

 

Mais detalhadamente o que eu fiz foi:

1- Gerei um arquivo .csv com o modelo do artista;

2- Usei esse arquivo para fazer a decomposição SVD (comentada no relatório 2);

3- Fiz a média aritmética de todas as linhas da matriz U resultando em um vetor linha, e peguei os dois primeiros elementos deste vetor para servir de coordenadas x e y;

4- Repeti isso para todos os 100 artistas com arquivos mais pesados da base A;

5- Com umas mágicas do python (matlab deve fazer também) plotei os pontos de referente a cada artista junto com seu nome. É isso que você pode ver na Figura 1.

 

Beleza, mas e aí? Ela responde à sua hipótese?

 

Não! Maaaas, dá uma vaga idéia de que algo certo não está errado. Veja só, alguns artistas com estilos parecidos estão meio que agrupados, por exemplo: Aviões do Forró está próximo de Amanda Ferrari (Forró); …. e parece que é só isso mesmo. Isso está parecendo o pai de uma criança desdentada e cheia de furúnculo chamando ela de “coisa mais linda do mundo”.

A verdade é que essa Figura 1 é só um monte de nome de artista jogado num gráfico. Sabe por que isso aconteceu? Porque o garoto maroto (alcione está lá na figura também) que vos escreve esqueceu uma coisa fundamental quando estava modelando os artistas: o modelo tem que ter parâmetros comparáveis entre os modelados.

Como assim? Da forma que está atualmente, cada linha da matriz do modelo representa um n-gram de acordes, ou seja, uma sequência de n acordes. As linhas, por outro lado, representam os acordes que aparecem após o n-gram. Até aí tudo bem, mas o problema é que o modelo atual só usa os n-grams e acordes que aparecem no artista e não todos os possíveis acordes e n-grams, o que tornaria a matriz de tamanho fixo e faria com que os modelos pudessem ser comparados diretamente usando o procedimento reportado na primeira página deste relatório. Os modelos que usei para gerar a Figura 1 possuem quantidades de linhas e colunas diferentes, então, até onde o software entende, eles podem representar qualquer coisa. Acontecer de duas bandas do mesmo estilo estarem próximas não passa de uma coincidência (pelo menos a meu ver).

Mas por que você não corrige isso e manda a Figura certa? Porque eu só fui perceber isso enquanto escrevia este maravilhoso relatório. E sendo um programador rápido como eu, só iria terminar isso lá pra o fim da tarde de quinta. Então, ao invés de mostrar resultados lindos, estou mostrando a vocês o que a falta de atenção pode levar. Não usem drogas! Só café mesmo.

 

Infelizmente, por hoje é só.

Sobre o Autor

Possui graduação em Engenharia Elétrica com habilitação em Eletrônica pela Universidade Federal de Sergipe (2014) e mestrado em Engenharia Elétrica pela Universidade Federal de Sergipe (2017). Foi professor voluntário da Universidade Federal de Sergipe no período de 2015/1 lecionando a disciplina de Circuitos Digitais. É Professor substituto de Ensino Básico, Técnico, Tecnológico e Superior do Instituto Federal de Sergipe no Campus Lagarto (IFS-Lagarto). Tem experiência na área de Engenharia Elétrica, com ênfase em Robótica e Reconhecimento de Padrões.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

pt_BRPortuguês do Brasil