Você está aqui: Página Inicial curitiba Estrutura do Câmpus Diretorias Diretoria de Pesquisa e Pós-Graduação Mestrado e Doutorado CPGEI Edital de Defesas 2016 CPGEI (Mestrado): Bruno Ribeiro Sodré-23/02/16

CPGEI (Mestrado): Bruno Ribeiro Sodré-23/02/16

Defesa Pública de Mestrado do Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
Quando 23/02/2016
das 14h00 até 17h00
Onde Sede Central: Sala B-205
Nome do Contato Prof. Marco José da Silva
Participantes Prof. Marco José da Silva, Dr. Orientador - UTFPR
Prof. Marcelo de Oliveira Rosa, Dr. Co-Orientador - UTFPR
Banca Examinadora:
Prof. Marcelo de Oliveira Rosa, Dr. Presidente - UTFPR
Prof. Eduardo Parente Ribeiro, Dr. - UFPR
Prof. Alexandre José Tuoto Silveira Mello, Dr. - UTFPR
Prof. Marco José da Silva, Dr. - UTFPR
Adicionar evento ao calendário vCal
iCal

Reconhecimento de padrões aplicados à identificação de patologias de laringe

Resumo: As patologias que afetam a laringe estão aumentando consideravelmente nos últimos anos devido à condição da sociedade atual onde há hábitos não saudáveis como fumo, álcool e tabaco e um abuso vocal cada vez maior, talvez por conta do aumento da poluição sonora, principalmente nos grandes centros urbanos. Atualmente o exame utilizado pela endoscopia per-oral, direcionado a identificar patologias de laringe, são a videolaringoscopia e videoestroboscopia, ambos invasivos e por muitas vezes desconfortável ao paciente. Buscando melhorar o bem estar e minimizar o desconforto dos pacientes que necessitam submeter-se a estes procedimentos, este estudo tem como objetivo reconhecer padrões que possam ser aplicados à identificação de patologias de laringe de modo a auxiliar na criação de um novo método não invasivo em substituição ao método atual. Este trabalho utilizará várias configurações diferentes de redes neurais. A primeira rede neural foi gerada a partir de 524.287 resultados obtidos através das configurações k-k das 19 medidas acústicas disponíveis neste trabalho. Esta configuração atingiu uma acurácia de 99,5% (média de 96,99±2,08%) ao utilizar uma configuração com 11 e com 12 medidas acústicas dentre as 19 disponíveis. Utilizando-se 3 medidas rotacionadas (obtidas através do método de componentes principais), foi obtido uma acurácia de 93,98±0,24%. Com 6 medidas rotacionadas, o resultado obtido foi de acurácia foi de 94,07±0,29%. Para 6 medidas rotacionadas com entrada normalizada, a acurácia encontrada foi de 97,88±1,53%. A rede neural que fez 23 diferentes classificações, voz normal mais 22 patologias, mostrou que as melhores classificações, de acordo com a acurácia, são a da patologia hiperfunção com 58,23±18,98% e a voz normal com 52,15±18,31%. Já para a pior patologia a ser classificada, encontrou-se a fadiga vocal com 0,57±1,99%. Excluindo-se a voz normal, ou seja, utilizando uma rede neural composta somente por vozes patológicas, a hiperfunção continua sendo a mais facilmente identificável com uma acurácia de 57,3±19,55%, a segunda patologia mais facilmente identificável é a constrição ântero-posterior com 18,14±11,45%. Nesta configuração, a patologia mais difícil de se classificar continua sendo a fadiga vocal com 0,7±2,14%. A rede com re-amostragem obteve uma acurácia de 25,88±10,15% enquanto que a rede com re-amostragem e alteração de neurônios na camada intermediária obteve uma acurácia de 21,47±7,58% para 30 neurônios e uma acurácia de 18,44±6,57% para 40 neurônios. Por fim foi feita uma máquina de vetores suporte que encontrou um resultado de 67±6,2%. Assim, mostrou-se que as medidas acústicas precisam ser aprimoradas para a obtenção de melhores resultados de classificação dentre as patologias de laringe estudadas. Ainda assim, verificou-se que é possível discriminar locutores normais daqueles pacientes disfônicos.
Palavras-chave: Patologias de laringe, Análise Acústica da Voz, Redes Neurais, Máquinas de Vetores Suporte

Pattern recognition applied to the identification of pathologies laryngeal

Abstract: Pathologies that affect the larynx are increasing considerably in recent years due to the condition of nowadays society where there are unhealthy habits like smoking, alcohol and tobacco and a vocal abuse increasing, perhaps due to the increase in noise pollution, especially in large urban cities. Currently the exam used by per-oral endoscopy, aimed to identify laryngeal pathologies, are videolaryngoscopy and videostroboscopy, both invasive and often uncomfortable to the patient. Seeking to improve the welfare and minimize discomfort for patients who need to undergo these procedures, this study aims to recognize patterns that can be applied to the identification of assisting mode of laryngeal pathologies in the creation of a new non-invasive method replacing the current method. This work will use several different configurations of neural networks. The first neural network is generated from 524.287 results obtained using the k-k settings of 19 acoustic measurements on this work. This configuration achieved an accuracy of 99.5% (mean 96.99±2.08%) when using a configuration with 11 and 12 acoustic measurements among the 19 available. Using 3 measures rotated (obtained by the principal components analysis method), it was obtained an accuracy of 93.98±0.24%. 6 rotated measures, the result was the accuracy was 94.07±0.29%. 6 measures rotated with standard input, found accuracy was 97.88±1.53%. The neural network had 23 different classifications, normal voice 22 more pathologies, showed that the best ratings, according to accuracy, are the hyperfunction pathology with 58.23±18.98% and normal voice 52.15±18.31%. As for the worst condition being classified, vocal fatigue met with 0.57±1.99%. Excluding the normal voice, or using a neural network comprising only pathological voice, hyperfunction remains the most easily identifiable with an accuracy of 57.3±19.55%, the second condition more easily identifiable It is the anterior-posterior constriction with 18.14±11.45%. In this configuration, the hardest condition to qualify remains vocal fatigue with 0.7±2.14%. The network re-sampling obtained an accuracy of 25.88±10.15% while the net with re-sampling and alteration of neurons in the hidden layer gave an accuracy of 21.47±7.58% to 30 neurons and an accuracy of 18.44±6.57% to 40 neurons. Finally it was made a support vector machine that found a score of 67±6.2%. Thus, it was shown that the acoustic measurements need to be improved to achieve better results of classification among the studied laryngeal pathologies. Even so, it was found that is possible to discriminate normal speakers dysphonia those pacients.
Keywords: Laryngeal pathologies, Acoustic Voice Analysis, Neural Network, Support Vector Machines

Lista de publicações:

NEGRI, L. H.; SODRÉ, B. R.; FABRIS, J. L.; PATERNO, A. S.; DELGADO, M. R. Controle fuzzy de velocidade e distância para carros elétricos simplificados. III Congresso Brasileiro de Sistemas Fuzzy (CBSF), João Pessoa - PB, p. 017-028, 17-20 Agosto 2014

Ações do documento