Aviso: O site da UTFPR está sendo reestruturado. Você está visitando a nossa página antiga.

Neste momento de transição, algumas atualizações estão sendo realizadas na nova versão, disponível aqui

Você está aqui: Página Inicial curitiba Estrutura do Câmpus Diretorias Diretoria de Pesquisa e Pós-Graduação Mestrado e Doutorado CPGEI Edital de Defesas 2018 CPGEI (Mestrado): Nelson Marcelo Romero Aquino - 02/03/18

CPGEI (Mestrado): Nelson Marcelo Romero Aquino - 02/03/18

Defesa Pública de Mestrado do Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
Quando 02/03/2018
das 09h00 até 12h00
Onde Sede Central: Sala C-301
Nome do Contato Heitor Silvério Lopes
Participantes Prof. Heitor Silvério Lopes, Dr. Orientador - UTFPR
Banca examinadora:
Prof. Heitor Silvério Lopes, Dr. Presidente - UTFPR
Prof. André Eugênio Lazzaretti, Dr. - UTFPR
Prof. Hugo Alberto Perlin, Dr. - IFPR
Adicionar evento ao calendário vCal
iCal

Abordagens de Aprendizado Profundo para Classificação de Biometrias Fracas em Vídeos

Resumo: O número de câmeras de vigilância instaladas em locais públicos cresceu enormemente nos últimos anos devido à necessidade de aumentar a segurança pública, permitindo obter uma grande quantidade de imagens e vídeos em tempo real sem muito esforço. Diferentes tipos de problemas podem ser resolvidos através do processamento dos dados obtidos por estas câmeras, como a identificação de indivíduos. As biometrias fracas podem ser úteis para executar esta tarefa, uma vez que elas fornecem informações que podem ser usadas para diferenciar uma pessoa de outro sem exigir a cooperação direta delas. No entanto, isso exige uma tarefa exaustiva de análise a ser feita por observadores humanos. Dependendo da quantidade de câmeras, isso poderia até se tornar uma tarefa impossível. Métodos de visão computacional poderiam ser uma alternativa válida para realizar classificação de biometrias fracas em imagens ou vídeos. Os métodos de Aprendizado Profundo (AP) têm alcançado desempenhos muito bons em tarefas de visão computacional como reconhecimento e detecção de objetos, ou segmentação de imagens. Seguindo esta linha, este trabalho tem como objetivo estudar a adequação de métodos de AP para classificar biometrias fracas em imagens ou vídeos. Apresentamos três contribuições sobre este tema nesta dissertação. Primeiro, realizamos um estudo sobre o efeito do aumento de dados no desempenho de redes neurais convolucionais para classificação de biometrias fracas em imagens. A segunda contribuição está relacionada com a transferência de informação de um conjunto de imagens a outro. Este processo se baseia em treinar um modelo com dados de uma distribuição e testá-lo em dados de outra distribuição. Finalmente, avaliamos o uso de modelos de AP para realizar a classificação em vídeos. Para este propósito, propomos uma nova abordagem baseada no uso de redes de memória de longo e curto prazo bidirecionais. Resultados para os experimentos de aumento de dados mostram que os aumentos de grandes tamanhos não induzem ao sobre-ajuste e que balancear um conjunto de dados antes do treino permite precisar de tamanhos de aumento menores para que o desempenho do modelo melhore. Quanto à transferência de informação, os resultados mostram que pode haver uma correlação entre a complexidade e similaridade dos conjuntos de dados que são utilizados para treinar e testar um modelo. Assim, se esta técnica for aplicada, o conjunto de treinamento deve preferencialmente ser muito semelhante ao do teste e deve ser de maior complexidade. Embora isso não seja definitivo, já que pode haver exceções dependendo da biometria fraca a classificar. Em termos de classificação de vídeo, nossa abordagem baseada em uma rede neural recorrente produziu os melhores resultados em termos de acurácia geral e balanço de classificação, quando comparado a uma abordagem baseada em classificar um vídeo usando apenas um de seus quadros e a um modelo AP que representa dependências temporais através de um filtro passa-baixo.
Palavras-chave: Aprendizado de Máquina, Aprendizado Profundo, Biometrias Fracas

Deep Learning Approaches for Soft Biometrics Classification in Videos

Abstract: The number of surveillance cameras installed in public places has grown enormously during the past years due to the necessity to increase public security, allowing to obtain a large amount of images and videos in real time without much effort. Different types of problems can be solved by processing the data obtained by security cameras, such as the identification of individuals. Soft biometrics attributes can be useful to perform this task, since they provide information that can be used to differentiate one person from another without requiring their direct cooperation. However, this demands an exhaustive process of analysis to be carried by one or more human observers. Depending on the quantity of cameras, this could even become an impossible task for humans. Hence, computer vision methods could be a valid alternative to perform soft biometric classification in images or videos. Within this score, Deep Learning (DL) methods have risen recently, achieving state-of-the art performances for several computer vision tasks such as object recognition, object detection and image segmentation. This is possible due to their capability to learn both, features and classifier, at once, in order to solve a particular problem. Following this line, this work aims at empirically studying the suitability of DL methods for classifying soft biometrics in images or videos. We present three contributions regarding this subject in this dissertation. First, we perform a study on the effect of data augmentation on the performance of convolutional neural networks for soft biometrics classification. The second contribution is related to transferring information from one soft biometric dataset into another to perform classification. This process is achieved by training a model with data from a distribution in order to test it on data from another distribution. Finally, we evaluate the use of DL models to represent or learn temporal dependencies, so as to perform soft biometrics classification in videos. For this purpose we propose a novel approach based on the use of bidirectional long short term memory networks. Results for the experiments regarding data augmentation show that large augmentation sizes do not induce overfitting and that balancing a dataset before performing on-line data augmentation leads to the necessity of smaller augmentation sizes in order to start improving the performance of the networks. As for transfer learning, results show that there could be a correlation between the complexity and the similarity of the datasets that are used for training and testing a model. Thus, if this technique is applied, the train set should preferably be very similar to the test data and should have a higher complexity. Although this is not definitive, since there could be exceptions depending on the soft biometric attribute to classify. Regarding video classification, in general, our approach based on a recurrent network yielded the best results in terms of overall accuracy and classification balance when compared to a baseline based on classifying a video using only one of its frames and a DL model that represents temporal dependencies through a low-pass filter.
Keywords: Machine Learning, Deep Learning, Soft Biometrics

Lista de publicações:

Aquino, N. M. R.; RIBEIRO, M.; Gutoski, M.; Benitez, C.V.; LOPES, H. S. A Gene Expression Programming Approach for Evolving Multi-Class Image Classifiers In: IEEE Latin American Conference on Computational Intelligence, 2017, Arequipa. In press in the LA-CCI IEEE conference, 2017.

Gutoski, M.; RIBEIRO, M.; Aquino, N.M.R.; LAZZARETTI, A. E.; LOPES, H. S. A Clustering-Based Deep Autoencoder for One-Class Image Classification In: IEEE Latin American Conference on Computational Intelligence, 2017, Arequipa. In press in the LACCI IEEE conference, 2017.

Aquino, N. M. R.; Gutoski, M.; HATTORI, L. T.; LOPES, H. S. The effect of data augmentation on the performance of convolutional neural networks. In: XIII Brazilian Congress on Computational Intelligence, 2017, Niterói, RJ. Anais do XIII CBIC, 2017.

Aquino, N. M. R.; Gutoski, M.; HATTORI, L. T. ; LOPES, H. S. Soft Biometrics Classification Using Denoising Convolutional Autoencoders and Support Vector Machines. In: XIII Brazilian Congress on Computational Intelligence, 2017, Niterói, RJ. Anais do XIII CBIC, 2017.

Gutoski, M.; Aquino, N. M. R.; RIBEIRO, M.; LAZZARETTI, A. E.; LOPES, H. S. Detection of Video Anomalies Using Convolutional Autoencoders and One-Class Support Vector Machines In: XIII Brazilian Congress on Computational Intelligence, 2017, Niterói, RJ. Anais do XIII CBIC, 2017.

HATTORI, L. T.; Gutoski, M.; Aquino, N. M. R. ; LOPES, H. S. Patch-Based Convolutional Neural Network for the Writer Classification Problem in Music Score Images. In: XIII Brazilian Congress on Computational Intelligence, 2017, Niterói, RJ. Anais do XIII CBIC, 2017.

Ações do documento