Você está aqui: Página Inicial curitiba Estrutura do Câmpus Diretorias Diretoria de Pesquisa e Pós-Graduação Mestrado e Doutorado CPGEI Edital de Defesas 2015 CPGEI (Doutorado): César Manuel Vargas Benítez-27/04/15

CPGEI (Doutorado): César Manuel Vargas Benítez-27/04/15

Defesa Pública de Doutorado do Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
Quando 27/04/2015
das 13h00 até 17h00
Onde Sede Central: Sala C-301
Nome do Contato Prof. Heitor Silvério Lopes
Participantes Prof. Heitor Silvério Lopes, Dr. Orientador UTFPR
Banca examinadora:
Prof. Heitor Silvério Lopes, Dr. Presidente UTFPR
Profa. Denise Tsunoda, Dra. UFPR
Profa. Karina dos Santos Machado, Dra. FURG
Prof. Rafael Bertolini Frigori, Dr. UTFPR
Prof. Fabrício Martins Lopes, Dr. UTFPR
Adicionar evento ao calendário vCal
iCal

Contribuições ao estudo do problema de dobramento de proteínas utilizando computação bioinspirada e dinâmica molecular

Resumo: O Problema de Dobramento de Proteínas (PDP) é considerado um dos desafios abertos mais importantes da Biologia e Bioinformática. Nesta tese, uma nova abordagem para simular os pathways de dobramento de proteínas é proposta onde, ao invés de utilizar a estrutura tridimensional da proteína, os estados de dobramento são representados por Mapas de Contatos (MC). Autômatos Celulares bidimensionais (2D-CA) são utilizados para simular o processo de dobramento, onde cada configuração representa um estado de dobramento e é obtida em relação ao seu estado predecessor e uma regra de transição. Determinar uma regra de transição para um dado comportamento dinâmico representa uma tarefa complexa. Portanto, é apresentada uma abordagem distribuida baseada em Programação de Expressão Gênica, chamada pGEP-CA. Funções de fitness específicas, baseadas em medidas de similaridade e simetria, são propostas. Também, um algoritmo heterogêneo paralelo Ecologicamente-inspirado é proposto. Este algoritmo, chamado pECO, é utilizado na reconstrução de estruturas a partir de MCs, usando o modelo 3D-AB off-lattice. Além disso, com o melhor de nosso conhecimento, é apresentada a primeira aplicação de Dinâmica Molecular (DM) ao PFP, usando o mesmo modelo de proteínas. Experimentos extensivos foram realizados para verificar a adequabilidade das abordagens propostas. Em adição, uma breve análise sobre o balanceamento de carga de processamento das arquiteturas paralelas é apresentada. Os resultados mostram que as abordagens obtiveram resultados coerentes, sugerindo que são adequadas para o problema. As regras de transição induzidas pelo pGEP-CA são capazes de gerar 2D-CA que representam DMs corretamente. Sobre a abordagem pECO, os resultados demonstram que a combinação de abordagens evolucionárias concorrentes tira proveito dos benefícios do efeito da coevolução e das diferentes estratégias de busca. De maneira geral, melhores resultados são obtidos para DMs com valores mais elevados de limiar. Além disso, pode ser observado que a abordagem de DM é capaz de levar a conformações que mimetizam propriedades biológicas, como a formação do núcleo hidrofóbico e os movimentos de respiração (breathing) das proteínas. Também, foi observado que o processamento paralelo é essencial, permitindo a obtenção de resultados em tempos de processamento razoáveis. Finalmente, as conclusões e diversas direções de pesquisa são apresentadas.
Palavras-chave: Dobramento de proteínas, Bioinformática, Computação Evolucionária, Computação Paralela, Autômatos Celulares, Dinâmica Molecular

Contributions to the study of the protein folding problem using bioinspired computation and molecular dynamics

Abstract: The Protein Folding Problem (PFP) is considered one of the most important open challenges in Biology and Bioinformatics. In this thesis, a novel approach for simulating the protein folding pathways is proposed where, instead using the three-dimensional structure of the protein, the folding states are represented by Contact Maps (CM). A two-dimensional Cellular Automata (2D-CA) evolver is used to simulate the folding process, where each configuration represents a folding state and it is obtained according to its predecessor and a transition rule. Since finding transition rules for simulating a dynamic behavior is a very difficult task, it is proposed a distributed Gene-Expression Programming (GEP)-based approach, called pGEP-CA. Specific fitness functions, based on similarity and symmetry measures, are proposed. Futhermore, a heterogeneous parallel Ecology-inspired algorithm is proposed. This algorithm, called pECO, is used for reconstructing the structures from the CMs, using the 3D-AB off-latticemodel. Moreover, to the best of our knowledge, it is presented the first application of Molecular Dynamics (MD) to the PFP, using the same model of proteins. Extensive experiments were done to evaluate the adequacy of the proposed approaches. Also, a brief analysis of the load balancing of the parallel architectures is presented. Results show that the approaches obtained coherent results, suggesting their adequacy for the problem. The induced transition rules by the pGEP-CA are able to generate 2D-CA that represent CMs correctly. Concerning the pECO approach, results show that the combination of concurrent evolutionary approaches took advantage of both the coevolution effect and the different search strategies. Overall, it is observed that better results are obtained for CMs with higher threshold values. In addition, it can be observed that the MD approach is capable of displaying biological features such as the hydrophobic core formation and the protein breathing motion. Furthermore, it is observed that parallel processing was not only justified but also essential for obtaining results in reasonable processing time. Finally, concluding remarks and several research directions for future works are presented.
Keywords: Protein Folding, Bioinformatics, Evolutionary Computation, Parallel Computing, Cellular Automata, Molecular Dynamics

Lista de publicações:

BENITEZ, C. M. V. ; WEINERT, W.R. ; LOPES, H. S. . Gene Expression Programming for evolving two-dimensional Cellular Automata in a distributed environment. In: 8th International Symposium on Intelligent Distributed Computing, 2014, Madrid, España. Intelligent Distributed Computing VIII. Warsaw, Polônia: SPRINGER, 2015. v. 570. p. 107-117.

PARPINELLI, R.S. ; BENITEZ, C.M.V. ; CORDEIRO, J. ; LOPES, H. S. . PERFORMANCE ANALYSIS OF SWARM INTELLIGENCE ALGORITHMS FOR THE 3D-AB OFF-LATTICE PROTEIN FOLDING PROBLEM. JOURNAL OF MULTIPLE-VALUED LOGIC AND SOFT COMPUTING, V. 22, P. 267-286, 2014.

SCALABRIN, M.H. ; PARPINELLI, R.S. ; BENITEZ, C.M.V. ; LOPES, H. S. . POPULATION-BASED HARMONY SEARCH USING GPU APPLIED TO PROTEIN STRUCTURE PREDICTION. INTERNATIONAL JOURNAL OF COMPUTATIONAL SCIENCE AND ENGINEERING, V. 9, P. 106-118, 2014.

BENITEZ, C.M.V ; PARPINELLI, R.S. ; LOPES, H.S. A HETEROGENEOUS PARALLEL ECOLOGICALLY-INSPIRED APPROACH APPLIED TO THE 3D-AB OFF-LATTICE PROTEIN STRUCTURE PREDICTION PROBLEM. IN: BRICS - CONFERENCE ON COMPUTATIONAL INTELLIGENCE, 2013, RECIFE. PROCEEDINGS OF BRICS-CCI, 2013.

BENÍTEZ, C.M.V ; LOPES, H.S. . AB-INITIO PROTEIN FOLDING USING MOLECULAR DYNAMICS AND A SIMPLIFIED OFF-LATTICE MODEL. JOURNAL OF BIONANOSCIENCE, V. 7, P. 391-402, 2013.

BENÍTEZ, C.M.V ; LOPES, H.S. MOLECULAR DYNAMICS FOR SIMULATING THE PROTEIN FOLDING PROCESS USING THE 3D AB OFF-LATTICE MODEL. IN: MARCILIO C. SOUTO; MARICEL G. KANN. (ORG.). LECTURE NOTES IN COMPUTER SCIENCE. 1ED.HEIDELBERG: SPRINGER BERLIN HEIDELBERG, 2012, V. 7409, P. 61-72.

BENITEZ, C.M.V. ; PARPINELLI, R.S. ; LOPES, H. S. . PARALLELISM, HYBRIDISM AND COEVOLUTION IN A MULTI-LEVEL ABC-GA APPROACH FOR THE PROTEIN STRUCTURE PREDICTION PROBLEM. CONCURRENCY AND COMPUTATION, V. 24, P. N/A-N/A, 2012.

BENITEZ, C.M.V. ; SCALABRIN, M.H. ; LOPES, H. S. ; ERIG LIMA, C.R. . RECONFIGURABLE HARDWARE COMPUTING FOR ACCELERATING PROTEIN FOLDING SIMULATIONS USING THE HARMONY SEARCH ALGORITHM AND THE 3D-HP-SIDE CHAIN MODEL. LECTURE NOTES IN COMPUTER SCIENCE, V. 7017, P. 363-374, 2011.

CHIDAMBARAM, C. ; BENÍTEZ, C.M.V. ; HEMBECKER, F. ; LOPES, H. S. A COMPARATIVE STUDY OF MACHINE LEARNING AND EVOLUTIONARY COMPUTATION APPROACHES FOR PROTEIN SECONDARY STRUCTURE CLASSIFICATION. IN: H.S. LOPES; L.M. CRUZ. (ORG.). COMPUTATIONAL BIOLOGY AND APPLIED BIOINFORMATICS. 1ED.RIJEKA: INTECH, 2011, V. , P. 239-258.

Ações do documento