Reconhecimento de Padrões e Redes Neurais Artificiais em Predição de Estruturas Secundárias de Proteínas
Autores
4811 |
554,385
|
|
4812 |
554,385
|
Informações:
Publicações do PESC
Neste trabalho propõe-se a utilização de reconhecimento de padrões e redes neurais artificiais Perceptron de Múltiplas Camadas (MLP) na predição de estruturas secundárias de proteínas. Parte-se das últimas melhorias de trabalhos anteriores de forma estanque, a saber: variação do tamanho de janelas; utilização de informações evolucionárias; utilização de júri de decisão e criação de redes neurais em cadeia, e propõe-se: reunir todas estas últimas melhorias em uma ferramenta única (cMLP); realizar testes com um conjunto de proteínas já testado por trabalhos anteriores; e realizar a comparação da ferramenta construída com outros classificadores já disponíveis na web, todos originados de trabalhos científicos, e assim, realizar um processo de otimização dos parâmetros da rede neural.
Otimizou-se a rede neural convencional com inicializações aleatórias, para torná-la uma rede neural MLP otimizada (oMLP). O processo de otimização ocorreu na utilização de parâmetros de inicialização do projeto da rede neural baseada na análise multiclasse discriminante linear e extração de subespaços com o Critério de Fisher de Pesos, inclusive na seleção de dados de entrada. Esperava-se que a rede oMLP demonstrasse consistentemente sua habilidade, controlando o aumento da dimensionalidade em conjuntos extensos de dados de proteínas e obtivesse melhorias significativas na maioria das medidas de desempenho, incluindo acurácia da predição da estrutura secundária e propriedades de convergência.
This thesis proposes to use pattern recognition and MultiLayer Perceptron (MLP) artificial neural networks in protein secondary structure prediction. We get the latest improvements of previous works, namely: variation in the size of windows; use of evolutionary information; use of decision jury and creation of neural networks chain and propose: bringing together all these improvements in a single tool (cMLP), to test with a set of proteins already tested by previous works and to perform the comparison of the tool built with other classifiers already available on the web, all arising from papers, and thus perform an optimization process of the neural network parameters.
The conventional neural network with random initializations was optimized, becoming an optimized MLP neural network (oMLP). The optimization process occurred in the initialization parameters of the neural network project based in the multi-class linear discriminant analysis and the weighted Fisher Criterion subspaces extraction, even in the selection input data. We hope that the oMLP network will be effective in the process of dimensionality reduction of the search space in extensive groups of protein data will enhance the most of the performance measures by including the accuracy of the secondary structure prediction and convergence properties.