This paper describes a biomolecular classification methodology based on multilayer perceptron neural networks. The system developed is used to classify enzymes found in the Protein Data Bank. The primary goal of classification, here, is to infer the function of an (unknown) enzyme by analysing its structural similarity to a given family of enzymes. A new codification scheme was devised to convert the primary structure of enzymes into a real-valued vector. The system was tested with a different number of neural networks, training set sizes and training epochs. For all experiments, the proposed system achieved a higher accuracy rate when compared with profile hidden Markov models. Results demonstrated the robustness of this approach and the possibility of implementing fast and efficient biomolecular classification using neural networks.
Abstract. This work describes the use of a recently proposed technique -gene expression programming -for knowledge discovery in the data mining task of data classification. We propose a new method for rule encoding and genetic operators that preserve rule integrity, and implemented a system, named GEPCLASS. Due to its encoding scheme, the system allows the automatic discovery of flexible rules, better fitted to data. The performance of GEPCLASS was compared with two genetic programming systems and with C4.5, over four data sets in a five-fold cross-validation procedure. The predictive accuracy for the methods compared were similar, but the computational effort needed by GEPCLASS was significantly smaller than the other. GEPCLASS was able to find simple and accurate rules as it can handle continuous and categorical attributes.
A tecnologia em saúde tornou-se um ator eficaz no processo de cuidar e gerir. Ela compõe a rede de atenção em saúde. Contudo sua característica ambivalente exige uma análise crítica e multidimensional de sua ação. O presente artigo tem como objetivo apresentar uma reflexão sobre a disseminação e uso da tecnologia nos serviços de saúde, tendo como plano de fundo sua ambivalência e ação como ator na rede de assistencial. Trata-se de uma análise acerca do uso da tecnologia em saúde e suas repercuções sobre o cenário da assistência integral ao paciente. Tal ponto faz-se necessário uma vez que seu uso acarreta em dualidade em suas consequências e por vezes expressa-se através da mecanização e visão tecnicista do cuidado. Acredita-se que toda inovação tecnológica deve ser compreendida e analisada de forma crítica, uma vez que esta possui característica ambivalente e sua utilização repercute em consequência multidimensional. Desta forma para minimizar os efeitos contraditórios da tecnologia é necessário que esta tome seu papel como ator para compor o processo de cuidar e gerir a fim de prestar uma assistência integral à saúde no papel de um ator não-humano capaz de agir sob a forma de intervenção para promoção, prevenção, diagnóstico ou tratamento de doenças, e reabilitação.
The prediction of protein function, based on its structure, is a hard problem in Molecular Biology. IntroduçãoA Biologia Molecular tem se desenvolvido rapidamente e uma enorme quantidade de dados é gerada constantemente. Entretanto, pouca informação se consegue extrair destes dados, logo a análise de dados tem se tornado o principal problema da biologia molecular [1].O esforço internacional do Genoma Humano e sequenciamento de inúmeros outros organismos têm proporcionado um crescimento contínuo na descoberta de novas estruturas de proteínas. Este fato tem aumentado ainda mais a necessidade do desenvolvimento de métodos de classificação mais eficientes.A utilização de redes neurais [2] no problema de classificação de proteínas tem trazido resultados promissores, como pode ser observado em [3] que propõe uma nova técnica para extrair aspectos de dados de proteínas e usa-os em conjunto com uma rede neural Bayesiana para classificar seqüências de proteínas, e em [4] que explora segmentos de seqüência ditos informativos para determinar estruturas e funções de classes de proteínas utilizando uma rede neural de três camadas com algoritmo de aprendizado backpropagation.Um aspecto importante da aplicação de redes neurais na classificação de seqüências de proteínas é a codificação da seqüência que deve ser realizada de maneira a permitir o processamento desta em uma rede neural. Neste artigo é apresentada uma nova forma de codificação que transforma a seqüência de uma proteína (estrutura primária -Figura 1) num conjunto de valores reais que podem ser diretamente inseridos na primeira camada da rede neural, diferentemente da maioria dos métodos que extrai informações relevantes de seqüências de proteínas, como aspectos de similaridade [3], para então originar o conjunto de dados que será utilizado como entrada da primeira camada da rede neural. Biologia molecularAs proteínas são constituídas de aminoácidos, sendo que estes se combinam através de ligações peptídicas fornecendo uma seqüência linear que contém informações necessárias para a geração de uma molécula protéica. As proteínas diferem umas das outras porque cada uma delas tem uma seqüência distinta de unidades de aminoácidos. Os aminoácidos são o alfabeto da estrutura protéica, pois eles podem ser agrupados em um número quase infinito de seqüências para formar um número igualmente infinito de diferentes proteínas [5].A seqüência de aminoácidos de uma proteína está diretamente relacionada à sua função. As proteínas geralmente contêm subestruturas cruciais no interior da sua seqüência de aminoácidos, também conhecidas como motifs [6], as quais são essenciais para a execução de sua função biológica, funcionando também como identidade da proteína.As proteínas são representadas por um alfabeto composto de 20 letras que representam os 20 aminoácidos que podem estar presentes em uma seqüência protéica, conforme Tabela 1.Os aminoácidos diferem entre si pela estrutura da sua cadeia lateral [5]. As propriedades das cadeias laterais dos aminoácidos, principalmente o f...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.