Sumario: | Estudos de evolução molecular por técnicas computacionais são geralmente conduzidos a partir de um alinhamento múltiplo de sequências homólogas, no qual sequências provavelmente originadas por um ancestral comum são alinhadas de forma que aminoacidos equivalentes ocupem a mesma posição. Padrões de conservação de resíduos em um alinhamento, ou em um subconjunto de suas sequências, podem ser extremamente informativos por sugerirem posições sob seleção e restrição evolutiva. Neste trabalho desenvolvemos uma metodologia baseado em ciências das redes, com objetivo de identificar grupos de resíduos e propriedades estereoquímicas funcionalmente relacionados, através da análise de coocorrência e detecção de comunidades. A metodologia foi aplicada as famílias das Transtiretinas/HIUases e dos receptores acoplados a proteína G (classe A). Em ambos os casos foram obtidos com sucesso grupos de resíduos determinantes de especificidade para diversas subclasses funcionais. Estes dados foram posteriormente utilizados como estimadores para uma máquina de suporte de vetores (SVM) que foi capaz de classificar corretamente até mesmo subclasses, a quais nenhum resíduo específico foi identificado. A classificação por SVM foi também aplicada as GPCRs órfãs gerando novas hipóteses a respeito das classes funcionais destas sequências
|