Princípios gerais do método de parcimônia

    O princípio de parcimônia é um princípio filosófico largamente empregado na Ciência. Foi proposto por um filósofo inglês, Ockam no século XVII e seu enunciado é aproximadamente o seguinte: Se existe mais de uma explicação para uma dada observação, devemos adotar aquela mais simples.
    O método de máxima parcimônia foi empregado em análises de seqüências moleculares com o propósito de reconstrução de árvores filogenéticas como uma simplificação do método de máxima verossimilhança por Eck e Dayhoff (1967). Já havia sido empregado implicitamente com o propósito de explicar a origem das inversões aninhadas nos cromossomos politênicos de espécies de Drosophila, em 1936 por Sturtervant e Dobzhansky.

1. O princípio da parcimônia nas reconstruções filogenéticas a partir de dados de seqüências macromoleculares.

    A aplicação do princípio de máxima parcimônia nas reconstruções filogenéticas é conceitualmente muito simples: Devemos escolher, dentre as árvores possíveis, aquela com o menor número de substituições que seja compatível com as seqüências observadas. Entretanto, a implementação é complexa, pois o número de árvores possíveis pode atingir valores muito altos.
    Para 3 seqüências, existe apenas uma árvore possível (que sejam bifurcantes, árvores tais como A--B--C não são consideradas):

    Para 4 seqüências, existem 3 árvores (bifurcantes) possíveis.

    Para 5 seqüências existem 15 árvores (bifurcantes):
    O número de árvores cresce muito rapidamente à medida que aumenta o número de seqüências. Você deve ter notado que para saber o número de ávores com N seqüências, multiplica-se o número de árvores com N-1 seqüências pelo número de ramos presentes em uma árvore com N-1 seqüências. Para 10 seqüências,mais de um milhão de árvores são possíveis. Para se atingir o número de partículas elementares do Universo conhecido (~1080), bastam 59 seqüências! E isso contando apenas as árvores sem raiz e estritamente bifurcantes.
 

2. Algoritmos para a reconstrução filogenética com máxima parcimônia.

    O algoritmo mais simples de se entender mas que também é o de maior exigência computacional é o de busca exaustiva, onde todas as árvores possíveis são verificadas. Na prática o emprego desse algoritmo é inviável para muitas seqüências. Existe também um algoritmo exato , "branch and bound" (que assegura que a árvore mais parcimoniosa é encontrada), que verifica apenas um subconjunto delas. Existem ainda os algoritmos heurísticos, que, embora não consigam, com certeza, determinar a árvore mais parcimoniosa, analisam um subconjunto muito reduzido das árvores possíveis mas que são mais prováveis de conter  a mais parcimoniosa, de acordo com critérios variáveis conforme o algoritmo. Entre este temos o "branch-swaping", o "star decomposition"  e o "nearest neighbor interchange".

3. Variações do método de máxima parcimônia.

    O método de parcimônia, em sua forma mais simples, tem como sua principal vantagem, segundo seus defensores,  a independência de modelos de evolução. Seus detratores argumentam, no entanto, que na verdade existe um modelo implícito, por exemplo, no qual todos os sítios de uma seqüência macromolecular tiem pesos iguais, de que não é considerada a diferença empírica entre taxas diferentes de transições e transversões, etc, em uma analogia com o modelo de Jukes e Cantor (1969).Certas variantes do método de parcimônia foram propostas para admitir modelos explícitos de evolução. Temos abaixo alguns exemplos:
a) Parcimônia de transversão.
    Nesse método, as mudanças que envolvem transições são simplesmente ignoradas da análise
b) Emprego de uma matriz de passos
    Para contemplar, por exemplo, diferenças entre transições de transversões, são empregadas, a priori, uma contagem diferente para transições e transversões. Por exemplo, com o emprego de uma matriz desse tipo:
 
 
DE
PARA
 
A
T
C
G
A
-
2
2
1
T
2
-
1
2
C
2
1
-
2
G
1
2
2
-

As transições contam um passo e as transverções contam 2 passos. Uma matriz para seqüências de aminoácidos em proteínas teria a dimensão 20,20.
Outros detalhes poderão ser encontrados em Swofford et al. (1996) e Miyaki et al. (2000).

Página principal