Um outro aspecto MUITO
importante e que deve ser criteriosamente considerado ao trabalhar com
sistemática molecular é a qualidade do conjunto de
dados. Seja em análises filogenéticas seja em análises
genealógicas, a qualidade dos dados deve ser a melhor possível
para que sejam confiáveis, de forma que devemos explorar todas as
estratégias possíveis para trabalhar com seqüências
corretas. Algumas desses estratégias são:
1) No caso de DNA, seqüenciar ambas as fitas (se necessário utilizar "primers" internos com superposição de seqüências), pois uma servirá de "contra-prova" da outra.
2) Seqüenciar pelo menos duas vezes um mesmo indivíduo.
3) Para filogenias de espécies,
se possível analisar pelo menos dois indivíduos daquela espécie
e, se necessário, utilizar a seqüência consenso inferida
a partir das seqüências obtidas.
Projetos envolvendoo sistemática
molecular necessitam de um planejamento detalhado, uma vez que as técnicas
envolvidas são relativamente caras e também porque em alguns
casos pode levar ao sacrifício dos organismos.
Os principais estágios de um projeto em sistemática molecular são:
- Definição clara do problema que se vai abordar;
- Realização de um estudo-piloto envolvendo:
- Definição dos marcadores moleculares adequados
- Definição da utilidade prática do marcador eleito
- Estabelecer o tamanho amostral adequado (e se, na prática, a obtenção das amostras é factível)
- Determinar as estratégias de coleta (museus, natureza, etc.)
- Coletar as amostras
- Analisar o material coletado
- Analisar o conjunto de dados
- Interpretar os resultados
Como já foi visto, a definição do problema a ser estudado será o ponto-chave para a definição de quais tipos de seqüências deverão ser utilizados (sejam ortólogas, parálogas, xenólogas). Um segundo ponto-chave, em especial em estudos de filogenias de espécies, duas outras características das seqüências devem ser consideradas:
1) taxa evolutiva
2) tipo de herança
Considerando os metazoários eucariotos, algumas
das características de seus genomas são:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Seqüências de DNA mitocondrial (mtDNA), são especialmente vantajosas em estudos de relações entre espécies próximas, relações entre híbridos, espécies partenogenéticas e casos de introgressão. No entanto podem apresentar algumas limitações como baixa ocorrência de polimorfismos em situações de divergência recente entre as linhagens ou a ocorrência de homoplasias (ruído filogenético) no caso de divergência muito antiga das linhagens.
O genoma nuclear é vastamente mais complexo que o mitocondrial. Seqüências de DNA nuclear (nDNA) são utilizadas preferencialmente em filogenias envolvendo níveis taxonômicos superiores, inclusive reinos (especialmente os genes codificantes para proteínas).
De um modo geral, as três principais áreas de aplicação de seqüências de nucleotídeos em sistemática molecular são:
1) Estudos de evolução molecular considerando os processos que geram as variações, as origens de novos alelos e locos, convergências e seleção.
2) Estudos populacionais (intra-específicos), envolvendo genealogias gênicas/alélicas, histórias demográficas, variação geográfica, fluxo gênico, hibridação, conservação da biodiversidade.
3) Estudos interespecíficos, envolvendo a reconstrução de filogenias e a avaliação de processos e padrões macroevolutivos.
Seqüências de DNA, no entanto, podem conter sítios altamente variáveis e outros sítios altamente conservados, de forma que a variabilidade é um balanço entre mutações ocorridas e as restrições estruturais e funcionais das moléculas. Devido a esse fato, os estudos-pilotos são muito importantes, pois imagine um conjunto de seqüências a serem estudadas e que apresentem uns poucos sítios livres para variar sendo o restante invariável por restrição. Seqüências assim geram uma comparação NADA informativa, comprometendo as análises, pois a pouca variabilidade está restrita àqueles sítios livres para variar, os quais podem estar saturados pelas substituições nucleotídicas.
Um sítio livre para variar
sofre tantas mudanças ao longo do tempo que acabamos por perder
informações importantes, como no exemplo a seguir:
tempo 1 ACCTAGCTA
tempo 2 ACGTAGCTA
tempo 3 ACCCAGCTT
tempo 4 ACTTAGCTT
tempo 5 ACGCAGCTC
tempo 6 ACGCAGCTA
Número de mudanças ocorridas ao longo de tempo: 9
Número de mudanças observadas: 2
µµµµµµµµ