BIO-5706 Questionário 1

(para 14/08/2013)

Texto:
Apweiler, R. Sequence databases. Cap. 1 In: Baxevanis, A. D. e Oullette, B. F. F. (2007). Bioinformatics, a practical guide to the analysis of genes and proteins. John Wiley & Sons, Hoboken. pp 4-24

1. Qual foi o primeiro banco de dados de sequências macromoleculares e quem é seu "herdeiro" atual?

2. O que diferencia um banco de dados de sequências macromoleculares primário de um secundário? Forneça um exemplo de cada um deles.

3. Explique as seguintes característica CDS de registros hipotéticos:

CDS             join (147..239,349..734,897..1023)
CDS             complement(915..2099)
CDS             complement(join(14104..14304,14364..14796,14895..15001,
                     15075..15139,15267..15357)
CDS             join(<29..85,249..296,444..>479)

4. Qual é o propósito do banco de dados RefSeq (http://www.ncbi.nlm.nih.gov/RefSeq/)?

5. O que vem a ser o banco de dados UniProt (http://www.uniprot.org/) e quais são as diferenças entre o SwissProt e o trEMBL?

6. Discuta as seguintes características dos bancos de dados de sequências nucleotídicas:

a) redundância (como as informações estão repetidas)
b) amostragem (como a probabilidade de se encontrar um determinado tipo de sequência ou sequências de determinados organismos são maiores que de outras sequências)
c) acurácia (nas próprias sequências e como elas encontram-se interpretadas nos registros)

7. Quais são as características e a utilidade do banco de dados UniParc (http://www.ebi.ac.uk/uniparc/)?