BIO-5706 Questionário 1

(para 12/08/2015)

Texto:
Apweiler, R. Sequence databases. Cap. 1 In: Baxevanis, A. D. e Oullette, B. F. F. (2007). Bioinformatics, a practical guide to the analysis of genes and proteins. John Wiley & Sons, Hoboken. pp 4-24

Questões

1. Coloque em ordem cronológica os termos abaixo, explique o significado se for um acrônimo, colocando os anos de criação e também se a entidade correspondente foi originada de outra ou se originou alguma.

a)PIR+
b)DDBJ
c)Atlas of Protein Sequence and Structure
d)EMBL
e)GenBank
f)EBI
g)PIR
h)trEMBL

2. Explique os conceitos de bancos primários e secundários de sequências macromoleculares. Forneça quatro exemplos de bancos de dados secundários.

3. Qual são os parâmetros dos três grandes bancos de dados primários de sequências macromoleculares (GenBank, DDBJ e EMBL) que permitem verificar se a sequência é a mesma?

4. O que é armazenado no banco RefSeq e qual é a importância desse tipo de dados?

5. Escreva uma legenda detalhada para a figura 1.3 explorando o fluxo de informação e o conteúdos dos diferentes conjuntos de dados.

6. Um estagiário do seu laboratório conseguiu obter experimentalmente uma sequência de resíduos de aminoácidos sem que tenha tido a necessidade de obter a sequência do gene correspondente. Em quais bancos de dados essa sequência poderia ser depositada?