BIO-5706 Questionário 1
(para 14/08/2013)
Texto:
Apweiler, R. Sequence databases. Cap. 1 In: Baxevanis,
A. D. e Oullette, B. F. F. (2007). Bioinformatics, a practical guide to
the analysis of genes and proteins. John Wiley & Sons, Hoboken. pp
4-24
1. Qual foi o primeiro banco de dados de
sequências macromoleculares e quem é seu "herdeiro"
atual?
2. O que diferencia um banco de dados de sequências macromoleculares
primário de um secundário? Forneça um exemplo de
cada um deles.
3. Explique as seguintes característica CDS de registros
hipotéticos:
CDS
join (147..239,349..734,897..1023)
CDS
complement(915..2099)
CDS
complement(join(14104..14304,14364..14796,14895..15001,
15075..15139,15267..15357)
CDS
join(<29..85,249..296,444..>479)
4. Qual é o propósito do banco de dados RefSeq
(http://www.ncbi.nlm.nih.gov/RefSeq/)?
5. O que vem a ser o banco de dados UniProt
(http://www.uniprot.org/) e quais são as diferenças entre
o SwissProt e o trEMBL?
6. Discuta as seguintes
características dos bancos de dados de sequências
nucleotídicas:
a) redundância (como as informações estão
repetidas)
b) amostragem (como a probabilidade de se encontrar um determinado tipo
de sequência ou sequências de determinados
organismos são maiores que de outras sequências)
c) acurácia (nas próprias sequências e como
elas encontram-se interpretadas nos registros)
7. Quais são as características e a utilidade do banco de
dados UniParc (http://www.ebi.ac.uk/uniparc/)?