Objetivos:
Essa atividade é para que o estudante adquira alguma
familiaridade com a obtenção de informações em bancos de
dados biomoleculares.
Atividade:
O número de bancos de dados biomoleculares está crescendo de forma tão rápida que é impossível se fazer um levantamento que seja minimamente estável com todos os recursos existentes. Aqui, selecionamos alguns bancos de dados para ilustrar os tipos de informação que pode ser obtidas deles.
Escolha uma proteína/gene que você tenha algum conhecimento prévio e tente extrair as informações pertinentes de três bancos de dados sobre esta proteína/gene dentre os diferentes bancos de dados mostrados abaixo. Para cada banco de dados escolhido, procure informações sobre seu escopo na própria descrição do banco de dados. Para sua busca, use a lógica Booleana, empregando os operadores "AND", "OR", "NOT" e "XOR". Em seguida, responda às questões abaixo sobre os três bancos de dados que você escolheu.
Note que isto é apenas uma pequena amostra das informações que podem ser obtidas através das centenas de bases de dados bio-moleculares atualmente disponíveis.
|
Sigla |
Endereço |
|
Genbank |
|
|
Uniprot |
|
|
PDB |
|
|
CATH |
|
|
GO |
|
|
Expression Atlas |
|
|
EnsEMBL |
|
|
KO |
1.- Quais os tipos de informações contidas nos bancos de dados? Como elas são obtidas?
2.- As informações contidas nos bancos de dados são curadas? Se sim, explique como é feita a curadoria dos dados?
3.- Existe, entre os bancos de dados que você escolheu, alguma relação entre os identificadores ou códigos de acesso?
Nota:
Vários bancos de dados em bioinformática usam um sistema em que as entradas podem ser identificadas de duas maneiras diferentes. Basicamente eles são chamados de:
l Identificador - é uma sequência de letras e números que geralmente pode ser interpretada com algum sentido por um ser humano, por exemplo, como uma abreviatura reconhecível da proteína completa ou nome de gene.
l Código (ou número) de acesso - é um código supostamente mais estável composto geralmente de número, possivelmente com algumas letras na frente, o qual identifica a entrada no banco de dados.
4.- O bancos de dados que você escolheu
possibilitam realizar buscas logicamente encadeadas de seus
conteúdos? Se sim, quais?