Caros.
Como vimos na aula, esta região está no banco de dados GENE com a ID
"Gene ID: 3308". O link direto é http://www.ncbi.nlm.nih.gov/gene/3308 .
A figura abaixo analisa as informações de comprimento de sequência é o
que cada parte dela representa,
A sequência é um trecho do genoma humano, no cromossomo 5, entre a base
133051970 e a 133105017. Ao todo são
68962, mas a gente só vê isso na página do nucleotídeo correspondente a
este trecho do genoma. O link pode ser acessado pela página do Gene, e vai
direto por aqui: http://www.ncbi.nlm.nih.gov/nuccore/NC_000005.10?report=genbank&from=133044012&to=133112973 . Claro que vocês podem fazer a conta
de subtrair e calcular quantas bases tem pelas posições do genoma.
A sequência toda contém o gene (que é igual ao transcrito), precedido e
sucedido de regiões que não se diz o que são, mas que provavelmente são regiões
intergênicas. Depois da região 5´-UTR começa
a ORF,no primeiro ATG do transcrito (isso acontece quase sempre em
eucariotos e vocês precisam saber porque). Nesta sequência estão também os
introns! Portanto, o mRNA não é a sequência contínua, mas a soma dos exons. A
ORF termina no códon de parada. Tudo isso está sinalizado na página do
nucleotídeo, mas não aparece na página do gene. Por isso é importante associar
as duas. O tamanho da ORF (sem os introns) pode ser calculado pelo tamanho da
proteína, na página da proteína. Então, são três páginas que vocês têm que ter
sempre associadas, neste caso.
Neste post eu não falo dos introns.
Vejam com atenção a figura abaixo, que é uma sinopse desta análise.
Nenhum comentário:
Postar um comentário