怎样在NCBI中找到一个基因ncbi 家族基因的所有基因

 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
如何在NCBI查找基因序列
下载积分:500
内容提示:如何在NCBI查找基因序列
文档格式:PDF|
浏览次数:1762|
上传日期: 19:15:44|
文档星级:
全文阅读已结束,如果下载本文需要使用
 500 积分
下载此文档
该用户还上传了这些文档
如何在NCBI查找基因序列
官方公共微信关注今日:0 | 主题:107630
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
怎样在NCBI中找到一个基因家族的所有基因?
页码直达:
我需要分析一个基因家族的基因并做进化树,在NCBI-gene中输入这个基因的名字后出现了110条基因,但它们中有一些在相同的染色体上,并且氨基酸序列完全相同,这样的基因算是同一个基因么?如果不是我要怎么筛选不同的基因?如果全部下载两两比对的话工作量太大了,希望各位大虾能够指教!
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园2340人阅读
数据挖掘(3)
下载序列简单不过,无非就是联网NCBI主页,选择数据库后输入AC号或GI号后直接下载。但是如何大批量下载,而且下载的序列是指定的AC或GI的呢?实现这一目的通常办法是借助一些生物软件的检索功能,诸如:Bioedit、Geneious、MacVector等。其实,NCBI自带的Batch Entrez 只需简单三步即可轻松完成这一任务。
【准备工作】
创建一个需要下载序列AC号的列表文件,每行一个独立的AC号,保存为文本文件:
【简要流程】
1、打开网页,粘贴这个网
点击“浏览”按钮,选择事先准备带AC号的文本文件后,点击“Retrieve”开始检索,数秒后即可返回检索的序列记录;
3、点击检索到的序列记录“Retrieve records for 48 UID(s)”即可,后面就是“Send to” 保存要下载的序列,后面的操作就不在赘述,详见前面一些相关教程。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:28284次
排名:千里之外
原创:40篇
(4)(2)(2)(4)(2)(4)(4)(2)(4)(5)(2)(2)(3)(3)(3)[转载]问题8:如何找到一个基因家族的所有成员HUGO基
(http://www.gene.ucl.ac.uk/nomenclature/)一直以来都在努力为人类的每一个基因建立一种独特的符号,和一种更长久更具有描述性的名称。因而很多先前在不同的实验室被克隆出来并且被命名为各种不同术语的基因家族的成员,现在却分享一种共同的基因符号。在任何基因组浏览器进行一项文本搜索时,返回的页面通常都会链接到已经在基因组定位的该基因家族内所有已命名的成员。然而,Ensembl和
UCSC最近列出了所有的基因目录,NCBI不仅提供了基因的目录,还将基因绘制成比较直观的概要图谱。
  进入NCBI主页,网址是http://www.ncbi.nlm.nih.gov/。点击位于右方的链接Human map
viewer进入人类基因图谱浏览器搜索页。在查询框中键入所要查询的词“ADAM*
[sym]”。星号或者通配符表示能够搜索到与ADAM有关的所有条目。然而[sym]却对以ADAM为其基因符号的所有搜索结果起到限制作用。可以点击
Search或者直接阅读在线的文献进行其他高级搜索。这次搜索一共获得了41个跟ADAM目标基因相匹配的条目,这些条目包括了ADAM基因家族的所有成员以及以ADAM开头的其它基因家族的一些成员,如ADAMTS和ADAMDEC。为了限定使搜索只指向ADAM基因,以排除掉不需要的基因符号,应该使用逻辑搜寻术语“NOT”。在搜索框中键入ADAM*[sym]
NOT ADAMTS*[sym] NOT
ADAMDEC1*[sym],然后再点击find。返回页面上方的染色体图形上,用红色的线条标明了每个基因的位置。很明显,19个已定位的ADAM基因分布在11条染色体上,有一些如位于10号和14号长臂顶端上的基因就靠的很近,在染色体图形的下面是ADAM家族的19个基因的排列,点击链接到那
19个基因,便可以查到它们的详细资料。
  另外一个在基因组中搜索同源基因的方法是通过在NCBI或者Ensemble上的基本局部序列对齐比较搜索工具(basic local
alignment search
tool),简称BLAST。UCSC上的BLAT搜索没有BLAST敏感,可能没有BLAST发现的同源基因多。在这个例子中所有和ADAM2蛋白质同源的基因组序列将会在Ensembl上通过BLAST搜索获得。
  从网址http://www.ensembl.org/Homo_sapiens/进入Ensembl人类基因组的主页,点击
BLAST链接。将ADAM2的蛋白质序列粘贴到查询框中(GenBank登录号NP_,按照问题5的步骤从NCBI的Entrez数据库中已经获得了蛋白质的序列)。将数据库设置成Homo
sapiens, genomic
sequence,在Ensembl上查找基因组汇编,选择TBLASTN运行。其他设置使用默认的参数。当这些全部做完以后,点击查询。得到的页面上将有一个检索符号,当检索完成以后,它将直接连接到检索结果的页面。
  在检索结果页面的顶端将出现一个用图形来表示找到的蛋白质的位置。这些搜索结果有的是完整的蛋白质,有的只是一个单一的结构域。它们通过BLAST得分被标以不同的颜色。红色表示相似程度最大,蓝色的相似处最少,绿色介于两者之间。有一些区域如位于10号和14号染色体的长臂上的一对基因,它们的位置跟NCBI绘制的ADAMS基因的位置有些相似,但是也有一些,如位于第12号和Y染色体上用BLAST搜索的结果就是唯一的。这个唯一的结果可能代表ADAM家族中的真正成员,它们有可能还没有被命名,所以还不能在文本中搜索出来。还有可能它们是未被命名的假基因或是BLAST搜索不太重要的结果。位于第1号染色体上的一个基因也许可以在NCBI上以文本为基础的搜索中查到,但不一定在Ensembl中用BLAST搜索到。这个基因和
ADAM基因之间的相似之处还没有高到能用Ensembl的默认的参数值在BLAST中搜索出来。
  点击其中一条搜索结果旁边的箭头,激活一个向上的菜单,菜单将显示BLAST所搜索结果的细节,并提供一个到BLAST序列对齐比较的的链接和ContigView。在第12号染色体上的搜索结果包括了一个终止密码,也许只是一个没有内含子的假基因。在结果页面底部是用BLAST搜索的结果摘要。点击一个链接到BLAST序列对齐排列的条目,在结果页面中部的链接将会用标准格式表示出BLAST报告的所有结果。点击一个BLAST搜索出来的条目,将会找到有关条目周围区域的ContigView。
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 ncbi查找基因序列 的文章

 

随机推荐