如何将Batch Entrez网站批量下载网站内容的多个菌组合的基因组文件拆分成多个单独细菌编号的序列文件

六盘水师范学院生物信息学实验室

学习常常是从模仿开始的从事系统发育或是生物信息学研究工作的的常常需要通过阅读别人的文章来学习一些经典的分析方法。然后峩们可能都有一个共同的体会文献读几百遍比不上用原文的数据,按照其方法一步一步的进行模仿分析将自己得到的结果和文章的结果进行比较之后才会豁然开朗。

好在通常文章都会有个表格列示了分析所用到的序列在Genbank中的索取号。我们只要全部下载到本地计算机就鈳以进行模拟分析了然而问题来了,一条一条的下载毕竟是个苦差事有没有什么简便的方法能够一次性把该表格中的序列全部下载下載下来呢?

用这个工具要求你有一个文件,里面是一个列表可以是Accession NumberGi Number或是NCBI里其它数据库的各种标识符。

文件的格式看例子:Bear.txt

下面我們就来逐步图解这个过程

为了图文并茂请下载pdf文件观看

首先当然是在你的文献中,找到这个列示有所有序列Genbank索取号的表格

第三列正是我所需要的信息这样,我们将这一列单独复制到记事本中保存为文件bear.txt

在有“浏览”字样的地方上传bear.txt, 点击Retrieve开始搜索。正常情况下会出现丅面的界面

因为我们需要全部的序列,直接下载全部序列

就这么简单,祝您科研愉快!

六盘水师范学院生物信息学实验室

学习常常是从模仿开始的从事系统发育或是生物信息学研究工作的的常常需要通过阅读别人的文章来学习一些经典的分析方法。然后峩们可能都有一个共同的体会文献读几百遍比不上用原文的数据,按照其方法一步一步的进行模仿分析将自己得到的结果和文章的结果进行比较之后才会豁然开朗。

好在通常文章都会有个表格列示了分析所用到的序列在Genbank中的索取号。我们只要全部下载到本地计算机就鈳以进行模拟分析了然而问题来了,一条一条的下载毕竟是个苦差事有没有什么简便的方法能够一次性把该表格中的序列全部下载下載下来呢?

用这个工具要求你有一个文件,里面是一个列表可以是Accession NumberGi Number或是NCBI里其它数据库的各种标识符。

文件的格式看例子:Bear.txt

下面我們就来逐步图解这个过程

为了图文并茂请下载pdf文件观看

首先当然是在你的文献中,找到这个列示有所有序列Genbank索取号的表格

第三列正是我所需要的信息这样,我们将这一列单独复制到记事本中保存为文件bear.txt

在有“浏览”字样的地方上传bear.txt, 点击Retrieve开始搜索。正常情况下会出现丅面的界面

因为我们需要全部的序列,直接下载全部序列

就这么简单,祝您科研愉快!

从NCBI下载基因序列时先进入NCBI主页選择数据库后输入GenBank AC号或GI号后直接下载。但在大批量下载网站内容基因序列时如果能够快速批量下载网站内容基因序列文件,将大大减少笁作量NCBI自带的Batch Entrez只需简单三步即可完成这一任务。

从下载基因序列是很简单的一件事生物学相关的人员可能都从NCBI下载过基因序列。下载方法无非就是先进入NCBI主页选择数据库后输入 AC号或GI号后直接下载。但在大批量下载网站内容基因序列时这样一个一个序列下载会耗费大量时间。如果能够快速批量下载网站内容基因序列文件将大大减少工作量。实现这一目的通常办法是借助一些生物软件的检索功能诸洳:Bioedit、Geneious、MacVector等。其实NCBI自带的Batch Entrez只需简单三步即可轻松完成这一任务。

一、准备基因序列号文件

创建一个需要下载序列GenBank进入号(AC号)的列表文件每行一个独立的AC号,保存为文本文件:

1、打开浏览器打开网址:

2、点击“浏览”按钮,选择事先准备带AC号的文本文件后点击“Retrieve”開始检索,数秒后即可返回检索的序列记录;

3、点击检索到的序列记录“Retrieve records for 48 UID(s)”然后点击“Send to”,选择需要保存的序列文件格式下载即可

我要回帖

更多关于 批量下载网站内容 的文章

 

随机推荐