blastn 怎么才算显著性水平怎么计算匹配

Blast本地化:使用Blastall进行数据库比对
Blast本地化:使用Blastall进行数据库比对
用blastall进行序列比对
blastall是最常用的blast程序之一,其功能非常强大,其下面有非常多的参数,但是一般使用的参数如:-p、-i、-d、-o、-e等几个。
-p: 执行的程序名称
-d: 搜索的数据库名称
-i : 要查询的序列文件名(Query File)
-e:(数学)期望值(Expectation value),E值是个统计阈值,缺省值10,
意指比对结果中由于随机偶然性产生的匹配结果不大于10,E值越小结果越可靠。
-o :查询结果输出文件名
-m: 比对结果显示格式选项,缺省值为0 ,即pairwise格式。另外还可以根据不同的需要选择1~6等不同的格式。
-I :在描述行中显示gi号[T/F],缺省值F
-v :单行描述(one-line
description)的最大数目,缺省值500
-b :显示的比对结果的最大数目,缺省值250
-F :对于要查询的序列做低复杂度区域(low complexity regions,
LCR)的过滤[T/F],缺省值T。对blastn用的是DUST程序,其他比对用的是SEG程序。
所谓“低复杂度区域”是指某些或一些残基过多表现,短周期重复等。对于高等哺乳动物的基因组序列,可以先用RepeatMask程序遮蔽重复元件。在输出结果中,对LCR区的序列核酸用“N”代替,蛋白质序列用“X”代替。
-a:运行BLAST程序所使用的处理器的数目,缺省值1
-S:在数据库中搜索时所使用的核酸链(strand),只对blastn、blastx和tblastx有效;1表示top,2表示bottom,3表示both;缺省值3
-T: 产生HTML格式的输出[T/F],缺省值F
-n: 使用MegaBlast搜索[T/F],缺省值F
-G: 打开一个gap的罚分(0表示使用缺省设置值),默认0
-E: 扩展一个gap的罚分(0表示使用缺省设置值),默认0
-q: 一个核酸碱基的错配(mismatch)的罚分(只对blastn有效),缺省值-3
-r : 一个核酸碱基的正确匹配(match)的奖分(只对blastn有效),缺省值1
-M: 所使用的打分矩阵,缺省值BLOSUM62
1.1.1. 参数说明
基本参数、比对优化参数、结果输出参数、控制输入参数
表:blastall命令的参数说明
使用的程序
字符[String]
blastnblastpblastx
使用的数据库
文件名[File In]
搜索用的序列
文件名[File In]
数字[Real]
控制比对结果的样式
0到11的整数[Integer]
0 = pairwise,1 = query-anchored
showing identities,2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = query-anchored no identities and blunt ends,
6 = flat query-anchored, no identities and blunt ends,
7 = XML Blast output,
8 = tabular,
9 tabular with comment lines
10 ASN, text
11 ASN, binary
比对结果存放的文件名
文件名[File Out]
过滤询问序列
DUST with blastn, SEG with others
打开gap得分
延伸gap得分
X dropoff value for gapped alignment
blastn 30, megablast 20, tblastx 0,
all others 15
显示gi号Show GI’s in deflines
核酸错配罚分
blastn only
核酸匹配得分
blastn only
Number of database sequences to show
one-line descriptions for (V)
Number of database sequence to show
alignments for (B)
Threshold for extending hits
blastp 11, blastn 0, blastx 12,
tblastn 13, tblastx 13, megablast 0
Perform gapped alignment
not available with tblastx
指定询问序列使用的遗传密码
指定数据使用的遗传密码
for tblast[nx] only
使用CPU的数目
SeqAlign file
[File Out]
Believe the query defline
比对使用的矩阵
blastn 11, megablast 28, all others
数据库的有效长度Effective length of the
use zero for the real size
Number of best hits from a region to
off by default, if used a value of 100
is recommended
0 for multiple hit, 1 for single
does not apply to blastn
Effective length of the search
use zero for the real size
Query strands to search against
for blast[nx], and tblastx, 3 is both,
1 is top, 2 is bottom
将结果保存为HTML格式
通过gi号列表,限制搜索范围
Use lower case filtering of FASTA
X dropoff value for ungapped
extensions in bits
0.0 invokes default behavior blastn
20, megablast 10, all others 7
X dropoff value for final gapped
alignment in bits
blastn/megablast 50, tblastx 0, all
PSI-TBLASTN checkpoint file
MegaBlast search
Location on query sequenc
Multiple Hits window size
default if zero (blastn/megablast 0,
all others 40)
Frame shift penalty
OOF algorithm for blastx
Length of the largest intron allowed
in a translated nucleotide sequence when linking multiple distinct
alignments
0 invo a negative
value disables linking.
Number of concatenated queries
for blastn and tblastn
Force use of the legacy BLAST en
Use composition-based statistics for
D or d: default (equivalent to F) 0 or
F or f: no composition-based statistics 1 or T or t:
Composition-based statistics as in NAR 29:, 2001
2: Composition-based score adjustment as in Bioinformatics
21:902-911,
2005, conditioned on sequence properties
3: Composition-based score adjustment as in Bioinformatics
21:902-911,
2005, unconditionally
For programs other than tblastn, must either be absent or be D,
Compute locally optimal Smith-Waterman
alignments
This option is only available for
gapped tblastn.
1.1.2. 使用说明与示例
程序使用说明
用核酸序列搜索核酸数据库
用蛋白质(氨基酸)序列搜索蛋白质数据库
寻找较高分值的匹配,对较远关系的不太适用
用核酸双链序列理论上的六种框架的所有翻译结果搜索蛋白质数据库,用于新的序列和ESTs的分析
转译搜索序列
用搜索的蛋白质和数据库中核酸的
用于寻找数据库中没有标注的编码区
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 显著性差异计算公式 的文章

 

随机推荐