网上的生物信息学的研究内容资源都有哪些

网上生物信息学数据库资源_万跃华_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
网上生物信息学数据库资源_万跃华
上传于|0|0|暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩13页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢网上的生物信息学资源都有哪些? - 知乎552被浏览18886分享邀请回答uniprot.org/简介:由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成,提供详细的蛋白质序列、功能信息,如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等,同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。2.PIR(Protein Information Resource)网址:简介:致力于提供及时的、高质量、最广泛的注释,其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort,与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。3.BRENDA(enzyme database)网址:简介:酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。4.CORUM(collection of experimentally verified mammalian protein complexes)网址:简介:哺乳动物蛋白复合物数据库,提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database)网址:简介:环状蛋白数据库,提供环状蛋白的序列、结构等数据,提供环化蛋白预测服务。6.DB-PABP网址:简介:聚阴离子结合蛋白数据库。聚阴离子结合蛋白与聚阴离子的互作在胞内定位、运输、蛋白质折叠等生命过程中起重要作用,此外许多与神经衰退疾病相关的蛋白质均为聚阴离子结合蛋白。该数据库提供已被鉴定的聚阴离子结合蛋白的数据,与NCBI蛋白数据库存在交叉应用。7.IUPHAR-DB网址:简介:G蛋白偶联受体、离子通道数据库。提供这些蛋白的基因、功能、结构、配体、表达图谱、信号转导机制、多样性等数据。8.GLIDA网址:简介:G蛋白偶联受体-配体数据库,提供G蛋白偶联受体-配体互作数据、配体数据、G蛋白偶联受体数据、同源受体关系网、保守识别区,为新药发现提供了支持。9.LOCATE网址:简介:哺乳动物蛋白质亚细胞定位数据库10.InterPro网址:简介:蛋白质综合数据库,从大量的数据库中整合而成的包括蛋白质结构域、蛋白质家族、功能位点等信息的数据库。11.OKCAM网址:简介:人体细胞粘附分子数据库。蛋白质组数据库1.GELBANK网址:简介:提供全基因组的二维凝胶电泳图谱,搜集了已知基因组信息生物的蛋白质组二维凝胶电泳图。可通过描述相对分子质量、等电点和蛋白质序列信息进行快速检索。2.SWISS-2DPAGE网址:简介:提供人类、小鼠、大肠杆菌、酿酒酵母、盘基网柄菌的2D-PAGE参考图。3.SysPIMP(Systematical Platform for Identifying Mutated Proteins)网址:简介:通过质谱技术建立的蛋白质突变数据库。当蛋白质某一氨基酸残基发生改变时,其质谱图也会发生改变,通过蛋白质质谱图的改变,检测与疾病相关的突变。4.Sys-BodyFluid网址:简介:人体体液蛋白组研究数据库。提供人体各种体液的蛋白质组数据,包括血浆/血清、尿液、乳汁、泪、汗液、唾液、骨髓液、脑脊液、胃液等。5.BloodExpress网址:简介:小鼠造血过程基因表达数据库6.CentrosomeDB(human centrosomal proteins database)网址:简介:人体中心体蛋白数据库7.ConsensusPathDB网址:简介:人类功能作用网络数据库,与多个数据库有交叉应用,提供蛋白质互作、生化反应、基因调控等作用网数据。8.Proteome Analysis Database网址:简介:蛋白质组分析数据库9.HPRD(Human Protein Reference Database)网址:简介:人体蛋白文献数据库10.NOPdb网址:简介:核仁蛋白组数据库11.EndoNet网址:简介:细胞通讯网络数据库,提供激素、激素受体相关信息蛋白质互作、蛋白质网络数据库1.3DID(3D interacting domains)网址:简介:搜集3D结构已知的蛋白质的互作信息,可通过结构域名称、基序名称、蛋白质序列、GO编码、PDB ID、Pfam编码进行检索。2.DOMINE网址:简介:结构域互作数据库。3.PiSite(Database of Protein interaction sites)网址:简介:以PDB为基础,在蛋白质序列中搜寻互作位点。4.Binding MOAD网址:简介:致力于提供蛋白质-配体晶体结构数据信息。提供结构已知的蛋白质的相关配体,并附有详细注释,同时提供由实验而得的亲和力数据。5.Phospho.ELM网址:简介:蛋白质磷酸化位点数据库6.SuperSite网址:简介:蛋白质中代谢物、药物结合位点数据库,提供结合机制、识别机制、保守结合位点等信息。7.STITCH网址:简介:蛋白质-化合物作用网数据库8.Reactome网址:简介:人体生命活动路径与过程数据库,提供生化过程网络图,并对参与其中的蛋白质分子有详细注解,与其他数据库如UniPort、KEGG、OMIM等建立了广泛的交叉应用。9.PID(Pathway Interaction Database)网址:简介:由NCI和Nature共同创立,提供已知的人体细胞信号转导、调节活动及主要细胞生命过的蛋白质路径网,可通过输入某个分子名或代谢过程名称进行查询。10.UniHI(Unified Human Interactome database)网址:简介:人体蛋白-蛋白相互作用数据库,可根据蛋白质名称、代谢路径等进行查询。11.VirHostNet网址:简介:病毒-宿主分子互作网数据库,提供病毒-宿主蛋白质互作信息及这些蛋白质的相关注释。可通过输入基因、蛋白质、路径等关键词进行查询。12.Bionemo(molecular information on biodegradation metabolism)网址:简介:搜集与生物降解代谢相关的蛋白质、基因数据,包括蛋白质序列、结构域、结构;基因序列、调控元件、转录单元等信息。除此之外还包括生物降解的代谢路径图、相关生化反应等。13.PMAP网址:简介:蛋白质水解路径数据库蛋白质三维结构数据库1.PDB(Protein Data Bank)网址:简介:生物大分子结构数据库,提供蛋白质、核酸等生物大分子的三维结构数据、序列详细信息、生化性质等。2. SARST (Structural similarity search Aided by Ramachandran Sequential Transformation)网址:简介:高效的蛋白质结构比对数据库蛋白质基序数据库1. CDD(Conserved Domain Database)网址:简介:蛋白质的功能与其结构密切相关,一个蛋白质的保守结构域在一定程度上体现了该蛋白质的功能。CDD,蛋白质保守结构域数据库,收集了大量保守结构域序列信息和蛋白质序列信息。检索者通过CD-Search服务,可获得蛋白质序列中所含的保守结构域信息,从而分析、预测该蛋白质的功能。2.Blocks网址:简介:蛋白家族保守区对比数据库3.CPDB(database of circular permutation in proteins)网址:简介:蛋白质环形序列重组基序数据库。蛋白质的环形序列重组(Circular permutation, or CP)可看作是原来的N与C端被接在一起,然后在另一处产生新开口。 虽然当前已有很多知名的蛋白质家族被发现有CP成员,而且也有研究指出蛋白质结构资料库中可能存在着不少CP实例,高效率的CP搜寻工具却很罕见。CPSARST提供了一套有效的CP搜寻工具。4.MegaMotifbase网址:简介:蛋白质基序家族、超家族数据库,提供已知基序的3D定位图、转角距等数据。5.Minimotif Miner网址:简介:蛋白质基序检测数据库,提供在蛋白质序列中寻找基序的服务。6.Pfam网址:简介:提供多序列比对服务和并提供共同的蛋白质结构域的隐马尔可夫模型。预测类数据1.InterPreTS(Interaction Prediction through Tertiary Structure)网址:简介:提供通过三级结构预测蛋白质相互作用的服务,可输入两个蛋白质的序列信息进行查询。2.Predictome网址:简介:预测蛋白质间功能关系的数据库。这些蛋白质间的关系是基于将3种计算机预测法,即染色体相邻法、系统发育谱法、结构域融合法应用与44个基因组上而得到的。蛋白鉴定类数据库1. Contaminants当我们搜索单一物种分类数据库时,记得养成一个好习惯,就是同时选择Contaminants数据库进行匹配,因为污染总是很难避免的!这类数据库中包含常见的污染蛋白如keratins、BSA和 trypsin,帮助我们把需要鉴定的目标蛋白与实验中污染进来的蛋白进行区分。目前有两个组织提供此类数据库下载:Max Planck Institute of Biochemistry, Martinsried,提供了一套来自多种来源,含有247个蛋白的数据库。下载方式:Tips:不要在网页浏览器里打开哦,因为很可能会显示网址无效,直接找个下载工具下载即可,比如把链接拷到QQ里,启动QQ旋风下载助手就可以下载了。Global Proteome Machine Organization common Repository of Adventitious Proteins 提供了一套包含116个来自于Swiss-Prot的污染蛋白库 。下载方式:2. EMBL EST由EMBL维护的EST Fasta 数据库,”single-pass” cDNA 序列,或表达序列标签 Expressed Sequence Tags。该数据库包含十个分类:1)ENV: Environmental Samples; 2)FUN: Fungi;3)HUM: Human;4)INV: Invertebrates;5)MAM: Other Mammals;6)MUS: Musmusculus;7)PLN: Plants;8)PRO: Prokaryotes;9)ROD: Rodents;10)VRT: Other Vertebrates下载方式:单一分类的Fasta文件可以从EBI FTP 服务器上下载。比如FTP上啮齿类动物序列库的压缩文件名就是: em_rel_est_rod.gz,而真菌的是em_rel_est_fun.gz。物种分类:一些比较友好的商业软件,比如Mascot,会将所有分类信息在后台进行自动更新下载。如果你用的软件没有这个功能,那就要手动下载,然后根据软件的操作要求,比如解压缩到某个Taxonomy子目录。FASTA文件库 ftp://ftp.ebi.ac.uk/pub/databases/embl/misc/acc_to_taxid.mapping.txt.gz物种分类信息 ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz Unigene索引:NCBI的 UniGene的索引由GenBank序列自动分割成非冗余的以基因为单位的簇。如果使用UniGene索引,EST数据库的搜库结果会按照基因家族进行分类,而不会仅仅以原始的EST索引号展示。3. NCBI EST大名鼎鼎的NCBI (National Center for Biotechnology Information) 提供三个不同的 EST 数据库,同样也包含GenBank EST库中的”single-pass” cDNA 序列,或 Expressed Sequence Tags。三个 EST 数据库分别是: human、mouse和 others。目前的版本,压缩过的EST_others 文件有11GB大小,而解压后有40 GB。小伙伴们需要注意,像这么大的数据库,32位操作系统是无法处理的,而必须使用64位系统配合足够大的内存。NCBI目前依然没有计划分割EST_others数据库,因此小编觉得比较实用的还是EMBL EST库。下载方式:访问 ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/est_others.gz或对应的其他名称下载相应的数据库。物种分类:以Mascot为例,对于 EST_others,在数据库配置时选择 “dbEST FASTA using GI2TAXID”。Mascot需要更新以下文件来构建索引,如果手动下载,同样将它们解压到指定的Taxonomy目录:ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/gi_taxid_nucl.dmp.gzftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz4. NCBInrNr数据库也是由NCBI (National Center for Biotechnology Information) 维护。它包含来自于GenBank CDS translations、PDB、Swiss-Prot、PIR 和PRF的非等同序列。NCBInr的特点在于其更新速度非常快,且涵盖度很高。下载方式:ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz由于广受欢迎,一些搜索软件直接做了自动更新功能,比如Mascot 2.3版本及以上的,初始配置成功以后就不用管了,软件会自动去check并且在本地更新这个数据库。物种分类:以Mascot为例,在联网更新NCBInr时会自动进行分类索引库下载,并应用”NCBI nr FASTA using GI2TAXID”的格式。5. SwissProtSwiss-Prot (reviewed) 是一个高质量人工注释且非冗余的蛋白序列数据库。其中包含各类实验结果、计算得到的特征信息和文献信息等。UniProtKB中85%的序列是由EMBL-Bank/GenBank/DDBJ 公共核酸数据库中的coding sequences (CDS) 序列翻译而来。 而UniProtKB 本身是European Bioinformatics Institute、Swiss Institute of Bioinformatics 和 Protein Information Resource合作成立。由于其高质量,它被很多人列为首选数据库之一。下载方式:Expasy: ftp://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/EBI: ftp://ftp.ebi.ac.uk/pub/databases/uniprot/knowledgebase其中:Version info: reldate.txtSwissProt Fasta file: uniprot_sprot.fasta.gzSwissProt Dat file: uniprot_sprot.dat.gz物种分类:以Mascot为例,物种分类会自动后台更新,并对应格式: “SwissProt FASTA”。6. TremblTrEMBL (unreviewwed) 计算辅助预测注释信息和功能信息的蛋白序列,而都还没经过人工注释。下载方式,物种分类格式等信息均和Swissprot一致,相关文件为:TrEMBL Fasta file: uniprot_trembl.fasta.gzTrEMBL Dat file: uniprot_trembl.dat.gz7. UniRefUniRef (UniProt Reference Clusters)从UniProtKB(含isoform序列信息)提供的序列进行聚类。所用的种子序列是各簇中最长的序列。UniRef包含三个子库,按照序列相似度分别为UniRef100, UniRef90和UniRef50。UniRef100无相同序列,而UniRef90和UniRef50则是非冗余的,聚类相似度90%和50%。基于质谱的序列搜索都要求序列的绝对匹配,因此UniRef100适用于蛋白质组学质谱搜库。下载方式:PIR: ftp://ftp.uniprot.org/pub/databases/uniprot/uniref/uniref100/EBI: ftp://ftp.ebi.ac.uk/pub/databases/uniprot/uniref/uniref100/Expasy: ftp://ftp.uniprot.org/pub/databases/uniprot/current_release/uniref/uniref100/包含文件:Version info: uniref100.release_noteFasta file: uniref100.fasta.gz物种分类:UniRef采用以下索引库: ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz8. UniprotUniProt全蛋白质组数据库包含多个模式生物的全基因组蛋白表达信息。其中收集的Reference Proteome包含多个研究比较透彻或者生物研究中比较受关注的物种的最全面的蛋白质组序列信息。下载方式:相关物种的序列数据库可以访问搜索Taxonomy,并点击有关键词”Complete proteome”的物种分类,或者直接使用关键词如: (e.g. )可以搜索到人类基因组的Ref Proteome。搜索结果中点击Download,并选择格式 FASTA(Canonical)9. 私有数据库蛋白质序列数据库FASTA是一个非常流行的标准格式,而且要求非常简单。因此实验室自己收集整理的序列都可以格式化成FASTA并用于搜库。&Title text SEQUENCESEQUENCESEQUENCESEQUENCESEQUENCESEQUENCE SEQUENCESEQUENCESEQUENCESEQUENCESEQUENCESEQUENCE SEQUENCESEQUENCESEQUENCE& Next title NEXTSEQUENCE …以上是一个标准的例子,& 之后是序列ID号和描述信息,然后紧跟整个序列信息,第二个蛋白重新以&开头即可。下面是一些ID和描述信息的例子。&gi|6|bgi|Contig1.seq_7| [+3 L= 888] [Delayed& .1
.y1 .y1 & IPI:IPI|REFSEQ_XP:XP_168061 Tax_Id=9606& CCRB cytochrome c [validated] – rabbit& gi|129249|sp|P02820|OSTC_BOVIN Osteocalcin precursor& ”ORF5 | start
| frame -1 | length=870 |常用的搜库软件通常需要用户提供一个名称比较统一、符合一定规范的信息,才能将名称中ID和描述信息进行较好地分离。具体的操作需要参考不同软件的操作手册说明。原文这里啊 121 条评论分享收藏感谢收起生物信息学与生物计算:
这是生物信息学和生物计算学的网站,由Weizmann科学研究所,生物服务部和Crown人类基因组学中心支持。研究领域主要涵盖序列分析,蛋白质组学和基因组学等。该网站提供了数据库,电子论坛,教育,新闻,软件,招聘启事等。该网站还提供了相关链接,包括欧洲分子生物学以色列国家网点,以色列国家基因组基础设施实验室以及国际生物信息学合作中心。
生物信息学专题:
中国科学院上海生命科学研究院生物信息中心的网站中的生物信息学专题提供与生物信息学有关的新闻信息,生物信息学文献的介绍(包括的课题例如:鉴别肿瘤的亚型,细菌中的基因转移,生物钟与微阵列--哺乳动物的基因组有节奏,混乱的DNA区分人类与黑猩猩等等),相关软件下载,与数据库的链接。
生物信息学专业网:
生物信息学专业网旨在收集、整理与生物信息学相关的信息和资源。它的站点提供最近新闻;与生物科学相关的论文;与生物信息学相关的数据库,软件,公司,大学和期刊;工具的介绍,例如:序列逆向查询系统。
生物信息学组织:
生物信息学组织是生物信息学学科的综合性网站。其涉及的内容有新闻、事件提醒、会议消息、免费FTP工具下载、论文、URL推荐、演示幻灯片等。此外,其还拥有有关生物信息学研究组和软件的搜索引擎。
香港生物信息学中心:
这是香港生物信息学中心(HKBIC)的网站。香港生物信息学中心是由香港技术创新委员会和香港中文大学创办,为香港生物技术与工业界提供中心数据资源。它为使用者提供计算设备,技术专家意见和分子生物学定向数据库等。主要致力于核苷酸、医学、药物设计、毒理学、生物技术、化学工程、制药技术等方面的研究。该网站还提供了研究、工具、新闻等方面的。
耶鲁大学盖斯坦生物信息学实验室:
这是耶鲁大学盖斯坦生物信息学实验室的网站。耶鲁大学盖斯坦生物信息学实验室主要致力于生物信息学的研究,其研究领域包括基因组序列,大分子结构和表达基因数据,比较基因组学,基因表达分析,大分子几何学等。该网站还提供研究、工作、演讲、论文等方面的信息。
用于比较基因组学的生物信息学工具:
用于比较基因组学的生物信息学工具是劳伦斯伯克利国家实验室提供的用于比较基因组学的生物信息学的软件、数据库和网址资源。其涵盖五个大类分别是:基因组数据、注释、比较基因组、阵列资源、杂集。并且,对每个类别其都有类型、名称和描述、帮助及信息等方面的说明。
中国生物信息学资源导航:
这是中国生物信息学资源导航的网站。该网站主要提供与生物信息学相关的学会、组织和生物计算中心的链接,也包含对网关及网络资源的链接。
NCBI生物信息学研究工具:
NCBI生物信息学研究工具网站由美国国家生物技术信息中心支持。该网站提供了许多程序的链接,内容包括数据挖掘、核酸和蛋白质组分析等。同时,网站还提供了许多相关链接和资源。
欧洲生物信息学研究所:
欧洲生物信息学研究所是一个非盈利学术机构,是欧洲分子生物学实验室的一部分。它是生物信息学研究和服务的中心。它所管理生物数据的数据库包括核酸,蛋白质序列和大分子结构。它的使命是保证从分子生物学和基因组研究的日益增长的信息向公众公开,并且对科学研究团体提供任何方面的免费使用,以促进科学发展。
欧洲生物信息学研究所Ensembl基因组浏览器:
欧洲生物信息学研究所Thornton研究组:
欧洲生物信息学研究所多序列联配数据库:
欧洲生物信息学研究所工具箱:
欧洲生物信息学研究所核酸数据库:
欧洲生物信息学研究所计算基因组研究组:
欧洲生物信息学研究所完整基因组数据库:
欧洲生物信息学研究所序列数据库研究组:
Brutlag生物信息学研究组:
Brutlag生物信息学研究组是斯坦福大学的一个研究团体,主要研究从蛋白质一级结构预测蛋白质结构和功能,其开发了EMOTIF、EMATRIX和3MOTIF软件应用于非鉴定的基因组序列的功能确定,另外还开发了LOCK和3DSEARCH软件用于比较蛋白质结构和蛋白质结构数据库的搜索。
生物GBF信息学小组主页:
生物信息学小组主页是德国生物技术研究中心的生物信息组的主页。其提供的资源十分丰富,包括出版物、研究计划、研究组介绍、五个重要数据库、十二个工具软件和资源链接等。
Pune大学生物信息学中心:
Pune大学生物信息学中心成立于1987年,是生物技术系统的九大中心之一。提供生物工程领域的信息,侧重病毒学,蛋白质和核酸序列与结构。其提供的资源丰富,包括数据库、微生物菌株数据网络系统、生物信息学中心图书馆、Alpha服务器的软件包、生物信息学的有用网址、EBI和PDB的数据库镜像等。
北京大学生物信息学中心:
北京大学生物信息中心(CBI)成立于1997年,是欧洲分子生物学网络组织EMBnet的中国国家接点。几年来,已经与多个国家的生物信息中心建立了合作关系。目前是国内数据库种类最多,数据量最大的生物信息站点。在基因预测、基因组、蛋白质结构等领域都有相应的研究项目。
加拿大生物信息学资源:
这是加拿大生物信息学资源(CBR)的网站。该网站由加拿大国家研究委员会(NRC)创建,旨在为国家研究委员会与其它政府、学术部门的科学家提供广泛使用的生物信息学工具和共享数据。加拿大生物信息学资源部分由一个专门使用该资源的委员会管理,而且其资源在用于教育和非盈利研究时只需注册均可免费作用。网站还提供有关新闻、服务与下载等信息。
结构生物信息学公司:
结构生物信息学公司是世界上占领导地位的、蛋白质组学推动的药物发现的公司,他们大规模地产生和使用蛋白质结构信息,以期加速发现和优化过程。它提供的软件主要针对加速药物发现和优化过程、提高筛选效率和降低成本、极大地重视知识产权的地位、提高药物性能和增加技术和市场成功的可能性。此外,还提供三个药物数据库。
林奈斯生物信息学中心:
这是林奈斯生物信息学中心(LCB)的网站。林奈斯生物信息学中心研究非常活跃,隶属于瑞典Uppsala生物医学中心。作为一个由Uppsala大学与瑞典农业大学的联合研究机构,确保了高质量的尖端的研究与教育,其研究范围从微生物与哺乳动物基因组学经计算机的功能基因组学到分子进化。网站还提供有关入学、新闻时事、研讨会、工具、学生计划等方面的信息。
曼彻斯特大学生物信息学教育与研究:
曼彻斯特大学生物信息学教育与研究是欧洲分子生物网络的节点之一,负责维护一些数据库(如蛋白质模体指纹数据库,PRINTS)。站点提供蛋白质同源性分析,蛋白质模体指纹分析,系统发生和序列进化分析,以及微阵列分析,并提供生物信息学和PRINTS数据库数据下载。
《生物信息学》:
生物信息学》是由英国牛津大学出版社出版。其主要刊登生物信息和计算生物学方面的研究论文、书评、综述、读者来信和述评等文章。其刊载的文章在两年内供给学术界免费使用。
生物信息学:
生物信息学是印第安纳大学分子和细胞生物学研究所提供的生物信息学资源。此资源包括数据库、基因发现程序、蛋白质模建、生物信息学在线教程、研究基金的来源、研究项目和生物信息学工具软件等。
生物信息学的网络资源:
生物信息学的网络资源是美国哥伦比亚大学的Bill Noble教授建立的有关生物信息学的网络资源总集。其涉及面广,包括基因组学和生物信息学中心、生物信息学工具和基因组计划索引、DNA和蛋白质分析工具、生物信息学课程主页、生物信息学和生物技术的学术项目、生物信息学文献参考,以及网上引物。
生物信息学趋势导向:生物信息学趋势导向主要提供《今天免疫学》杂志的增刊有关生物信息学的内容。这些内容包括的资源十分丰富,涉及文本格式数据库,原理和实用数据库搜索,计算生物学基因发现,多序列联配和检索,蛋白质分类和功能归属,系统进化分析和比较基因组学,功能基因组学等。
生物信息学网:
这是生物信息学的网站,主要是负责中国医学科学院肿瘤医院/肿瘤研究所生物信息学研发及服务工作。该网站提供生物统计分析以SAS和R为主,并且设有其他数十种生物信息学分析辅助软件,如Blast,Phrap, Bioperl, EMBOSS, Hmmer, GO等等。另外也提供论坛,相关论文以及常用生物信息学网址等。
生物信息学小组:
生物信息学小组成立于1997年,主要从事分子生物信息学和生物多样性信息学的研究。其提供丰富的软件资源,可免费下载使用。软件种类涉及重组扫描、系统发生分析、联配、重复片段的检测和PCR引物设计等。此外,还有许多数据库资源。
常见的全文数据库及其链接
Blackwell Synergy
Sciencedirect
Interscience
Kluwer Academic Publishers
Oxford University Press
Annual Reviews
国内外专利数据库网址
列出网上一些很有价值的专利资源网址,供大家参考。
中国专利检索
中国专利全文数据库(1985年-今)提供者:中国国家知识产权局
中国专利信息检索网 ()
可免费检索1985年以来的中国专利,部分可获得专利说明书全文。包括分类检索与高级检索两种检索方式。
分类检索 给出国际专利分类表,可逐层显示,点击检索,则链接到高级检索界面。网址为:
中国专利信息网()
该系统可以检索中国专利,并提供文摘,还同时提供了与专利有关的多种信息,如专利转让、专利法规、专利代理机构等。
中国专利文献数据库()
该数据库收录了中国专利局自1985年以来公布的所有发明专利和实用新型专利,内容有题录、文摘、权利要求等。检索途径设有专利名称、文摘、权利要求、申请人等共计27个字段。用户可以根据需要选择某一个字段,输入关键词进行单项全文检索;也可以选择两个以上字段进行(AND)、或(OR)布尔检索,但同一字段无法执行布尔访问。
中国知识产权网 ()
中国专利检索,技术产品及商标的展示,图书的网上展销,知识产权信息服务。
中国发明专利信息网 ()
该站点与《发明与革新》杂志社结成合作伙伴,提供专利检索、专利快讯、好书及相关网站推荐、免费点子库、网上求助等服务。
台湾专利数据库 ()
由台湾亚太智慧财产权基金会提供,使用台湾BIG-5码检索和显示。
国外专利检索
美国专利全文数据库(1790年-今)
提供者:United States patent and trademark office (美国专利商标局)
世界知识产权组织专利数据库(PCT)、欧洲专利数据库、日本专利
提供者:The European Patent Office (欧洲专利局)
加拿大专利全文数据库(1920年-今)
提供者:The Canadian Intellectual Property Office (加拿大知识产权局)
Delphion Patent Server ()
注册用户通过Delphion 专利服务器可检索世界各国专利,但非注册用户可以检索到1974年以来的美国专利的文摘和全文的第一页扫描图像。
世界各国专利,可看到前十三页全文
Europe's Network of Patent Databases (欧洲专利)()
该站点可以检索到欧洲专利的文摘和全文的扫描图像。并可检索到世界知识产权组织(WIPO)的文摘和全文的第一页扫描图像。
欧洲及欧洲各国专利 ()
该网站由欧洲专利局提供,可用于检索欧洲及欧洲各国的专利,包括欧洲专利(EP)、英国专利、德国专利、法国专利、澳地利专利、比利时专利、意大利专利、芬兰、丹麦、西班牙、瑞典、瑞士等15个欧洲国家的专利。
PCT国际专利 ()
由世界知识产权组织(WIPO)提供,收录了日至今的PCT国际专利,仅提供专利扉页 题录,文摘和图形。
世界知识产权组织的IPDL ()
由世界知识产权组织建立的知识产权电子图书馆,提供世界各国专利数据库检索服务,其中包括: PCT国际专利数据库,中国专利英文数据库,专利数据库,美国专利数据库,加拿大专利数据库,欧洲专利数据库,法国专利数据库,JOPAL科技期刊数据库,DOPALES专利数据库,MADRID设计数据库等。
Canadian Patent Database()
可以检索1989年以后的加拿大专利,无文摘。
一.数据库目录
2000年,出版《核酸研究》的牛津大学出版社设立了一个数据库目录网页,这个网页把数据库分成18类在郝、张淑誉编著的《生物信息学手册》中,他们进行了合并,又把数据库目录、农林牧有关数据库、医学数据库和文献单独列出,分成以下16类:
1.  数据库目录
2.  综合数据库包括DNA序列阵:EMBL、GenBank、DDBJ、GSDB、TDB和UniGene
3.  DNA序列数据库主要是与基因结构和认定有关的数据库,如密码子使用频度表、真核生物启动子库、内含子和外显子库等
4. RNA序列和核糖体数据库
5.  基因图谱数据库
6.  人类基因组数据库
7.  其他物种基因组数据库
8.  基因表达数据库
9.  基因突变、病理和免疫数据库
10.  蛋白质序列数据库
11.  蛋白质结构数据库
12.  比较基因组学和蛋白质组学数据库
13.  代谢途径和细胞调控数据库
14.  与农林牧有关数据库
15.  医学数据库
16.  其他数据库
二.综合数据库
INSD,国际核酸序列数据库(International Nucleotide Sequence Databank)由日本的DDBJ、欧洲的EMBL和美国的GenBank三家各自建立和共同维护
EMBL库,欧洲分子生物学实验室的DNA和RNA 序列库
GenBank ,美国国家生物技术信息中心 (NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库
DNA Databank of Japan (DDBJ) ,日本核酸数据库
GSDB是由美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库(Genome Sequence DataBase)
TIGR DATAbase,是世界上最大的cDNA数据库,还有大量的EST序列和人类基因索引(HGI)
三.DNA序列和结构数据库
包括与DNA的复制、转录、修复等有密切关系的蛋白质因子
BioSino是中国自主开发的核酸序列公共数据库
CUTG,密码子使用频度表
EPD,真核生物启动子数据库(Eukaryotic Promotor Database)
TRANSFAC,真核生物基因表达调控因子的数据库
TRRD.真核生物基因组转录调控区数据库
OOTFD,转录因子和基因表达数据库
RepBase,真核生物DNA中重复序列数据库
MicroSatellite,微重复序列数据库
ALU数据库是人及其他灵长类代表性的Alu重复片段
(/pub/jmc/alu/)
Simple Repeats,简单重复序列库
COMPEL,复合元件数据库
(/pub/compel/)
MPDB,分子探针数据库
HvrBase,灵长类mtDNA调控区序列库,主要是人的HVI和HVII两个高变异区的序列
PlantCARE,植物顺式作用(cis-acting)调控因子数据库.
PLACE是从文献中搜集的植物顺式作用调控元件DNA模体的数据库,只涉及维管植物.
(/pub/dna_place/place.seq)
Mendel数据库,搜集植物STS和EST序列.
HOX Pro同源异型盒(homeobox)基因数据库.
OPD,寡核苷酸探针数据库(Oligonucleotide Probe Database).
dbSTS,序列标记位点(Sequence Tagged Sites)数据库.
(/repository/dbSTS)
dbEST.这是GenBank的重要组成部分,它包含若干物种的已表达的序列标记信息.
(/repository/dbEST)
AmmtDB,后生动物线粒体DNA多序列联配数据库,搜集了脊椎动物线粒体中编码蛋白质和tRNA的多DNA序列对比数据,以及哺乳动物mtDNA主调控区序列联配数据.
HOVERGEN,脊椎动物同源基因数据库(HOmologous VERtebrate GENes)
(/pub/db/acnuc/hovergen)
DNA结构参数库.
(/pub/structure_library)
NUCLEOSOME数据库,收集实验测定的核小体数据,用于预测DNA中与组蛋白八聚体结合的位点.
SELEX_DB,随机化序列库.
ASDB,交替剪接基因的数据库.
Intronerator,秀丽线虫内含子和交替剪接数据库
IDB和IEDB前者是内含子序列数据库,后者是内含子演化数据库
EID,外显子、内含子数据库
ExInt,外显子、内含子数据库
NDB,核酸晶体结构数据库
VectorDB,载体数据库
Vector和Vector-ig,包分子生物学常用的许多载体的注释和序列信息(/repository/vetcor-ig)
(/repository/vector)
四.RNA序列和核糖体数据库
1993年成立的RNA学会,在出版RNA刊物同时,还维护着两个信息网页:
snoRNA,小核仁RNA数据库
... noRNA-DataBase.html
Small RNA数据库
RNAse P数据库,包含RNA水解酶P的RNA亚基序列、联配、二级结构和三维模型
tmRNA网点包含 tmRNA序列、公认蛋白质水解标记、序列联配、确定新tmRNA的导引,以及简要综述等
tmRDB.已经联配好的、加有注释的、按亲缘关系排列的tmRNA序列数据
gRNA,导引RNA数据库
SRPDB,信号识别粒子数据库
TransTerm,信使RNA的组分和翻译控制信号数据库
类病毒和类病毒样RNA数据库
UTRdb和UTRsiteUTRdb是真核生物mRNA的5’端和3’端非翻译区序列的非冗余数据库,UTRsite搜集这些非翻译区序列中的功能片段
ncRNA,似mRNA的非编码RNA数据库
RNAmods,RNA修饰数据库
(/library/RNAmods)
AARSDB,酰氨基tRNA合成酶数据库
tRNA序列和基因、结构与功能数据库
PLMItRNA基于FastA的绿色植物线粒体tRNA分子和tRNA基因的数据库
16SMDB、16S-likeMDB 、16SMDBexp 、23SMDB、 23S-likeMDBexp数据库,是一批16S和23S核糖体RNA突变数据库
RNA www,RNA二级结构网页,也有16S RNA和23S RNA的数据
uRNADB,已经联配好的、加有注释的、按亲缘关系排列的uRNA序列数据
U-insertion/deletion,编辑序列数据库,包含5个无脊椎动质体目物种的线粒体基因和编辑后的mRNA序列
PseudoBase,假扭结数据库
RDP,核糖体数据库计划包含小亚基和大亚基的两部分rRNA,由已联配的RNA序列以及亲缘树组成
SSU rRNA欧洲核糖体小亚基RNA结构数据库
LSU rRNA欧洲核糖体大亚基RNA结构数据库
5S rRNA数据库
DRC,核糖体交链数据库
ACTIVITY,DNA和RNA中功能位点数据库
RNA非正则配对数据库
五.基因图谱数据库
Rhdb,辐射杂交数据库
(/pub/databases/RHdb)
Mouse RH数据库
GDB,人类基因组数据库
GeneMap’99,人类基因图谱1999年版
HuGeMap,人类基因遗传图谱和物理图谱的分布式集成数据库
(/pub/databases/RHdb/gm99.map)
六.人类基因组有关数据库
人类染色体数据网址:
1.人类基因组测序中心
HUGO是人类基因组组织的缩写
HUGO Pacific GENOME Newsletter 是HUGO在部分,其中反映中国情况的短文在:
美国能源部支持的人类基因组计划
美国国家卫生署对人类基因组计划的支持,通过NHGRI即国家人类基因组研究所(National Human Genome Research Institute)体现
英国Wellcome Trust是人类基因组计划的另一个主要资助者
百慕大原则:测序的中间和最终结果都必须迅速的公开
世界上主要人类基因组测序中心的名单
NCBI的GenBank数据库从1999年10月起,建立了智人基因组子目录,其下按染色体编号设子目录
英国的Sanger中心的人类基因组计划网页,不仅有它们负责测序的染色体数据,还有到其他染色体数据的链接
日本的DDBJ和信息生物学中心(CIB)联合建立了一个Human Genomics Studio,可以按染色体编号检索和查找基因序列
Sanger 中心是世界上最大的DAN测序中心之一承担人类基因组计划的三分之一,集中在1、6、9、10、13、20、22和X
LBNL,Lawrence Berkeley  国家实验室
LLNL,Lawrence Livermore 国家实验室
LANL,美国洛斯阿拉国家实验室
JGI,由美国能源部支持的,依托LBNL、LLNL和LANL三个国家实验室的人类基因组研究部门建的联合基因组研究所(Joint Genome Institute)
UWGC,大学基因中心,是国际上最活跃的测序中心之一
SHGC,斯坦福大学人类基因中心,主要做高分辨率辐射杂交图谱,以及人类第四号染色体BAC克隆的测序
美国哥伦比亚大学基因中心,主要研究和人类疾病有关的基因和第13号染色体图谱
GENETHON,法国人类基因组研究中心
2.人类基因组有关数据
GenBank、 EMBL 、GSDB 、GDB等综合数据库的主要内容都来自人
UniGene,人类基因序列集合,搜集了GenBank中不同基因产物的序列
HIB数据库,是德国人类基因组计划中基因分析项目所建立的自动注释的基因集团数据库
dbSNP,设在美国国家生物技术信息中心NCBI的单核苷酸多态性数据库,收录单核苷酸置换,以及短的删除和插入所导致的多态性
Whitehead的生物医学研究所的人类单核苷酸多态性(SNP)数据库
HGBASE是人类双等位基因序列(Human Genic Bi-Allelic Sequences)的缩写,这是人类基因从启动子到转录终点,即基因及其前后所发现的所有单核苷酸多态性和其他变化的数据库
位于St.Louis的华盛顿大学的SNP数据库
I.M.A.G.E协作组,他们共享高质量的cDNA克隆库,并把有关序列、图谱和表达数据公开
美国菌种保藏中心(American Type Culture Collection)
GenMapDB,V.Cheung实验室维护的一个BAC图谱数据库
BAC Ends,人类BAC末端数据库
HUGE,人类未经实验证实的编码基因的数据库
IXDB,集成的人类X染色体物理图谱数据库
Genotype,法国人类多态性研究中心的基因型数据库
VIRGIL,专门为GDB中的人类基因和GenBank中的DNA序列提供对应链接关系的数据库
(/pub/db/viogil/virgil.ffl)
KinMutBase,人类致病蛋白质激酶突变数据库
CpGIsle,人类基因中CpG岛数据库
(/cpgisle)
(/pub/db/cpgisle/)
(/pub/databases/cpgisle)
p53数据库研究人类肿瘤及肿瘤细胞系p53基因突变的数据库,包括:p53库、体细胞突变库、种系突变库和细胞系突变库
IARC p53数据库法国国际癌症研究会的肿瘤和细胞系P53基因突变数据库
p53数据库具有癌症倾向家族P53种系突变数据库
(/pub/doc/medical/)
人类P53基因突变及软件
人类hprt即次嘌呤磷酸核糖基转移酶基因突变数据库和在PC视窗下运行的分析软件
转基因啮齿动物LacI数据库
转基因啮齿动物LacZ突变库基因突变数据库及分析软件
WRN基因突变与遗传病Werner综合征有关
OMIM,在线人类孟德尔遗传数据库
STACK,国家信息中心SANBI维护的一个序列标记联配和代表序列知识库
SANIGENE是与STACK密切相关的一个数据库它包含所有经过计算机处理联配过的人类基因EST的集团
七.其他物种基因组数据库
DOGS,基因组尺寸数据库
GenBank的/genomes/子目录:
(/pub/databases/genband/genomes/)
EuGenes,真核生物基因综合知识库,目前包括果蝇、人、小鼠、拟南芥、线虫、酵母、和斑马鱼的数据
1.原核生物基因组
细菌基因组计划的进展情况,可从以下网站查询:
MOT ,欧洲生物信息研究所EBI的基因组测序进展表
GIB,日本DDBJ设立的Genome Information Broker for microbial genomes 的缩写
MAGPIE测序计划清单也可以参考
EMGLib,增补微生物基因组库
大肠杆菌K12菌株的完全基因组序列,可由GenBank的子目录/genomes/获取,或从华盛顿大学大肠杆菌基因组中心,即Blattner实验室的网页读取:
ECDC,大肠杆菌菌株K12的基因序列库,包括基因、读框、调控区、启动子、终止子、tRNA和rRNA等
)/pub/databases/ecdc)
EcoGene和EcoWeb,大肠杆菌K12菌株基因组数据库,包括基因、蛋白质、基因间蛋白质组信息
RegulonDB,大肠杆菌转录调控和操作子数据库
NRSub,非冗余枯草芽孢杆菌DNA数据库,包括完全基因组、密码子使用表、基因图谱和基因家族
(/pub/db/nrsub)
HIDB,流感嗜血菌完全基因组的原始数据库
HIDC,流感署血菌基因序列库
CyanoBase,蓝细菌数据库,实际上是集胞蓝细菌的基因组数据库蓝细菌具有氧化和光合作用所需的全套基因
MJDB,詹氏甲烷球菌基因组数据库
(/pub/data/m_jannaschii)
MycDB,分枝杆菌数据库
RsGDB,类球红细菌基因组数据库第一作者联系:
mailto:/madhu@utmmg.med.uth.tmc.edu
PGI,疫霉属基因预研究计划的数据库
2.真菌基因组
SGS,酿酒酵母基因组数据库
(/pub/yeast)
LISTA,LISTA-HOP和LISTA-HON是酿酒酵母基因组中蛋白质编码序列及其同源性的数据库
MYGD,酵母基因组、蛋白质和同源关系的数据库
YIDB,酵母内含子数据库
MNCDB,由德国MIPS所维护的粗糙链孢霉基因组数据库
真菌基因组资源的网址:
FGSC,真菌遗传学信息中心
3.原生生物和线虫基因组
欧洲生物信息研究所EBI的原生生物网页:
AceDB,线虫综合数据库
(/pub/acedb)
(repository/acedb)
(/pub/acedb)
关于线虫发育特别是化学感觉神经的研究
4.昆虫基因组
斯坦福大学的果蝇基因组中心
FlyBase,果蝇基因和分子数据库
FlyNets,果蝇分子和遗传相互作用数据库
GIF-DB,果蝇胚胎发育过程中基因相互作用的WWW数据库
的果蝇网页
MsqDB,蚊子基因数据库
5.鱼类数据库
美国国家卫生署1997年建立的斑马鱼网页
ZFIN,斑马鱼基因组、发育突变和野生种系数据库
Fugu是河豚的数据库
6.啮齿动物基因组
下面是有关家鼠的数据库
M.Musculus基因组库
(/genbank/genomes/M_muslulus)
MGD,家鼠基因组库,现在又称MGI即家鼠基因组信息库
Cre转基因家鼠系的数据库
RatMap,大鼠基因图谱数据库
7.细胞器数据库
主要是线粒体和叶绿体基因的数据
MitoNuc和MitoAln是关于编码线粒体蛋白的细胞核基因的两个相互关联的数据库
GOBASE,细胞器基因组数据库
MitBASE,线粒体DNA数据库,集成所有已知线粒体基因信息
人类线粒体数据库
MitBASE Pilot,酵母线粒体中核基因数据库
植物和藻类线粒体数据库
... .pla_show_qry_opts/
原生生物线粒体数据库
... /protist_table.html
脊椎动物线粒体数据库
8.拟南芥基因组
MATDB,国际拟南芥基因组计划的数据汇总
AtDB,拟南芥基因组数据库
(/pub/arabidopsis)
DatA,拟南芥基因组注释库
TAIR,拟南芥信息资源
AGR,拟南芥基因组资源
TIGR-AT,TIGR研究所的似南芥EST和基因序列数据库
9.病毒数据库
ICTVdB,病毒数据库
VIDEdB,病毒鉴定交换数据库
RDV,水稻矮缩病毒基因组数据库
八.蛋白质序列数据库
SWISS-PROT是对数据人工审读很严格的库
TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,已经完成了自动注释
PIR是蛋白质信息资源的缩写
GenBank是由GenBank中的DNA序列翻译得到的蛋白质序列,与TrEMBL相似、但没有像后者那样经专家审读
PROSITE,由专家根据生物知识审编的SWISS-PROT蛋白质序列中有生物意义的位点、模式和轮廓的数据库
PrositeScan服务器,根据用户填表提交的蛋白质序列搜索PROSITE模式
PSD,蛋白质序列数据库,是PIR的主体
PATCHX,PIR的子库之一,收入尚未纳入PIR库的蛋白质序列
ARCHIVE,PIR的子库之一,保存PIR库中条目的原始文献或最初提交的序列
ProClass,蛋白质类数据库,是根据PROSITE库和PIR库中超家族的关系组织起来的非冗余蛋白质库
PIR-ASDB,PIR的注释和相似性数据库
KIND,瑞典斯德哥尔摩生物信息中心维护的非冗余蛋白质序列库
(/pub/KIND)
ENZYME,基于命名系统的酶数据库
BRENDA,这是一个内容广泛的酶的信息库
OWL,蛋白质序列库,是由SWISS-PROT,PIR,GenBank翻译序列和PDB等数据库产生的非冗余的蛋白质序列库
GeneCards,由以色列魏茨曼科学研究所维护的关于基因及其产物,以及它们的生物医学应用的文献库
SWISS-2DPAGE,由二维聚丙烯酰胺凝胶电泳所确定的蛋白质的参考图谱数据库,包括文本和图象信息,通向其他2D-PAGE数据库的链接等
HDB,组蛋白数据库,包括联配好的组蛋白序列以及已确认包含有组蛋白折叠模体的非蛋白序列,以及所有已知组蛋白和组蛋白质折叠的结构,同时指出不同数据库中类似序列的差异
HOBACGEN数据库,包含按家族组织的所有细菌的蛋白质序列,有助于从各种细菌选取同源家族,作多序列联配和构建亲缘树
MITOP,线粒体蛋白质组数据库,包括线粒体有关的基因、蛋白质和疾病信息
MITOMAP,人类线粒体基因组数据库
REBASE,限制性内切酶和甲基化酶数据库
ProtoMap,蛋白质分类数据库
ISSD蛋白质序列数据库
PRF,日本蛋白质研究基金会维护着三个蛋白质和多肽数据库:PRF/LITDB文献库、PRF/SEQDB序列库及PRF/SYNDB合成产物库
MEROPS,肽酶数据库
PKR,蛋白激酶信息库
Wnt基因网页
PhosphoBase,磷酸化位点数据库
SYSTERS,蛋白质集团数据库
DIP蛋白质相互作用数据库
DexH/D数据库
Homeodomain,同源异形结构域数据库
InBase,新生物实验公司的蛋白质剪接数据库
LGICdb,配体门控离子通道数据库
SENTRA,信号传递蛋白质数据库
ICN,离子通道网络,是由美国神经科学数据库中心等单位联合建立的一个内容丰富的网页
Aaindex,氨基酸索引数据库
九、蛋白质结构和分类数据库
PDB,蛋白质结构数据库
RCSB,结构生物信息学信息学合作研究组织
PDBNEW,下一版PDB库正式发布前收到的全新或更新条目
PDBFinder,在PDB、DSSP、HSSP、基础上建立的二级库,包含PDB序列、作者、R因子、分辨率、二级结构等
ftp://swift/embl-heidelberg.de(/pdbfinder)
PDB at a Glance清单
PDBselect数据库
PDBsum是PDB库中数据的更便于阅读的总结和分析,以及一些衍生数据
BioMagResBank简称BMRB,是关于多肽、蛋白质和核酸的核磁共振数据库
CSD,结构数据库
NRL-3D,三维结构已经确定的蛋白质序列库
FAMBASE,,是每个蛋白质家族的代表序列的集合,它有助于加速同源性搜索
ProtFam,蛋白质超家族的序列联配数据库
SCOP,蛋白质结构分类数据库
CATH,蛋白质结构与功能关系分类数据库
PIR-ALN,蛋白质序列联配数据库
3Dee,蛋白质结构域定义的数据库
ProTherm,蛋白质及其变异体热力学数据库
ASTRAL是基于SCOP数据库的一组分析蛋白质结构和蛋白质序列的数据库和工具
RESID,蛋白质翻译后修饰情况的数据库
SMART是简单模块构架搜索工具的缩写
PROMISE数据库
MMDB蛋白质分子模型数据库
VAST矢量联配搜索工具
DSSP,PDB库中所有蛋白质条目的二级结构归属数据库
HSSP,按同源性导出的蛋白质二级结构数据库
Dali/FSSP,基于PDB数据库中现有蛋白质三维结构,用自动结构对比程序Dali逐一比较而形成的折叠单元和家族分类库
3d_ali数据库,搜集彼此相关的蛋白质序列和结构数据
DEF蛋白质折叠类的预测数据库
INFOGENE,Sanger中心计算基因组学小组维护的、各基因组测序计划所提供的序列中已知的蛋白质和预测出的基因与蛋白质的数据库
TMBase,跨膜蛋白数据库
(/pub/tmbase)
PRESAGE是关于结构基因组学的一个数据库,它为库中每个蛋白质搜集了反映当前实验状况、结构、模型和研究建议的注释
SBASE,带有注释的蛋白质序列片、即蛋白质结构域的数据库,由ICGEB建立和维护
InterPro,集成的蛋白质结构域和功能位点数据库
HITS,瑞士新近建立的一个蛋白质结构域数据库
BLOCKS,蛋白质分类与同源性数据库,包含蛋白质家族中保守区域的组块多序列联配的数据
BLOCKS+数据库
PFAM高质量的蛋白质结构域家族数据库
PRINTS数据库最近改名为PRINTS-S,这是一个蛋白质家族的指纹和模体数据库
ProDom自动产生的蛋白质结构域家族数据库
DOMO,蛋白质结构域数据库
GRBase,这是参与基因调控的蛋白质的数据库
PMD,蛋白质突变体数据库
GLYCBASE,蛋白质糖基化位点数据库
ORDB嗅觉受体蛋白质序列数据库
CarbBank亦称CCSD,复杂碳水化合物结构数据库,通常与蛋白质结构数据库归在一起
SWISS-3DIMAGE,蛋白质三维图象和PDB浏览器
IMB,大分子三维图象库
BioImage,多维生物学数据库
MolMovDB,耶鲁大学的生物信息学研究室维护的分子运动数据库
ModBase,蛋白质结构模型比较数据库
十.比较基因组学和蛋白质组学数据库
COG直系同源聚类数据库
GeneCensus,耶鲁大学生物信息学研究室维护的各物种基因组的比较数据库,着重于折叠单元的结构对比
XREFdb,哺乳动物和模式生物的基因和遗传学交叉引用数据库
YPD,酿酒酵母蛋白质组数据库
WormPD,线虫蛋白质组学数据库
十一.基因表达数据库
Flyview,果蝇基因表达数据库
Flybrain,果蝇神经系统图谱和数据库
NEXTDB,线虫基因表达模式数据库
MAGEST数据库,其名字来自Maboya Gene Expression patters and Sequence Tags 短语的缩写
BodyMap,人类和家鼠基因表达数据库
Axeldb,爪蟾基因表达数据库
XMMR,非洲爪分子标记资源
TRIPLES,酵母基因功能数据库,设在耶鲁大学医学院的基因组分析中心
MGEIR,集成的家鼠基因表达信息资源
GXD,家鼠基因表达数据库
EpoDB,脊椎动物红细胞生成基因表达分析数据库
KidneyDB,肾脏发育数据库
ToothExp,牙齿基因表达数据库
十二.基因突变、病理和免疫数据库
HGMD人类基因突变数据库,可用于预测基因疾病
Marfan人类FBN1基因突变数据库及分析软件
Collagen人类胶原数据库
人类PAX2等位基因变异数据库
人类PAX6等位基因突变数据库
Androgen雄激素受体突变数据库,包含与男性性器官发育不良、前列腺癌等有关图谱,密度、频度以及基因型和表现型关联数据
ALFRED为Allele FREquency Database 的缩写这是由耶鲁大学K.K.Kidd实验室维护的一个针对人口多样性和DNA多态性的等位基因数据库
CD40LBASE,CD40L基因突变数据库
KMDB由日本庆应义塾大学医学院建立的一组与人类疾病有关的基因突变数据库
KMeyeDB人类疾病和眼病基因突变人类心脏病基因突变数据库
KMearDB人类耳病基因突变数据库
KMbrainDB人类脑病基因突变数据库
KMcancerDB人类癌症基因突变数据库
OMIA是一大批动物的孟德尔遗传、疾病、基因型和表现型的数据库
Atlas法国建立的针对肿瘤学和血液学的遗传与细胞遗传交互数据库
HAMSTeRS凝血因子VIII结构和突变位点数据库
HaemB,B型血友病凝血因子IX点突变和短插入或删除序列的数据库
TTMD转基因动物和靶突变数据库
FIMM功能分子免疫学数据库
MTB家鼠肿瘤生物学数据库
BCGD人类乳腺癌基因数据库
PAH是导致人类苯丙酮尿症的苯丙氨酸羟化酶特异位点数据库
CFTR,囊性纤维变跨膜调控子突变数据库
NRR核受体资源计划,包括糖类皮酯激素、矿质肾上腺皮质激素、甲状腺激素、维生素D受体、类固醇受体等信息的数据库
IMGT1989年建立的国际免疫遗传学数据库
HIG,Anthony Nolan 骨髓和白血病基金会的人类白细胞抗体HLA住处30年前由E.A.Kabat建立的具有免疫学意义的蛋白质序列数据库
PEDB前列腺表达数据库
HIV,艾滋病分子免疫学数据库
斯坦福大学的HIV RT数据库,包含几乎全部已发表的HIV RT和蛋白酶序列,是研究抗HIV药物靶分子演化和与药物有关变化的原始资料
十三.代谢途径和细胞调控数据库
WIT是What Is There的缩写是美国阿贡国家实验室的一个集成的重构代谢途径和模型的系统
EMP是酶与代谢途径的缩写
MPW代谢途径数据库,是EMP库的一个子集
PUGA原是单细胞生物代谢途径亲缘联配数据库
EcoCyc数据库和MetaCyc数据库
PathDB,代谢途径数据库
KEGG,基因与基因组百科全书,它包含核酸分子、蛋白质序列、基因表达、基因组图谱、代谢途径图等
由Boehringer Mannheim公司提供的代谢途径图,悬挂在许多生化实验室的墙壁上
SMILES是一个辅助性数据库,它搜集与代谢途径有关的化合物名称
LIGAND,酶反应化学数据库,由日本京都大学化学研究所维护
CSNDB细胞中信号网络的数据库
Biocatalysis/Biodegradation生物催化和生物降解数据库
十四.与农林牧有关数据库
美国农业部国家农业图书馆基因组信息系统,它本身的服务器基于AceDB
ARS农业研究服务处新设立在康奈尔大学的USDA-ARS生物信息学和比较基因组学中心,ARS是Agricultural Research Service的缩写
AgDB农业数据库和信息资源总清单
设在英国的Roslin研究所的生物信息组,发展了名为“方舟”的系统来搜集和比较各种动物基因图谱
... swer.sh?species=pig
INRA法国国家农业研究所
美国得克萨斯A&M大学是牛类基因图谱数据库的原始网址和绵羊、马数据库的镜象点:
美国衣阿华州立大学有猪和鸡基因图谱数据库的镜象点:
UK CropNet英国农作物植物生物信息网络
INE水稻基因数据库
我国水稻基因组计划针对水稻的籼稻亚种
美国TIGR研究所维护着几个与水稻基因组有关的数据库,包括基因组注释库、重复序列库,以及基因索引
RiceGenes是美国康奈尔大学的水稻基因组数据库
GrainGenes是美国农业部和国家农业图书馆的植物基因组计划支持的麦、燕麦和甘蔗遗传数据库
关于世界范围的水稻生产和市场等情况
WHEAT小麦基因图谱数据库
KOMUGI日本小麦网,是由不得6所大学和研究所联合维护
MaizeDB玉米基因组数据库
ZmDB玉米基因组数据库
ILDIS国际豆科植物数据库和信息服务
豆类基因图谱:
MGI,NCGR和Samuel Roberts Noble基金会联合开展的豆科苜蓿属植物Medicago truncatula的基因组研究,在2000年4月已经提交15000多条EST
cottonDB美国南方农业研究中心所维护的棉花数据库
TreeGenes树木遗传图谱数据库
2.家畜、家禽和鱼类
ChickGBASE鸡基因图谱计划,搜集全世界鸡基因图谱信息
Swimemap猪基因图谱计划,饮食店染色体图谱和标记
PiGBASE,猪基因图谱信息库
SheepBase已发表的绵羊基因位点数据库
Goatmap,山羊基因图谱数据库
HorseMap马基因图谱数据库
Bovmap法国的牛基因图谱数据库
BovBase英国的牛基因图谱数据库
BovGBASE美国农业部的家畜基因组图谱计划中的牛基因数据库
      Buffmap水牛基因图谱数据库。
       DogMap狗基因图谱数据库。
      CatMap猫基因图谱数据库。
      RabbitMap兔基因图谱数据库。
      RainMap彩虹鳟鱼基因图谱数据库。
       另一个鳟鱼科基因数据库在美国华盛顿州立大学:
十五.生物医学文献数据库
      MEDLINE是美国国家医学图书馆的文献摘要库,反映美国及其他国家3800多种医学和生物期刊的作者摘要和引用情况。
       最为方便的查询MEDLINE的方式,是通过NCBI的PubMed服务:
       SeqAnalRef这是由A.Bairoch个人维护的有关序列分析的文献目录。
       SCI是设在美国费城的科学信息研究所所提供的文献引用情况的检索服务。
      CancerWeb癌症网页:
       HUMAT人体解剖学数据库。
      KeyNet按生物序列功能组织的基因和蛋白质名称关键字库。
       BioABACUS生物学与生物技术以及计算机科学缩写字表。
十六.其他数据库
       Taxonomy分类学数据库。
      ETI世界生物多样性数据库设在荷兰的分类鉴定专家中心。
     位于美国麻省的Woods Hole海洋生物研究室有一个海洋动物数据库。
       TAED适应性演化数据库。
阅读(...) 评论()

我要回帖

更多关于 生物信息学的研究内容 的文章

 

随机推荐