全基因组选择的概念由哪个国家如何定义科学家家于2001年首次提出

是一项规模宏大跨国跨学科的洳何定义科学家探索工程。其宗旨在于测定组成人类

图谱并且辨识其载有的

及其序列,达到破译人类遗传信息的最终目的

“人类基因組计划”在研究人类过程中建立起来的策略、思想与技术,构成了生命如何定义科学家领域新的学科——基因组学可以用于研究微生物、植物及其他动物。人类基因组计划与

并称为三大如何定义科学家计划是人类如何定义科学家史上的又一个伟大工程,被誉为生命如何萣义科学家的“

组计划由美国如何定义科学家家于1985年率先提出于1990年正式启动的。美国、英国、法国、德国、日本和我国如何定义科学家镓共同参与了这一预算达30亿美元的人类基因组计划按照这个计划的设想,在2005年要把人体内约2.5万个基因的密码全部解开,同时绘制出人類基因的图谱换句话说,就是要揭开组成人体2.5万个基因的30亿个碱基对的秘密截止到2003年4月14日,人类基因组计划的

工作已经完成其中,2001姩人类基因组工作草图的发表

(由公共基金资助的国际人类基因组计划和私人企业塞雷拉基因组公司各自独立完成并分别公开发表)

被認为是人类基因组计划成功的里程碑。

美国、英国、法国、德国、日本、中国

对人类基因组的研究在70年代已具有一定的雏形

1985年5月在加州Santa Cruz甴美国DOE的Sinsheimer RL主持的会议上提出了测定人类基因组全序列的动议,形成了美国能源部的“人类基因组计划”草案

的Santa Fe讨论了这一计划的可行性,随后DOE宣布实施这一计划

1986年,诺贝尔奖得主杜尔贝科(R. Dulbecco)在《如何定义科学家》(Science)周刊撰文回顾肿瘤研究的进展指出要么依旧采用“零敲碎打”的策略,要么从整体上研究和分析人类基因组文中指出:如果我们想更多地了解肿瘤,我们必须关注细胞的基因组…… 從哪个物种着手努力?如果我们想理解人类肿瘤那就应从人类开始。……人类肿瘤研究将因对DNA的详细知识而得到巨大推动”

1986年遗传学镓McKusick V提出从整个基因组的层次研究遗传的如何定义科学家称为“基因组学”

1987年初,美国能源部和

为HGP下拨了启动经费约550万美元(全年1.66亿美元)

1988姩美国成立了“国家人类基因组研究中心”由Watson J出任第一任主任

1990年10月1日,经美国国会批准美国HGP正式启动总体计划在15年内投入至少30亿美元進行人类全基因组的分析。

1989年2月英国开始HGP特点是:帝国癌症研究基金会与国家医学研究委员会(

-MRC)共同负责全国协调与资金调控,剑桥附近的Sanger中心注重首先在线虫基因组上积累经验改进大规模DNA测序技术;同时建立了YAC库的筛选与克隆、特异细胞系、

、比较生物基因组DNA序列、信息分析等的“英国人类基因组资源中心”。可谓“资源集中、全国协调”

的HGP启动。如何定义科学家研究部委托国家医学如何定义科學家院制定HGP主要特点是注重整体基因组、cDNA和自动化。建立了人类多态性研究中心(CEPH)在全基因组YAC

)的构建以及驰名世界的用作基因组研究的经典材料CEPH家系(80个3代多个体家系)方面产生了巨大影响。

1990年美国能源部(DOE)与国立卫生研究院(NIH)共同启动HGP,原定投入30亿美元鼡15年时间完成该计划。英、日、法、德等国相继加入

通过了“欧洲人类基因组研究计划”,主要资助23个实验室重点用于“资源中心”的建立和运转还有

、日本、韩国、澳大利亚等。

的倡导下启动最初由国家自然如何定义科学家基金会和863高科技计划的支持下,先后启动叻“中华民族基因组中若干位点

的研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”

1998年在国家科技部的领导和牵线下,在仩海成立了南方基因中心

1998年5月11日,世界上最大的

仪生产商美国PE Biosystems公司以其刚研制成功的300台最新毛细管自动测序仪(ABI 3700)和3亿美元资金,成竝了Celera Genomics公司宣称要在3年内,以所谓的“人类全基因组霰弹法测序策略”完成人类基因组测序并声称要专利200~400个重要基因,并将所有序列信息保密3个月Celera公司已有雇员300多人,购买了号称“全球第三”的超大型计算机号称拥有了超过全球所有序列组装解读力量总和的实力。僦在六国共同宣布工作框架图构建完成的同一天Celera公司宣称已组装出了完整的人类遗传密码。Celera公司此举是对公益性的HGP的竞争与挑战

1998年,組建了中科院遗传所1998年在北京成立了北方人类基因组中心。1999年7月在国际人类基因组注册得到完成人类3号染色体短臂上一个约30Mb区域的测序任务,该区域约占人类整个基因组的1%

人类基因组计划(Human genome project)由美国于1987年启动,中国于1999年9月积极参加到这项研究计划中的承担其中1%的任務,即人类3号染色体短臂上约3000万个碱基对的

任务中国因此成为参加这项研究计划的唯一的发展中国家。

2000年6月26日参加人类基因组工程项目的美国、英国、法国、德国、日本和中国的6国如何定义科学家家共同宣布,人类基因组草图的绘制工作已经完成最终完成图要求测序所用的克隆能忠实地代表常染色体的基因组结构,序列错误率低于万分之一95%

区域被测序,每个Gap小于150kb完成图将于2003年完成,比预计提前2年由于人类基因测序和基因专利可能会带来巨大的商业价值,各国政府和一些企业都在积极地投入该项研究如1997年AMGEN公司转让了一个与中枢鉮经疾病有关的基因而获利3.92亿美元。

选择人类的基因组进行研究是因为人类是在“进化”历程上最高级的生物对它的研究有助于认识自身、掌握生老病死规律、疾病的诊断和治疗、了解生命的起源。

测出人类基因组DNA的30亿个

的序列发现所有人类基因,找出它们在染色体上嘚位置破译人类全部

在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、

、了解生命的起源、了解

生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与

等生命现象、为疾病的诊治提供如何定义科学家依据

人類基因组计划遗传图谱

又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的

在群体中的出现频率皆高于1%)的遺传标记为“路标”,以遗传学距离(在

事件中两个位点之间进行交换、重组的百分率1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为

创造了条件意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某┅标记邻近(紧密连锁)的证据这样可把这一基因定位于这一已知区域,再对基因进行分离和研究对于疾病而言,找基因和分析基因昰个关键

位点标记,HLA位点标记70年中后期,限制性片段长度多态性(RFLP)位点数目大于105,用

切割DNA链由于DNA的一个“点”上的变异所造成嘚能切与不能切两种状况,可产生不同长度的片段(等位片段)可用凝胶

显示多态性,从片段多态性的信息与疾病表型间的关系进行

找到致病基因。如Huntington症但每次酶切2-3个片段,信息量有限

,又称简短串联重复(STR)

为10-9,双等位型标记在人类基因组中可达到300万个,平均约每1250个碱基对就会有一个3~4个相邻的标记构成的

人类基因组计划物理图谱

谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的绘制物理图谱的目的是把有关基因的

及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的

的排列顺序即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的

不同的DNA,经酶切后就會产生不同长度的DNA片段由此而构成独特的酶切图谱。因此DNA物理图谱是DNA

的特征之一。DNA是很大的分子由限制酶产生的用于

反应的DNA片段只昰其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图广义地说,DNA测序从物理图谱制作开始它是测序工作的第一步。制作DNA物理图谱的方法有多种这里选择一种常用的简便方法──标记片段的部分

,来说明图谱制作原理

选择合适的限制性内切酶将待测DNA链(已经标记放射性同位素)完全降解,

经凝胶电泳分离后进行自显影获得的图谱即为组成该DNA链的酶切片段的数目和大小。

使待测DNA的一条链带上示踪

然后用上述相同酶部分降解该DNA链,即通过控制反应条件使DNA链上该酶的切口随机断裂而避免所有切口断裂的完全降解发生。部分酶解产物同样进行电泳分离及自显影比较上述二步的自显影图譜,根据片段大小及彼此间的差异即可排出酶切片段在DNA链上的位置下面是测定某

完整的物理图谱应包括人类基因组的不同载体DNA克隆片段

圖,大片段限制性内切酶切点图DNA片段或一特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征型序列(如CpG序列、Alu序列isochore)等的标记图,人类基因组的

图(即染色体的区、带、亚带或以染色体长度的百分率定标记),最终在分子水平上与

基本原理是把庞大的无从下手的DNA先“敲碎”再拼接。以Mb、kb、bp作为图距以DNA探针的STS(sequence tags site)序列为路标。1998 年完成了具有52,000个

(STS)并覆盖人类基因组大部分区域的连续克隆系的

。构建物理图的一个主要内容是把含有STS对应序列的DNA的克隆片段连接成相互重叠的“片段

(YAC)作为载体的载有人DNA片段的文库已包含了构建总體覆盖率为100%、具有高度代表性的片段重叠群”近几年来又发展了可靠性更高的BAC、PAC库或cosmid库等。

人类基因组计划序列图谱

随着遗传图谱和物悝图谱的完成测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程通过测序得到基因组的序列图谱。

对连续克隆系中排定的BAC克隆逐个进行亚克隆

并进行组装(公共领域测序计划)

在一定作图信息基础上,绕过大片段連续克隆系的构建而直接将基因组分解成小片段随机测序利用超级计算机进行组装(美国Celera公司)。

人类基因组计划转录图谱

转录图谱是茬识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱在人类基因组中鉴别出占具2%~5%长喥的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物

和疾病都是由结构或功能蛋白质决定的而已知的所有蛋白质都昰由mRNA编码的,这样可以把mRNA通过

合成cDNA或称作EST的部分的cDNA片段也可根据mRNA的信息人工合成cDNA或cDNA片段,然后再用这种稳定的cDNA或EST作为“探针”进行

,鑒别出与转录有关的基因用PolyA互补的寡聚T或

的相关序列作为引物对mRNA双端尾侧的几百个bp进行测序得到EST(

在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不哃基因中不同水平的表达还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。

人类基因组是一个国际合作项目:表征人類基因组选择的模式生物的DNA测序和作图,发展基因组研究的新技术完善人类基因组研究涉及的伦理、法律和社会问题,培训能利用HGP发展起来的这些技术和资源进行生物学研究的如何定义科学家家促进人类健康。

基因诊断、基因治疗和基于基因组知识的治疗、基于基因組信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预

胚胎细胞克隆羊——多利

筛选药物的靶点:与组合化学囷天然化合物分离技术结合,建立高通量的受体、酶结合试验以知识为基础的药物设计:基因蛋白产物的高级结构分析、预测、模拟—药粅作用“口袋”

生物的进化史,都刻写在各基因组的“天书”上;

是人的亲戚——13亿年;人是由300~400万年前的一种

进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“

”来自于非洲距今20万年——第二次“走出非洲”?

公园不只是科幻故事;种族选择性灭绝性生粅武器;基因专利战;基因资源的掠夺战;基因与个人隐私

破译人类遗传信息,将对生物学医学,乃至整个生命如何定义科学家产生無法估量的深远影响目前基因组信息的注释工作仍然处于初级阶段。随着将来对基因组的理解更加深入新的知识会使医学和生物技术領域发展更为迅速。基于DNA载有的信息在细胞生命活动中的指导作用在分子生物学水平上深入了解疾病的产生过程将大力推动新的疗法和噺药的开发研究。对于癌症、

等疾病的病因研究也将会受益于基因组遗传信息的破解事实上,在人类基因组计划完成之前它的潜在使鼡价值就已经表现出来。大量的企业例如巨数遗传公司开始提供价格合宜,而且容易使用的

、纤维性囊肿、肝脏疾病在内的很多种疾病

人类基因组计划对许多生物学研究领域有切实的帮助。例如当科研人员研究一种癌症时,通过人类基因组计划所提供的信息可能会找到某个,或某些相关基因如果在互联网上访问由人类基因组信息而建立的各种数据库,可以查询到其他如何定义科学家家相关的文章包括基因的DNA,

、功能多态性,以及和人类其他基因之间的关系也可找到和

等对应基因的进化关系,可能存在的突变及相关的信号传箌机制人类基因组计划对与肿瘤相关的

的研究工作,起到了重要的推动作用

分析不同物种的DNA序列的相似性会给生物进化和演变的研究提供更广阔的路径。事实上人类基因组计划提供的数据揭示了许多重要的生物进化史上的里程碑事件。如

的发育脊柱和免疫系统等都囷DNA载有的遗传信息有密切关系。

人类基因组计划疾病基因

人类基因组研究的一个关键应用是通过位置克隆寻找未知生物化学功能的疾病基洇这个方法包括通过患病家族

来绘制包含这些基因的染色体区域图,然后检查该区域来寻找基因位置克隆是很有用的,但是也是非常乏味的当在1980s早期该方法第一次提出时,希望实现位置克隆的研究者们不得不产生遗传标记来跟踪遗传进行染色体行走得到覆盖该区域嘚基因组DNA,通过直接测序或间接

方法分析大约1Mb大小的区域最早的两个障碍在1990s中期在人类基因组项目的支持下随着人类染色体的遗传和

的發展而清除。然而剩余的障碍仍然是艰难的。

所有这些将随着人类基因组序列草图的实用性而改变在公共数据库中的人类基因组序列使得

的计算机快速识别成为可能,随之进行相关候选基因的突变检测需要在

信息的帮助。对于孟德尔遗传疾病一个基因的搜索在一个適当大小的研究小组经常在几个月实现。至少30个疾病基因直接依赖公共提供的基因组序列已经定位克隆到因为大多数人类序列只是在过詓的12个月内得到,可能许多类似的发现还没有出版另外,有许多案例中基因组序列发挥着支持作用,例如提供候选

(2001年中国上海和丠京如何定义科学家家发现遗传性

基因组序列对于揭示导致许多普通的染色体删除综合症的机制同样有帮助。在几个实例中再发生的删除被发现,由同源体重组合在大的几乎同一的染色体内复制的不等交叉产生例子包括在第22条染色体上的DiGeorge/ velocardiofacial综合症区和在第7条染色体上的Williams-Beuren综匼症的重复删除。

基因组序列的可用性同样允许疾病基因的旁系同源性的快速识别对于两个理由是有价值的。首先

基因的突变可以引起相关遗传疾病。通过基因组序列使用发现的一个很好的例子是

(完全色盲)CNGA3基因,编码视锥体光感受器环GMP门控通道的a亚单位显示在┅些色盲家系中存在突变体。基因组序列的计算机检索揭示了旁系同源基因编码相应的b亚单位CNGB3(在EST数据库中没有出现)。CNGB3基因被快速认萣为是其他家系的色盲的原因另一个例子是由早衰1和早衰2基因提供的,它们的突变可能导致Alzheimer疾病的的早期发生第二个理由是旁系同源體可以提供治疗敢于的机会,例子是在镰刀状细胞疾病或β地中海贫血的个体中试图再次激活胚胎表达的血红蛋白基因,它是由于β-球蛋白

我们在在线人类孟德尔遗传数据库(OMIM)和

中进行了971个已知的人类疾病基因的

体的系统检索我们识别了286个潜在的旁系同源体(要求是至尐50个

的匹配,在相同的染色体上一致性大于70%但小于90%在不同的染色体上小于95%)。尽管这种分析也许识别一些

89%的匹配显示在新靶序列一个外显子以上的同源性,意味着许多是有功能的这种分析显示了在计算机中快速识别疾病基因的潜能。

人类基因组计划治疗疾病

在过去的卋纪里制药产业很大程度上依赖于有限的药物靶来开发新的治疗手段。最近的纲要列举了483个药物靶被看作是解决了市场上的所有药物知道了人类的全部基因和蛋白质将极大的扩展合适药物靶的寻找。虽然仅仅人类的小部分基因可以作为药物靶,可以预测这个数目将在幾千之上这个前景将导致基因组研究在药物研究和开发中的大规模开展。一些例子可以说明这一点:

介导快速兴奋响应以前识别的5-HT3A受體基因产生功能受体,但是比在活体内有小得多的电导交叉杂交实验和EST分析在揭示已知受体的其他同源体上都失败了。然而通过对人類基因组序列草图的低要求检索,一个推定的同源体被识别在一个PAC克隆中第11号染色体长臂上。同源体显示在纹状体、尾状核、

中表达铨长cDNA随后得到。这个编码胺受体地基因被命名为5-HT3B。当与5-HT3A组合成异二聚体中它显示负责大电导神经胺通道。假定胺途径在精神疾病和精鉮分裂症的中心作用一个主要的新的治疗靶的发现是相当有兴趣的。

的收缩和炎症作用先前认为是过敏反应的慢反映物质(SRS-A),通过特定的受体介导第二个类似的受体,CysLT2使用老鼠EST和人类基因组序列的重组得到识别。这导致了与先前识别的唯一的其它受体有38%氨基酸一致性的基因的克隆这个新的受体,显示高的亲和力和几个白三烯的结合映射在与过敏性哮喘有关的第13号染色体区域上。这个基因在气噵平滑肌和心脏中表达作为白三烯途径中抗哮喘药物开发中一个重要的靶,新受体的发现有明显的重要的作用

⑶ Alzheimer疾病在老年斑中有丰富的β-淀粉样物沉积。β-淀粉样物由前体蛋白(APP)蛋白

生成有一个酶是β位 APP裂开酶,是跨膜天冬氨酸

公共的人类基因组草图序列计算機搜索最近识别了BACE的一个新的同源序列,编码一个蛋白命名为BACE2,它与BACE有52%的氨基酸

包含两个激活蛋白酶位点和象APP一样,映射到第21条染色體的必须Down综合症区域它提出了问题,BACE2和APP过多的拷贝是否有功于加速Down综合症病人的脑部β-淀粉样物沉积

给出了这些例子,我们在基因组序列中进行系统的识别传统药靶蛋白质的

体使用的靶列表在SwissPrott数据库中识别了603个入口,有唯一的访问码

一个例子是:解决了困扰研究者幾十年的一个神秘课题:苦味的分子学基础。人类和其他动物对于某一种苦味有不同的响应(响应的多态性)最近,研究者将这个特征映射到人类和老鼠中然后检索了

偶合受体的人类基因组序列草图上的相关区域。这些研究很快导致了该类蛋白的新家族的发现证明了咜们几乎都在味蕾表达,实验证实了在培养细胞中的受体响应特定的苦基质

是全人类的财产,这一研究成果理应为全人类所分享、造福铨人类这是参与人类基因组工程计划的各国如何定义科学家家的共识。值得关注的是目前在人类基因组研究领域,出现了一些私营公司争相为其成果申请专利的现象美国

基因公司曾表示,想把一部分研究成果申请专利有偿提供给制药公司。

如:肥胖基因、支气管哮喘基因这类基因的新发现每年都有新报道。这些基因的发现增进了人们对许多重要疾病机理的理解,并且推动整个医学思想更快的从偅治疗转向重预防例如:湖南医科大学夏家辉教授组于发表克隆了人类神经性高频性耳聋的致病基因(GJB3),这是第一次在中国克隆的基洇

生物技术的产业化。一批世界级的大公司纷纷把它们的重心转向生命如何定义科学家研究和生物技术产品这种趋势或潮流也不能不說和人类基因组计划密切相关。

完成人类基因组序列完成图

⑴ 从当前物理图谱生成的克隆产生完成的序列覆盖基因组的常染色质区域大於96%。大约1Gb的完成序列已经实现剩下的也已经形成草图,所有的克隆期望达到8~10倍的覆盖率大约2001年中期(99.99%的正确率),使用已经建立的囷日益自动化的协议

⑵ 检测另外的库来关闭gaps。使用

或其他方法来分析没有闭合的Gaps大小22,21条染色体用这种方式2003年已经完成。

⑶ 开发新嘚技术来关闭难度较大的gaps大约几百个。

基因组序列工作框架图(Working draft):通过对染色体位置明确的BAC连续克隆系4-5倍覆盖率的测序(在BAC克隆水平嘚覆盖率不应低于3倍)获得基因组90%以上的序列,其错误率应低于1%工作框架图可用于基因组结构的认识、基因的识别和解析、疾病基因嘚

1、草图,许多疾病相关的基因被识别

2、SNP(人与人之间的区别)草图提供了一个理解遗传基础和人类特征进化的框架。

4、比较其它基因組可以揭示共同的调控元件和其他物种共享的基因的环境也许提供在个体水平之上的关于功能和调节的信息。

5、草图同样是研究基因组彡维压缩到细胞核中的一个起点这样的压缩可能影响到

6、在应用上,草图信息可以开发新的技术如DNA芯片、

,作为传统方法的补充目湔,这样的芯片可以包含

中所有的成员从而在特定的疾病组织中可以找到那些是活跃的。

2001年2月12日美国Celera公司与人类基因组计划分别在《洳何定义科学家》和《自然》杂志上公布了人类基因组精细图谱及其初步分析结果。其中政府资助的人类基因组计划采取基因图策略,洏Celera公司采取了“鸟枪策略”至此,两个不同的组织使用不同的方法都实现了他们共同的目标:完成对整个人类基因组的测序的工作;并苴两者的结果惊人的相似。整个人类基因组测序工作的基本完成为人类生命如何定义科学家开辟了一个新纪元,它对

、生物遗传、个體差异、发病机制、疾病防治、新药开发、健康长寿等领域以及对整个生物学都具有深远的影响和重大意义,标志着人类生命如何定义科学家一个新时代的来临

1、分析得知:全部人类基因组约有2.91Gbp,约有39000多个基因;平均的基因大小有27kbp;其中G+C含量偏低仅占38%,而2号染色体中G+C嘚含量最多;到目前仍有9%的碱基对序列未被确定19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少等等(具体信息可参见cmbi 特別报道:生命如何定义科学家的重大进展)

2、目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能在已知基因中酶占10.28%,核酸酶占7.5%

占5.3%,选择性调节分子占3.2%等。发现并了解这些功能基因的作用对于基因功能和新药的筛选都具有重要的意义

3、基因数量少嘚惊人:一些研究人员曾经预测人类约有14万个基因,但Celera公司将人类基因总数定在2.6383万到3.9114万个之间不超过40,000,只是线虫或果蝇基因数量的两倍人有而鼠没有的基因只有300个。如此少的基因数目而能产生如此复杂的功能,说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义也说明人类的基因较其他生物体更'有效',人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同这将对我们目前的许多观念产生重大的挑战,它为

中生物医学的发展提供新的非凡的机遇但由于基因剪切,EST数据库的重复以及一些技术和方法上的誤差将来亦可能人类的基因数会多于4万。

4、人类单核苷酸多态性的比例约为1/1250bp不同人群仅有140万个核苷酸差异,人与人之间99.99%的基因密码是楿同的并且发现,来自不同人种的人比来自同一人种的人在基因上更为相似在整个基因组序列中,人与人之间的变异仅为万分之一從而说明人类不同“种属”之间并没有本质上的区别。

5、人类基因组中存在“热点”和大片"荒漠"在染色体上有基因成簇密集分布的区域,也有大片的区域只有“

” ——不包含或含有极少基因的成分基因组上大约有1/4的区域没有基因的片段。在所有的DNA中只有1%-1.5%DNA能编码蛋白,茬人类基因组中98%以上序列都是所谓的“无用DNA”分布着300多万个长片断

。这些重复的“无用”序列决不是无用的,它一定蕴含着人类基因嘚新功能和奥秘包含着人类演化和差异的信息。经典分子生物学认为一个基因只能表达一种蛋白质而人体中存在着非常复杂繁多的蛋皛质,提示一个基因可以编码多种蛋白质蛋白质比基因具有更为重要的意义

6、男性的基因突变率是女性的两倍,而且大部分人类遗传疾疒是在

上进行的所以,可能男性在人类的遗传中起着更重要的作用

7、人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的说明是在

晚期才插入我们基因组的。可能是在我们人类的免疫防御系统建立起来前寄苼于机体中的细菌在共生过程中发生了与人类基因组的基因交换。

8、发现了大约一百四十万个

并进行了精确的定位,初步确定了30多种致疒基因随着进一步分析,我们不仅可以确定遗传病、肿瘤、心血管病、糖尿病等危害人类生命健康最严重疾病的致病基因寻找出个体囮的防治药物和方法,同时对进一步了解人类的进化产生重大的作用

9、人类基因组编码的全套蛋白质(

)比无脊椎动物编码的蛋白质组哽复杂。人类和其他脊椎动物重排了已有蛋白质的

形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质更重要的是偠靠重排和扩展已有的蛋白质,以实现蛋白质种类和功能的多样性有人推测一个基因平均可以编码2-10种蛋白质,以适应人类复杂的功能

、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。

目前基因组学的研究出现了几个重心的转移:一是将已知基因的序列与功能联系在一起的

研究;二是从作图为基础的基因分离转向以序列为基础的基因分离;三是从研究疾病的起因转向探索发疒机理;四是从疾病诊断转向疾病

在后基因组时代如果在已完成基因组测序的物种之间进行整体的比较、分析,希望在整个基因组的规模上了解基因组和

的功能意义包括基因组的表达与调控、基因组的多样化和进化规律以及基因及其产物在生物体生长、发育、分化、行為、老化和治病过程中的作用机制都必须发展新的算法以充分利用超级计算机的超级计算能力。

美国和英国如何定义科学家家2006年5月18日在英國《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序

中,1号染色体包含基因数量最多达3141个,是平均水平的两倍共有超过2.23亿个碱基对,破译难度也最大一个由150名英国和美国如何定义科学家家组成的团队历时10年,才完成了1号染色体的测序工作

洳何定义科学家家不止一次宣布人类基因组计划完工,但推出的均不是全本这一次杀青的“生命之书”更为精确,覆盖了人类基因组的99.99%解读人体基因密码的“生命之书”宣告完成,历时16年的人类基因组计划书写完了最后一个章节

人类基因组计划中还包括若干个模式苼物体基因组计划,中国重点支持的水稻基因组研究计划亦可划入这一范畴模式生物体一直就是生命如何定义科学家领域研究的基本模型,加之它们与人类相比基因组结构简单、单位DNA长度上基因密度高 易于基因的识别,而且从低等至高等的各个模式生物是研究基因

的绝佳材料各模式生物体之间的比较性研究将有助于人类基因的结构与功能的阐明。对于在整体水平研究基因的功能模式生物体更有着无法取代的地位。

中国的基因组研究工作起步较晚而且是基础差、底子薄、资金少,与国际上这几年HGP的惊人速度相比中间的差距很大,並且这种差距有进一步加大的可能中国生命如何定义科学家界应在如下几个方面共同努力:

⒈ 尽快收集和利用中国宝贵的多民族基因组資源和遗传病

材料, 并阻止这些资源盲目流向国外

⒉ 集中人力、物力和财力,建立互相配套的、集分子遗传学、 自动化技术和信息技术為一体的中心才能卓有成效地开展工作。

⒊ 根据中国国情和原有工作基础做到有所为有所不为, 走“短平快”和出奇制胜的道路直接楔入基因组研究中最为关键的部分-

,如走“cDNA计划”道路尽可能地克隆一大批新基因,在人类8万~10 万个基因中占有一定的份额同时,由于基因组DNA

是一项劳动和技能密集性工作如能引进技术, 培训一支高水平的技术队伍完全有可能将人类基因组测序的一部分工作吸引到中国。

推进中国基因组研究工作,并在基因组转录顺序的认识及基因功能推测方面多做工作

⒌ 多渠道筹措资金,在维护知识产权嘚前提下开展国际间合作

历史已将中国当代如何定义科学家家推上了人类基因组计划这一国际合作和竞争的大舞台,他们责无旁贷地要為供养自己的国家和人民负责为21世纪中国的如何定义科学家、技术和产业负责,唯有高瞻远瞩地认清当前的形势和不辞劳苦、不计得失哋拼搏才有可能在国际人类基因组计划中占有一席之地,有着交换和分享数据的资本共同品尝人类基因组这一全人类的“圣餐”。

中國1994年启动HGP现已完成南北方两个汉族人群和西南、东北地区12个少数民族共733个永生细胞系的建立,为中华民族基因保存了宝贵的资源并在哆民族基因组

的研究中取得了成就,在致病基因研究中有所发现定名为中华民族基因组结构和功能研究的HGP为“九五”国家最大的资助研究项目之一(700万元),为中国在下世纪国际HGP如何定义科学家的新一轮竞争中占据有利地位打好了基础

1990年~1998年,人类基因组序列已完成和囸在测序的共计约330Mb占人基因组的11%左右;已识别出

人类疾病相关的基因200个左右。此外细菌、古细菌、支原体和酵母等17种生物的全基因组嘚测序已经完成。

值得一提的是企业与研究部门的携手,将大大地促进测序工作的完成美国的基因组研究所(The Institute of Genome Research,TIGR)与PE(Perkin-Elmar)公司合作建立噺公司,三年内投资2亿美元预计于2002年完成全序列的测定。这一进度将比美国政府资助的HGP的预定目标提前三年美国加州的一家遗传学数據公司(Incyte)宣布(1998年〕,两年内测定基因组中的蛋白质

中的单核苷酸的多态性最后将绘制一幅人的10万个基因的定位图。与Incyte公司合作的

(Human Genome Science)公司的负责人宣称截止1998年8月,该公司已鉴定出10万多个基因(人体基因约为12万个)并且得到了95%以上基因的EST(expressed sequence tag)或其部分序列。

1998年9月14日媄国国家人类基因组计划研究所(NHGRI)和美国能源部基因组研究计划的负责人在一次咨询会议上宣布美国政府资助的人类基因组计划将于2001姩完成大部分蛋白质

的测序,约占基因组的三分之一测序的

不超过万分之一。同时还要完成一幅“工作草图”至少覆盖基因组的90%,差錯率为百分之一2003年完成基因组测序,差错率为万分之一这一时间表显示,计划将比开始的目标提前两年完成

是要解决包括肿瘤在内嘚人类疾病的

问题。6000多个单基因遗传病和多种大面积危害人类健康的多基因遗传病的致病基因及相关基因代表了对人类基因中结构和功能完整性至关重要的组成部分。所以疾病基因的克隆在HGP中占据着核心位置,也是计划实施以来成果最显著的部分

工作的带动下,疾病基因的定位、克隆和鉴定研究已形成了从

→蛋白质→基因的传统途径转向“

”或“定位克隆法”的全新思路。随着人类基因图的构成3000哆个人类基因已被精确地定位于染色体的各个区域。今后一旦某个疾病位点被定位,就可以从局部的基因图中遴选出相关基因进行分析这种被称为“

”的策略,将大大提高发现疾病基因的效率

目前,人类疾病的基因组学研究已进入到

疾病这一难点由于多基因疾病不遵循

取得突破。这方面的研究需要在人群和遗传标记的选择、数学模型的建立、

的 改进等方面进行艰苦的努力近来也有学者提出,用比較

的方法来识别疾病状态下基因的激活或受抑实际上,“癌肿基因组解剖学计划(Cancer Genome Anatomy Project,CGAP”就代表了在这方面的尝试

4、中国的人类基因组研究

研究的飞速发展和日趋激烈的基因抢夺战已引起了中国政府和如何定义科学家界的高度重视。在政府的资助和一批高水平的生命如何定義科学家家带领下中国已建成了一批实力较强的国家级生命如何定义科学家重点实验室,组建了北京、上海人类基因组研究中心有了研究人类基因组的条件和基础,并引进和建立了一批基因组研究中的新技术中国的HGP在多民族基因保存、基因组多样性的比较研究方面取嘚了令人满意的成果,同时在白血病、食管癌、肝癌、鼻咽癌等易感基因研究方面亦取得了较大进展

首先建立了寡核苷酸引物介导的人類高分辨染色体显微切割和显微基因克隆技术;已建立的17种染色体特异性DNA文库和24种染色体区特异性DNA文库及其探针;构建了人X染色体YAC图谱,巳完成了人X染色体Xp11.2-p21.3跨度的约35cM STS-YAC图谱的构建;建立了YAC-cDNA筛选技术

目前的研究工作还包括: 疾病和功能相关新基因的分离、

和克隆的技术和方法学的创新研究;中国少数民族HLA分型研究及特种基因的分析; 人胎脑cDNA文库的构建和新基因的克隆研究。

中国是世界上人口最多的国家囿56 个民族和极为丰富的病种资源,并且由于长期的社会封闭在一些地区形成了极为难得的族群和

群,一些多世代、多个体的大家系具有典型的遗传性状这些都是克隆相关基因的宝贵材料。但是由于中国的HGP 研究工作起步较晚、底子薄、资金投入不足,缺乏一支稳定的、高素质的青年生力军 中国的HGP 研究工作与国外近年来的惊人发展速度相比,差距还很大并且有进一步加大的危险。如果我们在这场基因爭夺战中不能坚守住自己的阵地那么在21 世纪的竞争中我们又将处于被动地位:我们不能自由地应用

和基因治疗的权力,我们不能自由地進行

的生产和开发我们亦不能自由地推动其他基因相关产业的发展。

1、生命如何定义科学家工业的形成

由于基因组研究与制药、生物技術、农业、食品、化学、化妆品、环境、能源和计算机等工业部门密切相关更重要的是基因组的研究可以转化为巨大的生产力,国际上┅批大型制药公司和化学工业公司大规模纷纷投巨资进军基因组研究领域形成了一个新的产业部门,即生命如何定义科学家工业

世界仩一些大的制药集团纷纷投资建立基因组研究所。Ciba-Geigy 和Ssandoz合资组建了Novartis 公司并斥资2.5亿美元建立研究所,开展基因组研究工作Smith Kline 公司花1.25亿美元加赽

的进度,将药物开发项目的25%建立在基因组学之上Glaxo-Wellcome 在基因组研究领域投入4,700万美元将研究人员增加了一倍。

大型化学工业公司向生命洳何定义科学家工业转轨孟山都公司早在1985年就开始转向生命如何定义科学家工业。至1997年该公司向生物技术和基因组研究的投入已高达66億美元。1998年4月杜邦公司宣布改组成三个实业单位,由生命如何定义科学家领头1998年5月,该公司又宣布放弃能源公司Conaco将其改造成一家生命如何定义科学家公司。Dow化学公司用9亿美元购入Eli Lilly公司40%的股票从事谷物和食品研究,后又成立了生命如何定义科学家公司Hoechst公司则出售了咜的基本化学品部门,转项投资生物技术和制药

传统的农业和食品部门也出现了向生物技术和制药合并的趋势。Genzyme Transgenics 公司培养出的基因工程羴能以较高的产量生产抗凝血酶Ⅲ一群羊的酶产量相当于投资1.15亿美元工厂的产量。据估计

生产的药物成本是大规模

法的十分之一。一些公司还在研究生产能抗骨质疏松的谷物以及大规模生产和加工基因工程食品。

能源、采矿和环境工业也已在分子水平上向基因组研究彙合例如,用产甲烷菌Methanobacterium 作为一种新能源用抗辐射的细菌Deinococcus radiodurans清除放射性物质的污染,并在转入tod基因后在高辐射环境下清除多种有害化学粅质的污染。

人类基因组计划当前的整体发展趋势是什么一方面,在顺利实现遗传图和物理图的制作后

正在向完成染色体的完整核酸序列图的目标奋进。另一方面功能基因组学已提上议事日程。人类基因组计划已开始进入由结构基因组学向功能基因组学过渡、转化的過程在功能基因组学研究中,可能的核心问题有:基因组的表达及其调控、基因组的多样性、模式生物体基因组研究等

⑴基因组的表達及其调控

一个细胞的基因转录表达水平能够精确而特异地反映其类型、

以及反应状态,是功能基因组学的主要内容之一为了能够全面哋评价全部基因的表达,需要建立全新的工具系统其定量敏感性水平应达到小于1个拷贝/细胞,定性敏感性应能够区分剪接方式还须达箌检测单细胞的能力。近年来发展的DNA微阵列技术如DNA芯片,已有可能达到这一目标

研究基因转录表达不仅是为了获得全基因组表达的数據,以作为数学

关键问题是要解析控制整个发育过程或反应通路的

网络的机制。网络概念对于生理和病理条件下的

都是十分重要的一方面,大多数细胞中基因的产物都是与其它基因的产物互相作用的;另一方面在发育过程中大多数的

都是在多个时间和空间表达并发挥其功能,形成基因表达的

在一个意义上,每个基因的表达模式只有放到它所在的

的大背景下才会有真正的意义。进行这方面的研究囿必要建立高通量的小鼠胚胎

蛋白质组学研究是要从整体水平上研究蛋白质的水平和修饰状态。目前正在发展标准化和自动化的二维蛋白質凝胶电泳的工作体系首先用一个自动系统来提取人类细胞的蛋白质,继而用色谱仪进行部分分离将每区段中的蛋白质裂解,再用质譜仪分析并在

中通过特征分析来认识产生的

的另一个重要内容是建立蛋白质相互关系的目录。

之间的相互作用构成了生命活动的基础組装基因组各成分间的详尽作图已在T7噬菌体(55个基因)获得成功。如何在模式生物(如酵母)和人类基因组的研究中建立自动方法认识鈈同的生化通路,是值得探讨的问题

目前,生物信息学已大量应用于基因的发现和预测然而,利用生物信息学去发现基因的蛋白质产粅的功能更为重要模式生物体中越来越多的蛋白质构建编码单位被识别,无疑为基因和蛋白质同源关系的搜寻和家族的分类提供了极其寶贵的信息同时,生物信息学的算法、程序也在不断改善使得不仅能够从

,也能从估计结构上发现同源关系但是,利用计算机模拟所获得的理论数据还需要经过实验经过的验证和修正。

人类是一个具有多态性的群体不同群体和个体在生物学性状以及在对疾病的

与忼性上的差别,反映了进化过程中基因组与内、外部环境相互作用的结果开展人类基因组多样性的系统研究,无论对于了解人类的起源囷进化还是对于生物医学均会产生重大的影响。

1)对人类DNA的再测序

可以预测在完成第一个人类基因组测序后,必然会出现对各人种、群体进行再测序和精细

的热潮这些资料与人类学、语言学的资料相结合,将有可能建立一个全人类的数据库资源从而更好地了解人类嘚历史和自身特征。另外基因组

的研究将成为疾病基因组学的主要内容之一,而群体遗传学将日益成为

研究中的主流工具需要对各种瑺见多因素疾病(如高血压、糖尿病和精神分裂症等)的相关基因及癌肿相关基因在基因组水平进行大规模的再测序,以识别其变异序列

对进化过程各个阶段的生物进行系统的比较DNA测序,将揭开生命35亿年的进化史这样的研究不仅能勾画出一张详尽的系统进化树,而且将顯示进化过程中最主要的变化所发生的时间及特点比如新基因的出现和全基因组的复制。

认识不同生物中基因序列的

将能够使我们有效地认识约束基因及其产物的功能性的因素。对序列差异性的研究则有助于认识产生大自然多样性的基础在不同生物体之间建立序列变異与

的时空差异之间的相关性,将有助于揭示基因的网络结构

⑶开展对模式生物体的研究

在人类基因组的研究中,模式生物体的研究占囿极其重要的地位尽管模式生物体的基因组的结构相对简单,但是它们的核心细胞过程和生化通路在很大程度上是保守的这项研究的意义是:1〕有助于发展和检验新的相关技术,如大规模

、大规模表达谱检验、大规模功能筛选等;2〕通过比较和鉴定能够了解基因组的進化,从而加速对人类基因组结构和功能的了解;3〕模式生物体间的比较研究为阐明

机制提供了重要的线索。

目前对于基因组总体结构組成方面的知识主要来源于模式生物体的基因组序列分析。通过对不同物种间

序列的计算机分析已发现了一定比例的

核心调控序列。根据这些序列建立的表达模式数据库对破译基因调控网络提供了必要的条件

识别基因功能最有效的方法,可能是观察基因表达被阻断后茬细胞和整体所产生的表型变化在这方面,

方法(knock-out)是一项特别有用的工具目前。国际上已开展了对酵母、线虫和果蝇的大规模

研究其中进展最快的是酵母。欧共体为此专门建立了一个称为EUROFAN(European Functional Analysis Network)的研究网络美国、加拿大和日本也启动了类似的计划。

随着线虫和果蝇基洇组测序的完成将来也可能开展对这两种生物的类似性研究。一些

系和技术体系建立后不仅能够成为研究单基因功能的有效手段,而苴为研究

性和基因间的相互作用等深层次问题奠定了基础小鼠作为哺乳动物中的代表性模式生物,在

的研究中展有特殊的地位

技术可鉯破坏小鼠的任何一个基因,这种方法的缺点是费用高利用

造成的随机突变是另一中可能的途径。对于人体细胞而言建立

和核酶瞬间阻断基因表达的体系可能更加合适。蛋白质水平的剔除术也许是说明基因功能最有力的手段利用组合化学方法有望生产出化学剔除试剂,用于激活或失活各种蛋白质

总之,模式生物体的基因组计划为人类基因组的研究提供了大量的信息今后,模式生物体的研究方向是將人类基因组8~10万个编码基因的大部分转化为已知生化功能的多成分核心机制而要获得酶一种

核心机制的精细途径,以及它们的紊乱导致疾病的各种途径的知识将只能来自对人类自身的研究。

的研究人类最终将将能够了解哪些进化机制已经确实发生,并考虑进化过程還能够有哪些新的潜能一种新的解答发育问题的方法可能是,将蛋白质

和调控顺序进行重新的组合建立新的

通路。也就是说未来的苼物如何定义科学家不仅能够认识生物体是如何构成和进化的,而且更为诱人的是产生构建新的生物体的可能潜力该计划在人类如何定義科学家史上又竖起了一座新的里程碑!这是一项改变世界,影响人类生活的壮举随着时间的推移,它的伟大意义将愈显昭彰

人类基洇组计划之塞雷拉人类基因组计划

在国际人类基因组计划(以下简称“国际计划”)启动八年后的1998年,美国如何定义科学家家克莱格·凡特创办了一家名为塞雷拉基因组(Celera Genomics)的小私立公司开展自己的人类基因组计划。与国际人类基因组计划相比公司希望能以更快的速度囷更少的投资(3亿美元,仅为国际计划的十分之一)来完成塞雷拉基因组的另起计划被认为对人类基因组计划是一件好事,因为塞雷拉基因组的竞争促使国际人类基因组计划不得不改进其策略进一步加速其工作进程,使得人类基因组计划得以提前完成

塞雷拉采用了更赽速同时更具风险的技术全基因组霰弹枪测序法。霰弹枪测序法的思想是将基因组打断为数百万个DNA片断然后用一定的算法将片断的序列信息重新整合在一起,从而得到整个基因组序列为了提高这一方法的效率,1980年代测序和片断信息整合达到了自动化。这一方法虽然已被用于序列长达6百万个

的细菌基因组测序但对于人类基因组中3千万个碱基对的

,这一技术能否成功在当时还未有定论

塞雷拉基因组一開始宣称只寻求对200至300个基因的专利权保护,但随后又修改为寻求对“完全鉴定的重要结构”的总共100至300个靶基因进行知识产权保护1999年,塞雷拉申请对6500个完整的或部分的人类基因进行初步专利保护;批评者认为这一举动将阻碍遗传学研究此外,塞雷拉建立之初同意与国际計划分享数据,但这一协定很快就因为塞雷拉拒绝将自己的测序数据存入可以自由访问的公共数据库而破裂虽然塞雷拉承诺根据1996年百慕達协定每季度发表他们的最新进展(国际计划则为每天),但不同于国际计划的是他们不允许他人自由发布或无偿使用他们的数据。

2000年美国总统克林顿宣布所有人类基因组数据不允许专利保护,且必须对所有研究者公开塞雷拉不得不决定将数据公开。这一事件也导致塞雷拉的股票价格一路下挫并使倚重生物技术股的纳斯达克受到重挫;两天内,生物技术板块的市值损失了约500亿美元

后基因组计划就昰人类完成人类基因组计划(结构基因组学)以后的若干领域,实际上是指完成顺序后的进一步计划其实质内容就是生物信息学与功能基因组学。其核心问题是研究基因组多样性遗传疾病产生的原因,基因表示调控的协调作用以及蛋白质产物的功能。

人类基因组研究嘚目的不只是为了读出全部的DNA序列更重要的是读懂每个基因的功能,每个基因与某种疾病的种种关系真正对生命进行系统地如何定义科学家解码,从此达到从根本上了解认识生命的起源、种间、个体间的差异的原因疾病产生的得机制以及长寿、衰老等困扰着人类的最基本的生命现象目的。

  • 人类元基因组计划:对人体内所用共生菌群的基因组进行序列测定并研究与人体发育和健康相关基因的功能。

  • (簡称HapMap计划):目标是构建人类DNA序列中多态位点的常见模式由于每个个体(除了

    子和克隆动物)的基因组都有独特之处,因此有必要对个體之间的差异在基因组上进行定位其完成将为研究人员确定对人类健康和疾病以及对药物和环境反应有影响的相关基因提供关键信息。

  • 囚类基因组多样性研究计划:对不同人种、民族、人群的基因组进行研究和比较这一计划将为疾病监测、人类的进化研究和人类学研究提供重要信息。

  • 贺淹才.基因工程概论:清华大学出版社2008
  • 3. .新浪[引用日期]
  • .中国经济周刊[引用日期]

格式:PDF ? 页数:124页 ? 上传日期: 12:53:10 ? 浏览次数:93 ? ? 2500积分 ? ? 用稻壳阅读器打开

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

免责声明:1本账号发布文档部汾来源于互联网,仅用于技术分享交流用版权为原作者所有。 2文档内容部分来自网络意见,与本账号立场无关涉及政治言论应当一律删除,请大家监督 3,如有侵犯原您的版权,请提出指正我们将立即删除相关资料 有其它问题也欢迎与本人联系,谢谢!

我要回帖

更多关于 如何定义科学家 的文章

 

随机推荐