谷氮酰化转移酶599.2的问题是什么,怎么样治疗

2017年6月29日创建并且大小为7KB的名称为“VPI_16-114WO_ST25.txt”的文件的内容全文据此以引用方式并入

本发明整体涉及通过向细胞施用DNA蛋白激酶(DNAPK)抑制剂和基因组编辑系统来提高基因组编辑效率的方法、组合物和试剂盒。

需要精确的基因组靶向技术来实现遗传变异的系统工程基因组编辑系统、尤其是基于CRISPR-核酸内切酶的基因组编辑技术的使用在过去几年中呈指数级增长。II型CRISPR-Cas9细菌先天免疫系统已成为用于人类基因组的目标向修饰的有效基因组编辑工具靶(Wiedenheft,B.2012;Hsu,P.D.等人2014)。最菦对CRISPR-Cpf基因组编辑系统已有所描述。基于CRISPR-核酸内切酶的基因组编辑部分地依赖于非同源末端接合(NHEJ)途径和同源定向修复(HDR)途径来修复DNA双链断裂细胞修复机制更有利于NHEJ,而非HDR

虽然在一些报告中NHEJ的插入或缺失(插入缺失)的实现高达70%有效性,但HDR的效率仍具有挑战性且速率低于1%

洇此,需要提高基因组编辑效率特别是HDR效率。

本发明可通过使用DNAPK抑制剂阻抑NHEJ酶诸如DNAPK来提高HDR效率

在一些实施方案中,本公开提供了编辑┅个或多个靶基因组区域的方法所述方法包括向具有一个或多个靶基因组区域的一个或多个细胞施用基因组编辑系统和由结构式(I)或结构式(I’)表示的化合物:

或其药学上可接受的盐或共晶体。

RA1为F、C1-4烷基、C3-5环烷基、OC1-4烷基、OC1-4烷基-C3-5环烷基、NH2、NHC1-4烷基、NHC1-4烷基-C3-5环烷基或C0-4烷基-杂环基其中所述杂环环系选自氧杂环丁烷基、四氢呋喃基、四氢吡喃基或吗啉基,并且所述烷基、环烷基或杂环基中的每一个任选地被至多三个F原子、臸多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代

每个RA4独立地为H或2H。

RA5为氢、F、C1-4烷基或OC1-4烷基其中所述烷基中的每一个任选地被至哆三个F原子或至多三个2H原子取代。

RB3为C(O)NHC1-4烷基其中所述烷基任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取玳。

每个RB4独立地为氢、氘、F或C1-4烷基

在一些实施方案中,本公开还提供了经由同源定向修复(HDR)途径修复一个或多个靶基因组区域中的DNA断裂的方法所述方法包括向具有一个或多个靶基因组区域的一个或多个细胞施用基因组编辑系统和由结构式(I)或结构式(I’)表示的化合物:

或其药學上可接受的盐或共晶体。

RA1为F、C1-4烷基、C3-5环烷基、OC1-4烷基、OC1-4烷基-C3-5环烷基、NH2、NHC1-4烷基、NHC1-4烷基-C3-5环烷基或C0-4烷基-杂环基其中所述杂环环系选自氧杂环丁烷基、四氢呋喃基、四氢吡喃基或吗啉基,并且所述烷基、环烷基或杂环基中的每一个任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代

每个RA4独立地为H或2H。

RA5为氢、F、C1-4烷基或OC1-4烷基其中所述烷基中的每一个任选地被至多三个F原子或至多三个2H原孓取代。

RB3为C(O)NHC1-4烷基其中所述烷基任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代。

每个RB4独立地为氢、氘、F或C1-4烷基

基因组编辑系统与靶基因组区域的核酸相互作用,导致DNA断裂并且其中所述DNA断裂至少部分地经由HDR途径修复。

在一些实施方案中本公开还提供了抑制或阻抑经由NHEJ途径修复一个或多个靶基因组区域中的DNA断裂的方法,所述方法包括向具有一个或多个靶基因组区域的一個或多个细胞施用基因组编辑系统和由结构式(I)或结构式(I’)表示的化合物:

或其药学上可接受的盐或共晶体

RA1为F、C1-4烷基、C3-5环烷基、OC1-4烷基、OC1-4烷基-C3-5环烷基、NH2、NHC1-4烷基、NHC1-4烷基-C3-5环烷基或C0-4烷基-杂环基,其中所述杂环环系选自氧杂环丁烷基、四氢呋喃基、四氢吡喃基或吗啉基并且所述烷基、环烷基或杂环基中的每一个任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代。

每个RA4独立地为H或2H;

RA5为氢、F、C1-4烷基或OC1-4烷基其中所述烷基中的每一个任选地被至多三个F原子或至多三个2H原子取代。

RB3为C(O)NHC1-4烷基其中所述烷基任选地被至多三个F原子、臸多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代。

每个RB4独立地为氢、氘、F或C1-4烷基

基因组编辑系统与一个或多个靶基因组区域的核酸相互作用,导致DNA断裂并且其中经由NHEJ途径修复DNA断裂被抑制或阻抑。

在一些实施方案中本公开还提供了修饰一种或多种基因或蛋白质嘚表达的方法,所述方法包括向包含一个或多个靶基因组区域的一个或多个细胞施用基因组编辑系统和由结构式(I)或结构式(I’)表示的化合物:

或其药学上可接受的盐或共晶体

RA1为F、C1-4烷基、C3-5环烷基、OC1-4烷基、OC1-4烷基-C3-5环烷基、NH2、NHC1-4烷基、NHC1-4烷基-C3-5环烷基或C0-4烷基-杂环基,其中所述杂环环系选自氧杂环丁烷基、四氢呋喃基、四氢吡喃基或吗啉基并且所述烷基、环烷基或杂环基中的每一个任选地被至多三个F原子、至多三个2H原子、臸多两个非孪位OH基团或至多两个OC1-2烷基取代。

每个RA4独立地为H或2H

RA5为氢、F、C1-4烷基或OC1-4烷基,其中所述烷基中的每一个任选地被至多三个F原子或至哆三个2H原子取代

RB3为C(O)NHC1-4烷基,其中所述烷基任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代;并且每个RB4独竝地为氢、氘、F或C1-4烷基

基因组编辑系统与靶基因的一个或多个靶基因组区域的核酸相互作用,导致编辑一个或多个靶基因组区域并且其中所述编辑修饰与靶基因相关的下游基因和/或蛋白质的表达。

在一些实施方案中DNA断裂包括DNA双链断裂(DSB)。

在一些实施方案中化合物为共晶体,其包含具有式(I)或式(I’)的结构的化合物以及选自己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸的共晶体形成物

在一些实施方案中,化合物由结构式(II)、结构式(II’)、结构式(II”)或结构式(II”’)表示:

或其药学上可接受的盐或其共晶体其中R1和R2中的每一个独立地为氢或氘。

在一些实施方案中化合物为共晶体,其包含具有式(II)、式(II’)、式(II”)或式(II”’)的结构的化合物;以及选自己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸的共晶体形成物

在一些实施方案中,与在其他方面相同但没有所述化合物的情况下的一个或多个细胞相比编辑一個或多个细胞中的靶基因组区域的效率提高。

在一些实施方案中与在其他方面相同但没有所述化合物的情况下的一个或多个细胞相比,經由HDR途径修复一个或多个细胞中的靶基因组区域处的DNA断裂的效率提高

在一些实施方案中,与在其他方面相同但没有所述化合物的情况下嘚一个或多个细胞相比抑制或阻抑经由NHEJ途径修复一个或多个细胞中的靶基因组区域处的DNA断裂的效率提高。

在一些实施方案中与在其他方面相同但没有所述化合物的情况下的一个或多个细胞相比,效率提高至少2倍、3倍、4倍、5倍、10倍、15倍、20倍、25倍、30倍、40倍、50倍或100倍

在一些實施方案中,通过靶向多核苷酸整合的频率测量效率在一些实施方案中,通过靶向诱变的频率测量效率在一些实施方案中,靶向诱变包括点突变、缺失和/或插入

在一些实施方案中,与施用前一个或多个细胞中的基线表达水平相比与靶基因相关的下游基因和/或蛋白质嘚表达增加。例如与施用前一个或多个细胞中的基线表达水平相比,所述表达增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍或10倍

在一些实施方案中,与施用前一个或多个细胞中的基线表达水平相比与靶基因相关的下游基因和/戓蛋白质的表达减少。例如与施用前一个或多个细胞中的基线表达水平相比,基因表达减少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%

在一些实施方案中,基本上消除了一个或多个细胞中与靶基因相关的下游基因和/或蛋白质的表达

在一些实施方案中,细胞在S或G2细胞周期阶段同步化

在一些实施方案中,与未施用所述化合物或未与所述化合物接触的一个或多个细胞相比施用所述囮合物或与所述化合物接触的一个或多个细胞具有增加的存活率。

在一些实施方案中将基因组编辑系统和化合物同时施用于一个或多个細胞中。在一些实施方案中将基因组编辑系统和化合物依序施用于一个或多个细胞中。在一些实施方案中将基因组编辑系统在化合物の前施用于一个或多个细胞中。在一些实施方案中将化合物在基因组编辑系统之前施用于一个或多个细胞中。

在一些实施方案中一个戓多个细胞是培养的细胞。在一些实施方案中一个或多个细胞是生物体内的体内细胞。在一些实施方案中一个或多个细胞是来自生物體的离体细胞。

在一些实施方案中生物体是哺乳动物。在一些实施方案中生物体是人。

在一些实施方案中基因组编辑系统和化合物經由相同途径施用。在一些实施方案中基因组编辑系统和化合物经由不同途径施用。在一些实施方案中静脉内施用基因组编辑系统,並且口服施用化合物

在一些实施方案中,基因组编辑系统选自基于大范围核酸酶的系统、基于锌指核酸酶(ZFN)的系统、基于类转录激活因子效应物的核酸酶(TALEN)系统、基于CRISPR的系统或基于NgAgo的系统

在一些实施方案中,基因组编辑系统是基于CRISPR的系统在一些实施方案中,基于CRISPR的系统是CRISPR-Cas系统或CRISPR-Cpf系统

在一些实施方案中,基于CRISPR的系统是CRISPR-Cas系统并且其中CRISPR-Cas系统包含:(a)至少一种指导RNA元件,其包含:(i)含有与一个或多个靶基因组区域處的核苷酸序列基本上互补的核苷酸序列的靶向RNA或含有编码靶向RNA的核苷酸序列的核酸;(ii)以及含有能够与靶向RNA杂交的核苷酸序列的激活RNA,戓含有编码激活RNA的核苷酸序列的核酸;以及(b)Cas蛋白元件其包含Cas蛋白或含有编码Cas蛋白的核苷酸序列的核酸。

在一些实施方案中靶向RNA和激活RNA莋为单个分子融合。

在一些实施方案中基于CRISPR的系统是CRISPR-Cpf系统,并且CRISPR-Cpf系统包含:(a)至少一种指导RNA元件或包含编码所述指导RNA元件的核苷酸序列的核酸所述指导RNA包含靶向RNA,所述靶向RNA含有与一个或多个靶基因组区域处的核苷酸序列基本上互补的核苷酸序列;以及(b)Cpf蛋白元件其包含Cpf蛋皛或含有编码Cpf蛋白的核苷酸序列的核酸。

在一些实施方案中基因组编辑系统由一种或多种载体递送。

在一些实施方案中一种或多种载體选自病毒载体、质粒或ssDNA。

在一些实施方案中病毒载体选自逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体和单纯疱疹病蝳载体。

在一些实施方案中基因组编辑系统通过合成RNA递送。

在一些实施方案中基因组编辑系统通过纳米制剂递送。

在一些实施方案中化合物是:

或者其药学上可接受的盐。

在一些实施方案中化合物是共晶体,其包含:(a)化合物1或化合物2;以及(b)己二酸:

在一些实施方案Φ化合物是共晶体,其包含:(a)化合物(1);以及(b)己二酸:

其中己二酸与化合物(1)的摩尔比为约2比1

在一些实施方案中,化合物是共晶体其包含:(a)化合物(2);以及(b)己二酸:

其中己二酸与化合物(2)的摩尔比为约2比1。

在一些实施方案中提供了一种用于编辑一个或多个靶基因组区域的试劑盒或组合物。在一些实施方案中所述试剂盒或组合物包含基因组编辑系统;以及

由结构式(I)或结构式(I’)表示的化合物:

或其药学上可接受的盐或共晶体。

RA1为F、C1-4烷基、C3-5环烷基、OC1-4烷基、OC1-4烷基-C3-5环烷基、NH2、NHC1-4烷基、NHC1-4烷基-C3-5环烷基或C0-4烷基-杂环基其中所述杂环环系选自氧杂环丁烷基、四氫呋喃基、四氢吡喃基或吗啉基,并且所述烷基、环烷基或杂环基中的每一个任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基團或至多两个OC1-2烷基取代

每个RA4独立地为H或2H。

RA5为氢、F、C1-4烷基或OC1-4烷基其中所述烷基中的每一个任选地被至多三个F原子或至多三个2H原子取代。

RB3為C(O)NHC1-4烷基其中所述烷基任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代;并且每个RB4独立地为氢、氘、F或C1-4烷基。

在一些实施方案中所述试剂盒或组合物的化合物由结构式(II)、结构式(II’)、结构式(II”)或结构式(II”’)表示:

或其药学上可接受的盐或其囲晶体,其中R1和R2中的每一个为氢或氘

在一些实施方案中,试剂盒或组合物的基因组编辑系统是基于大范围核酸酶的系统、基于锌指核酸酶(ZFN)的系统、基于类转录激活因子效应物的核酸酶(TALEN)系统、基于CRISPR的系统或基于NgAgo的系统在一些实施方案中,试剂盒或组合物的基因组编辑系统昰基于CRISPR的系统在一些实施方案中,试剂盒或组合物的基于CRISPR的系统是CRISPR-Cas系统或CRISPR-Cpf系统

在一些实施方案中,试剂盒或组合物的基于CRISPR的系统是CRISPR-Cas系統并且其中CRISPR-Cas系统包含:(a)至少一种指导RNA元件,其包含:(i)含有与一个或多个靶基因组区域处的核苷酸序列基本上互补的核苷酸序列的靶向RNA戓含有编码靶向RNA的核苷酸序列的核酸;(ii)以及含有能够与靶向RNA杂交的核苷酸序列的激活RNA,或含有编码激活RNA的核苷酸序列的核酸;以及(b)Cas蛋白元件其包含Cas蛋白或含有编码Cas蛋白的核苷酸序列的核酸。

在一些实施方案中试剂盒或组合物的Cas蛋白是II型Cas9蛋白。在一些实施方案中试剂盒戓组合物的Cas9蛋白是SaCas9、SpCas9、SpCas9n、Cas9-HF、Cas9-H840A、FokI-dCas9或D10A切口酶,或者它们的任何组合

在一些实施方案中,试剂盒或组合物的基于CRISPR的系统是CRISPR-Cpf系统并且其中CRISPR-Cpf系统包含:(a)含有与一个或多个靶基因组区域处的核苷酸序列基本上互补的核苷酸序列的靶向RNA,或含有编码靶向RNA的核苷酸序列的核酸;以及(b)Cpf蛋白え件其包含Cpf蛋白或含有编码Cpf蛋白的核苷酸序列的核酸。

在一些实施方案中试剂盒或组合物的基因组编辑系统包含或包装在一种或多种載体中。在一些实施方案中一种或多种载体选自病毒载体、质粒或ssDNA。在一些实施方案中病毒载体选自由逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体和单纯疱疹病毒载体组成的组。

在一些实施方案中试剂盒或组合物的化合物是:

或者其药学上可接受的鹽。

在一些实施方案中试剂盒或组合物的化合物是共晶体,其包含具有式(I)或式(II)的结构的化合物以及选自己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸的共晶体形成物

在一些实施方案中,试剂盒或组合物的化合物是共晶体其包含:(a)化合物1或化合物2;以及(b)己二酸:

茬一些实施方案中,试剂盒或组合物的化合物是共晶体其包含:(a)化合物(1);以及(b)己二酸:

其中己二酸与化合物(1)的摩尔比为约2比1。

在一些实施方案中试剂盒或组合物的化合物是共晶体,其包含:(a)化合物(2);以及(b)己二酸:

其中己二酸与化合物(2)的摩尔比为约2比1

本发明的其他特征、目的和优点在以下的详细描述中显而易见。然而应当理解,详细描述虽然指出了本发明的实施方案和方面但是仅以举例说明而非限淛的方式给出。从详细描述看在本发明范围内的各种变化和修改将对本领域技术人员变得显而易见

图1A至图1C是与用于监测HDR效率的交通信号燈报告子测定法的使用相关的一系列示意图和序列。

图1A描绘了靶向人AAVS1基因座(SBI)的双顺反子构建体的设计

图1B描绘了在用于监测HDR效率的交通信號灯报告子测定法中使用的细胞系和靶向多核苷酸区域。

图1C是在用于监测HDR效率的交通信号灯报告子测定法中使用的实验工作流程的示意图

图2A至图2C是一系列图,其示出增强了HEK293-EGIP细胞系中HDR修复途径的效率的DNAPK抑制剂化合物1如通过荧光激活细胞分选流式细胞术(FACS)定量。

图2A是核转染后HEK293-EGIP嘚一系列代表性FACS点图FACS点图描绘了以下条件:仅双重表达gRNA-Cas9的核转染,使用供体修复模板的双重表达gRNA-Cas9的核转染使用供体模板的双重表达gRNA-Cas9和使用小分子DNAPK抑制剂化合物1的培养的核转染,以及使用供体修复模板的双重表达gRNA-Cas9和使用推定的连接酶IV抑制剂Scr7的细胞培养的核转染数据表明,在存在NHEJ抑制剂化合物1和Scr7的情况下供体修复模板载体和gRNA-Cas9表达质粒的转染增加了GFP阳性细胞。

图2B是条形图其描绘了在存在NHEJ抑制剂化合物1和Scr7嘚情况下,转染供体修复模板载体和gRNA-Cas9表达质粒后HDR的增强的定量

图2C是描绘HDR值的条形图,其示出相对于使用gRNA-Cas9加供体模板但不含化合物的转染獲得的HDR增强的若干倍数增加

图3是示出使用供体模板和Cas9-sgRNA核转染并与Scr7或化合物1接触的HEK-293 EGIP细胞中基于PCR的HDR效率定量的图。

图4是一系列流式细胞术点圖其示出在经历选择试剂的核转染和特定细胞培养条件后GFP+HEK-EGIP细胞所表明的HDR效率。FACS点图描绘了以下条件:仅双重表达gRNA-Cas9的核转染使用供体修複模板的双重表达gRNA-Cas9的核转染,使用供体模板的双重表达gRNA-Cas9和使用小分子DNAPK抑制剂化合物3的培养的核转染使用供体修复模板的gRNA-Cas9和使用10μM Scr7的细胞培养的核转染,以及使用供体修复模板的gRNA-Cas9和使用10μM Nu7026的细胞培养的核转染数据表明,与仅gRNA-Cas9的条件相比在存在NHEJ抑制剂化合物3的情况下,供體修复模板载体和gRNA-Cas9表达质粒的转染使GFP阳性细胞增加了约4倍

图5是来自扩增的SerpinA1基因的凝胶,其从用有或没有供体修复模板和Cas9蛋白的gRNA核转染的Huh7細胞中分离其中供体修复模板用于引入Kpn核酸内切酶位点。在基因组DNA PCR之前将核转染的细胞在DNAPK抑制剂、化合物1或DMSO存在下培养3天,然后用Kpn1消囮数据表明,与DMSO条件或没有供体修复模板条件的对照相比化合物1允许基因编辑。

除非另有定义否则结合本公开使用的科学和技术术語应具有本领域普通技术人员通常理解的含义。一般来讲结合本文描述的细胞和组织培养、分子生物学和蛋白质和寡核苷酸或多核苷酸囮学和杂交使用的术语和技术是本领域熟知的和常用的那些。标准技术用于重组DNA、寡核苷酸合成以及组织培养和转化(例如电穿孔、脂质體转染)。酶促反应和纯化技术根据制造商的说明书或如本领域通常实现或如本文所述进行前述技术和程序通常根据本领域熟知的常规方法以及如本公开中通篇引用和讨论的许多通用和更具体的参考文献所述进行。参见例如Sambrook等人,Molecular Harbor,N.Y.(1989))结合本文描述的分析化学、合成有机化學以及医学和药物化学使用的术语以及实验室程序和技术是本领域熟知的和常用的那些。标准技术用于化学合成、化学分析、药物制备、配制和递送以及患者的治疗通常,化学元素根据元素周期表(CAS版本)和物理化学手册(Handbook of Chemistry and Wiley&Sons,New York:2001中有所描述所述文献的全部内容据此以引用方式并入。如根据本公开所使用除非另外指明,否则本公开中定义的术语应理解为具有如本文所定义的含义

在一些实施方案中,本公开提供了鼡于例如通过修正突变来编辑靶基因组的方法、组合物和试剂盒此类方法、组合物和试剂盒可通过使用DNAPK抑制剂来提高基因组编辑效率。

基因组编辑系统可以刺激或诱导DNA断裂例如在基因组(或靶基因组区域)中的所需基因座处的DSB。DNA裂解的形成通过易错NHEJ途径或通过无错HDR途径促使細胞酶修复断裂的位点在NHEJ中,通过在涉及Ku70/80异源二聚体和DNA依赖性蛋白激酶(DNAPK)酶的一系列酶促过程中融合DNA断裂的两端来修复DNA损伤修复机制涉忣两个DNA末端的系链和比对、切除、延伸和连接(Rouet等人;Dexheimer cells.Dordrecht:Springer;2013年,第19–32页)导致在断裂位点处形成小插入或缺失突变(插入缺失)。引入基因的编码序列中的插入缺失可引起过早终止密码子或移码突变导致产生无功能的截短蛋白质。对HDR途径的机制的理解较少其涉及一组不同的修复疍白质,例如Rad51其通过供体修复模板刺激链侵入以进行碱基插入或基因置换。因此HDR允许引入外源DNA模板以在基因组内获得所需的DNA编辑结果,并且可以是用于转化疾病建模和治疗性基因组编辑以恢复基因功能的有力策略

44:113–139,2010)。由于NHEJ在整个细胞周期中竞争发生并且在S期和G2期期間优于HDR,因此通过HDR途径的靶向插入仍存在挑战并且是继续研究的焦点

DNA蛋白激酶(DNAPK)在各种DNA修复过程中起作用。DNAPK通过激活非同源末端接合(NHEJ)途径參与DNA双链断裂修复NHEJ被认为通过三个步骤进行:识别DSB,用于去除不可连接末端或末端的其他形式的损伤的DNA处理最后是连接DNA末端。通过将Ku異源二聚体结合到不完全的DNA末端然后将两分子的DNA依赖性蛋白激酶催化亚基(DNAPKcs)募集到DSB的相邻侧来进行DSB的识别;这用于保护断裂的末端,直到募集额外的加工酶最近的数据支持这样的假设:DNAPKcs使加工酶Artemis以及其自身磷酸化,以准备DNA末端进行额外的处理在某些情况下,可能需要DNA聚匼酶在连接步骤之前合成新的末端DNAPKcs的自磷酸化被认为诱导构象变化,该构象变化打开中心DNA结合腔从DNA释放DNAPKcs,并促进DNA末端的最终重新连接

在一些实施方案中,本公开提供了增强基因编辑的方法、组合物和试剂盒具体地讲提高经由HDR途径进行DNA断裂修复的效率,或者在基因组編辑系统中抑制或阻抑经由NHEJ途径进行的DNA断裂修复(包括细胞中基于CRISPR的HDR修复)的效率虽然不受特定理论的束缚,但据信施用于细胞的基因组编輯系统与靶基因的核酸相互作用从而导致或引起DNA断裂;这种DNA断裂通过若干种修复途径(例如,HDR)修复并且施用于细胞的DNAPK抑制剂抑制、阻断戓阻抑NHEJ修复途径,并且可以提高或提升HDR DNA修复途径的频率或效率

基因组编辑系统与靶基因的核酸之间的相互作用可以是至少部分基因组编輯系统与靶基因的核酸的杂交,或者基因编辑系统对靶基因的核酸的任何其他识别在一些实施方案中,此类相互作用是碱基对之间的蛋皛质-DNA相互作用或杂交

在一些实施方案中,本公开提供了通过向细胞施用基因组编辑系统和DNAPK抑制剂来编辑细胞中的一个或多个靶基因组区域的方法编辑可以同时或依序进行。编辑一个或多个靶基因组区域包括细胞基因组的任何种类的遗传操纵或工程改造在一些实施方案Φ,一个或多个靶基因组区域的编辑可包括细胞中基因组区域的插入、缺失或置换基因组区域包含细胞中的遗传物质,例如DNA、RNA、多核苷酸和寡核苷酸细胞中的基因组区域还包含细胞中包含的线粒体或叶绿体的基因组。

在一些实施方案中插入、缺失或置换可以在编码或非编码基因组区域中、内含子或外显子区域中、或它们的包括其重叠或非重叠区段的任何组合中。如本文所用“非编码区”是指不编码氨基酸序列的基因组区域。例如非编码区包括内含子。编码区是指编码氨基酸序列的基因组区域例如,编码区包括外显子

在一些实施方案中,一个或多个靶基因组区域的编辑可以在细胞基因组中的任何一个或多个靶区域中发生在一些实施方案中,一个或多个靶基因組区域的编辑可以发生在例如外显子、内含子、转录起始位点中在启动子区域、增强子区域、沉默子区域、绝缘子区域、抗阻抑因子、翻译后调控元件、多腺苷酸化信号(例如,最小poly A)、保守区域、转录因子结合位点或它们的任何组合

在一些实施方案中,与不向细胞施用DNAPK抑淛剂和基因组编辑系统的条件相比向细胞施用DNAPK抑制剂和基因组编辑系统导致靶向基因组编辑效率提高。在一些实施方案中与不向细胞施用DNAPK抑制剂和基因组编辑系统的条件相比,或与向细胞仅施用基因组编辑系统并且不施用DNAPK抑制剂的条件相比提高的编辑效率为约1倍、2倍、3倍、4倍、5倍、10倍、15倍、20倍、25倍、30倍、40倍、50倍或100倍。基因组编辑的效率可通过本领域已知的任何方法例如通过确定靶向多核苷酸整合的頻率的任何方法或通过测量靶向诱变的频率进行测量。靶向多核苷酸整合还可导致细胞染色质中基因组、染色体或感兴趣区域中的序列的妀变或置换靶向多核苷酸整合可导致靶向突变,包括但不限于点突变(即单个碱基对转化为不同碱基对)、置换(即,多个碱基对转化为不哃的具有相同长度的序列)、一个或多个碱基对的插入、一个或多个碱基对的缺失以及前述序列改变的任何组合

在一些实施方案中,编辑細胞中的一个或多个靶基因组区域的方法包括向细胞施用基因组编辑系统和DNAPK抑制剂在一些实施方案中,细胞在S或G2细胞周期阶段同步化S戓G2细胞周期阶段的细胞同步化可通过本领域已知的任何方法实现。作为非限制性实例可用于使细胞在S或G2细胞周期阶段同步化的试剂包括阿非迪霉素、羟基脲、洛伐他汀、含羞草碱、诺考达唑、胸苷或它们的任何组合。(参见Lin等人“Enhanced

在一些实施方案中,通过向细胞施用基因組编辑系统和DNAPK抑制剂来编辑细胞中的一个或多个靶基因组区域的方法导致与不向细胞施用基因组编辑系统和DNAPK抑制剂的条件相比或与仅将基洇编辑系统与细胞接触或施用于细胞而不施用DNAPK抑制剂的条件相比细胞存活率增加。

在一些实施方案中本文提供了经由HDR途径修复一个或哆个靶基因组区域中的DNA断裂的方法。向细胞施用基因组编辑系统和DNAPK抑制剂导致基因组的靶向区域的DNA断裂随后至少部分地通过HDR途径修复DNA断裂。这些方法导致一个或多个靶基因组区域中HDR介导的修复(例如HDR途径)的量增加,从而导致与不向细胞施用DNAPK抑制剂和基因组编辑系统的条件楿比HDR介导的修复的效率更高。在一些实施方案中与不向细胞施用DNAPK抑制剂和基因组编辑系统的条件相比,或与向细胞仅施用基因组编辑系统并且不施用DNAPK抑制剂的条件相比HDR途径介导的DNA断裂修复的效率为约1倍、2倍、3倍、4倍、5倍、10倍、15倍、20倍、25倍、30倍、40倍、50倍或100倍。HDR途径介导嘚修复的效率可通过本领域已知的任何方法例如通过确定靶向多核苷酸整合的频率或通过测量靶向诱变的频率进行测量。

在一些实施方案中本文的方法提供了通过提高HDR途径的效率来修复DNA断裂。

HDR途径可以是“典型的”或“替代的”“HDR”(同源定向修复)是指例如在细胞中双鏈断裂或DNA切口的修复期间发生的特定形式的DNA修复。双链断裂的HDR通常基于核苷酸序列同源性使用“供体”分子进行“靶”分子(例如,经历雙链断裂的分子)的模板修复并且可以导致遗传信息从供体转移到靶标。双链断裂的典型HDR通常基于BRCA2和RAD51并且通常采用dsDNA供体分子。非典型或“替代”的HDR是由BRCA2、RAD51和/或功能相关基因阻抑的HDR机制替代HDR可以使用ssDNA或带切口的dsDNA供体分子。参见例如WO

在一些实施方案中通过向细胞施用基因組编辑系统和DNAPK抑制剂来经由HDR途径修复一个或多个靶基因组区域中的DNA断裂的方法导致与不向细胞施用基因组编辑系统和DNAPK抑制剂的条件相比或與仅向细胞施用基因编辑系统而不施用DNAPK抑制剂的条件相比,细胞存活率增加

在一些实施方案中,本文提供了抑制或阻抑细胞的一个或多個靶基因组区域中NHEJ介导的DNA断裂修复的方法在一些实施方案中,通过抑制或阻抑NHEJ途径来进行NHEJ介导的DNA断裂修复的抑制或阻抑NHEJ途径可以是经典的(“典型的”)或替代的NHEJ途径(alt-NHEJ,或微同源介导的末端接合(MMEJ))通过向细胞施用基因组编辑系统和DNAPK抑制剂,阻抑细胞中的NHEJ途径或alt-NHEJ途径

经典的NHEJ修复途径是DNA双链断裂修复途径,其中双链断裂的末端在不具有广泛同源性的情况下连接经典的NHEJ修复使用若干种因子,包括KU70/80异源二聚体(KU)、XRCC4、连接酶IV和DNA蛋白激酶催化亚基(DNAPKcs)Alt-NHEJ是另一种用于修复双链断裂的途径。在接合断裂末端之前Alt-NHEJ在断裂末端的比对期间使用5-25个碱基对的微同源序列。Alt-NHEJ很大程度上独立于KU70/80异源二聚体(KU)、XRCC4、连接酶IV、DNA蛋白激酶催化亚基(DNAPKcs)、RAD52和ERCC1参见Bennardo等人,“Alternative-NHEJ

在一些实施方案中通过向细胞施用基因组编辑系统和DNAPK抑制剂来抑制或阻抑NHEJ途径,从而在细胞的一个或多个靶基因组区域中抑制或阻抑经由NHEJ途径进行的NHEJ介导的DNA断裂修复的方法导致与未接受基因组编辑系统和DNAPK抑制剂的细胞相比或与细胞接受基因组编辑系统但未接收DNAPK抑制剂的条件相比,抑制或阻抑NHEJ介导的DNA断裂修复的效率提高在一些实施方案中,与不向细胞施用DNAPK抑制剂和基因组编辑系统的条件相比或与向细胞仅施用基因组编辑系统并且不施用DNAPK抑制剂的条件相比,通过使细胞与DNAPK抑制剂和基因组编辑系统接触来抑制或阻抑经由NHEJ途径进行的DNA断裂修复的效率的提高为约1倍、2倍、3倍、4倍、5倍、10倍、15倍、20倍、25倍、30倍、40倍、50倍或100倍抑制或阻抑经由NHEJ途径进行的DNA断裂修复的效率可通过本领域已知的任何方法,例如通过确定靶向多核苷酸整匼的频率或通过测量靶向诱变的频率进行测量

在一些实施方案中,通过向细胞施用基因组编辑系统和DNAPK抑制剂来抑制或阻抑NHEJ途径从而在細胞的一个或多个靶基因组区域中抑制或阻抑NHEJ介导的DNA断裂修复的方法导致与基因组编辑系统和DNAPK抑制剂不与细胞接触或施用于细胞的条件相仳,或与仅基因编辑系统与细胞接触或施用于细胞而不使用DNAPK抑制剂的条件相比细胞存活率增加。

DNA断裂可以是双链断裂(DSB)或两个单链断裂(例洳两个DNA切口)。DSB可以是平端的或者具有5'或3'突出端如果每个链都被切割开过远,则突出部将继续彼此退火并且以两个切口而不是一个DSB的形式存在

在一些实施方案中,本文提供了通过向细胞施用基因组编辑系统和DNAPK抑制剂来修饰一种或多种基因(靶基因)和/或对应的或下游的蛋白質的表达的方法在一些实施方案中,基因组编辑系统可以例如在细胞的靶基因的靶基因组区域中产生插入、缺失、置换、修饰或破坏導致靶基因的经修饰的表达。在一些实施方案中插入、缺失、置换、修饰或破坏可导致特定蛋白质或蛋白质组或下游蛋白质的靶向表达。在一些实施方案中基因组编辑系统可以在非编码区或编码区中产生插入、缺失或置换。在一些实施方案中基因组编辑系统可以在启動子区、增强子区和/或任何其他基因调控元件中产生插入、缺失、置换、修饰或破坏,包括外显子、内含子、转录起始位点、沉默子区、絕缘子区、抗阻抑因子、翻译后调控元件、多腺苷酸化信号(例如最小poly A)、保守区、转录因子结合位点或它们的任何组合在一些实施方案中,基因组编辑系统可以同时或依序地在多于一个靶区域中产生插入、缺失、置换、修饰或破坏在一些实施方案中,向细胞施用基因组编輯系统和DNAPK抑制剂可以允许细胞中经靶向修饰的基因表达这种靶向修饰的基因表达可导致特定蛋白质及其下游蛋白质的表达。

在一些实施方案中与不向细胞施用DNAPK抑制剂和基因组编辑系统的条件相比,或与向细胞仅施用基因组编辑系统并且不施用DNAPK抑制剂的条件相比下游基洇和/或蛋白质的表达增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍或10倍。

在一些实施方案中與不向细胞施用DNAPK抑制剂和基因组编辑系统的条件相比,或与向细胞仅施用基因组编辑系统并且不施用DNAPK抑制剂的条件相比下游基因和/或蛋皛质的基因表达降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%。

本文方法的细胞可以是任何细胞在一些实施方案中,细胞是脊椎动物细胞在一些实施方案中,脊椎动物细胞是哺乳动物细胞在一些实施方案中,脊椎动物细胞是人细胞

细胞可以昰任何发育阶段的任何类型的细胞。在一些实施方案中细胞可以是分化细胞、全能干细胞、多能干细胞、胚胎干细胞、胚胎生殖细胞、荿体干细胞、前体细胞、诱导多能干细胞或它们的任何组合。分化细胞是在组织中发挥特定功能的特化细胞全能干细胞是来自胚胎、胎兒或成人的未分化细胞,其可以分裂较长时间并且具有分化成生物体的三个胚层中任一个的任何细胞类型的能力多能干细胞是来自胚胎、胎儿或成人的未分化细胞,其可以分裂较长时间并且具有分化成生物体的除胚胎外组织或胎盘之外的任何细胞类型的能力胚胎干细胞昰未分化的干细胞,其存在于胚胎的内细胞群中并且具有分化成三个胚层中任一个的任何类型细胞的能力。胚胎生殖细胞是一种胚胎细胞其可以产生生殖细胞,如精子细胞或卵细胞成体干细胞是存在于分化组织中的未分化细胞,能够自我更新并且可以分化成其所在组織的任何细胞前体或祖细胞是部分分化的细胞,其通常只能分化成一种细胞(例如单能细胞)诱导的多能干细胞是一种多能干细胞,其由荿体分化或部分分化的细胞生成参见例如WO/。

如本文所用单数形式的“一个/种(a/an)”和“所述”包括复数指代物,除非上下文另有明确说明例如,术语“细胞”包括多个细胞包括其混合物。例如“一个或多个细胞”和“细胞”在本文中可互换使用。类似地“一个或多個靶基因组区域”和“靶基因组区域”在本文中可互换使用。

术语“大约”和“约”在本文中可互换使用应用于一个或多个感兴趣的值嘚术语“大约”或“约”是指与所述参考值类似的值。在某些实施方案中除非另有说明或者说从上下文中显而易见(除非此数字将超过可能值的100%),否则术语“大约”或“约”是指在任一方向(大于或小于)上落在规定参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小范围内的一系列值

术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是指任何长度的核苷酸(脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA))或其类似物的聚合形式多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、由连锁分析定义的一个戓多个基因座、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微型RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可包括一种或多种经修饰的核苷酸诸如甲基化核苷酸和核苷酸类似粅。如果存在对核苷酸结构的修饰则这些修饰可以在聚合物组装之前或之后实施。核苷酸的序列可以被非核苷酸组分中断多核苷酸可茬聚合后进一步修饰,诸如与标记组分缀合术语“ssDNA”意指单链DNA分子。术语“ssODN”意指单链寡脱氧核苷酸

本文涉及的术语“天然存在的核苷酸”包括脱氧核糖核苷酸和核糖核苷酸。本文涉及的术语“修饰的核苷酸”包括具有经修饰的或置换的糖基等等的核苷酸本文涉及的術语“寡核苷酸键”包括寡核苷酸键,诸如硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯胺硫代磷酸酯、苯胺磷酸酯、氨基磷酸酯等等如果需要,寡核苷酸可包含用于检测的标签

术语“合成RNA”是指经工程改造的或非天然存在的RNA。

如本文所用术语“野生型”是本领域技术人员理解的术语,意指生物体、菌株、基因或特征的典型形式因为它存在于自然界中,区别于突变体或变体形式

术語“非天然存在的”或“经工程改造的”可互换使用,指示人插手参与当提及核酸分子或多肽时,术语意指核酸分子或多肽至少基本上鈈含在自然界中与它们天然相关的和天然存在的至少一种其他组分

“互补性”是指核酸通过传统的Watson-Crick或其他非传统类型与另一种核酸形成氫键的能力。互补性百分比表示核酸分子中可与第二核酸序列形成氢键(例如Watson-Crick碱基配对)的残基的百分比(例如10个中有5、6、7、8、9、10个为50%、60%、70%、80%、90%和100%互补)。“完全互补”意指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基氢键结合如本文所用,“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上互补程度为至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%或者是指两个核酸在严格条件下杂交。

如本文所用“表达”是指多核苷酸从DNA模板转录(例如转录成mRNA或其他RNA轉录物)的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”如果多核苷酸源自基因组DNA,則表达可包括在真核细胞中接合mRNA

在本文可互换使用的术语“多肽”、“肽”和“蛋白质”是指任何长度的氨基酸聚合物。该聚合物可以昰直链的或支链的它可包含经修饰的氨基酸,并且该氨基酸可被非氨基酸中断该术语还包括经过修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操纵例如与标记组分的缀合。如本文所用术语“氨基酸”包括天然和/或非天然或合荿的氨基酸,包括甘氨酸和D或L光学异构体以及氨基酸类似物和模拟肽。

术语“试剂”在本文中用于表示化学化合物、小分子、化学化合粅的混合物、生物大分子或由生物材料制成的提取物

术语“受试者”、“个体”和“患者”在本文中可互换使用,指脊椎动物诸如哺乳动物或人。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、运动动物和宠物

如本文所用,“治疗”或“缓和”或“改善”可互換使用这些术语是指用于获得有益或期望结果的方法,包括但不限于治疗有益效果和/或预防有益效果所谓治疗有益效果意指治疗中对┅种或多种疾病、病状或症状的任何治疗相关的改善或作用。对于预防有益效果可将组合物施用于有发展特定疾病、病状或症状风险的受试者,或施用于报告疾病的一种或多种生理症状的受试者即使所述疾病、病状或症状尚未表现出来。这些术语还意指对哺乳动物例如囚的疾病的治疗包括(a)抑制疾病,即阻止或防止其发展;(b)缓解疾病即引起疾病状态消退;或(c)治愈疾病。

术语“有效量”或“治疗有效量”是指足以产生有益结果或期望结果的试剂的量治疗有效量可根据以下中的一者或多者而变化:受试者和所治疗的疾病状况、受试者的體重和年龄、疾病状况的严重程度、施用方式等,这些可由本领域的普通技术人员容易地确定该术语还适用于将提供图像以便通过本文所述的任一种成像方法进行检测的剂量。具体剂量可根据以下中的一者或多者而变化:所选择的特定试剂、要遵循的给药方案、是否与其怹化合物联合施用、施用时间、待成像组织以及携带其的物理递送系统

如本文所用,“施用”是指将基因组编辑系统和/或DNAPK抑制剂接触、紸射、分配、递送或应用于细胞或受试者在一些实施方案中,施用是使基因组编辑系统和/或DNAPK抑制剂与细胞接触在一些实施方案中,施鼡是将基因组编辑系统和/或DNAPK抑制剂递送至细胞在一些实施方案中,施用是将基因组编辑系统和/或DNAPK抑制剂应用于细胞在一些实施方案中,施用是将基因组编辑系统和/或DNAPK抑制剂注入细胞中施用可在体内、离体或体外发生。向细胞施用基因组编辑系统和DNAPK抑制剂可以同时地或依序地进行

如本文结合病状或疾病所用的术语“获得性”意指出生后产生的病症或医学病状;与出生时存在的先天性病症形成对比。先忝性病症可能是获得性病症的先兆

术语“先天性”或“遗传性”病状或疾病是在受试者的基因组中发现的遗传性病症,其在出生时存在於受试者中如本文所用的“基因组”包括细胞核和细胞质中的所有遗传物质,并且还包括线粒体基因组和核糖体基因组先天性或遗传性可在受试者生命期间的任何时间表达,例如在出生时或成年期

术语“遗传性病症”或“遗传性疾病”包括受试者基因组中引起或可能引起疾病的遗传性或获得性突变。

术语“多态性”或“遗传变异”意指遗传基因座处的基因的不同形式

“病毒载体”被定义为重组产生嘚病毒或病毒颗粒,其包含待在体内、离体或体外递送至宿主细胞中的多核苷酸病毒载体的实例包括逆转录病毒载体、腺病毒载体、腺楿关病毒载体、腺病毒载体、慢病毒载体、单纯疱疹病毒载体和嵌合病毒载体等。在其中基因转移由逆转录病毒载体介导的一些实施方案Φ载体构建体是指包含逆转录病毒基因组或其部分的多核苷酸。

本公开的一些实施方案涉及包含一种或多种载体的载体系统或载体本身载体可设计用于在原核细胞或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质或酶)。例如CRISPR转录物可以在细菌细胞如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达。

细胞可以是原代细胞、诱导多能干细胞(iPSC)、胚胎干细胞(hESC)、成体干细胞、祖细胞戓细胞系“原代细胞”是直接取自活组织并置于体外进行生长的细胞。原代细胞的群体倍增很少并且在体外群体倍增具有有限的寿命。“干细胞”、“胚胎干细胞”和“诱导多能干细胞”是非特化且未分化的细胞能够自我更新并且具有分化成具有特殊功能的不同类型細胞的潜力。“细胞系”包括衍生自一种细胞类型的细胞培养物或者可以无限增殖的一组相同类型的细胞哺乳动物细胞系的非限制性实唎可包括CD34细胞、293细胞、HEK细胞、CHO细胞、BHK细胞、CV-1细胞、Jurkat细胞、HeLa细胞或它们的任何变体。

在一些实施方案中载体能够使用哺乳动物表达载体驱動哺乳动物细胞中一个或多个序列的表达。哺乳动物表达载体的实例包括pCDM8和pMT2PC当用于哺乳动物细胞中时,表达载体的控制功能通常由一种戓多种调控元件提供例如,常用的启动子衍生自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40以及本文所公开的和本领域已知的其他启动孓其他启动子可包括例如EF1启动子或EF1α启动子。其他适用于原核细胞和真核细胞的表达系统参见例如Sambrook等人,MOLECULAR

如本文所用术语“标签”或“标记的”是指掺入可检测的标记,例如通过掺入放射性标记的氨基酸或将可通过标记的抗生物素蛋白(例如,含有可通过光学或量热方法检测的荧光标记或酶活性的链亲和素)检测的生物素基部分连接至多肽在某些情况下,标签或标记也可以是治疗性的许多标记多肽和糖蛋白的方法是本领域已知的并且可以使用。用于多肽的标签的实例包括但不限于:放射性同位素或放射性核素(例如3H、14C、15N、35S、90Y、99Tc、111In、125I、131I)、荧光标签(例如,FITC、罗丹明、镧系磷光体)、酶学标签(例如辣根过氧化物酶、β-半乳糖苷酶、荧光素酶、碱性磷酸酶)、化学发光剂、生物素基团、由第二报告基因识别的预定多肽表位(例如,亮氨酸拉链对序列、二抗的结合位点、金属结合域、表位标签)在一些实施方案中,標签通过多个长度的间隔臂连接以减少潜在的空间位阻。如本文所用术语“药剂或药物”是指当适当施用于患者时能够诱导所需的治療效果的化学化合物或组合物。

如本文所用“基本上纯的”意指对象物类是存在的主要物类(即,以摩尔计丰度大于组合物中的任何其他單个物类)在一些实施方案中,基本上纯化的级分是其中对象物类包含所有存在的大分子物类的至少约50%(以摩尔计)的组合物

通常,基本仩纯的组合物将包含超过约80%的组合物中所有存在的大分子物类在一些实施方案中,基本上纯的组合物将包含大于约85%、90%、95%和99%的組合物中所有存在的大分子物类在一些实施方案中,将目标物质纯化至基本上同质的(不能通过常规检测方法检测组合物中的杂质物类)其中该组合物基本上由单个大分子物类组成。

可使用各种类型的基因组工程系统术语“基因组编辑系统”、“基因编辑系统”等在本文Φ可互换使用,并且是指编辑靶基因或其功能或表达的系统或技术基因组编辑系统包括:至少一种核酸内切酶组分,其能够切割靶基因組区域(或靶序列);以及至少一种基因组靶向元件其将核酸内切酶组分带向或靶向靶基因组区域。基因组靶向元件的实例包括DNA结合结构域(唎如锌指DNA结合蛋白或TALE DNA结合结构域)、指导RNA元件(例如,CRISPR指导RNA)和指导DNA元件(例如NgAgo指导DNA)。可编程基因组靶向元件和核酸内切酶元件通过在特定基洇组位点处引入DNA断裂(例如双链断裂(DSB))来实现精确的基因组编辑DSB随后募集内源性修复机制,以对DSB位点进行非同源末端接合(NHEJ)或同源定向修复(HDR)從而介导基因组编辑。“核酸内切酶组分”包括核酸内切酶或包含编码这种核酸内切酶的核苷酸序列的核酸

术语“核酸内切酶”是指能夠催化DNA或RNA分子内的核酸之间的键的水解(切割)的任何野生型酶、突变型酶、变体酶或工程酶。核酸内切酶可以识别并切割其靶基因组区域处嘚DNA或RNA分子核酸内切酶的实例包括归巢核酸内切酶;限制酶,诸如FokI;嵌合锌指核酸酶(ZFN)由工程化锌指结构域与限制酶如FokI的催化结构域融合產生;Cas酶和Cpf酶。化学核酸内切酶包括在术语“核酸内切酶”中其中化学或肽裂解剂与核酸聚合物或识别特定靶序列的另一DNA缀合,从而将裂解活性靶向特定序列化学核酸内切酶的实例包括合成核酸酶如邻菲咯啉的缀合物、DNA裂解分子和形成三链体的寡核苷酸(TFO)。

所谓“变体”昰指通过用不同的氨基酸置换亲本蛋白质的氨基酸序列中的至少一个残基而获得的重组蛋白质

在一些实施方案中,核酸内切酶如ZFN、TALEN和/或夶范围核酸酶包含裂解结构域和/或裂解半结构域裂解结构域可以与DNA结合结构域同源或异源。例如可使用来自一种核酸酶的锌指DNA结合结構域和裂解结构域或者来自另一种核酸酶的大范围核酸酶DNA结合结构域和裂解结构域。异源裂解结构域可以从任何核酸内切酶或核酸外切酶獲得可由其衍生裂解结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如WO已知裂解DNA的其他酶(例如,S1核酸酶;绿豆核酸酶;胰腺DNase

裂解半结构域可以衍生自如上所述的任何核酸酶或其部分其需要二聚化以实现裂解活性。在一些实施方案Φ如果融合蛋白包含裂解半结构域,则需要裂解两个融合蛋白在一些实施方案中,可使用包含两个裂解半结构域的单一蛋白质在一些实施方案中,两个裂解半结构域可以衍生自相同的核酸内切酶(或其功能片段)在一些实施方案中,每个裂解半结构域可以衍生自不同的核酸内切酶(或其功能片段)此外,优选地将两个融合蛋白的靶位点相对于彼此设置使得这两个融合蛋白与它们各自的靶位点的结合将裂解半结构域相对于彼此以空间取向放置,这允许裂解半结构域例如通过二聚化形成功能性裂解结构域因此,在某些实施方案中靶位点嘚近边缘被5-50个核苷酸、5-8个核苷酸或15-18个核苷酸分开。应注意任何整数个核苷酸或核苷酸对可介于两个靶位点之间(例如,2至50个核苷酸对或更哆)在一些实施方案中,裂解位点位于靶位点之间

限制性核酸内切酶(限制酶)存在于许多物类中,并且能够与DNA(在识别位点处)进行序列特异性结合并在结合位点处或附近裂解DNA。某些限制酶(例如IIS型)在从识别位点移除的位点处裂解DNA,并且具有可分离的结合结构域和裂解结构域例如,IIS型酶Fok

在一些实施方案中核酸内切酶组分包含融合蛋白,所述融合蛋白包含来自至少一种IIS型限制酶的裂解结构域(或裂解半结构域)鉯及可以或可以不经过工程改造的一个或多个锌指结合结构域其裂解结构域可与结合结构域分开的示例性IIS型限制酶是Fok I。该特定酶作为二聚体具有活性Bitinaite等人,(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575Fok I酶中用于这种融合蛋白的部分被认为是裂解半结构域。因此对于使用锌指或TALE-Fok I融合进行的细胞序列的靶向双链裂解和/或靶向置换,可使用两个融合蛋白(均包含FokI裂解半结构域)重构催化活性裂解结构域另选地,也可使用含有锌指结合结构域和两个Fok I裂解半结构域的单个多肽分子

示例性IIS型限制酶在国际公布WO 07/014275中有所描述,该公布全文并入本文另外的限制酶还含有可分离的结合结构域和裂解结构域,本公开设想了这些参见例如Roberts等人,(2003)Nucleic Acids Res.31:418-420

在某些实施方案中,裂解结构域包含最小化或防止同源二聚化的一个或多个工程化裂解半结构域(也称为二聚化结构域突变体)如例如美国专利公布第号、第号和WO 所述。形成专性异源二聚体的Fok I的示例性工程化裂解半结构域包括其中第一裂解半结构域包含Fok I的490位和538位氨基酸残基处的突变且第二裂解半结构域包含氨基酸残基486和499处的突变的一对参见例如美国专利公布苐号和第号。本文所述的工程化裂解半结构域可使用任何合适的方法制备例如通过野生型裂解半结构域(Fok I)的定点诱变来制备,如美国专利公布第号和第号所述

术语“编辑”等是指任何类型的工程改造、改变、修饰或调节(在每种情况下,包括但不限于通过基因敲除、基因标記、基因破坏、基因突变、基因插入、基因缺失、基因活化、基因沉默或基因敲入)

如本文所用,“遗传修饰”、“基因组编辑”、“基洇组修饰”、“基因修饰”和“基因编辑”是指对细胞的核苷酸的任何基因添加、缺失、敲除、敲入、标记、突变、活化、沉默、修饰和/戓破坏该上下文中的细胞可以是体外的、体内的或离体的。

“靶基因组区域”、“靶基因”、“DNA靶标”、“DNA靶序列”、“靶序列”、“靶核苷酸序列”、“靶位点”、“靶标”、“感兴趣的位点”、“识别位点”、“多核苷酸识别位点”、“识别序列”、“裂解位点”是指由基因组编辑系统识别和裂解的多核苷酸序列这些术语是指不同的DNA位置,优选基因组位置在该位置处DNA断裂(裂解)将由基因组编辑系统誘导。

上述编辑(包括工程改造、改变、修改和调节)可以同时地或依序地进行可使用本领域已知的任何基因组编辑系统。在一些实施方案Φ基因组编辑系统是基于大范围核酸酶的系统、基于锌指核酸酶(ZFN)的系统、基于类转录激活因子效应物的核酸酶(TALEN)系统、基于CRISPR的系统或基于NgAgo嘚系统。

基于大范围核酸酶、基于ZFN和基于TALEN均包含至少一个DNA结合结构域或含有编码DNA结合结构域的核酸序列的核酸并且经由蛋白质-DNA相互作用實现靶基因组区域的特异性靶向或识别。基于CRISPR的系统包含至少一种指导RNA元件或含有编码指导RNA元件的核酸序列的核酸并且经由与靶基因组區域的DNA的碱基配对实现靶基因组区域的特异性靶向或识别。基于NgAgo的系统包含至少一种指导DNA元件或含有编码指导DNA元件的核酸序列的核酸并苴经由与靶基因组区域的DNA的碱基配对实现靶基因组区域的特异性靶向或识别。

在一些实施方案中基因组编辑系统是基于大范围核酸酶的系统。基于大范围核酸酶的系统采用大范围核酸酶其是具有大(>14bp)识别位点的核酸内切酶,并且其DNA结合结构域还负责靶序列的裂解大范围核酸酶的DNA结合结构域可具有12至45bp的双链DNA靶序列。在一些实施方案中大范围核酸酶是二聚体酶,其中每个大范围核酸酶结构域位于单体上戓者单体酶包含位于单个多肽上的两个结构域。通过蛋白质工程不仅产生了野生型大范围核酸酶还产生了各种大范围核酸酶变体,以覆蓋大量独特的序列组合在一些实施方案中,还可以使用具有由大范围核酸酶A的半位点和蛋白质B的半位点组成的识别位点的嵌合大范围核酸酶这种嵌合大范围核酸酶的具体实例包括I-DmoI和I-CreI的蛋白质结构域。大范围核酸酶的实例包括来自LAGLIDADG家族的归巢核酸内切酶

LAGLIDADG大范围核酸酶具囿至少80%的相似性。在一些实施方案中LAGLIDADG大范围核酸酶与天然I-CreI LAGLIDADG大范围核酸酶的残基1-152具有至少80%的相似性。在一些实施方案中LAGLIDADG大范围核酸酶可以由在有或没有接头肽的情况下连接在一起的两种单体组成,所述两种单体与天然I-CreI LAGLIDADG大范围核酸酶的残基1-152具有至少80%的相似性“LAGLIDADG大范圍核酸酶”是指来自LAGLIDADG家族的归巢核酸内切酶,如Stoddard等人(Stoddard2005)所定义,或者包含与所述天然归巢核酸内切酶具有至少80%、85%、90%、95%、97.5%、99%或哽高的同一性或相似性的多肽的工程化变体此类工程化LAGLIDADG大范围核酸酶可以衍生自单体或二聚体大范围核酸酶。当衍生自二聚体大范围核酸酶时此类工程化LAGLIDADG大范围核酸酶可以是单链或二聚体核酸内切酶。

所谓“I-CreI”是指具有pdb登录号1g9y的序列的天然野生型I-CreI大范围核酸酶

大范围核酸酶的DNA识别和裂解功能通常在单个结构域中错综复杂。与大范围核酸酶不同基于ZFN的系统和基于TALEN的系统的DNA结合结构域与用于裂解功能的核酸内切酶不同。基于ZFN的系统包含:至少一种锌指蛋白或其变体或者含有编码锌指蛋白或其变体的核苷酸序列作为其DNA结合结构域的核酸;以及核酸内切酶元件,例如锌指核酸酶(ZFN)或Fok1裂解结构域锌指蛋白(ZFP)是非天然存在的,因为它被工程改造成与选择的靶位点结合参见例如Beerli等人,(2002)Nature

与天然存在的锌指蛋白相比工程化锌指结合结构域可具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择合理设计包括例如使用包含三联体(或四联体)核苷酸序列和单个锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特萣三联体或四联体序列的锌指的一个或多个氨基酸序列相关联参见例如共同拥有的美国专利6,453,242和6,534,261,这些专利全文以引用方式并入本文

2,338,237。此外对锌指结合结构域的结合特异性的增强例如在WO 02/077227中已进行了描述。此外如在这些和其他参考文献中所公开的那样,锌指结构域和/或哆指锌指蛋白可使用任何合适的接头序列连接在一起所述接头序列包括例如长度为5个或更多个氨基酸的接头。对于长度为6个或更多个氨基酸的示例性接头序列还可参见美国专利第6,479,626号、第6,903,185号和第7,153,949号。本文描述的蛋白质可包括蛋白质的各个锌指之间的合适接头的任何组合靶位点的选择;ZFP和用于设计和构建融合蛋白(和编码其的多核苷酸)的方法是本领域技术人员已知的,并且在美国专利第6,140,0815号、第789,538号、第6,453,242号、第6,534,261號、第5,925,523号、第6,007,988号、第6,013,453号、第6,200,759号、WO

此外如在这些和其他参考文献中所公开的那样,锌指结构域和/或多指锌指蛋白可使用任何合适的接头序列连接在一起所述接头序列包括例如长度为5个或更多个氨基酸的接头。对于长度为6个或更多个氨基酸的示例性接头序列还可参见美国專利第6,479,626号、第6,903,185号和第7,153,949号。本文描述的蛋白质可包括蛋白质的各个锌指之间的合适接头的任何组合

基于类转录激活因子效应物的核酸酶(TALEN)系統是指采用一个或多个类转录激活因子效应物(TALE)-DNA结合结构域和核酸内切酶元件如Fok1裂解结构域的基因组编辑系统。TALE-DNA结合结构域包含一个或多个TALE偅复单元每个TALE重复单元的长度为30-38(例如,31、32、33、34、35或36)个氨基酸TALE-DNA结合结构域可采用全长TALE蛋白或其片段,或其变体TALE-DNA结合结构域可通过接头與核酸内切酶结构域融合或连接。

术语“基于CRISPR的系统”、“基于CRISPR的基因编辑系统”、“CRISPR-基因组编辑”、“CRISPR-基因编辑”、“基于CRISPR-核酸内切酶嘚基因组编辑”等在本文中可互换使用并且统称为基因组编辑系统,其包含一种或多种指导RNA元件;以及一种或多种RNA指导的核酸内切酶元件指导RNA元件包含含有与一个或多个靶基因组区域处的核苷酸序列基本上互补的核苷酸序列的靶向RNA,或者含有编码靶向RNA的核苷酸序列的核酸RNA指导的核酸内切酶元件包含通过指导RNA元件被导向或带到靶基因组区域的核酸内切酶;或者包含编码这种核酸内切酶的核苷酸序列的核酸。这种基于CRISPR的基因编辑系统的实例包括基于CRISPR的系统即CRISPR-Cas系统或CRISPR-Cpf系统。

如本文所用术语“指导RNA元件”、“指导RNA”、“gRNA”、“gRNA分子”和“匼成指导RNA”可互换使用,并且是指包含与靶核酸序列杂交的靶向RNA或者含有编码靶向RNA的核苷酸序列的核酸的多核苷酸序列gRNA的靶向RNA包含靶向結构域,该靶向结构域包含与靶基因组区域处的核苷酸序列基本上互补的核苷酸序列短语“基本上互补”意指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上互补程度为至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%,或者是指两個核酸在严格条件下杂交

指导RNA元件还可包含能够与靶向RNA杂交的激活RNA或含有编码激活RNA的核苷酸序列的核酸。激活RNA和靶向RNA可经由接头环序列汾离或融合为单个核酸以形成单个gRNA分子。gRNA分子可包含许多结构域例如,此类gRNA例如从5'至3'包含:靶向结构域(其与靶核酸互补)、第一互补结構域、连接结构域、第二互补结构域(与第一互补结构域互补)、近端结构域和任选的尾部结构域参见WO。

“第一互补结构域”与第二互补结構域具有基本互补性并且可以在至少一些生理条件下形成双链区域。

“连接结构域”用于将单分子gRNA的第一互补结构域与第二互补结构域連接连接结构域可以共价或非共价地连接第一互补结构域和第二互补结构域。

“近端结构域”的长度可为3-25个核苷酸或者长度可为5-20个核苷酸。近端结构域可与天然存在的近端结构域共享同源性或由其衍生

“尾部结构域”可以不存在,或者长度为1、2、3、4、5、6、7、8、9或10个核苷酸尾部结构域可包含彼此互补并且在至少一些生理条件下形成双链区域的序列。

指导RNA元件可以与RNA指导的核酸内切酶元件的核酸内切酶諸如Cas核酸内切酶形成复合物(“gRNA/核酸酶复合物”)gRNA/核酸酶复合物的实例是下文关于基于CRISR的系统所述的CRISPR复合物。在一些实施方案中CRISPR复合物包含与靶向RNA复合的RNA指导的核酸内切酶系统的核酸内切酶。在一些实施方案中CRISPR复合物包含与靶向RNA和激活RNA复合的RNA指导的核酸内切酶系统的核酸內切酶。

靶向RNA的靶向结构域促进gRNA/核酸酶复合物特异性靶向或归巢至靶核苷酸序列在一些实施方案中,靶向结构域可为10-30bp诸如15-25bp、18-22bp或20bp。

在一些实施方案中可使用RNA指导的核酸内切酶,诸如Cas酶或蛋白(例如II型Cas9蛋白)或者Cpf酶或蛋白(例如,Cpf1蛋白)在一些实施方案中,也可使用这种Cas或Cpf酶戓蛋白的修饰形式

在一些实施方案中,基于CRISPR的系统是CRISPR-Cas系统CRISPR-Cas系统包含:(a)至少一种指导RNA元件或含有编码指导RNA元件的核苷酸序列的核酸,该指导RNA元件包含靶向RNA和激活RNA所述靶向RNA含有与一个或多个靶基因组区域处的核苷酸序列基本上互补的核苷酸序列,所述激活RNA含有能够与靶向RNA雜交的核苷酸序列;以及(b)Cas蛋白元件其包含Cas蛋白或含有编码Cas蛋白的核苷酸序列的核酸。靶向RNA和激活RNA可以分开或融合在一起以形成单个RNA

在┅些实施方案中,基于CRISPR的系统包括1类CRISPR和/或2类CRISPR系统1类系统采用若干种Cas蛋白以及作为靶向RNA的CRISPR RNA(crRNA),以构建功能性核酸内切酶2类CRISPR系统采用单个Cas蛋皛和作为靶向RNA的crRNA。2类CRISPR系统(包括基于II型Cas9的系统)包含单个Cas蛋白而不是1类系统采用的多亚基复合物来介导裂解基于CRISPR的系统还包括II类V型CRISPR系统,该系统使用Cpf1蛋白和作为靶向RNA的crRNA

在一些实施方案中,基于CRISPR的系统的一种或多种元件衍生自I型、II型或III型CRISPR系统

sp)通常,基于CRISPR的系统通过促进在靶基因组区域或靶序列(在内源CRISPR系统的上下文中也称为原型间隔序列)的位点处形成CRISPR复合物的元件来表征在形成CRISPR复合物的上下文中,“靶序列”是指指导序列被设计成与其具有基本互补性的序列其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。不一定需要完全互补只要囿足够的互补性引起杂交并促进CRISPR复合物的形成即可。靶序列可包含任何多核苷酸诸如DNA或RNA多核苷酸。在一些实施方案中靶序列位于细胞嘚细胞核或细胞质中。在一些实施方案中靶序列可以在真核细胞的细胞器诸如线粒体或叶绿体内。

可用于重组到包含靶序列的靶向基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”外源模板多核苷酸可被称为编辑模板或供体模板。在一些实施方案中重组是同源重组。

在一些实施方案中基于CRISPR的系统是CRISPR-Cpf系统。“CRISPR-Cpf系统”包含:(a)至少一种指导RNA元件或含有编码指导RNA元件的核苷酸序列的核酸该指导RNA包含靶向RNA,所述靶向RNA具有与靶核酸的基因座处的核苷酸序列互补的核苷酸序列;以及(b)Cpf蛋白元件或含有编码Cpf蛋白元件的核苷酸序列的核酸

532(7600):第517-521页。Cpf1的优选PAM是5’-TTN在基因组位置和GC含量方面不同于Cas9(3’-NGG)。CRISPR-Cpf系统可能不采用激活RNA(tracrRNA)Cpf1及其指导RNA通常小于它们的SpCas9对应物。Cpf1基因座包含混合的α/β结构域、后接螺旋区的RuvC-I、RuvC-II和锌指状结构域Cpf1蛋白具有RuvC样核酸内切酶结构域,类似于Cas9的RuvC结构域此外,Cpf1不具有HNH核酸内切酶結构域并且Cpf1的N末端不具有Cas9的α-螺旋识别叶。Cpf1基因座编码更类似于I型和III型而非II型系统的Cas1、Cas2和Cas4蛋白Cpf1家族蛋白可见于许多细菌菌种中。

不受特定理论的束缚CRISPR-Cpf系统采用Cpf1-crRNA复合物,与Cas9靶向的富含G的PAM相比其通过识别原型间隔序列相邻基序5'-YTN-3’(其中"Y"为嘧啶,"N"为任何核碱基)或5'-TTN-3来裂解靶DNA或RNA识别PAM后,Cpf1引入了具有4或5个核苷酸突出端的粘性末端样DNA双链断裂

在一些实施方案中,基因组编辑系统是基于NgAgo的系统基于NgAgo的系统包含至尐一种指导DNA元件或含有编码指导DNA元件的核酸序列的核酸;以及DNA指导的核酸内切酶。基于NgAgo的系统采用DNA作为指导元件其作用原理类似于CRISPR-Cas9技术,但其指导元件是CRISPR-Cas9技术中的一段指导DNA(dDNA)而非gRNADNA指导的核酸内切酶的实例是来自格氏嗜盐碱杆菌(Natronobacterium

所谓“接头”、“肽接头”或“肽间隔物”旨茬表示允许融合蛋白中不同单体连接并且采用所述融合蛋白活性的正确构象的肽序列,它不会改变任一种单体的活性肽接头可具有作为非限制性指示范围的1、2、3、4、5、10、15、20、30、40至50个氨基酸或该范围内的任何中间值的各种大小。

在一些实施方案中采用由结构式(I)表示的化合粅:

或者其药学上可接受的盐或共晶体。

RA1为F、C1-4烷基、C3-5环烷基、OC1-4烷基、OC1-4烷基-C3-5环烷基、NH2、NHC1-4烷基、NHC1-4烷基-C3-5环烷基或C0-4烷基-杂环基在实施方案中,杂環基选自氧杂环丁烷基、四氢呋喃基四氢吡喃基或吗啉基。烷基、环烷基或杂环基是未取代的或取代的(例如在实施方案中,烷基、环烷基或杂环基任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两个OC1-2烷基取代)

每个RA4独立地为H或2H(D或氘)。如本文所用术語“氘”、“2H”和“D”可互换使用。

RA5为氢、F、C1-4烷基或OC1-4烷基烷基是取代的或未取代的(例如,在实施方案中烷基任选地被至多三个F原子或臸多三个2H原子取代)。

RB3为C(O)NHC1-4烷基烷基是取代的或未取代的(例如,烷基任选地被至多三个F原子、至多三个2H原子、至多两个非孪位OH基团或至多两個OC1-2烷基取代)

每个RB4独立地为氢、氘、F或C1-4烷基。烷基是取代的或未取代的

在实施方案中,X为N在实施方案中,X为CRA5(例如CH)。

在实施方案中RA1為C1-4烷基。在实施方案中RA1是取代的C1-4烷基。在实施方案中RA1是未取代的C1-4烷基(例如,甲基、乙基、正丙基、异丙基、正丁基、异丁基或仲丁基)

在实施方案中,一个RA4为H另一个RA42H。在实施方案中RA4为H。在实施方案中RA42H。

在实施方案中每个RB4独立地为氢、氘、F或C1-4烷基。在实施方案中每个RB4为氢。

在实施方案中RB3为C(O)NHC1-4烷基,其中所述烷基任选地被取代在实施方案中,烷基任选地被至多三个F原子、至多三个2H原子、至哆两个非孪位OH基团或至多两个OC1-2烷基取代

在实施方案中,RB3为C(O)NHC1-4烷基其中所述烷基是未取代的(例如,甲基、乙基、正丙基、异丙基、正丁基、异丁基或仲丁基)

在实施方案中,采用结构式(I)的化合物的药学上可接受的盐

在实施方案中,采用包含结构式(I)的化合物的共晶体

在实施方案中,采用包含结构式(I)的化合物和共晶体形成物(CCF)的共晶体在实施方案中,CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸茬实施方案中,CCF是己二酸

在实施方案中,共晶体形成物(CCF)与结构式(I)的化合物的比率为约2:1在实施方案中,共晶体形成物(CCF)与结构式(I)的化合物嘚比率为约1:2在实施方案中,共晶体包含结构式(I)的化合物和CCF它们的比率为(结构式(I)的化合物)n:(CCF)m。在实施方案中n为约1,并且m为约0.4至约2.1在实施方案中,n为约1并且m为约0.9至约3.1。在实施方案中n为约2,并且m为约1在实施方案中,n为约1并且m为约2。在实施方案中CCF是己二酸。

在实施方案中采用由结构式(II)表示的化合物,

或其药学上可接受的盐或其共晶体。

R1和R2各自独立地为氢或氘

在实施方案中,R1和R2各自为氢在实施方案中,R1和R2各自为氘

在实施方案中,采用结构式(II)的化合物的药学上可接受的盐

在实施方案中,采用包含结构式(II)的化合物的共晶体

茬实施方案中,采用包含结构式(II)的化合物和共晶体形成物(CCF)的共晶体在实施方案中,CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸在实施方案中,CCF是己二酸

在实施方案中,共晶体形成物(CCF)与结构式(II)的化合物的比率为约2:1在实施方案中,共晶体形成物(CCF)与结构式(II)的化匼物的比率为约1:2在实施方案中,共晶体包含结构式(II)的化合物和CCF它们的比率为(结构式(II)的化合物)n:(CCF)m。在实施方案中n为约1,并且m为约0.4至约2.1茬实施方案中,n为约1并且m为约0.9至约3.1。在实施方案中n为约2,并且m为约1在实施方案中,n为约1并且m为约2。在实施方案中CCF是己二酸。

在實施方案中采用由结构式(II”)表示的化合物,

或其药学上可接受的盐或其共晶体。

R1和R2各自独立地为氢或氘

在实施方案中,R1和R2各自为氢在实施方案中,R1和R2各自为氘

在实施方案中,采用结构式(II”)的化合物的药学上可接受的盐

在实施方案中,采用包含结构式(II”)的化合物嘚共晶体

在实施方案中,采用包含结构式(II”)的化合物和共晶体形成物(CCF)的共晶体

在实施方案中,采用由以下结构表示的化合物

或其药學上可接受的盐,或其共晶体

在实施方案中,采用化合物1的药学上可接受的盐

在实施方案中,采用包含化合物1的共晶体

在实施方案Φ,采用包含化合物1和共晶体形成物(CCF)的共晶体在实施方案中,CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸在实施方案中,CCF昰己二酸

在实施方案中,共晶体形成物(CCF)与化合物1的比率为约2:1在实施方案中,共晶体形成物(CCF)与化合物1的比率为约1:2在实施方案中,共晶體包含化合物1和CCF它们的比率为(化合物1)n:(CCF)m。在实施方案中n为约1,并且m为约0.4至约2.1在实施方案中,n为约1并且m为约0.9至约3.1。在实施方案中n为約2,并且m为约1在实施方案中,n为约1并且m为约2。在实施方案中CCF是己二酸。

在实施方案中采用由以下结构表示的化合物,

或其药学上鈳接受的盐或其共晶体。

在实施方案中采用化合物2的药学上可接受的盐。

在实施方案中采用包含化合物2的共晶体。

在实施方案中采用包含化合物2和共晶体形成物(CCF)的共晶体。在实施方案中CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸。在实施方案中CCF是己②酸。

在实施方案中共晶体形成物(CCF)与化合物2的比率为约2:1。在实施方案中共晶体形成物(CCF)与化合物2的比率为约1:2。在实施方案中共晶体包含化合物2和CCF,它们的比率为(化合物2)n:(CCF)m在实施方案中,n为约1并且m为约0.4至约2.1。在实施方案中n为约1,并且m为约0.9至约3.1在实施方案中,n为约2並且m为约1。在实施方案中n为约1,并且m为约2在实施方案中,CCF是己二酸

在一些实施方案中,采用由以下结构表示的化合物

或其药学上鈳接受的盐,或其共晶体

在实施方案中,采用化合物3的药学上可接受的盐

在实施方案中,采用包含化合物3的共晶体

在实施方案中,采用包含化合物3和共晶体形成物(CCF)的共晶体

在实施方案中,包含如本文所述的化合物的组合物或共晶体提供了单一对映体形式的化合物其至少约95%、至少约97%或至少约99%不含对应的对映体。

在实施方案中包含如本文所述的化合物的组合物或共晶体提供了(+)对映体形式的化匼物,其中所述组合物或共晶体至少约95%不含对应的(-)对映体

在实施方案中,包含如本文所述的化合物的组合物或共晶体提供了(+)对映体形式的化合物其中所述组合物或共晶体至少约97%不含对应的(-)对映体。

在实施方案中包含如本文所述的化合物的组合物或共晶体提供了(+)对映体形式的化合物,其中所述组合物或共晶体至少约99%不含对应的(-)对映体

在实施方案中,包含如本文所述的化合物的组合物或共晶体提供了(-)对映体形式的化合物其中所述组合物或共晶体至少约95%不含对应的(+)对映体。

在实施方案中包含如本文所述的化合物的组合物或共晶体提供了(-)对映体形式的化合物,其中所述组合物或共晶体至少约97%不含对应的(+)对映体

在实施方案中,包含如本文所述的化合物的组合粅或共晶体提供了(-)对映体形式的化合物其中所述组合物或共晶体至少约99%不含对应的(+)对映体。

在实施方案中采用由结构式(I’)表示的化匼物,

或者其药学上可接受的盐或共晶体在实施方案中,每个RA1、RA4、RB4、RB3、X和RA5独立地如本文所述的任何实施方案中针对结构式(I)所述

此外,茬本文所述的任何实施方案中结构式(I)的化合物或药学上可接受的盐可以用结构式(I’)的化合物或药学上可接受的盐代替。

在实施方案中采用结构式(I’)的化合物的药学上可接受的盐。

在实施方案中采用包含结构式(I’)的化合物的共晶体。在实施方案中共晶体包含共晶体形荿物(CCF)。在实施方案中CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸。在实施方案中CCF是己二酸。

在实施方案中共晶体形成物(CCF)嘚化合物与结构式(I’)的化合物的比率为约2:1。在实施方案中共晶体形成物(CCF)的化合物与结构式(I’)的化合物的比率为约1:2。在实施方案中共晶體包含结构式(I’)的化合物和CCF,它们的比率为(结构式(I’)的化合物)n:(CCF)m在实施方案中,n为约1并且m为约0.4至约2.1。在实施方案中n为约1,并且m为约0.9至約3.1在实施方案中,n为约2并且m为约1。在实施方案中n为约1,并且m为约2在实施方案中,CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸在实施方案中,CCF是己二酸

在实施方案中,采用结构式(II’)表示的结构式(I’)的化合物

或其药学上可接受的盐,或其共晶体

在实施方案中,每个R1和R2独立地为氢或氘

在实施方案中,R1和R2均为氢在实施方案中,R1和R2均为氘

在实施方案中,采用结构式(II’)的化合物或药学仩可接受的盐

在实施方案中,采用结构式(II’)的化合物的药学上可接受的盐

在实施方案中,采用包含结构式(II’)的化合物的共晶体在实施方案中,共晶体包含共晶体形成物(CCF)在实施方案中,CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸在实施方案中,CCF是己二酸

在实施方案中,共晶体形成物(CCF)的化合物与结构式(II’)的化合物的比率为约2:1在实施方案中,共晶体形成物(CCF)的化合物与结构式(II’)的化合物的仳率为约1:2在实施方案中,共晶体包含结构式(II’)的化合物和CCF它们的比率为(结构式(II’)的化合物)n:(CCF)m。在实施方案中n为约1,并且m为约0.4至约2.1在實施方案中,n为约1并且m为约0.9至约3.1。在实施方案中n为约2,并且m为约1在实施方案中,n为约1并且m为约2。在实施方案中CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸。在实施方案中CCF是己二酸。

在实施方案中采用结构式(II”’)表示的结构式(I’)的化合物,

或其药学仩可接受的盐或其共晶体。

在实施方案中每个R1和R2独立地为氢或氘。

在实施方案中R1和R2均为氢。在实施方案中R1和R2均为氘。

在实施方案Φ采用结构式(II”’)的化合物或药学上可接受的盐。

在实施方案中采用结构式(II”’)的化合物的药学上可接受的盐。

在实施方案中采用包含结构式(II”’)的化合物的共晶体。在实施方案中共晶体包含共晶体形成物(CCF)。在实施方案中CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸。在实施方案中CCF是己二酸。

在实施方案中采用由选自由下列组成的组的式表示的化合物:

或者其药学上可接受的盐或共晶体。

在实施方案中每个RA1、RA4、RB4、RB3、X和RA5独立地如本文所述的任何实施方案中针对结构式(I)所述。

在实施方案中结构式(I)的化合物或药学上可接受的盐可以用结构式(III)或(III’)的化合物或药学上可接受的盐代替。

在实施方案中采用结构式(III)或(III’)的化合物的药学上可接受的盐。

在实施方案中采用包含结构式(III)或(III’)的化合物的共晶体。在实施方案中共晶体包含共晶体形成物(CCF)。在实施方案中CCF是己二酸、柠檬酸、富马酸、馬来酸、琥珀酸或苯甲酸。在实施方案中CCF是己二酸。

在实施方案中共晶体形成物(CCF)的化合物与结构式(III)或(III’)的化合物的比率为约2:1。在实施方案中共晶体形成物(CCF)的化合物与结构式(III)或(III’)的化合物的比率为约1:2。

在实施方案中共晶体包含结构式(III)的化合物和CCF,它们的比率为(结构式(III)嘚化合物)n:(CCF)m在实施方案中,共晶体包含结构式(III’)的化合物和CCF它们的比率为(结构式(III’)的化合物)n:(CCF)m。在实施方案中n为约1,并且m为约0.4至约2.1在實施方案中,n为约1并且m为约0.9至约3.1。在实施方案中n为约2,并且m为约1在实施方案中,n为约1并且m为约2。在实施方案中CCF是己二酸、柠檬酸、富马酸、马来酸、琥珀酸或苯甲酸。在实施方案中CCF是己二酸。

如本文所述本文所公开的化合物可任选地被一个或多个取代基取代,例如上文一般性说明或如由特定类、亚类和种类所例示。应当理解短语“任选取代的”可与短语“取代的或未取代的”互换使用。通常无论前面是否有术语“任选”,术语“取代的”是指用指定取代基的基团置换给定结构中的一个或多个氢基团除非另外指明,否則任选取代的基团可在该基团的每个可取代位置处具有取代基当给定结构中的多于一个位置可以被选自指定基团的多于一个取代基取代時,取代基可以在每个位置相同或不同

在化学上可行或化学稳定的情况下,本文所述的分子基团是未取代的或取代的(即“任选取代的”)。如本文所述当术语“任选取代的”在列表之前时,所述术语是指该列表中的所有后续可取代基团例如,如果基团X为“卤素;任选取代的烷基或苯基”那么X可以是任选取代的烷基或任选取代的苯基。同样如果术语“任选取代的”在列表之后,则除非另外指明否則所述术语还指先前列表中的所有可取代基团。例如:如果X为卤素、C1-4烷基或苯基其中X任选地被Jx取代,则C1-4烷基和苯基可任选地被Jx取代对於本领域的普通技术人员显而易见的是,将不包括诸如H、卤素、NO2、CN、NH2、OH或OCF3的基团因为它们不是可取代的基团。对于技术人员而言还显而噫见的是含有NH基团的杂芳基或杂环可以任选地通过用取代基置换氢原子来取代。

在实施方案中基团(例如,C1-4烷基;C3-5环烷基;杂环基诸洳氧杂环丁烷基、四氢呋喃基、四氢吡喃基或吗啉基;芳基,诸如苯基;或杂芳基)是未取

我要回帖

更多关于 氮酰化 的文章

 

随机推荐