多少新活性化合物物可以构建comfa

共计253 条
定量构效关系需要的仅仅是分子的结构信息以及所研究性质的实验数据,通过对计算出来的各种分子结构参数和实验性质进行分析,建立结构参数和所研究的性质之间的定量关系。根据各种建模方法建立可靠的相关模型,依此模型可以进行活性预测,同时根据模型系数找出对分子活性影响比较大的分子结构信息,对分子设计有重要的指导意义。  
从多个结构参数或者描述子中选择少数与活性相关的有效变量是定量构效关系研究的一个重要步骤,描述子选择的好坏直接影响着定量构效关系模型的可靠性。本文对怎样选择对分子生物活性有显著贡献的描述子做了深入研究,开发了基于遗传算法实现的广义簇显著性分析方法,通过这种方法能够有效地找到显著性的描述子,对建立定量构效关系模型,设计新分子有指导性的意义。  
从数据集中选择样本分子作为训练集也是建立定量构效关系模型过程中的一个关键步骤,训练集与测试集选择的均匀程度影响着模型的稳健性。本文对怎样选择合适的样本分子作为训练集做了研究,引入了洋葱式D-优化试验设计思想,开发了基于遗传算法实现的GA-DOOD程序,能够快速的找到信息量大的分子组合,便于构建定量构效模型。  
传统定量构效模型一般都期望获得全局的结构与生物活性之间的定量关系,但是在很多情况下,整个分子集中有一些分子组具有某种与活性相关的特殊特征,代表着局部的结构活性关系。传统的QSAR模型不能识别这种局部的特殊关系,不能获得良好的预报结果。为此本文提出了分组建模的思想,依据分子之间的结构相似性划分为几组,分别建立自组织分子场模型,测试集的归属通过维相关距离来实现。  
本论文对定量构效关系中的描述子选择方法、训练集样本选择方法和建模分组方法进行了探讨,应用药物/化合物的构效关系研究,获得了一定的成绩,所建立的相关模型对药物的性成分筛选和药物设计具有一定的指导作用,值得深入研究。可望通过进一步究,为药物分子的筛选及其创新药物设计开辟了一条新的道路。
该文系统地综述了人工神经网络和模糊逻辑,以及它们的结合物-模糊神经网络的理论,并且简要地介绍了化合物的定量构效关系(qsar)的研究进展情况.该文的重点在于深入研究简化型模糊神经网络的快速训练算法,并且针对现有模糊神经网络存在的问题,提出了"划分四子集的模糊神经网络"的新模型.
定量构效关系研究是化学计量学的重要分支。本论文主要是基于应用本实验室提出并发展的几个新的化学计量学算法,对一些药物体系进行了定量构效关系分析。
建立定量构效关系模型第一步是计算大量的分子描述符,下一步则是对这些描述符进行变量选择。然而这样将变量减少往往会导致信息的丢失。本论文采用本实验室最近引入化学计量学的基于粒子群优化的最优逐区变量提取来进行隐变量提取,并运用这些隐变量代替原始变量建立回归模型。基于这个方法对二[(吖啶-4-羧基酰胺)丙基]甲胺衍生物的抗癌活性以及环氧酶抑制剂的活性进行了定量构效关系分析。结果发现改进的粒子群优化算法是一个非常有效的搜索最优变量组合的方法,具有较快的收敛速度。
在构效关系的研究中,当训练集中的化合物结构差异较大或是化合物对受体的作用机制不同时,很难仅用一个线性模型来包含所有感兴趣的化合物。为了解决这个问题,引入了基于粒子群优化的分段超球建模(PHMPSO),这个新的方法是将整个数据集分成几个子集,以获得满意的分段线性模型。基于这个方法,对2-芳基(杂环芳基)-2,5-二氢吡唑[4,3-C]喹啉-3-(3H)衍生物对苯(并)二氮受体的亲和性进行了建模,并同用多元线性回归对整体数据集建立的单一模型和K均值聚类分析法得到的结果进行了比较,结果发现,应用PHMPSO算法能有效的提高回归模型的拟合程度。
通过对建模所用变量的分析,能够得到一些药物与生物大分子作用的信息,对以后的药物合成有一定的指导作用。
波段选择也属于变量选择,它是用选出来的波段代替全波段建模从而改善模型的性能。本文附章报道的是用本实验室提出的改进的粒子群优化算法对咖啡因含量不同的血浆样本的近红外吸收光谱进行波段选择,选出的波段用偏最小二乘建模。所建立的校正模型与用全波段建立的模型相比较。结果表明用改进的粒子群优化算法进行波段选择能显著改善模型的性能,改进的粒子群优化算法被证实是一个有效的波段选择方法。
紫杉醇是从短叶红豆杉的树皮中分离而得到的,紫杉醇是乳腺癌、子宫癌、胰腺癌和结肠癌等10多种癌症的特效药物,为了研究紫杉醇的作用机理,有关学者作了大量的构效关系研究.目前普遍认为:c-13上侧链的构型、c-2上的苯甲酰基obz、c4基团和四元氧环,均是活性必需的基团.该研究目的在于运用量子化学、分子力学、统计分析等方法建立药物分子的定量构效关系(qsar)模型,从电子结构和立体构型上探讨紫杉醇类似物结构与抗癌活性的关系.寻求合理的紫杉醇活性构型,解决d环是否必需基团的争议,解释c2′和c3′位的手性构型如何影响活性.为开发活性高、水溶性好、毒副作用低的紫杉醇类似物提供理论基础.
剂量-反应关系评定一直是危险度评估的核心部分,目前随着对致病机制的进一步认识,可以将传统的多阶段模型与疾病的发展进程结合起来,建立基于生物学背景的多阶段剂量.反应关系模型,提高危险度评估的准确度和精密度。
由于几乎没有单独的研究能够获得建立完整多阶段模型所需的数据,本研究将meta分析思路应用到危险度评估过程的剂量-反应关系研究中,建立剂量.反应关系的meta回归模型,为基于机制的危险度评估提供依据。并对建模策略进行了初步探讨。
本研究分别介绍了线性,广义线性和非线性meta回归模型的模型结构及参数估计方法。按照meta分析系统评价原则,收集26篇关于铅致雄性生殖毒性的英文文献,建立数据库。并以此数据为例,构建基于生物学背景的多阶段混合效应模型,思路如下:①建立年龄、体重与铅暴露前后睾丸重量变化的线性meta回归模型,与单纯随机效应模型相比,研究间方差明显减少,说明在meta分析中考虑协变量是必要的。②分别建立血.脑屏障及血-睾丸屏障通路下从暴露到疾病的多阶段meta回归模型,其模型结构包括logistic模型,指数模型,线陛模型和双曲线模型,这些模型的生物学意义明确。③初步建立暴露剂量、暴露时间与血铅关系的交互作用模型,随机效应结果显示自变量间不存在交互作用。
由于缺乏原始数据,非线性meta,回归模型参数的估计难以实现,本文采用参数bootstrap方法进行参数估计与假设检验,在迭代次数达500轮时结果较稳定。
根据研究体会,对多阶段混合效应模型的建模策略提出以下几点粗浅建议:
1.首先根据散点图趋势建立固定效应模型,并以此作为初始模型,指定该模型回归系数的估计值为下阶段混合效应模型的迭代初始值。
2.在危险度评估中建立的各阶段剂量-反应关系模型应符合研究指标间的生物学意义。
3.基于各研究中因变量与自变量间的曲线形状可能存在较大差异,建模时可依次考虑固定效应模型、随机效应模型和带协变量的随机系数模型,并观察研究水平的方差与残差方差的变化,以及与协变量的关系,从而选择最优模型。
4.在资料允许的情况下,meta回归中可以考虑协变量间的交互作用。这对于机制的深入解释是有帮助的。
5.在统计软件尚不能直接实现对非线性meta回归模型的wigls、reml估计时可根据研究指标的经验分布,采用参数bootstrap方法进行参数估计及假设检验。
以中国移动定制机分销模式的变动为例,本文运用结构计量模型对渠道结构变动的经济效应做了实证分析。在估计出需求参数和渠道成本参数的基础上,本文通过反事实模拟方法,评估了中国移动推行后向一体化战略对产业链上各行为主体的经济影响。结果发现,国代商同时向社会渠道和中国移动渠道分销定制机存在显著的规模经济;中国移动收回国代商定制机的分销代理权后,国代商与中国移动自身的边际成本均有所上升,且二者的利润边际都出现下降,这意味着中国移动改变企业边界和渠道结构安排是明显的"双输"决策。
该研究中,我们尝试将定量构效关系(quantitative structure activity relationship,qsar)研究的理论和方法用于th细胞表位以及ctl表位的定量预测中,并借助相应的实验技术进行鉴定,力求建立新的t细胞表位快速筛选的技术平台.我们结合氨基酸的理化性质与拓扑学方法,构建了能表征th表位序列结构及电性特征的电子-拓扑参数.另一方面,ctl表位(cytotoxic t lymphocyte epitopes)在ctl活化过程中扮演着十分关键的角色,决定了ctl的特异性杀伤效应,从而在机体抗感染和抗肿瘤免疫中发挥着极为重要的作用.总之,我们将定量构效关系研究的理论和方法成功地运用到了t细胞表位的定量预测之中.对th细胞表位的预测进行了初步探讨并建立了半定量的预测模型;较为详细地讨论了hla-a*0201限制性ctl表位亲和性的估算和预测,并建立了相关的定量模型和开发了相应的软件,实验进一步验证了所建模型的实用性和有效性.
该文利用COMFA方法和FLARM方法对一系列的表皮生长因子受体酪氨酸激酶抑制剂进行了三维水平上的构效关系研究,得到了合理的构效关系模型,并对一些化合物的活性进行了预报.FLARM方法的计算结果给出了虚拟的受体模型,该模型说明了抑制剂与受体之间可能的相互作用,这与NOVARTIS的药效团模型非常类似.在此基础上比较了COMFA和FLARM这两种方法.基于以上研究,分析和归纳出了酪氨酸激酶抑制剂的药效团,并以此作为提问结构在三维数据库中进行搜索.从得到的命中结构中挑选了12个化合物用COMFA和FLARM这两种方法对其活性进行了预报,发现在FLARM方法的预报结果中有2个化合物具有一定的预报活性.因此这2个化合物很可能具有酪氨酸激酶抑制剂的活性,可能可以作为先导化合物进行结构优化.
随着网络技术的发展和不同形式的海量数据的积累,许多企业内部的商业数据被存储在不同的关系数据库中,运行在不同的开发平台和操作系统上,构成异构系统。因为xml已经成为web数据交换标准,所以,在关系数据库的相关研究中,一个重要的研究领域就是基于xml的异构数据的交换与共享已经成为一个研究热点。
本文对现有的异构数据的交换理论和实现方法的研究现状做了深入的研究,探讨了异构数据交换过程中相关的关键技术,重点对关系数据与xml之间的转换模型和方法进行了分析和对比,针对现有方法的运行成本高和维护效率低的缺点,本文给出了模块化的思想,以及关系模式与模块化的xml之间的的转换模型和方法btt(bottom totop,自底向上)。首先,给出表示关系模式的向量模型,保存了关系结构与属性信息和用户自定义约束信息;同时根据xml是典型的树状结构的特点,给出了xml模式树模型。其次,在关系模式的向量模型及xml模式树模型的基础上,给出了btt方法的映射原理及其映射规则,该方法不仅保持了关系模式的结构信息、属性信息和约束信息的完整保留,而且自底向上的映射顺序则在没有牺牲转换效率的情况下,完成了模块化的封装与重用,使得转换后的xml schema文档在维护效率上的性能优势。再则,通过大量的实验数据,证明了与传统的模式转换方法相比,btt方法在维护效率上的明显优势。最后,本文结合全国大集中模式下的计费系统的实际项目,将btt方法应用其中,具有很大的现实意义。关键词:异构数据;关系模式;xml schema;模式转换
培美曲塞(pemetrexed),商品名alimta,化学名n-(4-[2-(2-氨基-4(3h)-4-氧代-7-氢-吡咯并[2,3-d]嘧啶-5基-)乙基]苯甲酰基)-l-谷氨酸二钠,是多靶点作用于叶酸依赖途径的抗肿瘤新药。由于美国专利合成与提纯方法过于复杂且产率较低,本学位论文对培美曲塞的合成及精制尝试了多种改进方法,简化了反应条件与提纯方法并提高了产率。在此基础上,本论文对培美曲塞的活性与核磁共振谱进行了模拟与预测,均取得了良好的效果,对培美曲塞的结构优化与核磁共振谱的研究提供了一些参考。因此本论文的研究内容主要由以下三部分构成:(1)抗癌药物培美曲塞的合成与分析;(2)抗癌药物与抗艾滋病药物的定量构效关系(qsar)研究;(3)培美曲塞与嘌呤类化合物13c与15n nmr化学位移的定量构谱关系(qssr)研究。
培美曲塞属细胞周期特异性抗代谢药物。临床研究表明,其单药对多种肿瘤有效,其中主要是非小细胞肺癌、恶性胸膜间皮瘤,其它还有头颈部肿瘤、胃癌、膀胱癌、宫颈癌以及胰腺癌等。本论文在专利文献的基础上对培美曲塞的合成方法进行了显著的改进,以烯丙醇与4-碘代苯甲酸乙酯为起始原料,经过herk反应、醛加成反应、消去、加成、水解环合、酰胺化、水解共7步反应得到目标产物,总收率达19.9%,大幅降低了生产成本,具有一定的经济效益与应用价值。通过hplc内标法检测其含量达99.7%,并对其化学结构进行了初步分析和归属确认。
定量构效关系,是一个重要的现代药学与化学基础理论研究与开发应用领域,其核心内容是考察和分析基本分子结构特征与物化性质或生物活性之间的定量相关关系。本文利用实验室新提出的一种全新的3d分子结构描述——三维原子场全息作用矢量(3d-hovaif)对培美曲塞及38个抗癌药物与35个hetp类抗艾滋病药物进行了qsar研究。两个模型的复相关系数(r2cum)、交互校验的复相关系数(q2cum)和模型的标准偏差(rmsee)分别为r2cum=0.840和0.939, q2cum=0.792和0.906, rmsee=0.769和0.433,其中对培美曲塞活性预测值为5.41与报道的5.70非常接近。这对培美曲塞结构优化提供了一种参考方法。
定量构谱关系,是一种研究化合物分子结构与波谱关系的统计方法,本文利用原子电性作用矢量(aeiv)和原子杂化状态指数(ahsi)及γ效应校正表征培美曲塞及嘌呤类化合物66个c微环境,51个n微环境及其自身杂化状态,应用多元线性回归(mlr)建立qssp模型,两个模型的复相关系数(r2cum)、交互校验的复相关系数(q2cum)和模型的标准偏差(rmsee)分别为r2cum=0.929和0.987, q2cum=0.896和0.966, rmsee=5.848和7.222。所建模型不仅在一定程度上阐明了以上化合物nmr谱化学位移与其分子结构信息间关系,同时也为培美曲塞15n nmr谱研究提供了参考。
本文针对严重危害人类健康的两种病毒性传染疾病:流感及丙型肝炎,选择关键作用靶标进行了先导化合物的发现、优化设计及相应的生物活性测定,同时对sars冠状病毒3cl蛋白酶底物的三维定量构效关系进行了研究。
1.神经氨酸酶是流感病毒复制生命周期中的重要蛋白质,已成为针对流感病毒药物设计的理想靶标,但随着对现有药物具有抗药性流感病毒株的出现,迫切需要开发全新骨架的药物来与之抗衡。通过分子对接虚拟筛选及酶抑制活性测定得到了具有高抑制流感病毒神经氨酸酶活性的化合物,其中活性最高化合物的半数抑制常数达到135nm,这些化合物与已知神经氨酸酶抑制剂的化学结构均不相同,为进一步发展全新骨架的神经氨酸酶抑制剂提供了可能。利用分子对接、药效团匹配、类药性规则等方法对化合物数据库进行虚拟筛选后所选出的47个化合物中有7个化合物表现出对流感病毒神经氨酸酶的抑制活性,虚拟筛选的成功率为15﹪。通过详细分析活性化合物与酶的结合模式,结合对已知的部分神经氨酸酶抑制剂建立的三维定量构效关系模型,对于所得到的活性化合物进行了优化设计,得到了预测活性更高的全新骨架的抑制剂。
2.丙型肝炎是一种在世界范围内广泛传播的一种病毒性传染病,并被认为是引起慢性肝硬化和肝癌的一个主要原因,而且目前对于治疗丙肝并没有有效的疫苗或药物。丙肝病毒生命复制过程中的rna依赖的rna聚合酶ns5b被认为是抗丙肝药物设计的重要靶标。利用分子生物学方法,表达纯化得到了具有rna依赖的rna聚合酶活性的ns5bdchis蛋白,采用放射性同位素标记utp方法建立了抑制剂筛选实验体系,并对虚拟筛选得到的21个化合物进行了活性测定。其中的一个活性化合物黄芩苷是一种重要的天然产物,是中药黄芩的主要组成成分,该化合物对于ns5b的半数抑制常数ic50达到3.50μm。该研究结果为中药黄芩的护肝作用提供了明确的分子机理,为在此基础上发展出具有更高活性的丙肝rna依赖的rna聚合酶抑制剂奠定了基础。还对两类不同作用机制的ns5b抑制剂建立了具有良好预测能力的三维定量构效关系模型。
3.3cl蛋白酶被认为是抗sars及其他冠状病毒所致疾病的重要药物设计靶点。采用比较分子场分析方法对一系列sars冠状病毒3cl蛋白酶底物进行了三维定量构效关系分析,结合该蛋白酶与底物识别的其他特征,设计出了新的具有更高活性的底物,并得到了实验证实。
计算机辅助分子设计(CAMD)与定量构效关系(QSAR)的研究是药物设计与研制的关键环节和重要基础。如何产生出表征分子结构特征的结构参数是定量构效关系研究成败的关键所在。作者根据分子二维拓扑结构,以原子电性和原子间距描述不同分子环境中各类原子之间的相互作用,并结合原子类型划分方案,应用了用于表征药物主要是有机药物分子结构的新型矢量型结构描述子:分子电性距离矢量(MEDV)。在分子电距矢量的基础上进行拓展并对几类生物活性物质进行了定量构效关系及定量构性关系研究。本文的主要内容和研究结果如下:
(1)将分子距边矢量(MDEV)用于100种多环芳烃的化学结构表征,对其毛细管气相色谱保留值进行定量相关性研究,发现存在良好的线性相关关系,相关系数R=0.9899,采用留一法进行交互检验,得相关系数R=0.9856,可见模型稳定性很好,可用于多环芳烃色谱保留指数的分子建模与定量预测。
(2)根化路径数矢量能良好表征151个烷烃碳原子C-13核磁共振化学位移,相关系数达R=0.944。另外,对伯仲叔季类碳原子分别进行建模,相关系数分别为0.993,0.983,0.961,0.992,经交互检验说明模型稳定。
(3)对几类抗艾滋病类药物分子包括肽类HIV-1蛋白酶抑制剂、一组电子等排衍生物和环尿素类化合物采用新型的分子电距矢量进行结构表征,并与其抗艾滋病病毒活性进行相关研究,分别取得良好结果。对寻找高活性抗HIV药物有一定的指导意义。
(4)将以分子电性距离(MED)矢量为基础的新型矢量型结构描述子按氢分类的分子电性距离矢量(H-MEDV)对28个具有肝细胞毒性的苯胺类药物的结构参数和对三种肝细胞逸出酶活性进行定量构效关系建模,模型相关系数分别为0.924,0.874,0.818。所建立的三组多参数模型稳定并具有良好的估计预测能力。
(5)应用表征药物主要是有机药物分子结构的新型矢量型结构描述子:按氢分类的分子电性距离矢量(H-MEDV)和分子全息距离矢量(MHDV)对40个氨基喹啉类化合物进行了结构参数表征和抗疟原虫活性相关关系建模分析。并运用多元线性回归方法和逐步回归方法来构造数学模型(R>0.9)。所建立的多参数模型稳定并具有良好的估计预测能力。
肽与蛋白质的结构表征是其定量构效关系(QUANTITATIVE STRUCTURE-ACTIVITY
RELATIONSHIP,QSAR)研究的前提和重要内容。由于肽和蛋白质的空间结构及功能信
息隐藏于一级结构即氨基酸序列中,因此,氨基酸的结构信息对肽及蛋白质的定
量构效关系研究至关重要。本文从氨基酸的结构特征出发,构建了两种全新的氨
基酸结构表征体系,即VHESH和VSTPV。VHESH(PRINCIPAL COMPONENT SCORE VECTOR
OF HYDROPHOBIC,ELECTRONIC,STERIC,AND HYDROGEN BOND PROPERTIES)来源于20种天然氨基
酸的113种物理化学性质,通过对其中50个疏水性质、23个电性性质、35个立
体性质和5个氢键性质分别进行主成分特征提取而产生,其中VHSE1和VHSE2
代表氨基酸疏水特性;VHSE3~VHSE6代表氨基酸电性特性;VHSE7和VHSE8则
代表氨基酸的立体特性;VHSE9和VHSE10代表氨基酸氢键供体和受体特性。
VSTPV(PRINCIPAL COMPONENT SCORE VECTOR OF STRUCTURAL AND TOPOLOGICAL VARIABLES)则来
源于166种天然及非天然氨基酸的85种拓扑结构信息,并经主成分特征提取而产
生。与Z-SCALE等其它氨基酸描述子比较,VHESH具有物理化学意义明确,表征
能力强,结果易解释等优点;而基于氨基酸拓扑结构性质的VSTPV则具有计算方
法简便,不依赖实验数据以及拓展性能好等优点。
在肽定量构效关系研究中,将VHESH和VSTPV用于血管紧张素转化酶抑制
剂、后叶催产素、人类1型双载蛋白SH3结构域亲和肽、阳离子抗菌肽及细胞穿
膜肽的定量构效关系研究,都取得了较好构效关系建模结果。基于VHESH表征方
法的构效关系研究发现:血管紧张素转化酶抑制剂第2残基电性与疏水性及第1
残基立体等性质与生物活性呈正相关关系,而其第1残的电性等性质则与活性呈
负相关关系;后叶催产素第1残基电性及疏水性质和第3残基立体及氢键性质与
其生物活性呈显著正相关关系,而第2残基疏水、电性及立体性质与其活性呈负
相关关系;分析影响人类1型双载蛋白SH3结构域亲和肽亲和性关键作用力可知,
第P-3与第P2之间残基(含P-3与P2残基)的相应性质对亲和活性影响较为显著;阳
离子抗菌肽第3残基电性性质,第6、7和12残基立体性质以及第11和12残基
的疏水性与抗菌效价呈正相关关系,而第6、10和12残基电性性质则与抗菌效价
呈显著的负相关关系;细胞穿膜肽的相关残基的物化性质及拓扑性质对其穿膜性
能影响较大。应用VSTPV表征方法对以上体系进行构效关系研究亦取得了较优的
建模和预测结果,且得出影响活性关键氨基酸位点与VHESH模型结果基本吻合。
在以上研究基础上,根据最优定量构效关系模型,在模型应用域范围内分别设计
了一系列全新分子,其预测活性与各体系最高预测活性相比均有不同程度提高。
将VSTPV应用于含非天然氨基酸肽衍生物体系即血管舒缓激肽促进剂、牛乳
清蛋白水解肽和弹性蛋白酶模拟底物的定量构效关系研究,取得了较好的结果。
研究表明,血管舒缓激肽促进剂分子的第2、3残基相关拓扑信息与其生物活性呈
强相关;牛乳铁蛋白水解肽的第6、8残基拓扑性质与其生物活性关系密切;弹性
蛋白质模拟底物A、B残基部分变量的二次项和交互项对酶催化反应影响很大。
应用定量构效关系相关理论和方法对蛋白质特性及功能预测进行了研究。基
于VHESH和VSTPV结构表征基础上,对人免疫缺陷病毒蛋白酶裂解位点(HⅣ
PR)、蛋白质磷酸化位点和蛋白质与RNA相互作用位点进行预测及特异性分析,
取得了优于其他方法的预测结果。研究显示,HIV PR的第1、2、4、5和6残基
的立体、氢键、电性及疏水性质或对应的拓扑性质是HIV PR被识别重要因素;磷
酸化位点序列的P-3位点物化性质(VHESH)及其拓扑性质(ⅣSTPV)对S、T和Y位
点磷酸化影响最大;与RNA相互作用的蛋白质序列第2、5、6残基立体、疏性、
电性和拓扑信息对RNA和蛋白质相互作用位点影响较大。
构效关系建模方法与技术是定量构效关系研究的一个重要内容。本文比较了
多元线性回归(MLR)、偏最小二乘(PLS)、线性判别分析(LDA)及支持向量机(SVM)
等方法在肽及蛋白质结构与功能关系研究中应用。结果表明,MLR在满足相关条
件前提下,通常可以取得较好结果;PLS可较好地解决变量数较多且存在多重共
线性情况;LDA用于模式识别效果好,模型易解释;SVM能较好地解决小样本、
非线性、高维数和局部最小等问题。此外,为提高模型质量,采用多元线性逐步
回归(SMR)、遗传算法(GA)筛选变量。研究发现,这两方法能较好地删除原始变量
中噪音信息。
模型质量评价及其应用域现已成为建模方法学中的一个关键性问题。文中将
全部样本划分为训练集和预测集两个部分,由训练集样本建立QSAR模型,通过
内部和外部双重验证来对模型进行质量评价。采用的内部验证方法有留一法(LEAVE
ONE OUT,LOO)、留组法(LEAVE 1/N OUT,LNO)、留多法(LEAVE MANY OUT,LMO)以及Y
随机排序验证(Y RANDOM PERMUTATIONS TEST)。在内部验证基础上,通过多种评价函数
对模型的外部预测能力进行评价,以确保模型的真实有效性。在此基础上,以样
本的X空间标准化模型距离为依据确定了模型的应用域,避免模型外推后给活性
预测带来的较大误差及不确定性。
关键词:定量构效关系,分子结构表征,VHESH,VSTPV,肽,蛋白质
  本文对5-羟色胺受体的分布、功能及分子生物学知识进行了综述。综合利用了同源模建、药效团方法、长时间的分子动力学模拟和虚拟筛选等多种方法,建立了可以作为筛选激动剂的一个5-ht2c受体活性构象模型。根据这个药效团模型和其他文献报道的结合位点的信息,我们确定了5-ht2c受体与激动剂的结合位点。将激动剂20对接到5-ht2c受体中后,经过长时间的复合物分子动力学模拟,得到一个受体和激动剂复合物的模型。根据我们的药效团模型和已知文献报道的激动剂与5-ht2c受体结合模式信息判断,复合物中的受体与激动剂的结合模式是合理的。  本文采用了分子对接方法和三维定量构效关系方法探索它们的作用机理。这些拟肽化合物在与β分泌酶结合时的空间取向和所采用的构象形式是通过autodock3.03确定的。对三维定量构效关系模型和β分泌酶的结合位点进行了对比,comfa和comsia场的分布都和β分泌酶结合口袋的结构特征相吻合,能合理解释衍生物的活性的差异与结构的关系。
定量构效关系研究(quantitativestructureandactivityrelationship,qsar)是开发新药物的重要辅助手段。尤其是在不知道受体结构的情况下,qsar研究能够总结实验结果,确定下一步实验的目标。
本文第一章详细介绍了一种3d-qsar方法—比较力场分析(comparativemolecularfieldanalysis,comfa),及其强化工具包:advancedcomfa。advancedcomfa工具包由数据库叠合,regionfocusing,optimizingqsar等几个模块组成。不仅能帮助我们生成并优化comfa模型,而且还可以大量自动生成新的结构并进行活性预测,使整个分析过程更加快速,全面。
文中第二章详细讨论了一个使用comfa法和advancedcomfa工具包构建模型并预测新化合物活性的例子:α-氧代膦酸酯类衍生物的comfa分析。
为了研究α-氧代膦酸酯类衍生物的除草活性与其结构之间的关系,发现有更高活性的tq457.2,我们对它们作了comfa分析,建立了比较好的comfa模型。在得到的comfa模型基础上,参考合成人员的意见,选用了sybyl程序中sub1v表格内常见的32个取代基,使用optimizingqsar模块生成并预测了大量的新结构(共计5120个)及其活性,从中进行筛选的结果,为合成人员的下一步工作提供了可能的方向。
本文在分析评述有机污染物定量构效关系(QSAR)建模研究现状、人工神经网络(ANN)和遗传算法(GA)的基本原理、优化算法的基础上,针对从化合物结构衍生出来的诸多变量中选择描述变量较难、采用ANN进行QSAR建模中存在的输入节点难以确定和局部收敛等问题,提出了反向传播人工神经网络(BP-ANN)和遗传算法(GA)辅助式结合和合作式结合两种方式进行QSAR建模的方法策略,并编写出相关计算机程序.本文首先开展了BP-ANN与GA辅助式结合进行QSAR建模的方法研究,利用GA的全局搜索能力,在众多的化合物结构描述变量中选择出参与建模的结构参数作为ANN的输入节点,再利用ANN强大的非线性建模能力进行建模.将自编的程序用于实例研究,结果表明:利用GA能有效地确定问题变量的最佳组合,并能同时获得多个高质量的QSAR模型,其给出的结构与活性之间的关系信息更为全面、正确.BP-ANN建模过程归根结底是连接权重的学习过程,一般采用误差梯度下降法来调整网络权重,要克服ANN所固有的收敛速度慢、局部极小值问题,必须摒弃单纯利用梯度法学习权值的策略.本文开展了BP-ANN与GA合作式结合进行QSAR建模的方法研究,采用GA对网络权值进行编码,将权值的学习过程转化为GA和BP-ANN共同学习进化的过程.首先利用GA产生若干不同初始网络权值的模型,再利用BP-ANN使权值迅速接近最优解,二者交替,最终实现网络收敛到最佳解.将自编的程序用于实例研究,结果表明:该方法很好地克服了BP算法存在的过拟合和局部最优问题,提高了网络的训练速度和学习精度.本文还探讨了ANN模型的解释能力.模拟BP梯度下降推导连接权重的修正过程,推导出单一输入的变化对输出影响的偏微分公式;同时对GARSON等人提出的权重方法作了合理的简化.实例研究表明:通过以上两种方法的结合,能准确地获得各变量的重要性关系,并定量的给出各变量对输出的影响水平,极大地提高了ANN模型的解释能力,为ANN在QSAR建模中的应用拓展了思路.
本论文以新药创制为主线,初步探索了组合化学这一新型合成技术与策略的实现方法,选取绿色的MANNICH缩合反应,重点讨论了多组分反应及合成计量学的应用。在本实验室业已完成关于药物分子设计和定量构效关系的良好前期研究基础上,将分子电距矢量及原子电距矢量两类矢量型结构描述子扩展应用于定量构性关系与定量构谱关系的研究,分别取得预期结果。
本文主要内容和研究结果如下:
1.MANNICH碱的三组分反应合成。选取三组分缩合MANNICH反应体系,在基本一致的反应条件下模拟组合合成,通过变换三种反应底物和/或试剂芳香酮、芳香醛与芳香胺系列,进行多次实验合成大量的结构类似产物(即超小型的化合物库)。引入原子利用效率,结合合成产率对MANNICH反应进行综合目标量化,并考察了反应条件、催化剂及试剂结构对反应的影响。合成得到30余个新型的MANNICH碱,产率20.14-91.00%,熔点71.6-396.8℃,原子利用效率94.36%-96.18%。
2.肉桂酸合成试验设计与优化。采用碳酸钾(K2CO3)作催化剂,聚乙二醇-400(PEG-400)作相转移催化剂,对传统PERKIN反应合成肉桂酸工艺条件进行改进,并对该反应的实验/条件空间进行系统考察,初步探索合成计量学应用。通过正交、均匀、中心组合试验设计对苯甲醛和乙酐配比、K2CO3的用量、PEG-400的用量、反应温度及反应时间进行优化,将合成产率由40-50%提高到68.69%,收效明显。
3.MANNICH反应的定量结构与反应性相关(QSRR)研究。对试剂/反应空间进行系统考察,继续合成计量学研究。提出以分子电性距离矢量VMED与分子全息距离矢量VMHD分别用于MANNICH反应的生成物即MANNICH碱与反应物包括酮、醛及胺的分子结构的表征,对其实验合成产率与产物熔点分别构建定量相关模型,继以留一法交互检验评价模型质量。结果分别良好,如样本集3中合成产率QSRR模型的复相关系数R与交互校验RCV分别为R=0.9540与RCV=0.9170,表明以该两类矢量型描述子构建有机合成反应定量相关模型切实可行。
4.酪氨酸蛋白酶抑制剂定量构效关系(QSAR)研究。将分子全息距离矢量VMHD用于的酪氨酸蛋白酶抑制剂苄叉丙二腈类化合物分子结构的表征,藉助主成分回归技术,对其生物活性PIC50构建线性相关模型。结果显示,以此方法所建立的定量模型具有相关性高、稳定性好、预测性较强的优点(复相关系数R、交互校验RCV与均方根误差RMS分别为0.8与0.400)。进一步作了逐步回归(SMR)分析VMHD变量之间相互作用,并与多元线性回归(MLR)所建QSAR模型进行了比较。所得结果良好,有利于辅助完成药物活性预测及新药分子设计,为创制新药物提供有用方法和技术。
5.胺与酰胺的定量构谱关系(QSSR)研究。系统地研究了红外光谱振动频率与核磁共振化学位移的规律性。提出以原子电距矢量VAED用于MANNICH碱与N,N-二取代芳酰胺分子化学微环境中单个原子的表征,分别构建相应红外振动频率与核磁共振化学位移的定量相关QSSR模型,进行波谱摸拟研究。结果表明,以此方法构建的定量构谱关系(QSSR)模型相当稳定,并具有较好的估计与预测能力。例如,对第一组17个类MANNICH碱,共价键C=O红外振动频率定量模型的复相关系数R、交互校验RCV分别为0.6。可望将VAED推广应用于其它体系诸如有机酸碱或其它谱图诸如紫外、质谱等的波谱模拟和分子模建研究。
  本文研究青藤碱衍生物镇痛抗炎作用的定量构效关系(QSAR)。方法:以青藤碱为先导化合物,在其A环4位酚羟基进行酰化、醚化合成了七种青藤碱衍生物;通过小鼠扭体和大鼠足跖肿胀模型分别考察这些衍生物的镇痛和抗炎作用,并用LOGIT法计算ED50;采用HANSCH方程对实验结果进行数学处理,拟合QSAR方程。结果:青藤碱衍生物的结构经红外、质谱及氢谱得以证实;所得QSAR方程为LOG1/C=-2.032+0.184π(镇痛活性方程,R2=0.779,F=21.136)和LOG1/C=-2.598+0.198(抗炎活性方程,R2=0.951,F=116.731)。研究表明:在青藤碱的酚羟基上引入亲脂性基团时有利于增强其镇痛及抗炎活性。
本文研究的目的主要是针对logit模型中系统项效用标定提出一套改进方案,将bcl模型扩展到限制条件更宽松的logit模型中,同时为改善box-cox转换模型自身的缺陷提出一个改进的模型形式。
系统项效用是影响logit模型选择概率的一个关键因素,但从mnl模型发展而来的离散选择模型大都没有对系统项效用的结构形式做深入的分析研究,要么直接构造非线性模型,要么仅仅停留在线形结构假设的层面。针对这个问题本文提出bcl模型的扩展并对其模型形式进行了改进,同时结合示例提出一套便于操作的处理流程,具有一定的理论和实际意义。
本文的研究基于计量经济学关于离散选择模型的研究和统计学数据分析中关于box-cox数据转换的研究。为放宽iia特性和系统项效用线性组合假设的限制,我们考虑将bcl模型扩展到其他离散选择模型(主要是nested logit模型)中,同时,针对bcl模型中box-cox转换函数定义域限制问题提出了改进转换函数模型,最后分别用计算示例将各个模型的计算流程及结果加以比较,进而得出结论。
分子结构表征(MOLECULAR STRUCTURAL CHARACTERIZATION,MSC)是当代药物分子设计
与药效评价中不可缺少的重要技术,同时也是定量构效关系(QUANTITATIVE
STRUCTURE-ACTIVITY RELATIONSHIP,QSAR)研究涉及到的第一个环节。它的核心思想是将
一个有机分子的结构和性质特征转化为一组特征代码,并伎这个过程中信息损失
达到最小。目前流行的表征方法包括二维拓扑描述子和三维分子场描述子等。本
研究小组以原子电性和原子间距离描述不同分子环境中各类原子之间的相互作
用,并结合原子类型划分方案,提出了用于表征药物主要是有机药物分子结构的
新型矢量型结构描述子:原子电性作用矢量(ATOMIC ELECTRONEGATIVITY INTERACTION
VECTOR,AEIV)和三维全息原子场作用矢量(THREE-DIMENSIONAL HOLOGRAPHIC VECTOR OF
ATOMIC INTERACTION FIELD,3D-HOVAIF),并进行了初步分析。研究内容如下:
①借助原子电性作用矢量和原子杂化状态指数,对39种丁烷衍生物类木脂素
共计854个等价碳原子进行表征,并建立用于模拟该类分子13CNMR化学位移的
多元线性回归方程。所得定量结构波谱关系模型及留一法交互检验相关系数分别
为R2=0.962和Q2=0.925。进一步用从马尾松松针分离所得新木脂素中20个
13CNMR化学位移对模型进行外部验证,预测结果与实验值较接近。表明所建模型
有良好稳定性和泛化力,可对丁烷衍生物类木脂素13CNMR谱学数据准确模拟。
②进一步探讨AEIV的适用性。利用原子电性作用矢量描述MANNICH碱中C=O
与P=O所处的化学环境,并与其伸缩振动吸收峰位相关联,利用理论计算模拟的
手段对化合物分子的红外谱图进行归属和分析,取得了令人满意的结果,表明A E
Ⅳ与MANNICH碱中C=O与P=O伸缩振动频率有很好的相关性。
③运用三维全息原子场作用矢量(3D-HOVAIF)对猫爪草中18种脂肪酸进行
QSAR研究。采用逐步回归(STEPWISE MULTIPLE REGRESSION,SMR)进行变量筛选,偏
最小二乘回归(PARTIAL LEAST SQUARE REGRESSION,PLS)建立定量构效关系模型。所建模
型复相关系数(R2)、留一法交互校验(CV)复相关系数(Q2)分别为0.977和0.946。结
果表明,3D-HOVAIF能较好表征猫爪草中脂肪酸的结构信息,且所建模型具有较
好稳定性和预测能力。
④运用3D-HOVAIF对30个神经氨酸酶抑制剂进行结构表征,采用逐步回归
筛选变量,偏最小二乘回归建立定量构效关系模型。所建模型的复相关系数R2、
留一法交互校验(CV)复相关系数Q2分别为0.624和0.409。得出结论:疏水作用是
影响其活性的关键因素;3D-HOVAIF能较好表征酰基硫脲类似物结构信息,且所
建模型具有较好稳定性和预测能力。
⑤首次将三维全息原子场作用矢量用于二肽毛细管区带电泳迁移率预测。为
研究经验模型和多变量分析技术在二肽毛细管区带电泳(CZE)淌度预测中的应用,
建立了逐步回归-多元线性回归(SMR-MLR)模型。数据集包含53个二肽在PH2.5
时测得的淌度值。在众多经验模型中,OFFORD模型(即μ=Q/M2/3)与所选数据集
相关性最好。故将该荷质比形式作为描述子之一建立定量结构-淌度关系(QSMR)
模型。其他描述子则来自三维全息原子场作用矢量(3D-HOVAIF),以表征侧链氨
基酸原子间的静电、立体和疏水相互作用。结果表明,所建模型预测能力比简单
的OFFORD模型有所提高。
关键词:定量构效关系,分子结构表征,原子电性作用矢量,
三维全息原子场作用矢量
共253条数据
&所有年份 &&
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="
<option value="

我要回帖

更多关于 化合物活性筛选 的文章

 

随机推荐