首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着高通量筛选技术的快速发展,化学品的毒性相关信息与日俱增。现今快速发展的数据挖掘技术和机器学习等计算机方法为化学品的毒性预测和风险防控提供了新途径。有害结局路径(adverse outcome pathway, AOP)将化合物的结构、分子启动事件和生物的有害结局建立关联,为污染物的毒性测试、预测和评估提供了新的模式,最终实现风险评估并应用于管理决策。定量结构-活性关系(QSAR)建模、分子模拟以及多组学技术在AOP的各个方面发挥了重要作用。基于此,本综述主要介绍数据挖掘与机器学习在毒理学中的应用方法,涉及QSAR建模、分子模拟及组学等方面,并结合实例分析系统阐述了当前研究的重点与方向,以更好地适应当前大数据时代的研究背景。  相似文献   

2.
正辛醇-空气分配系数是描述化学品在空气和环境有机相之间分配的一个关键参数,对化学品分配、迁移、转化规律和生态效应评价具有重要意义。采用量子化学方法对309个化合物进行结构优化,采用遗传算法筛选最优结构描述符,运用多元线性回归和神经网络算法构建化学品正辛醇-空气分配系数预测模型。模型方程表明影响化学品正辛醇-空气分配系数的3个参数为分子中非氢原子个数(Nsk)、3D-MoRSE描述符(Mor12u)、氮原子和氧原子数目(n HDon)。拟合结果显示,多元线性回归模型决定系数R2和标准误差分别为0.911和0.880,神经网络模型决定系数R2和均方根误差分别为0.839和0.830。基于杠杆(leverage)法评价模型的应用域,结果表明模型具有较强的稳健性、预测性和拟合能力。通过定量结构-活性关系(QSAR)预测技术可弥补正辛醇-空气分配系数测试数据的缺失,减少测试费用和评估数据的不确定性。  相似文献   

3.
有机磷化合物(OPs)广泛分布在各种环境介质中,并对各类生物的健康有潜在的危害。本研究采用基于逐步算法(SW)和遗传算法(GA)的多元线性回归(MLR)方法,收集并筛选出53种OPs的数据集并建立其关于大鼠急性口服毒性(LD50)的定量结构活性关系(QSAR)模型。构建的SW-MLR模型的参数决定系数(R2)、留一法交叉验证系数(QLOO2)、外部检验系数(QF12和QF22)分别为0.897、0.817、0.515和0.505,GA-MLR模型的参数分别为0.827、0.752、0.831和0.828。2个模型的统计参数表征了良好的预测能力。使用外部测试集对模型进行评估时,发现GA-MLR模型比SW-MLR模型具有更好的预测和泛化能力。此外,基于建立的模型预测了其他9种OPs的急性毒性,并辅以分子对接技术探究了其潜在的神经毒性。分子对接结果显示,其中8种OPs可以与人类丁酰胆碱酯酶结合。模型机理解释和分子对接结果显示,OPs取代基的...  相似文献   

4.
全/多氟烷基化合物(PFASs)是一类备受关注的化学品,已在多种环境介质中检出。然而,目前PFASs的生物活性数据缺乏,限制了其危害性评价和管理,有必要构建PFASs生物活性的高通量筛查模型。本研究基于卷积神经网络(CNN)算法,采用分子灰度图像作为输入,构建了PFASs的23种活性终点的筛查模型(简称Image-CNN模型)。与使用分子指纹和分子描述符作为输入,采用随机森林和支持向量分类器算法构建的基准测试模型相比,Image-CNN模型预测效果更好,平均的受试者工作特征曲线下面积达0.96。与此前模型相比,模型性能更优。基于分子指纹相似性,表征了模型的应用域。筛查了已知最大的PFASs名录,其中3种PFASs在所有建模的活性终点中都被预测为有活性。  相似文献   

5.
采用新型的的三维原子场全息作用矢量(3D-HoVAIF)研究了200种芳香化合物的化学结构与其生物毒性的定量构效关系(QSAR).首先对芳香化合物进行了结构参数化表达,然后采用逐步回归(SMR)对变量进行筛选,建立了三维定量构效关系模型.其87个无氢键分子的模型和113个有氢键分子的模型的复相关系数和标准偏差分别为R2=0.801,SD=0.473和R2=0.929,SD=0.318.模型具有良好的稳定性和预测能力,证明了该三维原子场全息作用矢量在分子结构表征和生物毒性预测上的适用性.  相似文献   

6.
生物富集因子(BCF)是评价化学品生物累积能力的重要参数.目前全球市场上使用的化学品数量已超过了35万种,但是只有一千多种化学品具有BCF值.定量构效关系(QSAR)模型被认为是一种有效填补数据空缺的方法.目前大多数预测BCF的QSAR模型为单一模型,而集成模型可能会对BCF的预测效果有所改进.本研究建立了一个全面的鱼...  相似文献   

7.
测定了23种酚的臭氧氧化速率,分别采用遗传算法(GA)结合偏最小二乘法(PLS)、遗传算法结合人工神经网络(ANN)建立了酚类物质臭氧氧化速率的定量构效关系(QSAR)模型.研究表明,臭氧氧化酚的速率可用伪一级反应速率模型描述,苯环上取代基得失电子的能力对酚的氧化速率影响较大.基于GA-PLS算法建立的QSAR模型为lgk=3.439-0.206lg P(辛醇-水分配系数对数值)+0.122×p Ka(解离常数)+0.3464χpc(四阶路径/簇分子连接性指数)-0.0236q C-(碳原子所带最大负电荷).基于GA-ANN算法建立的QSAR模型含有参数lg P、4χpc、p Ka和α(平均分子极化率).留一法交叉验证结果表明,基于GA-ANN算法建立的模型比基于GA-PLS算法建立的模型具有更好的稳健性.QSAR研究表明,酚的臭氧氧化速率与电子云分布以及苯环上取代基的性质密切相关,另外,水的溶剂化作用对酚的氧化速率也有显著影响.  相似文献   

8.
气相中有机化学品与羟基自由基(!OH)反应速率常数(k_(OH))是评价化学品大气持久性的重要参数.而化学品种类繁多,现有的k_(OH)实验数据不能满足其生态风险评估的需求.因此,需要建立一种能够快速预测有机化学品k_(OH)的方法,填补现有数据的缺失.本研究搜集整理了917种有机化合物的k_(OH)实验值,采用逐步多元线性回归法(MLR)和支持向量机法(SVM)分别构建了用于预测多种类化合物lgk_(OH)的线性和非线性定量结构-活性关系(QSAR)模型.基于MLR的预测模型具有良好的拟合度(经校正的相关系数的平方R_(adj.tr)~2=0.862、均方根误差RMSE_(tr)=0.455)、稳健性(交叉验证系数Q_(LOO)~2=0.856)和预测能力(外部验证系数Q_(ext)~2=0.850).基于SVM的预测模型也具有良好的拟合度(R_(adj.tr)~2=0.915,RMSE_(tr)=0.358)和预测能力(Q_(ext)~2=0.860).机理分析表明,最高占据分子轨道能(E_(HOMO))、卤素原子在分子中所占的百分比(X%)和分子中具有=CH—结构的数目(NdsCH)是最重要的3个描述符,解释了数据集78.3%的方差.采用Williams法表征模型的应用域.所建立的模型可用于预测烷烃、烯烃、炔烃、芳香族化合物、醇类、酮类、醚类、醛类、酸类、酯类、卤代化合物、含氮化合物、含硫化合物等室温下的k_(OH).  相似文献   

9.
以大肠杆菌为模式生物,分别测定了7种磺胺(SAs,分别为磺胺二甲基嘧啶(SCP)、磺胺吡啶(SPY)、磺胺甲恶唑(SMX)、周效磺胺(SDX)、磺胺喹恶磷(SQ)、磺胺对甲氧嘧啶(SM)、磺胺甲氧哒嗪(SMP)),及3种群体感应抑制剂(QSIs,分别为3-甲基-2-(5H)-呋喃酮(MF)、N-乙烯基吡咯烷酮(VP)、(R)-3-吡咯烷醇(HPL))的单一毒性和联合毒性,并且采用分子对接技术建立了QSIs与SAs对大肠杆菌联合毒性的QSAR模型.结果表明其联合毒性效应表现为拮抗和相加作用;同时,基于SAs和QSIs分别与它们的目标靶蛋白二氢叶酸合成酶(DHP5)与大肠杆菌家族蛋白(Sdi A)之间相互作用的结合能(Ebinding)和混合物的辛醇-水分配系数Kow(mix)构建了SAs和QSIs对大肠杆菌的二元联合毒性的QSAR模型,具有较好的相关性(R2为0.901).该模型经过验证,具有良好的预测能力(预测值与实测值的R2为0.913),研究可为今后抗生素与群体感应抑制剂的环境联合生态风险评价以及毒性预测提供一定的理论依据和技术支持.  相似文献   

10.
全氟化合物(perfluorinated compounds, PFCs)作为一种新兴有机污染物,因其环境持久性及生物富集性,对生态环境健康存在潜在风险。鉴于实验测定PFCs生物富集作用的局限性,为实现对PFCs生物富集因子(bioconcentration factor, BCF)的合理预测及其影响因素分析,本研究基于前人报道的log BCF实验数据,采用多元线性逐步回归方法建立了PFCs对鱼类肝脏生物富集作用的定量结构-活性关系(quantitative structure-activity relationship, QSAR)模型,并对该模型进行了全面验证与评估及机理解释。结果表明,所建QSAR模型的决定系数(R2=0.902)、内部验证指标(QLOO2=0.852)、外部验证指标(QF12=0.855、QF22=0.850、QF32=0.814)等统计参数均符合建模标准,模型具备良...  相似文献   

11.
在环境水体中,可电离有机化合物(IOCs)可解离为分子和离子形态。研究表明,IOCs离子形态的环境行为、毒性效应等都与其分子形态存在较大差异,因而在研究IOCs环境行为、毒性效应时不应忽略离子化的影响。在构建IOCs相关预测模型时如何表征离子化的影响是当前研究的重要内容之一。探讨了采用基于形态修正的描述符构建IOCs水生毒性预测模型的可行性。具体而言,采用逐步多元线性回归(MLR)方法,构建了可预测63种取代酚、取代苯甲酸和取代苯胺等IOCs对大型溞急性毒性的定量结构-活性关系(QSAR)模型。与仅采用分子形态描述符的模型相比,使用基于形态修正描述符的模型决定系数(R2)、去一法交叉验证系数(Q2LOO)、外部验证系数(Q2EXT)等参数从0.622~0.705提高到了0.840~0.875,表明基于形态修正描述符的模型具有更好的拟合优度、稳健性和预测能力。因此,在将来的研究中,可采用基于形态修正的描述符构建IOCs水生毒性效应预测模型。  相似文献   

12.
羟基自由基(·OH)反应常数对于表征有机污染物在大气环境中持久性具有重要意义.依据经济合作与发展组织(OECD)关于QSAR模型构建与验证的导则,采用量子化学方法对覆盖了不同种类的722个化合物进行结构优化,遗传算法筛选最优结构描述符,运用多元线性回归构建化学品羟基自由基反应常数预测模型.拟合结果显示,多元线性回归模型决定系数R2和标准误差分别为0.819和0.508,基于leverage法评价模型的应用域,结果表明模型具有较强的稳健性、预测性和拟合能力.美国环保局EPI Suite中AOPWIN模块羟基自由基反应常数预测模型没有给出明确的应用域,利用所建模型与美国EPI Suite对化学物质进行比较,其中,有85个化学物质预测优于EPI Suite软件.通过定量结构-活性关系(QSAR)预测技术可弥补羟基自由基反应常数测试数据的缺失,减少测试费用和评估数据的不确定性.  相似文献   

13.
用密度泛函理论(DFT)B3LYP方法,在6-31G(d)基组水平上,对8个1-取代-2-氨基苯并咪唑化合物分子进行了全优化计算,得到其轨道能(ENHOMO、ENLUMO以及二者轨道能隙ΔE2)、原子电荷(Q)等量子化学参数,以及热能校正值Eth、恒容热容Cv、熵S等热力学性质,并计算了8种1-取代-2-氨基苯并咪唑化合物分子的电性拓扑状态指数Em。通过最佳变量子集回归建立这些化合物毒性的QSAR模型,以及热力学性质的QSPR模型。模型的相关系数R2和采用逐一剔除法得到的交叉验证相关系数R2cv均大于0.84和0.72,利用2个模型得到毒性的预测值与实验值的误差分别为0.11和0.20,3个热力学性质预测模型的误差分别为3.89%、4.03%和2.64%,吻合度较好,经检验证明所建模型具有良好的鲁棒性和预测能力。研究工作揭示了基团对毒性大小影响的变化规律、有利于对苯并咪唑类化合物在生态环境中的危害性进行评价,可为研发高效、低毒的苯并咪唑类新型药物提供理论依据。  相似文献   

14.
Nano-QSAR: 纳米毒理学领域的新方法   总被引:1,自引:0,他引:1  
随着纳米毒理学实验研究的不断深入,反映纳米材料生物毒性效应的数据也不断丰富,以这些数据为基础建立的定量结构活性关系(QSAR)模型开始发挥其在纳米材料潜在毒性研究和预测方面的作用。纳米材料的QSAR(Nano-QSAR)研究以经典QSAR模型为指导,结合纳米材料特殊的物理化学性质,提供了一种对纳米材料快速筛选和优先测试的新途径。本文就Nano-QSAR的前期研究现状,从纳米材料结构描述符、毒性效应数据和建模方法3个方面分析了模型的构建流程和框架;通过列举部分研究成果和主要的模型指标,初步探讨了建模方法的选择和结构描述符的识别;最后指出目前Nano-QSAR研究面临的挑战和今后努力的方向。  相似文献   

15.
毒性数据是对化学品进行环境风险评价的基础,慢性毒性数据更能真实的反映毒物对水生生物生长、繁殖及生理功能产生的影响。本文采用细菌生长抑制实验,测定了17种卤代苯对长江水中混合细菌的慢性毒性,得到-lgNOEC值,毒性范围在4.27(氯苯)~5.22(1,2,4-三氯苯)之间。选用量化参数对毒性数据进行定量结构活性关系(QSAR)研究,结果表明,卤代苯对江水细菌的慢性毒性主要与化合物分子的空间大小有关,量化参数范德华面积(SVdW)及分子生成热(Hf)能够很好的描述卤代苯对江水细菌的慢性毒性。  相似文献   

16.
复杂多变的水化学条件影响重金属生物有效性和毒性,进一步影响水质基准的制定,需要建立既考虑水化学条件又考虑时间过程的毒代动力学-毒效动力学(toxicokinetics-toxicodynamics, TK-TD)模型去实时地模拟金属的生物蓄积性及产生的毒性。本研究将生物配体模型(biotic ligand model, BLM)中氢离子与配体络合常数(KHBL)引入TK-TD模型,尝试建立预测水环境不同pH条件下金属毒性的理论模型框架,分别预测镉(Cd)和铅(Pb)在染毒溶液pH为4.5、5.5和6.5下在斑马鱼幼鱼体内的积累和急性毒性,并验证该模型框架的有效性和合理性。结果表明,Pb的最大吸收速率(Jmax)比Cd大约3倍。Cd的致死速率(kk)是Pb的4倍。Cd和Pb的安全阈值(threshold)之间相差30倍。染毒溶液中H+浓度增加可显著抑制Cd和Pb在斑马鱼幼鱼体内的累积量。基于KHBL的TK-TD模型可以较好地预测染毒溶液不同pH(pH=4.5、5.5和6.5)条件...  相似文献   

17.
由于农药的过度使用,水生生态环境正在受到威胁。虹鳟(Oncorhynchus mykiss)的水生毒性在农用化学品环境风险评价中起着重要作用。本文提出了两个范数指数公式,并由此导出几个范数描述符,建立了定量结构-活性关系(QSAR)模型用于预测各种农药对虹鳟的急性毒性(LC50)。结果表明,目前的QSAR模型的R2为0.8053。同时,内部验证(QLOO2=0.7606)、外部验证(Rtraining2=0.8011,Rtesting2=0.8108)、Y-随机化试验和适用域分析进一步证明了该QSAR模型的稳定性、可靠性和广泛的应用领域。因此,这些范数描述符可能适用于描述农药结构以预测水生生物急性毒性。  相似文献   

18.
QSAR模型内部和外部验证方法综述   总被引:2,自引:0,他引:2  
验证定量-结构活性相关(QSAR)模型,是保证模型对未知样本的生物活性具有可靠预测能力的重要前提.然而,目前部分QSAR论文没有对模型进行有效验证.因此,本文详细综述QSAR模型的内部验证方法和外部验证方法.内部验证方法包括留一法(leave-one-out,LOO)交叉验证,留多法(leave-many-out,LMO)或留N法(leave-N-out,LNO)交叉验证,y随机化验证和自举法.评价模型外部预测能力的统计量包括Q2F1、Q2F2、Q2F3、一致性相关系数(concordance correlation coefficient,CCC)、r珋2m和Golbraikh-Tropsha方法.此外,从文献中总结出可接受QSAR模型对应的统计量参考数值,从而为QSAR建模者提供指导与帮助.  相似文献   

19.
陈跃卫  申哲民 《环境化学》2022,41(2):673-682
超临界水氧化(SCWO)作为一项高效的去除水体中有机污染物的技术已得到了广泛的应用.为了更好地理解含氮有机物污染物在SCWO中总氮(TN)去除的规律,本研究以定量构效关系(QSAR)模型为方法,构建了41种含氮有机污染物在SCWO中TN%与有机污染物分子量子化学参数之间的QSAR模型.其最优QSAR模型结果为TN%=8...  相似文献   

20.
群体感应抑制剂是抗生素最有可能的替代品,两者在环境中的共存会对生物造成联合毒性影响。以革兰氏阳性菌枯草芽孢杆菌(Bacillus subtilis,B.subtilis)为模式生物,3种群体感应抑制剂(呋喃酮、吡咯酮和吡咯)和磺胺类药物为研究对象,测定了20 h单一和联合毒性。结果显示,3种群体感应抑制剂和磺胺的联合毒性分别表现为相加和拮抗。同时根据不同的联合毒性效应,以药物和蛋白分子的对接结合能(Ebinding)作为结构参数分别构建了联合毒性的QSAR模型,并分析了不同毒性效应下混合物中各组分的相互作用关系。结果表明,无论是相加还是拮抗,在二元混合体系中磺胺与其靶蛋白DHPS的有效结合浓度总是高于群体感应抑制剂与Lux S的有效结合浓度;但当产生拮抗作用时,磺胺与DHPS的有效结合浓度相对较低,推测可能是群体感应抑制剂的存在使得磺胺由分子态变为离子态,从而使其难以穿过细胞壁与DHPS结合导致的。本研究为建立和分析联合毒性的QSAR模型提供了一定的理论基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号