首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
依据经济合作与发展组织(OECD)关于定量结构-活性关系(QSAR)模型构建和使用导则,将780个有机化合物,以4:1的比例随机划分为训练集(624个化合物)和验证集(156个化合物),通过多元线性回归(MLR)方法构建了一个包含12个描述符的有机化合物鱼类生物富集因子(BCF)的QSAR模型。QSAR模型的调整决定系数R2ad j=0.809,去一法交叉验证系数Q2LOO=0.803,外部验证系数Q2EXT=0.732,表明模型具有较好的拟合优度、稳健性和预测能力。采用欧几里德距离方法表征模型应用域,通过威廉姆斯图分析模型离群点,并对模型进行机理解释。所构建的模型,可以用于预测应用域内有机化学品的生物富集因子。  相似文献   

2.
全氟化合物(perfluorinated compounds, PFCs)作为一种新兴有机污染物,因其环境持久性及生物富集性,对生态环境健康存在潜在风险。鉴于实验测定PFCs生物富集作用的局限性,为实现对PFCs生物富集因子(bioconcentration factor, BCF)的合理预测及其影响因素分析,本研究基于前人报道的log BCF实验数据,采用多元线性逐步回归方法建立了PFCs对鱼类肝脏生物富集作用的定量结构-活性关系(quantitative structure-activity relationship, QSAR)模型,并对该模型进行了全面验证与评估及机理解释。结果表明,所建QSAR模型的决定系数(R2=0.902)、内部验证指标(QLOO2=0.852)、外部验证指标(QF12=0.855、QF22=0.850、QF32=0.814)等统计参数均符合建模标准,模型具备良...  相似文献   

3.
依据经济合作与发展组织(OECD)关于定量结构-活性关系(QSAR)模型构建和使用导则,通过多元线性回归(MLR)方法建立了一个包含9个描述符的卤代有机化合物鱼类生物富集因子(BCF)的QSAR模型。QSAR模型的调整决定系数R2adj = 0.877,去一法交叉验证系数Q2LOO= 0.873,外部验证系数Q2EXT= 0.757,表明模型具有较好的拟合优度、稳健性和预测能力。采用欧几里德距离方法表征了模型应用域,并对模型进行了机理解释。所构建的模型,可以用于预测应用域内卤代化合物的BCF。  相似文献   

4.
水生生物急性毒性QSAR模型研究进展   总被引:4,自引:3,他引:1  
化学品污染对人类健康和生态环境造成潜在风险。但是,危害性信息缺失是进行化学品风险评价的主要挑战。经济合作与发展组织(OECD)和美国环保署都提倡用非动物实验替代方法来弥补数据缺失。定量结构-活性关系(QSAR)被认为是一种有应用前景的替代技术。水生生物急性毒性是化学品风险评估和优先污染物筛选中最常用的参数之一。但是,目前可获得的实验毒性数据非常有限。本文总结了近年来发展的急性毒性预测模型,包括:(1)基于同类化合物建模;(2)基于数理统计建模;(3)基于化合物毒性作用模式建模。从模型预测能力、应用域、机理解释等角度对这3类模型进行了比较。其中,基于作用模式构建的模型一般具有较好的预测性能,并有助于机理解释,将是今后水生生物急性毒性预测的发展方向。  相似文献   

5.
有机化合物在生物体内的富集,通常用生物富集因子(bioconcentration factor,简称BCF)来表达,这是化合物生态环境毒性评估的重要指标。为合理预测有机化合物是否易于生物富集,首先从美国环保局网站收集了624个具有不同BCF值的化合物,然后采用7种分子指纹结合5种机器学习方法(包括支持向量机、C4.5决策树、k最近邻法、随机森林法和朴素贝叶斯法),构建了化合物BCF的分类预测模型,所有模型均采用独立外部验证集进行验证。其中,使用Chemo Typer分子指纹结合支持向量机方法得到的二分类模型,整体预测准确度最好,达到了85.4%。通过采用信息增益、频率分析等方法,进一步确定了化合物中易于引起生物富集的关键子结构,包括芳基氯、二芳基醚、氯代烷烃等。研究中所用到的方法为有毒化学品的生态风险评价提供了良好可靠的预测工具。  相似文献   

6.
针对磺胺类抗生素在鱼体内的生物富集特性,采用半静态生物富集测试法,研究磺胺二甲嘧啶(SMT)和磺胺甲恶唑(SMX)在斑马鱼(Brachydanio rerio)体内的生物富集规律及生物富集系数(bio-concentration factor,BCF),并选用3种常用预测模型对2种磺胺类抗生素的BCF值进行估算,比较了估算值与实际测定值,为磺胺类抗生素生物富集性的预测提供依据。研究结果表明,当暴露浓度为0.01 mg·L~(-1)~1.00 mg·L~(-1)时,鱼体对SMT的最大生物富集系数BCF值为1.11,最大富集量出现在暴露24~48 h期间;SMX的最大BCF值为1.15,最大富集量处于暴露96~168 h之间。根据磺胺类抗生素的理化性质,通过比较3种生物富集预测模型获得SMT和SMX的BCF值,发现其中Kow预测模型所得估算值最为接近实测值。因此可利用该模型作为磺胺类抗生素富集性的预测工具,为我国兽药抗生素的环境风险预测和评价提供依据。  相似文献   

7.
QSAR模型内部和外部验证方法综述   总被引:2,自引:0,他引:2  
验证定量-结构活性相关(QSAR)模型,是保证模型对未知样本的生物活性具有可靠预测能力的重要前提.然而,目前部分QSAR论文没有对模型进行有效验证.因此,本文详细综述QSAR模型的内部验证方法和外部验证方法.内部验证方法包括留一法(leave-one-out,LOO)交叉验证,留多法(leave-many-out,LMO)或留N法(leave-N-out,LNO)交叉验证,y随机化验证和自举法.评价模型外部预测能力的统计量包括Q2F1、Q2F2、Q2F3、一致性相关系数(concordance correlation coefficient,CCC)、r珋2m和Golbraikh-Tropsha方法.此外,从文献中总结出可接受QSAR模型对应的统计量参考数值,从而为QSAR建模者提供指导与帮助.  相似文献   

8.
由于农药的过度使用,水生生态环境正在受到威胁。虹鳟(Oncorhynchus mykiss)的水生毒性在农用化学品环境风险评价中起着重要作用。本文提出了两个范数指数公式,并由此导出几个范数描述符,建立了定量结构-活性关系(QSAR)模型用于预测各种农药对虹鳟的急性毒性(LC50)。结果表明,目前的QSAR模型的R2为0.8053。同时,内部验证(QLOO2=0.7606)、外部验证(Rtraining2=0.8011,Rtesting2=0.8108)、Y-随机化试验和适用域分析进一步证明了该QSAR模型的稳定性、可靠性和广泛的应用领域。因此,这些范数描述符可能适用于描述农药结构以预测水生生物急性毒性。  相似文献   

9.
外源性化学品暴露是肝脏疾病的重要病因,有必要筛查肝毒性化学品并进行管理。定量构效关系(QSAR)模型,通过关联化学品的分子结构和毒性效应,可用于肝毒性化学品的有效筛查。本研究旨在构建性能优异的肝毒性化学品的QSAR筛查模型。以往基于机器学习算法的化学品肝毒性筛查模型数据来源单一,覆盖的化学空间有限。本研究搜集整理了4 014种化学品肝毒性的定性数据,使用多种机器学习算法,建立了肝毒性化学品的筛查模型。以PubChem指纹作为模型输入,应用随机森林算法所建模型的效果最优。十折交叉验证的准确率(RA)、敏感性(RSE)、特异性(RSP)和受试者工作特征曲线下的面积(AROC)分别为0.714, 0.596, 0.799和0.764;外部验证的RA,RSE,RSP和AROC分别为0.733, 0.620, 0.812和0.804。基于分子相似性原理,表征了模型应用域。分子中是否具有氮原子以及氮原子的数量,是决定化学品是...  相似文献   

10.
Nano-QSAR: 纳米毒理学领域的新方法   总被引:1,自引:0,他引:1  
随着纳米毒理学实验研究的不断深入,反映纳米材料生物毒性效应的数据也不断丰富,以这些数据为基础建立的定量结构活性关系(QSAR)模型开始发挥其在纳米材料潜在毒性研究和预测方面的作用。纳米材料的QSAR(Nano-QSAR)研究以经典QSAR模型为指导,结合纳米材料特殊的物理化学性质,提供了一种对纳米材料快速筛选和优先测试的新途径。本文就Nano-QSAR的前期研究现状,从纳米材料结构描述符、毒性效应数据和建模方法3个方面分析了模型的构建流程和框架;通过列举部分研究成果和主要的模型指标,初步探讨了建模方法的选择和结构描述符的识别;最后指出目前Nano-QSAR研究面临的挑战和今后努力的方向。  相似文献   

11.
随着高通量筛选技术的快速发展,化学品的毒性相关信息与日俱增。现今快速发展的数据挖掘技术和机器学习等计算机方法为化学品的毒性预测和风险防控提供了新途径。有害结局路径(adverse outcome pathway, AOP)将化合物的结构、分子启动事件和生物的有害结局建立关联,为污染物的毒性测试、预测和评估提供了新的模式,最终实现风险评估并应用于管理决策。定量结构-活性关系(QSAR)建模、分子模拟以及多组学技术在AOP的各个方面发挥了重要作用。基于此,本综述主要介绍数据挖掘与机器学习在毒理学中的应用方法,涉及QSAR建模、分子模拟及组学等方面,并结合实例分析系统阐述了当前研究的重点与方向,以更好地适应当前大数据时代的研究背景。  相似文献   

12.
采用新型的的三维原子场全息作用矢量(3D-HoVAIF)研究了200种芳香化合物的化学结构与其生物毒性的定量构效关系(QSAR).首先对芳香化合物进行了结构参数化表达,然后采用逐步回归(SMR)对变量进行筛选,建立了三维定量构效关系模型.其87个无氢键分子的模型和113个有氢键分子的模型的复相关系数和标准偏差分别为R2=0.801,SD=0.473和R2=0.929,SD=0.318.模型具有良好的稳定性和预测能力,证明了该三维原子场全息作用矢量在分子结构表征和生物毒性预测上的适用性.  相似文献   

13.
羟基自由基(·OH)反应常数对于表征有机污染物在大气环境中持久性具有重要意义.依据经济合作与发展组织(OECD)关于QSAR模型构建与验证的导则,采用量子化学方法对覆盖了不同种类的722个化合物进行结构优化,遗传算法筛选最优结构描述符,运用多元线性回归构建化学品羟基自由基反应常数预测模型.拟合结果显示,多元线性回归模型决定系数R2和标准误差分别为0.819和0.508,基于leverage法评价模型的应用域,结果表明模型具有较强的稳健性、预测性和拟合能力.美国环保局EPI Suite中AOPWIN模块羟基自由基反应常数预测模型没有给出明确的应用域,利用所建模型与美国EPI Suite对化学物质进行比较,其中,有85个化学物质预测优于EPI Suite软件.通过定量结构-活性关系(QSAR)预测技术可弥补羟基自由基反应常数测试数据的缺失,减少测试费用和评估数据的不确定性.  相似文献   

14.
15种取代酚对淡水发光菌Q67的毒性及定量构效分析   总被引:1,自引:0,他引:1  
为了更加准确和便捷地预测各种取代酚类化合物的急性毒性,以淡水发光菌Q67(Vibrio qinghaiensis sp.-Q67)为受试生物,测定了15种典型取代酚的急性毒性;采用logD(正辛醇/水分配系数),LUMO(分子最低空轨道能)和MW(分子量)等取代酚的7种主要结构参数,利用偏最小二乘回归法建立了定量结构-活性相关(quantitative structure-activity relationships,QSAR)模型。结果表明,15种取代酚的EC_(50)在5.76×10~(-6)~1.27×10~(-3)mol·L~(-1)之间,且有很好的剂量-效应关系;QSAR模型的主成分分析显示,-logEC_(50)与logD、LUMO和MW值正相关,且logD对模型的贡献最大,即越容易与Q67菌结合的酚类化合物对其的急性毒性越大;建立的QSAR模型具有较好的预测能力(Q~2_(EXT)=0.91,RMSE=0.49)和较高的稳定性(Q~2_(CUM)=0.58),能够用于预测其他酚类化合物对Q67菌的急性毒性。  相似文献   

15.
利用三油酸甘油酯-醋酸纤维素半透复合膜(TECAM)对12种邻苯二甲酸酯类化合物(PAEs)进行微耗式快速富集试验(24 h),估算生物模拟采样方法对PAEs化合物的富集动力学参数以及富集系数,比较了膜富集系数(MCF)与生物富集系数(实验测定、模型预测)之间的相关性,及其随化合物的辛醇-水分配系数(KOW)的变化趋势。结果表明:(1)随着疏水性的增强,化合物在TECAM膜中具有不同的富集趋势:弱疏水性化合物能快速平衡,中疏水性化合物先经历线性富集阶段随后到达曲线富集阶段,中强疏水性化合物一直处于线性阶段;(2)膜对PAEs的富集系数随KOW的增加先上升后下降,与BCF随KOW的变化趋势一致,同时两种富集系数对KOW均符合二次曲线模型,并且MCF的相关性更好;(3)对MCF整体高于BCF的结果做出了解释——生物代谢使得BCF偏低,而TECAM对PAEs的富集不涉及代谢过程。尽管MCF不能表征生物体对邻苯二甲酸酯等可生物降解目标化合物的代谢过程,但该方法不受物种个体差异影响,具有估算水生生物富集目标化合物的潜在能力,更利于化合物之间的评估比较,并可作为对比研究生物代谢对BCF的影响。  相似文献   

16.
化学品风险评价是进行化学品环境管理和污染防治的前提,其关键在于化学品环境暴露和危害性数据的获取。仅采用实验测试获取相关数据的效率较低、成本高,难以满足数以万计的化学品风险评价的需求。以定量构效关系(QSAR)模型为代表的计算毒理学技术,可实现化学品环境暴露与危害性参数的高通量预测,是填补相关数据缺失的重要方法。近年来,计算毒理学领域发展了一批面向化学品环境暴露和危害性参数预测的软件工具,集成了数据和模型资源,在化学品管理活动中发挥了重要作用。本研究共搜集了国内外25款计算毒理学软件,通过文献资料调研和软件试用,从开发背景、预测终点、预测方法、功能与信息完整度和内嵌模型预测性能等方面对软件进行分析比较。分析表明,化学品管理法规支持、多方合作和数据共享,是计算毒理学软件开发的重要基础条件。现有计算毒理学软件在预测终点覆盖度、预测结果可靠性、软件实用性和可拓展性方面仍有提升空间。未来相关软件的开发需要结合深度学习等先进建模技术,增强软件的预测性能并扩大其应用范围,使之成为化学品风险综合评价和决策分析的实用工具。  相似文献   

17.
气相中有机化学品与羟基自由基(!OH)反应速率常数(k_(OH))是评价化学品大气持久性的重要参数.而化学品种类繁多,现有的k_(OH)实验数据不能满足其生态风险评估的需求.因此,需要建立一种能够快速预测有机化学品k_(OH)的方法,填补现有数据的缺失.本研究搜集整理了917种有机化合物的k_(OH)实验值,采用逐步多元线性回归法(MLR)和支持向量机法(SVM)分别构建了用于预测多种类化合物lgk_(OH)的线性和非线性定量结构-活性关系(QSAR)模型.基于MLR的预测模型具有良好的拟合度(经校正的相关系数的平方R_(adj.tr)~2=0.862、均方根误差RMSE_(tr)=0.455)、稳健性(交叉验证系数Q_(LOO)~2=0.856)和预测能力(外部验证系数Q_(ext)~2=0.850).基于SVM的预测模型也具有良好的拟合度(R_(adj.tr)~2=0.915,RMSE_(tr)=0.358)和预测能力(Q_(ext)~2=0.860).机理分析表明,最高占据分子轨道能(E_(HOMO))、卤素原子在分子中所占的百分比(X%)和分子中具有=CH—结构的数目(NdsCH)是最重要的3个描述符,解释了数据集78.3%的方差.采用Williams法表征模型的应用域.所建立的模型可用于预测烷烃、烯烃、炔烃、芳香族化合物、醇类、酮类、醚类、醛类、酸类、酯类、卤代化合物、含氮化合物、含硫化合物等室温下的k_(OH).  相似文献   

18.
正辛醇-空气分配系数是描述化学品在空气和环境有机相之间分配的一个关键参数,对化学品分配、迁移、转化规律和生态效应评价具有重要意义。采用量子化学方法对309个化合物进行结构优化,采用遗传算法筛选最优结构描述符,运用多元线性回归和神经网络算法构建化学品正辛醇-空气分配系数预测模型。模型方程表明影响化学品正辛醇-空气分配系数的3个参数为分子中非氢原子个数(Nsk)、3D-MoRSE描述符(Mor12u)、氮原子和氧原子数目(n HDon)。拟合结果显示,多元线性回归模型决定系数R2和标准误差分别为0.911和0.880,神经网络模型决定系数R2和均方根误差分别为0.839和0.830。基于杠杆(leverage)法评价模型的应用域,结果表明模型具有较强的稳健性、预测性和拟合能力。通过定量结构-活性关系(QSAR)预测技术可弥补正辛醇-空气分配系数测试数据的缺失,减少测试费用和评估数据的不确定性。  相似文献   

19.
陈跃卫  申哲民 《环境化学》2022,41(2):673-682
超临界水氧化(SCWO)作为一项高效的去除水体中有机污染物的技术已得到了广泛的应用.为了更好地理解含氮有机物污染物在SCWO中总氮(TN)去除的规律,本研究以定量构效关系(QSAR)模型为方法,构建了41种含氮有机污染物在SCWO中TN%与有机污染物分子量子化学参数之间的QSAR模型.其最优QSAR模型结果为TN%=8...  相似文献   

20.
多环芳烃光解活性的量子化学研究   总被引:6,自引:1,他引:5  
应用量子化学从头算HF/6-311 G(d)和B3LYP/6-311 G(d)方法计算了16种PAHs的多种量子化学参数,选取六种参数为分子结构的描述符,采用最小二乘法对16种PAHs的光解半衰期进行逐步多元线性回归分析,得到两个PAHs光解半衰期的QSAR模型,模型具有较高的相关系数,可有效地用于预测PAHs的光解半衰期,结果表明,HF方法所得模型优于B3LYP方法所得的模型,所得模型与基于半经验PM3算法的QSAR模型相比较,HF从头算方法所建立的QSAR模型比半经验PM3算法的结果要好,在所考查的诸多参数中,分子最高占有轨道特征值EHOMO对PAHs光解半衰期起着决定作用,最后,运用所得模型预测了3种PAHs的光解半衰期。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号