文章信息
第一、通讯作者:周晓骏 副教授
通讯单位:西安交通大学
https://doi.org/10.1016/j.jhazmat.2024.133945
亮点
•应用QSPR建模技术预测(S)VOCs在织物-空气间的分配系数。
•甄别并整合了关键的分子结构与环境因子描述符。
•针对不同场景,提出了两种先进并经过验证的模型。
•本研究有助于化学物质环境行为及人体暴露的高通量评估。
研究进展
多孔织物作为室内常用的装饰性及功能性材料,具有高承载率及大比表面积的特点,是室内挥发性及半挥发性有机物(S)VOCs赋存与多相耦合反应输运的主要媒介,亦是人体多途径健康暴露的重要窗口。有机化合物分子与室内织物表面间的分配行为是影响环境归趋的关键。化合物及织物纤维的理化性质是决定分配过程自由能的内因,空气温湿度作为外因,通过影响织物的热湿状态也会作用于相间分配过程。然而,现有确定织物-空气分配系数的方法限于特定的织物-化学物质组合,并缺乏对室内环境因素的全面考虑。本文统计了大量(S)VOCs的织物-空气分配系数(Kfa)实验数据,并甄别出了影响分配系数的关键分子描述符。随后,建立了两类织物-空气分配系数的定量构效关系(QSPR)模型,并通过统计指标分析和内外部验证分别评价并对比了两类QSPR模型的拟合性能、稳健性和预测能力。
图1 图文摘要
通过检索近年来的文献,本文收集了包含24种(S)VOCs和3种织物的153个织物-空气分配系数(Kfa)实验数据。其中,VOCs包括甲醛和BTEX,SVOCs包括一种氧苯酮、两种多氯联苯(PCBs)、六种邻苯二甲酸酯(PAEs)、和十种多溴联苯醚(PBDEs)。织物纤维材质包括棉、丝和涤纶。查询各类化合物的辛醇-空气分配系数(Koa)、蒸气压(VP)、辛醇-水分配系数(Kow)和水溶解度(S),作为描述化合物理化性质的备选分子描述符。通过共线性诊断及图2所示的相关性分析,并将这四个参数交叉组合构建QSPR模型,从拟合优度、稳健性和预测能力等多个方面对它们进行比较,最终选择logVP和logS作为表征化合物属性的描述符。
图2 训练数据集的logKfa与(a) logVP、(b) logKoa、(c) logKow以及(d)logS 的相关性分析
除有机化合物的理化性质外,室内的环境参数对织物-化合物的分配行为也有重要影响。通过假设Kfa的温度依赖性遵循范霍夫方程,得到Kfa的温度修正自变量Tterm,1。此外,基于Langmuir单分子层吸附理论,亦可推导得到Kfa的温度修正自变量Tterm,2。湿度对不同织物-化合物分配的作用主要受有机分子的水溶性和材料的亲疏水性的影响,选择织物平衡回潮率W作为QSPR模型中的湿度校正自变量。对三种织物进行了不同湿度条件下的等温吸湿实验,利用扩展Langmuir吸附等温线方程对三种织物平衡回潮率(W)与相对湿度(φ)进行拟合,结果如图3所示。
图3 三种织物的平衡回潮率(W)和相对湿度(φ)的拟合结果
利用多元线性回归建立QSPR模型,建立了织物-空气分配系数与各类分子描述符之间的关联式,并基于温度修正自变量划分了两类QSPR模型。对构建的QSPR模型进行评估和验证,通过对训练集的内部验证分析来评估模型的拟合优度和稳健性,通过对验证集的外部验证分析来评估模型的预测能力。图3(a)和(b)展示了实验值与预测logKfa的散点图,图3(c)和(d)展示了预测值与实验数据的残差图,图3(e)展示了两种方法预测的各种化合物和织物的平均残差分布。两种方法的平均残差相似,残差绝对值主要保持在1以下,表明预测准确性一致且预测性能良好。PCBs、PBDEs和PAEs等SVOCs的预测残差在两种方法中均低于甲醛和BTEX等VOCs,聚酯和棉织物的残差小于丝织物的残差。为进一步评估这两个模型在实际应用中的性能和可靠性,将其应用于预测一组独立验证数据集,四种化合物的残差均低于0.7,进一步证明了本文提出的QSPR模型具有高预测准确性。
图4 QSPR模型的验证和评估
(a) QSPR模型1预测值与实验值的比较;(b) QSPR模型2预测值与实验值的比较;(c) QSPR模型1的残差分布;(d) QSPR模型1和2的残差比较;(e) 不同类型化合物及织物的残差比较;(f) 独立验证数据集的残差
在本研究提出的QSPR模型中,预测因子logVP、∆Hv、T、logS和φ的范围分别为-6.02~5.05 Pa、22.3~72.8 kJ/mol、18~60 °C、-8.32~1.17 mol/L、以及22~75%,从而定义了模型的应用域。此外,通过机理解释分析了化合物理化性质和环境参数对开发的QSPR模型中Kfa的影响。为了更好地说明每个描述符对Kfa的影响,对各描述符进行了敏感性分析,结果如图4(a)和(b)所示,化合物的蒸气压VP对分配系数的影响最大,其次是水溶解度S、温度T和相对湿度φ。
图5 logKfa对不同描述符的敏感性分析
(a) QSPR模型1;(b) QSPR模型2
本文提出的快速预测织物挥发性有机物分配系数的QSPR模型,通过选择合理的分子描述符,考虑了有机化合物的属性、环境温度、湿度和纤维的吸湿特性,可实现不同环境参数下织物-有机化合物分配系数的高通量预测。经过严格的内部和外部验证,证实了该模型出色的拟合精度、稳健的内部一致性和可靠的外部预测能力。研究结果有助于高效准确掌握室内有机化合物浓度分布规律,为暴露评估及健康风险评价提供依据。
作者介绍
周晓骏,博士,西安交通大学米兰平台,米兰(中国)副教授,长期从事室内空气质量与人体健康领域研究。先后主持国家自然科学基金面上、青年项目等科研项目10余项。以第一/通讯作者在J Hazard Mater,Build Environ,Sci Total Environ等国际学术期刊发表科研论文20余篇,参编中英文学术著作4部,获陕西省优秀博士学位论文、Build Environ期刊年度最佳论文奖,作为主要完成人获西藏自治区科学技术一等奖、陕西省科学技术二等奖、华夏建设科学技术二等奖等科研奖励。
通讯邮箱:zhouxiaojun@xjtu.edu.cn