【建模文章解讀】采用液質(zhì)聯(lián)用技術(shù)鑒定大環(huán)內(nèi)酯類抗生素的雜質(zhì)以及構(gòu)建QSRR模型預測雜質(zhì)的保留時間
導讀
為促進制藥同行對建模與模擬方法的深入理解,多參考國內(nèi)外同行建模的思路與流程,深入理解應用案例中建模的要點;凡默谷技術(shù)部精心挑選了建模與模擬較有特色的文章進行剖析解讀,希望對您有幫助。
解讀人:凡默谷陳濤
推薦理由
中國食品藥品檢定研究院構(gòu)建大環(huán)內(nèi)酯類抗生素雜質(zhì)結(jié)構(gòu)-色譜保留關系(QSRR)模型的應用案例。
詳細講述了構(gòu)建QSRR模型的流程,并基于該流程思路建立起關系良好的三種白霉素類大環(huán)內(nèi)酯類抗生素雜質(zhì)結(jié)構(gòu)與色譜保留時間的QSRR模型。
借助這些模型,可提前預測新雜質(zhì)在相應色譜條件下的出峰時間,考察色譜系統(tǒng)的適應性;也可以對已知但未檢出雜質(zhì)的出峰時間進行預測,評估這部分雜質(zhì)未檢出的原因。
該研究拓展了傳統(tǒng)定量構(gòu)效關系(QSAR)模型的應用,也為雜質(zhì)檢測、評估提供一種全新的研究思路。
文獻摘要
通過發(fā)酵或者半合成生產(chǎn)的大環(huán)內(nèi)酯類抗生素一般都包含有很多成分,且隨著生產(chǎn)工藝的變動還經(jīng)常引入新的雜質(zhì)。因此,其雜質(zhì)控制的分析方法需要良好的靈敏度和選擇性。通過檢索藥典以及相關參考文獻,本工作分別建立了三種獨立、靈敏、準確的LC-MS分析方法,以用于檢測交沙霉素、交沙霉素丙酸酯、麥迪霉素以及它們的有關物質(zhì);
實際中,由于采用不同的雜質(zhì)控制分析方法,可能會導致部分已知雜質(zhì)被漏檢;另外,由于生產(chǎn)工藝、合成技術(shù)的發(fā)展等,也會帶來一些新的未知雜質(zhì);因此一個良好的分析方法盡量能覆蓋對某個藥物所有可能的雜質(zhì)進行評估。在分析方法建立和篩選過程中,如果能提前預測所有雜質(zhì)的大致出峰位置,以判斷所采用的分析方法能否將各種潛在雜質(zhì)分離開;
案例基于三種大環(huán)內(nèi)酯類抗生素及其有關物質(zhì)的結(jié)構(gòu)式與對應的優(yōu)化條件下的色譜保留時間,構(gòu)建QSRR模型。所構(gòu)建的模型經(jīng)內(nèi)部驗證、外部預測評估后,確定了最終具有較高準確性、穩(wěn)定性的預測模型,該模型可進一步預測對未檢測出的已知雜質(zhì)的色譜保留時間,也可在新雜質(zhì)結(jié)構(gòu)式確認后用于預測其大致的出峰時間。
1. 研究背景
通過發(fā)酵或者半合成生產(chǎn)的大環(huán)內(nèi)酯類抗生素一般都包含有很多成分,且隨著生產(chǎn)工藝的變動還經(jīng)常引入新的雜質(zhì)。因此,其雜質(zhì)控制的分析方法需要良好的靈敏度和選擇性。通過檢索藥典以及相關參考文獻,本工作分別建立了三種獨立、靈敏、準確的LC-MS分析方法,以用于檢測交沙霉素、交沙霉素丙酸酯、麥迪霉素以及它們的有關物質(zhì);
實際中,由于采用不同的雜質(zhì)控制分析方法,可能會導致部分已知雜質(zhì)被漏檢;另外,由于生產(chǎn)工藝、合成技術(shù)的發(fā)展等,也會帶來一些新的未知雜質(zhì);因此一個良好的分析方法盡量能覆蓋對某個藥物所有可能的雜質(zhì)進行評估。在分析方法建立和篩選過程中,如果能提前預測所有雜質(zhì)的大致出峰位置,以判斷所采用的分析方法能否將各種潛在雜質(zhì)分離開;
案例基于三種大環(huán)內(nèi)酯類抗生素及其有關物質(zhì)的結(jié)構(gòu)式與對應的優(yōu)化條件下的色譜保留時間,構(gòu)建QSRR模型。所構(gòu)建的模型經(jīng)內(nèi)部驗證、外部預測評估后,確定了最終具有較高準確性、穩(wěn)定性的預測模型,該模型可進一步預測對未檢測出的已知雜質(zhì)的色譜保留時間,也可在新雜質(zhì)結(jié)構(gòu)式確認后用于預測其大致的出峰時間。
2 建模數(shù)據(jù)與處理
2.1 白霉素相關的16元大環(huán)內(nèi)酯類結(jié)構(gòu)式特點
2.3 數(shù)據(jù)獲取及處理
包含交沙霉素、麥迪霉素、麥白霉素、北里霉素、交沙霉素丙酸酯、麥迪霉素醋酸酯及其雜質(zhì)在內(nèi)的24個白霉素相關的16元大環(huán)內(nèi)酯類化合物用于篩選構(gòu)建QSRR模型;
模型中應用的色譜保留時間是在麥迪霉素醋酸酯優(yōu)化的色譜系統(tǒng)下檢測得到的,并列舉在上述表格
采用半經(jīng)驗的MOPAC/AM1方法對所有化合物進行能量最小化處理,確定最穩(wěn)定的分子結(jié)構(gòu)式,并將所有結(jié)構(gòu)式連同色譜保留時間制作為sdf格式的文件;
建立和驗證后的QSRR模型,再進一步建立麥迪霉素醋酸酯最優(yōu)的色譜條件下交沙霉素以及交沙霉素丙酸酯保留時間與其優(yōu)化的色譜條件的保留時間的轉(zhuǎn)化關系,用于這兩個化合物雜質(zhì)保留時間的預測;
三種化合物及其雜質(zhì)在各自優(yōu)化條件下的保留時間如下表所示:
3 模型結(jié)果與分析
3.1 分子描述符的產(chǎn)生與篩選
采用ADMET Predictor軟件根據(jù)化合物的結(jié)構(gòu)式可自動產(chǎn)生親脂性、理化性質(zhì)、拓補參數(shù)等200多個分子描述符。所有產(chǎn)生的描述符,進一步依據(jù)相關原則去除一些無效的描述符,包括剔除非數(shù)性描述、低方差描述、無代表性描述符、篩選高敏感、高相關性描述符、區(qū)間線性靈敏度分析等方式,最后篩選得到50個分子描述符用于進一步的QSRR模型搭建。
3.2 訓練集和測試集的產(chǎn)生
采用Kohonen self-organizing map的方法并設置minimum test set size為20%,由軟件隨機分配與產(chǎn)生模型搭建的訓練集和測試集。
3.3 建模方法的選擇與設置
選擇多重線性回歸(MLR)的方法進行搭建模型,并設置該模型最小的描述符個數(shù)為2個,最大的描述符個數(shù)為16,設置輸入個數(shù)從2-16的每次增長間隔為2:即分別考察選擇描述符個數(shù)為2、4、6、8、10、12、14、16時對模型相關性的影響。
3.4 模型搭建與結(jié)果
設置好上述參數(shù)后,即可基于軟件自動搭建每種情況下的模型,并將相關結(jié)果列舉在軟件最終顯示界面中;可選擇不同的評價指標(如R2, RMSE等)對各個模型進行評價,篩選得到最優(yōu)的模型;經(jīng)過統(tǒng)計分析后,發(fā)現(xiàn)采用8個分子描述符、18個化合物作為訓練集、MLR建模方法可以得到最理想的QSRR模型,優(yōu)化模型用到的分子描述如下:
3.5 結(jié)果驗證與預測能力檢測
采用R2, RMSE等統(tǒng)計學分別對訓練集和測試集的預測誤差進行內(nèi)部驗證,其相關結(jié)果顯示如下。結(jié)果提示,建立的QSRR模型具有良好的準確性:
模型還進一步采用留一法較差驗證的方法進行了外部驗證,以考察模型預測的能力。相關的統(tǒng)計學參數(shù)(如Q2, RMSE-CV等)列舉如下。結(jié)果顯示,建模的模型同樣具有較好的外部預測能力:
4 模型應用
4.1 建立加沙霉素色譜保留時間的預測關系
基于上述麥迪霉素醋酸酯色譜系統(tǒng)中構(gòu)建的QSRR模型,建立了加沙霉素最優(yōu)色譜條件下的保留時間預測的公式,以用于加沙霉素及其雜質(zhì)在其最優(yōu)色譜條件下保留時間的預測。轉(zhuǎn)化關系如下:
y = 2.29x + 12.71 (x是在麥迪霉素醋酸酯色譜系統(tǒng)的保留時間),其中r2為0.97, SD值為3.79, n = 10。
4.2 建立加沙霉素丙酸酯色譜保留時間的預測關系
基于上述麥迪霉素醋酸酯色譜系統(tǒng)中構(gòu)建的QSRR模型,建立了加沙霉素丙酸酯最優(yōu)色譜條件下的保留時間預測的公式,以用于加沙霉素丙酸酯及其雜質(zhì)在其最優(yōu)色譜條件下保留時間的預測。轉(zhuǎn)化關系如下:
y = 1.15x ? 3.81 (x是在麥迪霉素醋酸酯色譜系統(tǒng)的保留時間),其中r2為0.99, SD值為0.27, n = 11。
4.3 預測加沙霉素及加沙霉素丙酸酯未檢出的已知雜質(zhì)保留時間
基于建立的良好QSRR模型以及相應的轉(zhuǎn)化關系公式,預測在優(yōu)化的色譜條件,未檢出的相關已知雜質(zhì)的色譜保留時間,結(jié)果如下:
根據(jù)各個雜質(zhì)的保留時間,可推測這些雜質(zhì)可能不存在本次檢測的樣品中,或者其含量低于檢測限;同時也應該密切關注可能出現(xiàn)在這些已知雜質(zhì)保留時間附近的新雜質(zhì)。
5 模型討論
本工作建立和優(yōu)化三種獨立的、敏感的色譜分析方法,以用于檢測加沙霉素、交沙霉素丙酸酯和麥迪霉素醋酸酯及其有關物質(zhì),并進一步根據(jù)化合物的結(jié)構(gòu)式與色譜保留時間,構(gòu)建了準確度高、有預測能力的QSRR模型。
該模型可進一步用于預測色譜系統(tǒng)未檢出的已知雜質(zhì)的保留時間;也可用于預測生產(chǎn)過程、合成工藝變動引入的新雜質(zhì)的保留時間。以評價目前品種的分析方法對質(zhì)控容量的潛力,評估當前系統(tǒng)能否對雜質(zhì)實現(xiàn)有效控制,在分析檢測之前篩選出合理的分析標準進行質(zhì)控研究。
6 應用軟件與模塊
該案例應用的軟件是ADMET Predictor (version 7.2),涉及模塊為Modeler module。
參考文獻
Xia Zhang, et al., Identification of impurities in macrolides by liquid chromatography-mass spectrometric detection and prediction of retention times of impurities by constructing quantitative structure-retention relationship (QSRR). J Pharm Biomed Anal. 2017 Oct 25; 145:262-272. IF: 3.255
延伸閱讀文獻
王晨等,頭孢地尼有關物質(zhì)定量結(jié)構(gòu)?色譜保留模型的建立. 藥學學報,2015, 50 (9): 1161?1166