近年來,AI制藥已經(jīng)成為醫(yī)療領(lǐng)域的新晉熱門賽道。2023年ChatGPT的爆火,讓人們看到生成式AI在制藥領(lǐng)域應(yīng)用的多種新可能。
    ChatGPT是由OpenAI開發(fā)的最先進(jìn)的語言模型。創(chuàng)建者OpenAI在測試階段免費(fèi)提供了原型軟件,并鼓勵用戶分享他們的反饋。隨著ChatGPT的廣泛覆蓋,人工智能的學(xué)習(xí)迭代及其在新藥研發(fā)實(shí)踐中的探索迅速升溫。本文初步探討ChatGPT對藥物發(fā)現(xiàn)帶來的影響和變化。
1.ChatGPT在藥物發(fā)現(xiàn)方面的未來前景
    藥物發(fā)現(xiàn)是一個非常困難和復(fù)雜的過程,原因有以下幾方面:一是生物復(fù)雜性,人體是一個極其復(fù)雜的系統(tǒng),在分子水平上理解人體如何工作相當(dāng)困難;二是高失敗率,大多數(shù)進(jìn)入臨床試驗(yàn)的藥物最終未能獲批上市;三是藥物發(fā)現(xiàn)過程漫長且成本高昂,將一種新藥推向市場可能需要長達(dá)15年的時間,花費(fèi)數(shù)十億美元;四是嚴(yán)格的監(jiān)管要求,藥物研發(fā)的過程受到嚴(yán)格監(jiān)管,藥物必須經(jīng)過一系列臨床前研究和臨床試驗(yàn)才可能被批準(zhǔn)上市。此外,許多已知的藥物靶點(diǎn)已經(jīng)被開發(fā),而尋找新的靶標(biāo)變得越來越困難。
    近年來,CADD(計(jì)算機(jī)輔助藥物研發(fā))以及AIDD(AI輔助藥物研發(fā))在加速新藥研發(fā)進(jìn)展方面已經(jīng)取得一定成就,不少研究機(jī)構(gòu)和企業(yè)采用CADD/AIDD輔助進(jìn)行研發(fā)。作為生成式AI技術(shù)的代表,ChatGPT在藥物發(fā)現(xiàn)方面有以下前景。
識別和驗(yàn)證新的藥物靶標(biāo)
    ChatGPT可以應(yīng)用于科學(xué)文獻(xiàn)的數(shù)據(jù)集,并用于生成給定疾病或生物靶標(biāo)的最新研究總結(jié)。這可以幫助研究人員快速識別新的潛在靶標(biāo),或更好地了解特定領(lǐng)域的研究現(xiàn)狀。
設(shè)計(jì)新藥
    ChatGPT可以應(yīng)用于已知藥物分子的數(shù)據(jù)集,并用于生成具有相似性質(zhì)的新化學(xué)結(jié)構(gòu)。這可以幫助研究人員確定成功幾率更高的新先導(dǎo)化合物。
優(yōu)化藥物特性
    ChatGPT可用于預(yù)測新藥的藥代動力學(xué)和藥效學(xué),并支持早期藥物發(fā)現(xiàn)中化學(xué)庫的虛擬篩選。
評估毒性
    ChatGPT可以在毒性數(shù)據(jù)的數(shù)據(jù)集中進(jìn)行應(yīng)用,并用于預(yù)測新藥的潛在毒性作用。
生成藥物相關(guān)報告和論文
    ChatGPT可以應(yīng)用于藥物相關(guān)論文的數(shù)據(jù)集,并用于生成總結(jié)特定領(lǐng)域研究現(xiàn)狀的報告和論文。
    通過提供一種經(jīng)濟(jì)有效的方法來處理大量數(shù)據(jù)并產(chǎn)生新的知識,ChatGPT可以幫助研究人員作出更明智的決定,加速藥物發(fā)現(xiàn)過程。值得注意的是,ChatGPT只是藥物發(fā)現(xiàn)中使用的許多工具中的一個,它不能替代實(shí)驗(yàn)驗(yàn)證和臨床試驗(yàn)。然而,它可以通過提供一種經(jīng)濟(jì)有效的方法來處理大量數(shù)據(jù)和產(chǎn)生新的知識,從而顯著加快和改善藥物開發(fā)過程。
2.ChatGPT在藥物研發(fā)中可能起到的作用
    傳統(tǒng)的創(chuàng)新藥物研發(fā),是通過對大量化合物進(jìn)行實(shí)驗(yàn)篩選,找到有活性的藥物先導(dǎo)化合物。而使用計(jì)算化學(xué)方法的藥物發(fā)現(xiàn),是基于物理原理和應(yīng)用計(jì)算機(jī)算法來幫助發(fā)現(xiàn)新藥。它涉及使用計(jì)算機(jī)模擬和建模技術(shù)來預(yù)測潛在藥物分子的性質(zhì)和相互作用。這些方法可用于了解蛋白質(zhì)和其他生物靶標(biāo)的結(jié)構(gòu)和行為,設(shè)計(jì)和優(yōu)化能與這些靶標(biāo)結(jié)合并調(diào)節(jié)其活性的新化合物??梢哉f,計(jì)算化學(xué)通過提供一種經(jīng)濟(jì)有效的方法來篩選大量化合物,預(yù)測其潛在的療效和毒性,并確定新的先導(dǎo)化合物用于進(jìn)一步開發(fā),在現(xiàn)代藥物發(fā)現(xiàn)中發(fā)揮著至關(guān)重要的作用。此外,它還可使研究人員能夠設(shè)計(jì)選擇性更強(qiáng)、副作用更少的新藥,以及從分子水平了解藥物作用機(jī)制,并優(yōu)化藥物的藥代動力學(xué)和藥效學(xué)。
    在使用計(jì)算化學(xué)方法的藥物發(fā)現(xiàn)過程中,ChatGPT可能起到以下十方面作用。
計(jì)算化學(xué)物質(zhì)的多樣性(multiplicity)
    當(dāng)使用者詢問Zn的多樣性時,ChatGPT給出了正確的答案:“Zn是原子序數(shù)為30的過渡金屬,它的電子構(gòu)型有30個電子。Zn的電子構(gòu)型為[Ar]3d^10 4s^2。由于所有的電子都在軌道中配對,Zn的multiplicity為1。這意味著HOMO中的所有電子都是配對的,分子中沒有未配對的電子?!笨梢?,ChatGPT可以利用密度泛函理論(DFT)在量子力學(xué)計(jì)算中確定各種化學(xué)物質(zhì)的多樣性。
與AutoDock對接
    ChatGPT成功給出了AutoDock(分子模擬軟件)的輸入文件,還解釋了其中提到的參數(shù)。
查找PDB文件
    ChatGPT在PDB(蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫)搜索中也很有用。例如,它可以提供金屬蛋白、與DNA結(jié)合的蛋白、刺突蛋白等的PDB ID。然而,ChatGPT未能回答復(fù)雜的問題。
給出Fasta序列
    Fasta是一種基于文本用于表示核酸序列或多肽序列的格式。ChatGPT可以給出Fasta序列但不能比較Fasta序列。在這種情況下,ChatGPT無法提示Fasta序列,然而它建議可以從UniProt數(shù)據(jù)庫中獲得Fasta序列。
ADMET特性
    關(guān)于藥物的ADMET(吸收、分布、代謝、排泄和毒性)特性,ChatGPT只能給出已知藥物的特性,這些內(nèi)容可以很容易地從各種藥物數(shù)據(jù)庫中獲得。
文獻(xiàn)檢索幫助
    ChatGPT的一個主要應(yīng)用是文獻(xiàn)檢索,并列出與主題相關(guān)的具體結(jié)果。
對接代碼
    ChatGPT可以幫助編寫基本代碼,這一功能可在藥物發(fā)現(xiàn)的許多方面廣泛使用。
檢查剽竊
    ChatGPT可用于檢測剽竊,使研究成果順利發(fā)表。
機(jī)器學(xué)習(xí)和數(shù)據(jù)分析
    ChatGPT可以使用其應(yīng)用程序編程接口(API)集成到程序或應(yīng)用程序中,允許開發(fā)人員輸入文本并接收模型生成的響應(yīng)??梢允褂肞ython、JavaScript和C#等編程語言訪問API。此外,OpenAI團(tuán)隊(duì)還發(fā)布了模型的預(yù)訓(xùn)練版本,可以使用稱為轉(zhuǎn)移學(xué)習(xí)的過程針對特定任務(wù)進(jìn)行微調(diào)。
創(chuàng)新
    創(chuàng)新是研究領(lǐng)域的一個主要部分,只有提出不同的問題才能做到創(chuàng)新。在這一方面,ChatGPT對于幫助藥物研發(fā)人員提出新穎的想法非常有用。
3.ChatGPT在藥物發(fā)現(xiàn)方面的局限性
    當(dāng)然,與其他機(jī)器學(xué)習(xí)模型一樣,ChatGPT所提供的答案在準(zhǔn)確性、廣泛性方面仍存在局限,在藥物發(fā)現(xiàn)方面也不例外。局限性主要體現(xiàn)在以下方面。
依賴于數(shù)據(jù)的質(zhì)量和可用性
    如果數(shù)據(jù)不完整、存在偏倚或不準(zhǔn)確,則模型的預(yù)測可能不可靠。
缺乏實(shí)驗(yàn)驗(yàn)證
    ChatGPT可以生成預(yù)測和假設(shè),但不能進(jìn)行實(shí)驗(yàn)或測量化合物的性質(zhì)。因此,模型作出的預(yù)測需要實(shí)驗(yàn)驗(yàn)證。
對潛在生物學(xué)的理解有限
    雖然ChatGPT可以生成類似人類語言的文本,但它不理解它正在模擬的系統(tǒng)的潛在生物學(xué)意義。因此,模型做出的預(yù)測可能并不總是反映系統(tǒng)的真實(shí)復(fù)雜性。
可解釋性有限
    ChatGPT與其他機(jī)器學(xué)習(xí)模型一樣,可能難以解釋,且不清楚模型是如何得出特定預(yù)測的。
處理不確定性的局限性
    ChatGPT是一種確定性模型,不能解釋數(shù)據(jù)和預(yù)測中的不確定性。
缺乏透明度
    ChatGPT是一個黑盒模型,很難理解和解釋模型的內(nèi)部工作原理,這會使模型的預(yù)測難以信任。
總之,ChatGPT是一種強(qiáng)大的語言模型,可以協(xié)助藥物發(fā)現(xiàn)。通過處理和生成類人文本,可以幫助研究人員快速識別新的潛在靶標(biāo),更好地了解研究現(xiàn)狀、以及設(shè)計(jì)新藥、優(yōu)化新藥的藥代動力學(xué)和藥效學(xué)。然而,要注意的是,ChatGPT只是藥物發(fā)現(xiàn)中使用的許多工具中的一個,它并不能替代實(shí)驗(yàn)驗(yàn)證和臨床試驗(yàn)。此外,它不能進(jìn)行復(fù)雜計(jì)算,如模擬和分析分子水平研究。盡管如此,ChatGPT在藥物發(fā)現(xiàn)中的應(yīng)用是一個很有前景的領(lǐng)域,它有可能顯著加快和改善藥物開發(fā)過程。
(來源:中國醫(yī)藥報)