分子對接
分子對接(macromolecular docking )是分子模擬的重要方法之一,其本質是兩個或多個分子之間的識別過程,其過程涉及分子之間的空間匹配和能量匹配。分子對接方法在藥物設計、材料設計等領域有廣泛的應用。
背景
大多數蛋白質的生物學作用,例如它們與哪些其他大分子相互作用,目前人們的認知並不充分。即使是那些參與了一個已有廣泛研究的生物過程(例如克雷布斯循環)的蛋白質,也可能有意想不到的相互作用分子或與該過程無關的功能。
在已知蛋白質-蛋白質相互作用的情況下,還會出現其他問題。遺傳病(例如囊性纖維化)是由錯誤摺疊或突變的蛋白質引起的,人們希望了解給定突變是否會導致異常的蛋白質-蛋白質相互作用。在遙遠的未來,人們可能可以設計蛋白質來執行生物功能,而分析這些蛋白質的潛在相互作用將必不可少。
對於任何給定的一組蛋白質,以下問題可能會引起人們的興趣:
- 這些蛋白質是否在體內結合?
如果它們結合,
- 它們在結合狀態下採用什麼樣的空間構型?
- 它們之間的相互作用有多強?
如果它們不結合,
- 它們能否通過誘導突變而結合?
蛋白質-蛋白質對接最終被設想能夠解決所有這些問題。此外,由於對接方法可以基於純粹的物理原理,甚至未知功能(或研究相對較少)的蛋白質也可以進行對接。唯一的先決條件是它們的分子結構已經被實驗確定,或者可以通過蛋白質結構預測技術估計。
蛋白質-核酸相互作用在活細胞中占有重要地位。轉錄因子,它們調節基因表達,和聚合酶,它們催化複製,都是由蛋白質組成的,而它們與之相互作用的遺傳物質是由核酸組成的。建模蛋白質-核酸複合物提出了一些獨特的挑戰,如下所述。
歷史
分子對接這一想法的歷史可以追溯到19世紀提出的受體學說,Fisher提出的受體學說認為,藥物與體內的蛋白質大分子即受體會發生類似鑰匙與鎖的識別關係,這種識別關係主要依賴兩者的空間匹配。隨著受體學說的發展,人們對生理活性分子與生物分子的相互作用有了更加深刻的認識,從基於空間匹配的剛性模型逐漸發展成為基於空間匹配和能量匹配的柔性模型。模型的優化使通過計算模擬分子間相互作用的設想更容易實現。另一方面,計算機和計算科學的迅速發展又使得人們能夠處理大量數據,這兩方面的因素共同促成了分子對接方法的出現。
早期的分子對接方法用分子力學方法或者量子化學方法計算小分子之間分子識別,在一些分子模擬軟體包中也含有分子對接的模塊。但是由於算法和計算機處理能力的限制,早期的對接方法較難處理含有大分子的分子對接過程。
1995年由Accelrys公司開發的計算化學軟體Affinity上市,這是第一個可以進行有大分子參與的商業化分子對接軟體,此後,商業化和免費的分子對接軟體層出不窮。現在應用中的分子對接軟體涵蓋了剛性對接、半柔性對接、柔性對接等各種對接方法,在能量優化方面則使用了人工神經網絡、遺傳算法、模擬退火、禁忌搜索、局部搜索等各種方法,目前的分子對接方法是研究小分子與大分子相互作用模式、生物大分子間識別、分子自組裝、超分子結構等課題的常用方法之一。
原理與方法
分子對接方法的兩大課題是分子之間的空間識別和能量識別。空間匹配是分子間發生相互作用的基礎,能量匹配是分子間保持穩定結合的基礎。對於幾何匹配的計算,通常採用格點計算、片斷生長等方法,能量計算則使用模擬退火、遺傳算法等方法。
各種分子對接方法對體系均有一定的簡化,根據簡化的程度和方式,可以將分子對接方法分為三類。
剛性對接:剛性對接方法在計算過程中,參與對接的分子構像不發生變化,僅改變分子的空間位置與姿態,剛性對接方法的簡化程度最高,計算量相對較小,適合於處理大分子之間的對接。
半柔性對接:半柔性對接方法允許對接過程中小分子構像發生一定程度的變化,但通常會固定大分子的構像,另外小分子構像的調整也可能受到一定程度的限制,如固定某些非關鍵部位的鍵長、鍵角等,半柔性對接方法兼顧計算量與模型的預測能力,是應用比較廣泛的對接方法之一。
柔性對接:柔性對接方法在對接過程中允許研究體系的構像發生自由變化,由於變量隨著體系的原子數呈幾何級數增長,因此柔性對接方法的計算量非常大,消耗計算機時很多,適合精確考察分子間識別情況。
主要分子對接軟體
DOCK
DOCK是目前應用最廣泛的分子對接軟體之一,由Kuntz課題組開發。DOCK應用半柔性對接方法,固定小分子的鍵長和鍵角,將小分子配體拆分成若干剛性片斷,根據受體表面的幾何性質,將小分子的剛性片斷重新組合,進行構像搜索。在能量計算方面,DOCK考慮了靜電相互作用、范德華力等非鍵相互作用,在進行構像搜索的過程中搜索體系勢能面。最終軟體以能量評分和原子接觸罰分之和作為對接結果的評價依據。
AutoDock
Autodock是另外一個應用廣泛的分子對接程序,由Olson科研組開發。AutoDock應用半柔性對接方法,允許小分子的構像發生變化,以結合自由能作為評價對接結果的依據。自從AutoDock3.0版本以後,對能量的優化採用拉馬克遺傳算法(LGA),LGA將遺傳算法與局部搜索方法相結合,以遺傳算法迅速搜索勢能面,用局部搜索方法對勢能面進行精細的優化。
FlexX
FlexX是德國國家信息技術研究中心生物信息學算法和科學計算研究室開發的分子對接軟體,目前已經作為分子設計軟體包BioSolveIT LeadIT的一個模塊實現商業化。FlexX使用碎片生長的方法尋找最佳構像,根據對接自由能的數值選擇最佳構像。FlexX程序對接速度快效率高,可以用於小分子資料庫的虛擬篩選。