蛋白質(zhì)建模方法 Modeller 和Swiss model
蛋白質(zhì)建模方法 Modeller 和Swiss model

第一種方法:? ? ?最簡(jiǎn)便的方法,swiss_model建模
材料準(zhǔn)備:一段已知的氨基酸序列:(本篇文章采用從modeller的基礎(chǔ)教程里的TvLDH)
打開swiss model官網(wǎng)? ? (https://swissmodel.expasy.org/)
開始:一鍵建模 Builde Model

下一步:將氨基酸序列粘貼到如下文本框

第三步:點(diǎn)擊 Build Model開始建模,swiss model 網(wǎng)站會(huì)將你的剛剛復(fù)制到文本框的上傳到后臺(tái),后臺(tái)建模器會(huì)自動(dòng)選擇一個(gè)最為相似的蛋白質(zhì)序列,作為模板進(jìn)行建模。這個(gè)過(guò)程大概需要5到10分鐘

第四步:得到結(jié)果(づ?●─●?)づ,嘻嘻
不過(guò)大家看紅框的地方序列相似度100%,說(shuō)明這個(gè)模型已經(jīng)被建立過(guò)來(lái),而且這個(gè)被建立過(guò)的模型已經(jīng)上傳的世界蛋白質(zhì)數(shù)據(jù)庫(kù)了,如果你沒有特殊的需要,這個(gè)模型(如圖中4uum)的可靠性非常高了,你就不用再建了,當(dāng)然這里我們?nèi)匀皇褂眠@段序列,因?yàn)樗莔odeller官網(wǎng)給的序列,為了方便大家按照modeller官網(wǎng)的教程步調(diào)一致。

關(guān)于Modeller建模
? ? ??前言:?swiss model建模簡(jiǎn)單方便,可靠性高,但是它不能進(jìn)行多模板建模,而且也不能修改其中你想優(yōu)化的序列片段,那modeller就提供了另一種方法,靈活性高,可進(jìn)行多模板建模,和序列片段優(yōu)化,雖然操作相對(duì)有些繁瑣,不過(guò)這對(duì)于理解建立蛋白質(zhì)模型的思路和歷程都很有幫助。
? ? 本篇教程和其他教程略有不同的地方:
? ?1:采用在Pycharm直接運(yùn)行腳本文件,而不同于如圖5,在Modeller終端運(yùn)行腳本。
? 2:在搜索模板的步驟,我們采用了Swiss model搜索模板的方法。
這兩種操作都是官網(wǎng)提供的思路,也是modeller建模,腳本運(yùn)用的靈活之處,也為了大家更方便的學(xué)習(xí)和操作。
??

第二種:運(yùn)用modeller建模
??
? ? ? 第一步:材料準(zhǔn)備
? ? ??材料準(zhǔn)備:一段已知的氨基酸序列:(從modeller的基礎(chǔ)教程里找 , 以官網(wǎng)給的TvDHL為例 )注意要修改為? .ali? 的格式哦,如 TvLDH.ali ,直接重命名修改后綴名即可。
??
MSEAAHVLITGAAGQIGYILSHWIASGELYGDRQVYLHLLDIPPAMNRLTALTMELEDCAFPHLAGFVATTDPKA
AFKDIDCAFLVASMPLKPGQVRADLISSNSVIFKNTGEYLSKWAKPSVKVLVIGNPDNTNCEIAMLHAKNLKPEN
FSSLSMLDQNRAYYEVASKLGVDVKDVHDIIVWGNHGESMVADLTQATFTKEGKTQKVVDVLDHDYVFDTFFKKI
GHRAWDILEHRGFTSAASPTKAAIQHMKAWLFGTAPGEVLSMGIPVPEGNPYGIKPGVVFSFPCNVDKEGKIHVV
EGFKVNDWLREKLDFTEKDLFHEKEIALNHLAQGG
第二步:搜索模板
? ? ? ? 運(yùn)行:搜尋模板:在Modeller通過(guò)用build_profile.py和compare.py兩個(gè)python腳本,來(lái)篩選與目標(biāo)序列相似的模板。耗時(shí)較長(zhǎng),而且對(duì)比的數(shù)據(jù)庫(kù)pdb_95.pir有限,在這里我們采用swiss model網(wǎng)站的搜尋模板功能
? ? ? ??

? ? ?結(jié)果:找到模板,為了和官網(wǎng)教程保持一致,這里還是按照官網(wǎng)給的1bdmA模板
第三步:模板與目標(biāo)序列對(duì)齊
運(yùn)行:用align2d.py腳本使目標(biāo)序列這里用的是TvDHL和模板對(duì)齊,模板用.pdb格式
結(jié)果:生成TvLDH-1bdmA.pap文件
第四步:建立模型
運(yùn)行:用model-single.py進(jìn)行建模
結(jié)果:TvLDH.B99990001.pdb? ??
TvLDH.B99990002.pdb? ?
TvLDH.B99990003.pdb? ?
TvLDH.B99990004.pdb?
TvLDH.B99990005.pdb
注意:可以根據(jù)自己的需要選擇要建模的個(gè)數(shù),同時(shí)建模個(gè)數(shù)越多,耗時(shí)也越長(zhǎng),但是建出好模型的概率也會(huì)越大。
篩選最優(yōu)建模結(jié)果:從model-single.log篩選最優(yōu)的模板,一般看molpdf分?jǐn)?shù)最低的。
第五步:評(píng)測(cè)畫圖
運(yùn)行:用evaluate_model.py腳本對(duì)建立的蛋白質(zhì)模型進(jìn)行評(píng)測(cè)
結(jié)果:得到TvLDH.profile文件
用gnuplot或者 plot_profiles.py畫圖
那在這里我們直接用?plot_profiles.py畫圖了,?plot_profiles.py在官網(wǎng)給的basic example文件里有。
當(dāng)然如果你習(xí)慣用gunplot軟件畫圖,也可以達(dá)到同樣的效果。如果你沒有這個(gè)軟件的話,這里提供一個(gè)下載鏈接https://jaist.dl.sourceforge.net/project/gnuplot/gnuplot/5.4.3/gp543-win64-mingw.exe。使用命令行語(yǔ)句,'plot "TvLDH.profile" using 1:42 with lines'
我們這里采用plot_profiles.py

這個(gè)pylab模塊在Matplotlib庫(kù)下,所以要提前安裝Matplotlib 在終端Terminal 執(zhí)行命令 pip install matplotlib即可

?在這里要注意一個(gè)事項(xiàng),evaluate.py第一次運(yùn)行一次,那么我只能得到一個(gè)畫圖的數(shù)據(jù)文件TvLDH.profile,但是我們還需要模板Template所用的數(shù)據(jù),也就是圖中的綠線(Template)所用的數(shù)據(jù),所以我們需要修改一下evaluate.py腳本,把下圖中圈紅線的修改一下,運(yùn)行一下evaluate.py得到畫模板線的數(shù)據(jù)1bdmA.profile文件。
? ? ? ?如果大家有Python基礎(chǔ)的話,理解起來(lái)還是很簡(jiǎn)單的,當(dāng)然對(duì)這些腳本的簡(jiǎn)單理解和修改,也能很好的幫助大家理解modeller建模過(guò)程,如果大家感興趣的話,Ctrl+左鍵,可以直接查看一些方法的源代碼,進(jìn)一步了解建模所運(yùn)用的數(shù)學(xué)算法,如果不了解Python的話也沒關(guān)系啦,按照我介紹的步驟也能得到結(jié)果,同時(shí)我也會(huì)上傳一些步驟視頻。

修改為下圖:

最后一步:運(yùn)行plot_profiles.py,生成dope_profile.png如下圖,學(xué)會(huì)制作這個(gè)圖很重要哦,接下來(lái)的多模板建模還要用到畫圖。
? ?加油,各位!
寫的不好的地方,多多見諒(づ?●─●?)づ,有什么疑問(wèn)的地方,歡迎評(píng)論留言,別忘了點(diǎn)贊哦

?