?原核表達技術:表達不同于其它一些實驗,比如:提取質粒、PCR、電鏡切片,這些人為控制的因素比較多,出問題相對來說也比較好分析。表達呢,你把質??寺『美?,交給細胞,然后有些事情就不全是你要怎樣就怎樣了。原核表達在表達當中來說還是比較簡單,細菌培養條件簡單、生長速度快,需要的儀器和培養基都比較便宜。當然,它也存在一些缺乏高級修飾、細胞內部還原性過高等缺點。
???原核表達從一開始的設計就非常重要,所謂好的開始是成功的一半。做足準備功夫,可是省去很多將來后悔的事情。首先,我們要根據是否要求可溶將載體分成兩大類,如果希望可以同時嘗試多種表達系統,也有許多商業化的系統供選擇。
前面已經介紹過許多做原核表達服務或公司的商業化載體、菌株和多系統表達體系,現在我想先從自己的蛋白分析講起。同樣的載體、同樣的系統,很可能表達這個蛋白表達量奇高,但是另外一個就是做不出來,所以沒有萬能的載體,只有永恒的分析。當然如果你的蛋白曾經在原核表達系統中成功表達出來那是最好的,選擇同樣的載體表達成功率會高很多。如果沒有也最好嘗試找一些曾經表達過和你的蛋白擁有相類似結構的文獻。比如大部分含有哺乳動物src同源的SH2蛋白相互作用域的蛋白都是用pGEX系列載體表達出來的。根據經驗而言,含有較少半胱氨酸和脯氨酸的、平均大小為60kD的單體蛋白較容易表達。
在下面將列出幾個影響表達的因素,大家可以在表達前根據這幾個因素自己分析一下:
1.?翻譯起始位點
??? 現在大部分的表達載體都提供起始位點,所以它已經把起始密碼子與核糖體結合位點的距離進行優化了,一般情況下不需要自己再加,不過還是要留意載體圖譜上是否注明有起始密碼子和終止密碼子
2.?GC含量
??? 表達序列中的GC含量超過70%的時候可能會降低蛋白在大腸桿菌中的表達水平。GC含量可以利用DNA STAR、Vector NTI Suite等軟件進行預測。
3.?二級結構
??? 在起始密碼子附近的mRNA二級結構可能會抑制翻譯的起始或者造成翻譯暫停從而產生不完全的蛋白。所以要進行mRNA結構優化如果利用軟件分析DNA或RNA結構上有柄(stem)結構,并且結合長度超過8個堿基,這種結構會因為位點專一突變等因素而變得不穩定。
4.?基因或者蛋白的大小
??? 一般說來小于5kD或者大于100kD的蛋白都是難以表達的。蛋白越小,越容易被降解。在這種情況下可以采取串聯表達,在每個表達單位(即單體蛋白)間設計蛋白水解或者是化學斷裂位點。如果蛋白較小,那么加入融合標簽GST、Trx、MBP或者其它較大的促進融合的蛋白標簽就較有可能使蛋白正確折疊,并以融合形式表達。
??? 對于另一個極端,大于60kD的蛋白建議使用較小的標簽,如6×組氨酸標簽。對于結構研究較清楚的蛋白可以采取截取表達。當然表達時要根據目的進行截取,如果是要進行抗體制備而截取,那么一定要保證截取的部位抗原性較強。對于抗原性也可以利用軟件分析,比如Vector NIT Suite或者一些在線軟件,不過在分析之余也要認識到這是一種數據統計的結論,如果蛋白和免疫動物親緣關系較遠的話還是不妨一試的。
5.?親疏水性
??? 這也是一種經驗之談,相信經常做蛋白表達的人都發現表達親水區域時表達量會比較高,如果你要表達一個膜蛋白,那么勸你做好長期抗戰的準備吧。有許多軟件可以對氨基酸的親疏水性進行分析,比如Vector NIT Suite,除此之外還可以利用在線跨膜區預測軟件
??? 對于自己表達蛋白有所了解后就可以開始對載體進行選擇了,目前商業化的載體基本上包含以下幾個元件:
?
??? 除了上面標出的元件外還需要有復制起點,它對于控制質粒的拷貝數非常重要;另外就是篩選標記了,比如藍白斑篩選的lacZ,各種抗生素標記。在以上幾個元件中,我們需要注意的是負責調節與啟動的元件,也就是調控子和啟動子。其中啟動子對于蛋白表達的速度起著舉足輕重的作用,它與最終蛋白的表達量、是否可融密不可分。這里,對于世面上廣泛銷售的幾種原核表達載體使用的啟動子進行總結。
|
啟動子? |
來源? |
調控手段(濃度)? |
強度? |
|
LacUV5 |
乳糖操縱元? |
lacI/IPTG (0.1-1mM) |
強? |
|
Trp |
色氨酸操縱元? |
trpR 3-β-吲哚丙烯酸? |
強? |
|
Tac |
結合了色氨酸啟動子的-35序列和乳糖啟動子的-10序列? |
lacI/IPTG (0.1-1mM) |
強? |
|
PL? |
λ噬菌體? |
λcI阻遏物/溫度? |
強? |
|
噬菌體T5 |
T5噬菌體? |
lacI/IPTG (0.1-1mM) |
強? |
|
pBAD |
阿拉伯糖操縱元? |
AraBAD/阿拉伯糖(1μm-10mM)? |
嚴謹? |
|
T7 |
T7 RNA聚合酶? |
lacI/IPTG (0.1-1mM) |
非常強? |
??? 乳糖操縱子是應用最廣泛的調控模式,除了IPTG這種化學誘導方式之外還有利用吲哚丙烯酸和阿拉伯糖的化學誘導。如果你害怕這些化學物質會損害細菌的生長,那么你可以嘗試利用溫度誘導的載體,如:pDH2。它利用PL啟動子,在溫度上升到42℃后進行誘導表達。
??? 可以看到在所有啟動子里屬T7啟動子最強,它可以將大腸桿菌的資源最大程度地調用過來表達外源蛋白。這樣一些難表達的蛋白都可以在pET系統里面表達出來,但是是不是越強就越好呢?如果你需要表達蛋白是可溶的,那么T7啟動子就不那么適合了。較弱的啟動子轉錄速度較慢,這樣對于表達可溶、穩定、完整的蛋白比較有利。
??? Novagen可以說是的pET系統是最王牌的T7啟動子表達系統,可是當T7啟動子的強啟動效應不受歡迎的時候怎么辦呢?在這里給讀者留個小小的疑問,看看大家有沒有仔細看筆者寫的Novagen篇。提示一下,雖然它轉錄速度快,但是可以控制它的拷貝數,又或者是……利用這些原理Novagen載體也可以毒性高的外源蛋白。
??? 載體上除了啟動子這個需要注意之外,另外一個就是標簽了。很多標簽是為了增加蛋白的可溶性,也有一些是為了方便鑒定表達產物,所以在表達時可以選擇加標簽。是否加標簽要看個人需要,筆者認為如果是表達一個人家沒表達過的蛋白最好還是加標簽,這樣方便將來鑒定。如果從經濟角度考慮最好加入6×組氨酸標簽,筆者曾經以為加什么標簽都無所謂(前提是不需要融合表達),結果加了個Novagen的T7·Tag,等到鑒定的時候發現單抗那么貴。而且還不好買的,一些較少人用的標簽會讓你很傷腦筋。這也是表達前要準備的功課之一哦。
??? 好了,如果你選好了載體,那么下一步就是設計引物的。相信大多數人都是利用PCR把目的基因調出來的吧。設計引物可以使用一下兩個軟件,Primer Premier或者Oligo。如果要表達全長,其實也就沒那么多要考慮,從一頭一尾找至少8個匹配序列在加上與載體匹配的序列就可以了。
??? 不過,我還是有以下幾點提醒一下各位:
1.?這一點其實很容易理解,但是有時也容易被遺忘。那就是先查查表達外源片段中含有什么內切酶位點,不要設計重了,否則酶切時發現怎么老是有預期外的小片段出現。
2.?根據載體上的酶切位點設計引物,現在許多類似T載原理的克隆方法也可以應用到原核表達中了,如果T載克隆方法要定向很多時候要多加4個堿基,設計引物時候可別忘了加。在設計酶切位點的5’端不要忘了加保護堿基,不同內切酶所需的保護堿基不同,SalⅠ不需要保護堿基,EcoRⅤ需要1個,NotⅠ需要2個,HindⅢ最好有3個。一般情況下,都設計2個。
3.?注意啟始密碼子和終止密碼子的讀碼框。如果載體上有ATG可以不另外加了,但是通常ATG后不是緊跟外源片段的,如果中間含有載體序列,務必確定中間這段序列不會造成你外源序列的移碼。按情況需要,可以加1到2個堿基在引物中使讀碼框正確。有始有終,同樣正常的終止密碼子才能保證蛋白的產出。大部分載體也有終止密碼子,如果你對載體的不放心,也可以在引物中設計上終止密碼子,這樣萬無一失。
4.?還有就是設計一對引物需要注意的地方:一對引物之間Tm值相差不宜過大,能一樣最好;一對引物不宜形成發夾結構、互相配對,若配對時最好不要是G-C的結合(可以用軟件分析);3'端以G、C結尾為宜等等。如果要詳細研究可以看一下PCR技術的相關書籍,很厚。還有就是記得把上游引物設計成有義鏈,下游設計成反義鏈,否則就沒有片段出現了。雖然這是很小的地方,可是經常會被忽略。
5.?如果你是進行截取表達,那么除了之前提到的要注意截取親水區,還有一點就是對密碼子的使用頻率進行分析。如果在大腸桿菌中使用較少的密碼子在外源片段中連續出現,還是避開它為上策。
看完這么多是不是覺得有點思緒萬千呢。以前給我上課的一位教授說過,做試驗,那要大膽設計,小心求證。快去合成引物開始表達吧。萬一蛋白質表達不出來,我這還有下篇呢。
