LncRNA 引物設計-十年資深qPCR引物設計經驗分享及常用LncRNA數據庫介紹-產品資訊-資訊-生物在線

LncRNA 引物設計-十年資深qPCR引物設計經驗分享及常用LncRNA數據庫介紹

作者:上海吉凱基因醫學科技股份有限公司 2020-03-27T10:11 (訪問量:18926)

昨天下午吉凱基因在B站平臺直播間的在線直播課程《實驗中如何利用國自然熱點之非編碼RNA研究策略于方法》圓滿結束,如您錯過了直播課程,不用擔心,錄播課程預計會在直播結束后一周內上傳到直播間,關注B站直播間“吉凱基因”輕松獲得。
在直播期間及直播結束有老師問道:LncRNA的qPCR引物如何設計?在設計的時候有沒有需要特別注意的地方?如何能設計出最好的qPCR引物。基于這些問題,總結自己10年qPCR引物設計經驗分享給大家。
LncRNA的qPCR引物相比于編碼基因,是要復雜。導致其復雜的原因并不是引物設計原則上有特別之處,而是在于有太多的LncRNA數據庫,數據庫之間往往沒有關聯,且不同數據庫的維護也不盡相同。今天的文章分兩塊:LncRNA數據庫介紹和LncRNA引物設計注意事項。

LncRNA數據庫介紹
1、NCBI RefSeq
NCBI不多做介紹,通常LncRNA信息我們參考RefSeq數據庫中的數據,RefSeq數據庫中的數據參考數據,是經過人工審核,其數據信息可信,注釋全面。RefSeq數據庫中LncRNA的命名通常是NR_或者XR_開頭,后面加數字,其外顯子信息位置,數量信息非常完整。關于RefSeq數據庫的介紹,感興趣的老師可以查看文章《帶你走入RefSeq數據庫》,鏈接https://mp.weixin.qq.com/s/ZuE40OSnzxrMk_yrP-Y5ag。


2、Ensembl
相同的LncRNA,Ensembl數據庫中信息往往要比NCBI多很多,特別是轉錄本數量。且數據變化非常快且變化會很大,可能昨天瀏覽這個數據庫中某個LncRNA只有2個轉錄本,隔天再去看的時候,可能就變成3個甚至更多。NCBI就不同,盡管更新頻率也非常的快,但是LncRNA的變化通常很小,轉錄本數量基本不變化,序列變化的可能性也非常的小。關于不同數據中的命名格式可以查看文章《不知道數據庫命名規則怎么能真正了解數據庫?》鏈接https://mp.weixin.qq.com/s/D6r2CD1qKj0iMNdYSoqrKQ


3、UCSC
UCSC數據庫的LncRNA數據個人認為更新相對較慢,但有些LncRNA名稱如uc001ylu就需要前往UCSC數據庫查詢其序列信息。UCSC Genome Browser可以根據基因組的位置、基因ID、轉錄本等信息進行瀏覽查詢。


4、RNAcentral
RNAcentral 整合了包括 Ensembl、GENCODE、Greengenes、HGNC、LNCipedia、lncRNAdb、miRbase、NONCODE、RDP、RefSeq、Rfam、SILVA 在內的多個數據庫。


5、NONCODE
NONCODE是一款綜合性的數據庫,該數據庫是一個比較全面的ncRNA相關注釋的數據庫,尤其是lncRNA信息,不僅支持常用lncRNA的Name、NONCODE Gene ID(例如:NONHSAG036681.2)搜索,部分lncRNA支持其他數據庫名字進行搜索。該數據庫目前收入了很多物種,主要是動物方面的,包括人、小鼠、大鼠、奶牛、雞、果蠅、斑馬魚、線蟲、酵母、擬南芥、黑猩猩、大猩猩、恒河猴、復鼠、鴨嘴獸、猩猩。數據庫包含信息豐富,包括表達、功能、與疾病關系、染色體位置、序列保守性等,并可進行序列Blast搜索,同時支持數據下載。


6、Lncipedia
LNCipedia數據庫整合了多個人類(Human)LncRNA數據庫信息,很大程度上解決了LncRNA數據庫各自為政的問題,這些數據庫包括LncRNAdb、Broad Institute、Ensembl、Gencode、Refseq、NONCODE、FANTOM,同時還包括Nielsen, Hangauer等多篇文獻中發現的LncRNA信息。目前已經更新到5.2版本,包括127,802 轉錄本序列和 56,946 條基因。


7、Lncrnadb
該數據庫可以查詢類似LINC00066, NCRNA00066名稱的LncRNA。lncRNAdb數據庫是一個真核生物的lncRNA綜合數據庫。它包括特異的序列結構信息,如轉錄本、基因組位置、表達、亞細胞定位和保守位點以及相關的功能和疾病。

數據庫介紹總結:前面提到LncRNA的qPCR引物設計相比與編碼基因確實要難,其原因就體現在LncRNA的數據庫是在太多,而我們設計得到的qPCR引物通常都需要進行引物特異性比對,最好用的莫過于NCBI Primer-Blast,但是在特異性比對可供選擇的比對數據庫都只是NCBI,其他LncRNA數據庫無法選擇。接下來,小編就分享下非NCBI RefSeq來源的LncRNA的qPCR引物設計應該怎么做?

LncRNA 的qPCR引物設計注意事項
LncRNA的qPCR引物設計最主要的三個原則:跨外顯子設計,特異性比對,引物位置。
1、跨外顯子設計
跨外顯子設計的目的就是避免基因組的污染,跨外顯子設計有兩種辦法,具體見示意圖:
(1)正向F引物和反向R引物落在不同的外顯子上

此處注意:(a)如果產物大小允許,正向F引物和反向R引物可以落在不同的外顯子上;(b)如果正向F引物和反向R引物只能落在兩個相鄰的外顯子上,那優先選擇內含子最大的兩個外顯子上。

(2)正向引物或者反向引物跨了兩個外顯子

此處注意:(a)如果能選擇(1)就不要選擇(2)方法設計,(2)設計方法引物位置受限,設計得到的引物參數可能不是最優。(b)如果選擇(2)方法設計,那跨兩個外顯子的引物的3端序列不要跨第二個外顯子太多序列,建議不要超過6個堿基,否則就相當于沒有跨外顯子設計。

2、特異性比對
從上述數據庫中查到LncRNA的序列信息后,建議先使用NCBI進行比對,簡單做一個核苷酸比對和基因組比對。核苷酸比對的目的是看看這條LncRNA有沒有與NCBI RefSeq同源性較高的序列信息。如果有,可能涉及到需要判斷他們是否是同一條基因的問題?;蚪M比對的目的是簡單判斷其外顯子個數組成,因為有些LncRNA數據庫可能沒有提供外顯子數量信息和外顯子位置信息。比對其實就是一個不同數據庫之間LncRNA信息的轉換,當統一后,那LncRNA引物設計就容易許多。
關于NCBI blast Database選擇問題可以查看文章《使用NCBI做BLAST,我應該選擇哪個Database?》,鏈接https://mp.weixin.qq.com/s/dKGH_GvNzhO_ofRTUuAbEQ。

3、引物位置
引物盡量不要落在LncRNA序列兩端100bp序列以內,原因是防止兩端序列不準確。曾經碰到一個老師,自己使用RACE驗證Ensembl數據庫中的LncRNA序列,發現兩端序列有缺失。

4、同源區設計
本人設計qPCR引物通常都選擇在同源區設計,檢測其總RNA情況,具體根據各自實驗要求而定。這里不多做展開介紹。

上海吉凱基因醫學科技股份有限公司 商家主頁

地 址: 上海市浦東新區張江高科技園區愛迪生路332號

聯系人:

電 話: 4006210302

傳 真:

Email:service@genechem.com.cn

相關咨詢
ADVERTISEMENT