如何選擇合適的轉錄本進行過表達研究-技術前沿-資訊-生物在線

如何選擇合適的轉錄本進行過表達研究

作者:上海吉凱基因醫學科技股份有限公司 2019-11-15T15:50 (訪問量:16709)

一個編碼基因往往有多種轉錄本(Transcript Variant),當我們想研究一個編碼基因的GOF(Gain of function)時,通常的做法是將編碼基因的編碼區(CDS)構建到質粒或者病毒載體中,進而導入細胞內是基因的表達量增加。那么問題來了?當一個基因有多個轉錄本的時候,我選擇哪個轉錄本來研究呢?今天呢,小編就給大家介紹幾個數據庫,幫助大家更好的選擇具體的轉錄本。


首先我們說明下為什么一個基因會有多個轉錄本?最可能的四種原因如下,一個基因的多個轉錄本產生通常是其中的一種原因或者幾種原因共同發生導致。

(1)alternative splicing

選擇性剪接(Alternative splicing)是基因的一種表現方式。生物的基因序列中,包含了內含子(intron)與外顯子(exon),兩者交互穿插,組成基因。其中內含子并不表現,外顯子才是能夠轉錄成mRNA(之后再進一步轉譯成蛋白質)的片段。而選擇性剪接便是利用這樣的特性,將同一基因中的外顯子以不同的組合方式來表現,制造出不同的蛋白質。比如基因Gene ID: 2668NM_001190468.1轉錄本和NM_199231.2轉錄本

(2)alternative promoter usage

同一個基因可能由不同的啟動子,不同的啟動子導致產生不同的蛋白質,比如Gene ID: 2668NM_000514.4轉錄本;

(3)alternative initiation

同一條mRNA中使用不同的翻譯起始密碼子,通常情況下產生出僅僅在N端有差別的蛋白質序列,比如基因Gene ID: 2668NM_001278098.1轉錄本

(4)ribosomal frameshifting

一種翻譯重編碼機制,其導致核糖體改變其對遺傳密碼的讀取,產生不是由mRNA直接編碼的蛋白質,或者兩種甚至更多種不同的蛋白質;

更多原因如下,這些原因一個或者多個都可能導致一個基因產生不同的轉錄本。

RNA editing

Selenocysteine

Ribosomal skipping

Chromosomal rearrangement

Polymorphism

Pyrrolysine

Triplet repeat expansion

RNA translational shunting

RNA termination-reinitiation

RNA suppression of termination

對于上述列出來的多種原因大家如有疑問,歡迎文末留言交流。

弄清楚了一個基因有不同轉錄本的原因,接下來我們就說說到底怎么選擇轉錄本進行研究。小編列舉如下幾個數據庫供參考。

1NCBI

NCBI中有兩個地方可以參考,一個是NCBI Reference Sequences (RefSeq)區域;一個是每個轉錄本的Nucleotide界面。

1NCBI Reference Sequences (RefSeq)

有些基因NCBI明確會告知哪個主要轉錄本,舉例human HIF1A(hypoxia inducible factor 1 subunit alpha),在NCBI Reference Sequences (RefSeq)區域,對NM_001530.4轉錄本有這樣的描述:This variant (1) represents the predominant transcript, and encodes isoform 1。需要說明的是,在該位置很少有“predominant transcript”的說明。


2Nucleotide database



2 MANE

MANEMatched Annotation from the NCBI and EMBL-EBI的縮寫,這個數據庫收錄了人類編碼基因的一個“representative”轉錄本。

UniProt的使命是為科學界提供全面,高質量和免費獲取的蛋白質序列和功能信息資源。對于人類基因,當檢索某一個具體的基因時,在結果頁面的Sequence區域,通常會選擇某一個轉錄本編碼的蛋白質(isoform)當做是'canonical'序列。而這個'canonical'序列可以說是100%會對應到NCBI RefSeq 中某一個轉錄本。UniProt對于'canonical'序列有嚴格的標準,必須滿足如下四種標準里邊的至少一個標準。

(1)It is the most prevalent.s

(2)It is the most similar to orthologous sequences found in other species.

(3)By virtue of its length or amino acid composition, it allows the clearest description of domains, isoforms, polymorphisms, post-translational modifications, etc.

(4)In the absence of any information, we choose the longest sequence.


UniProt四個標準看到,最長轉錄本作為最后才考慮的一個標準,也就是說在選擇基因轉錄本的時候,并不是最長轉錄本就是該基因的prevalent 轉錄本,或者predominant 轉錄本,或者representative 轉錄本,又或者'canonical'序列。小編比較了NCBIMANE,UniProt三個數據庫中數據,絕大多數情況下,都是選擇最長的轉錄本作為representative 轉錄本。但是有例外情況,比如Gene ID: 2668。MANEUniProt中都是NM_000514.4轉錄本,而NCBI中最長轉錄本為NM_001190468.1。


總結:小編之所以給出例外情況,就是希望大家在后續確定研究的轉錄本時可以參考這三個數據庫,而不是一味的選擇最長轉錄本。當然具體情況需要根據大家的具體實驗而定。比如文獻中告知研究的突變位點,那需要根據突變位點以及文獻中的其他信息進行確定,而且小編以前碰到過文獻中研究的并非當前NCBI數據庫的轉錄本序列,而是較舊的轉錄本序列。比如NM_000514當前的versionNM_000514.4,那就對應的會有NM_000514.3NM_000514.2,NM_000514.1。表示轉錄本version的標志見截圖紅色方框。


文末福利:可能有人會問,如何查看較舊轉錄本與當前轉錄本的區別或者說每次都做了哪些更新?


點擊上圖紅色方框,選擇“Revision History”即可看到該轉錄本每次更新的時間。選中兩條記錄即可查看二者之間做了哪些具體的內容更新。



上海吉凱基因醫學科技股份有限公司 商家主頁

地 址: 上海市浦東新區張江高科技園區愛迪生路332號

聯系人:

電 話: 4006210302

傳 真:

Email:service@genechem.com.cn

相關咨詢
ADVERTISEMENT