?全基因組重測序是對已有參考序列(Reference Sequence)的物種的不同個體進行基因組測序,并以此為基礎進行個體或.群體水平的差異性分析。通過全基因組重測序,研究者可以找到大量的單核苷酸多態性位點(SNP)、拷貝數變異(Copy Number Variation, CNV)、插入缺失(Insertion/Deletion,)、結構變異(Structure Variation, SV)等變異位點。這在人類疾病及動植物育種研究等方面具有重大的指導意義。
????? 上海伯豪可以幫助您利用有Illumina HISeq2500等平臺進行全基因組重測序,并通過生物信息學的手段,分析不同個體基因組間的差異, 同時完成注釋,從而幫助您在全基因組水平上掃描并檢測特定人群的重要遺傳性狀相關位點。
?
技術路線
?

?服務相關
1.????? 樣品純度:OD 260/280值應在1.7~2.0 之間;RNA 應該去除干凈。
2.????? 樣品濃度:最低濃度不低于50ng/μl。
3.????? 樣品總量:每個樣品總量不少于4μg。
4.????? 樣品溶劑:要溶解在H20或Low TE (pH 8.0)中。
5.????? 樣品運輸:DNA低溫運輸(-20℃);且在運輸過程中請用parafilm將管口密封好,以防出現污染;收到樣品后,甲方需要對樣品進行檢測,最終樣品的量和純度,以甲方的檢測結果為準。
?
數據分析流程和內容
??

數據基礎分析內容:
1. 序列質量評估:應用測序質量Q值進行評估。
2. 數據預處理:去除總體質量低于標準的reads、接頭序列去除reads中由于測序產生的含糊的N堿基。
3. 基因組mapping統計,包括mapped reads ratio, genome coverage, genome depth等信息的統計。
4. 基因組SNV檢測結果:堿基突變情況;對應的氨基酸的改變,是否同義突變;對應染色體的物理位置定位信息;關聯的dbSNP庫信息(若是新發現SNV則無此信息);該SNV位點相關基因信息(若是新發現SNV則無此信息)。
5. 基因組SV檢測結果:基因組發生SV的類型,SV區段的起始/終止位置,SV對氨基酸,蛋白質功能的影響。
6. 基因組Small InDel檢測結果:基因組發生Small InDel區段的大小,位置,(僅限于有參考序列,reference sequence,的區域);關聯的基因信息。
數據高級分析總覽
?
?
|
復雜疾病/性狀關聯研究 |
腫瘤基因組學研究 |
群體進化研究 |
遺傳圖譜構建 |
|
群體SNP檢測、分型 |
成對樣本的somatic? SNV/InDel/CNV檢測,注釋、統計 |
群體SNP檢測、分型 |
群體SNP檢測、分型 |
|
群體SNP位點質控 |
SNP/InDel數據庫分析(dbSNP/1000G/UCSC) |
基于參考單體型集合的缺失基因型推斷、填充 |
群體SNP位點質控 |
|
SNP注釋與統計(OMIM, ENCODE) |
SNV/InDel COSMIC數據庫注釋、篩選 |
樣本質控(親緣關系檢測、基于IBD的樣本污染檢測、PCA群體分層檢測) |
樣本質控(系譜矯正,樣品混雜檢測) |
|
樣本質控(親緣關系檢測、基于IBD的樣本污染檢測、PCA群體分層檢測) |
SNV保守性預測(SIFT、Polyphen-2) |
連鎖不平衡分析 |
遺傳圖譜構建 |
|
基于單個位點的關聯分析 |
? |
系統進化樹分析 |
QTL定位 |
|
候選區域LD分析 |
? |
群體多態性分析 |
? |
|
GO、PATHWAY富集分析 |
? |
選擇分析、馴化基因分析 |
? |
?
?
?
應用案例
?
全基因組重測序揭示小細胞肺癌基因組的變化
吸煙會引發癌癥,但是人們對這一過程的分子機制并不清楚,一般認為吸煙過程中釋放的大于60種致癌物質可與DNA鏈上的鳥嘌呤和腺嘌呤進行化學修飾從而產生大的復合物,該復合物改變了DNA雙螺旋的結構,如果這些復合物沒有被及時糾正,那么在DNA復制的過程中就會產生突變,從而引發癌癥,Erin D.Pleasance 等利用第二代測序技術(ABI SOLID)對一個小細胞肺癌(Smal-cell lung cancer,SCLC)細胞系NCI-H209進行全基因組重測序,探討了煙氣中的致癌物質引發該細胞系基因組中哪些堿基及其周圍序列產生突變及細胞損傷修復路徑。
原文出處:A mall-cell lung cancer genome with complex signatures of tobacco exposure.
?Nature,2010,463:184-190.
