解析公共基因組數據污染源及解決方案-技術前沿-資訊-生物在線

解析公共基因組數據污染源及解決方案

作者:北京三博遠志生物技術有限責任公司 2011-02-24T00:00 (訪問量:26012)

目前,在對全球科學家開放的公共基因組數據庫中,約有1/5的植物、細菌、和非靈長類動物的基因組數據受到了人類基因不同程度的污染!

【污染來源:】

1、污染風險潛藏在每個測序環節,基因組數據被污染,很可能在樣品處理時就開始了。為了獲取足夠量的測序樣本,各實驗室首先會對極少量的被測物種基因進行擴增,方法之一是利用大腸桿菌等細菌對基因樣品做擴增培養。盡管培養要求在潔凈環境中進行,但倘若操作不當,作為培養基的細菌就有可能“趁隙”混入樣品。

2、 另一種被稱為“PCR”的核酸擴增技術完全依靠人工操作,污染來源更多:有可能是空氣中的細菌落到了樣品中,也可能是滅菌后仍殘留在試劑中的基因片段,但最常見的污染源可能是科學家自身,比如在擴增前,實驗者的一個細胞飄進了樣品里。雖說肉眼看不見,但人無時無刻不在散布自己的DNA,一個觸摸、一次呼吸都有可能破壞測序樣品的純度。

【解決方案:】

1、研究人員應該嚴格要求自己

事實上,污染可能在測序的任何一個環節發生。因此,研究人員戴手套、口罩進行實驗操作不僅是對自身的保護,也可避免樣品受到自身的污染??扇绱撕唵蔚牟僮饕幊滩⑽幢辉S多實驗人員放在心上。當基因測序成為生命科學研究中的家常便飯,不少研究者的操作也變得隨意,不拘小節恰是潛伏在人們心中的污染源。

2、遞送者是截污的第一張“濾網”

無孔不入的細菌,懸浮于空氣中的唾沫星子,這些防不勝防的外源基因似乎意味著,基因測序不可能做到100%零污染。其實相當部分被污染的數據其實可以被過濾掉。在向公共基因組數據庫遞送數據之前,會將測序結果與計算機中龐大的數據庫做比對。過濾污染的過程就像是用軟件掃描,而遞送者最清楚整個過程中有可能插入的外源基因,由此選擇合適的“軟件”。嚴格的實驗設計可“堵截”部分污染。DNA由雙鏈組成,嚴謹的科學家會對兩鏈分別測序而后相互驗證。

如果首道過濾關口沒有把牢,那么隨后還有第二和第三張“濾網”。公共基因組數據庫管理者盡管面對呈幾何級數增長的海量數據,但始終有責任過濾并校正來自世界各國的原始數據,最起碼應標記污染,以提醒數據使用者當心“陷阱”。

3、能否借鑒古DNA研究規范

從采樣開始,古DNA研究就遵循一套嚴苛的流程——在發掘現場,一旦發現骨骼等樣本,研究人員必須立刻戴上手套、口罩和帽子,將樣本放入無菌樣本袋中,隨后帶回實驗室密封保存。接下來的DNA提取和測序,要在超凈化的萬級無菌實驗室進行。從樣本粗洗到鉆洞采樣,再到DNA抽取、配試劑等等,每一個步驟都要在完全獨立的房間內做,每做完一個樣本,都要進行空氣過濾和紫外線消毒。整個過程中,研究者都必須“全副武裝”,連眼睛也不能外露——要戴上透明眼罩。

不難想象,古DNA研究的“防污”策略是以高昂成本為代價的,而如此高成本,大規?;驕y序幾乎無力負擔。為此,更多人把目光投向了生物信息學家,希望他們能改進現在的基因組數據污染過濾系統,當好“治污”把關人。(由三博遠志編輯)

本文轉自三博遠志業界新聞:http://www.sunbiotech.com.cn/news_view-id3196.htm

北京三博遠志生物科技有限公司 商家主頁

地 址: 北京市海淀區東北旺南路26號

聯系人: 陳

電 話: 010-57030007

傳 真: 010-57030008

Email:sbobio@163.com

相關咨詢
ADVERTISEMENT