近期,很多客戶在蛋白質組學文章投稿時遇到下面的問題,編輯要求將原始數據上傳到公共數據庫。
那么問題來了:
公共數據庫是哪個數據庫?
該怎么上傳數據?
上傳哪些數據呢?
下面,就由小編來給大家一一解答。
?
◆ 公共數據庫有哪些?
目前主流的上傳蛋白質組學數據的公共數據庫有兩種:ProteomeXchange和iProX。
ProteomeXchange(簡稱PX) 網站是目前比較主流的上傳蛋白組學質譜數據的存儲平臺(http://www.proteomexchange.org),旗下包括有PRIDE Archive, MassIVE, PeptideAtlas, and jPOST等子平臺。
iProX 是國內的上傳蛋白質組學質譜數據的存儲平臺,是在ProteomeXchange協會制定的數據共享指導方針的指導下建立的,包括數據上傳系統和蛋白質組數據庫。用戶可以將自己的蛋白質組數據以公開或私密方式上傳。另外,由于iProX的服務器在國內,所以數據上傳的速度相對較快,且不需要下載和安裝軟件。國內研究者亦可以選擇該平臺進行數據提交。
此次,就由小編給大家介紹一下iProX上傳蛋白組學數據的方法步驟吧。
?
◆ 蛋白質組數據如何上傳?
步驟一:注冊賬號和登錄
進入iProX官網:
https://www.iprox.cn/page/HMV006.html,點擊右上角Register。按照四步注冊要求,填寫用戶名、密碼、郵箱、姓名、單位等信息。
注冊完成后,系統會給您注冊時登記的郵箱發送確認郵件,進入您的郵件點擊鏈接激活賬號即可。激活后,便可使用注冊的用戶名和密碼登錄iProX。
此時網頁會提醒你安裝或升級IBM Aspera插件,按照網頁的提示依次下載安裝即可。后面數據上傳時會用到此插件。

?
步驟二:新建項目
登錄后,即可進入如下頁面。在“Project”下拉菜單“New Project”或“My Space”頁面的“New Project+”新建項目。

Tips:上圖左側的Project Tree包含三種類型數據文件①Project是用戶自己提交的project和subproject②Groups是用戶參加的group中對group成員開放的project和subproject③Public Project是所有對公眾開放的project和subproject。您如果將來參與了某個group或者對某個開放的項目感興趣,可在此處打開查看。
?
步驟三:填寫項目信息
在彈出的新頁面中,根據上方導航欄順序填寫項目信息,包含項目標題、關鍵詞、項目描述、作者、通訊作者等。注意:“*”為必填項,其他為選填。Submitter、Lab Head和Publication填寫完成后點擊“save”,以免后續報錯。
該頁面中的“Access Level”有三種選擇,如下圖所示,客戶可根據自己的要求選擇對應的項目訪問權限。信息填寫完后點“Continue”保存當前填寫信息進入下一步。

Tips:上圖中的“Add to Groups”的含義是將項目(包括下面的子項目)共享到選擇的群組,選擇群組后,即使是“private”的項目和子項目,也對該群組成員公開。
“Add to subprojects”即將項目(包括下面的子項目)添加到選擇的超級項目,選擇后,項目和子項目的實驗元信息可通過超項目進行瀏覽,但項目和子項目數據的訪問權限同“Access Level”中的選擇。
?
步驟四:填寫子項目信息
iProX提交系統以項目為數據管理單位的(相當于一次完整的實驗研究),一個項目下可以有多個子項目(多次實驗結果)??梢哉J為一個子項目為一個項目下面的一次實驗;如果沒有重復/對照等不同類型的實驗,一個項目下面可以只有一個子項目。
該部分需要填寫子項目名稱、物種、質譜儀等相關信息。“*”為必填項,其他為選填。子項目中大量實驗元信息需要通過標準的控制詞匯表進行填寫即可,即點擊“Choose”,選填控制詞匯表(CV)。若項目中的樣本涉及多個物種,也可點擊“+New”添加。

如果選項里沒有您需要的詞匯,可在“CV terms Search”里搜索并選擇、添加。信息填寫完后點“Continue”保存當前填寫信息進入下一步。

?
步驟五:上傳數據
iProX提供兩種上傳原始數據的方法:①通過網頁直接上傳(Upload by Browse),適合少量并且較小的文件(網頁上傳文件大小不能超過4Gb);②通過Aspera插件上傳(upload by Aspera),適合大量較大的文件(不受文件大小和數量的限制)。一般推薦使用upload by Aspera。
iProX提供兩種數據提交方式:Complete submission(完整提交)和Partial submission(部分提交)。它們分別包含的要提交的數據及對應的格式如下表所示。目前由于利用 PRIDE Converter 2 生成 PRIDE XML 格式文件存在多種困難,所以現在多采用 Partial submission的形式來上傳數據。上傳數據時系統會根據文件的后綴進行判斷,如系統判斷錯誤,您可以手動更改:原始數據的File Type選擇Raw,搜庫結果選擇Search。


設置完成后,點擊Strat upload,瀏覽器會自動啟動Aspera,在彈出的對話框中輸入您的iProX賬號密碼即可。上傳成功后在Data File會出現你已經上傳成功的文件名稱,如下圖(如果沒有可以刷新頁面)。信息填寫完后點“Continue”保存當前填寫信息進入下一步。

?
步驟六:確認信息
數據提交完成后,勾選剛剛上傳數據的項目和子項目,然后點擊Submit。接下來就是要等待iProX管理員的審核啦。審核完成后,您注冊時登記的那個郵箱會收到一封郵件,如管理員有反饋意見,按照其意見更改或補充再提交即可。審核通過后,就可以獲得iProX編號了。

?
數據上傳的工作已經完成啦。是不是很簡單呢?
最后的最后,在文章致謝后的"Data Availability"或者其他位置寫明數據集的訪問信息(URL, project ID),保密的數據集則需在郵件里告知編審數據訪問的賬號和密碼。
?
中科新生命擁有17年蛋白組學科研服務經驗,與國內1500多家科研院校、1000多家臨床醫院以及生物醫藥企業等有著良好的合作。此外,中科新生命有著專業的售后服務團隊,為老師提供全面的技術支撐和耐心的問題解答。歡迎有組學意向的老師前來咨詢。
