簡介
1.PPI
PPI(Protein-protein interaction),蛋白質-蛋白質相互作用。網絡圖中的節點代表蛋白質,連線表示兩個蛋白質之間存在關聯。蛋白質是基因表達的產物,通過了解蛋白質分子之間的關聯性從而間接了解基因之間的相關性,進而挖掘核心的調控基因。
2.STRING數據庫
STRING數據庫是蛋白質相互作用的數據庫,覆蓋物種多,蛋白數量多。數據庫目前包含14'094個物種和67'592'464 個蛋白質。其中string數據庫中的數據來自包含Biocarta, BioCyc, GO, KEGG, and Reactome在內的5個數據庫。關系得分表示可信度,分越高越可信。
3.CytoscapeCytoscape是一個專注于開源網絡可視化和分析的軟件。其最強大的功能在于大規模蛋白質-蛋白質相互作用、蛋白質-DNA和遺傳交互作用的分析。
數據準備
我們想要知道已知的多個蛋白之間的關聯性,在這里我們選擇案例#1作為示例。
- 打開STRING數據庫——選擇多個蛋白——輸入蛋白——點擊search——點擊CONTINUE

- 這樣我們就獲取了輸入蛋白之間的關聯關系,我們將這張圖以表格(string_interactions.tsv)的形式下載下來

- 具體的表格注釋已寫在表格中

使用cytoscape繪圖
- 首先打開cytoscape軟件,接下來我們將下載的表格(string_interactions.tsv)導入cytoscape當中

- 在導入的過程中,還有需要設置的部分
點擊標題,確定每一列是節點屬性還是線屬性,也可設置這列的數據類型。如果這列是文字,選擇ab,表示這一列是字符型;如果這列是數值,根據需要,選擇整型或者浮點型;如果這列是布爾值,選擇y/n。案例中我們使用默認選擇。

- 表格導入之后就會自動生成網絡圖
這樣的圖還不是最終圖,仍需要美化,這就體現了cytoscape的優勢。

- 如何美化
節點的顏色、形狀、字體修改。
如果提供的節點屬性包含FC值和pvalue,我們可以根據FC設置節點的大小,FC值越大,節點越大;也或者根據pvalue值設置節點的由藍到紅的漸變等。

線的類型、顏色、粗細

總結
以上就是從STRING到PPI網絡圖的基本流程和簡單操作。除了上述方法外,Cytoscape也可通過安裝插件——stringApp的方法,來獲取該數據庫中的蛋白質之間的關聯。不管哪種方法,最終目的都是獲取PPI網絡圖。
