KEGG數(shù)據(jù)庫中文教程
博奧生物有限公司生物芯片北京國家工程研究中心北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.c
博奧生物有限公司
生物芯片北京國家工程研究中心
北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.capitalbio.com
KEGG 數(shù)據(jù)庫中文教程
,博奧生物有限公司
生物芯片北京國家工程研究中心
北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.capitalbio.com
快速導航
1. 這篇教程介紹了什么?
2. KEGG數(shù)據(jù)庫里面有什么?
3. 我如何查詢某一特定的代謝途徑(pathway)的信息,例如Glycolysis / Gluconeogenesis?
4. 我如何查詢某一化合物的信息, 例如Pyruvate?
5. 我如何查詢Pyruvate 涉及了哪些生化反應?
6. 我如何查詢某一基因的信息, 例如gltA ?
7. 我如何知道Bacillus subtilis是否有g(shù)ltA?
8. 我如何查詢 gltA 在其他物種中的同源基因?
9. 我如何列出某一代謝途徑中涉及的所有的酶?例如cytrate cycle pathway(TCA 循環(huán))
10. 我如何知道人類的cytrate cycle中pyruvate carboxylase這種酶有多少化合物與其發(fā)生相互作用?
11. 我如何查詢?nèi)祟愑蒀itrate 生成Acetyl-CoA 的可能步驟?
12. 我有一條未知的序列,如何查詢KEGG 數(shù)據(jù)庫中是否有基因或酶與其對應?
,博奧生物有限公司
生物芯片北京國家工程研究中心
北京市昌平區(qū)生命科學園路18號
郵編:102206
電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.capitalbio.com
一. 簡介
代謝(Metabolism)是指細胞內(nèi)發(fā)生的各種化學反應的總稱。一個代謝途徑(Metabolic
pathway )包括一系列互相聯(lián)系的反應(reaction),反應中的酶( enzyme)以及反應中的前體或者產(chǎn)物(substrate) 。 隨著現(xiàn)代生物信息學的進展,我們可以通過計算機來展示,以至預測細胞內(nèi)的代謝途徑。
現(xiàn)在常用的查詢代謝途徑的數(shù)據(jù)庫主要包括:KEGG(http://www.genome.jp/kegg/), GenMAPP(), BioRag() 等。本教程主要介紹KEGG 數(shù)據(jù)庫的使用方法。
KEGG (Kyoto Encyclopedia of Genes and Genomes)是由日本京都大學和東京大學聯(lián)合開發(fā)的數(shù)據(jù)庫,可以用來查詢代謝途徑,酶(或編碼酶的基因),產(chǎn)物等,也可以通過BLA ST 比對查詢未知序列的代謝途徑信息。KEGG 主要通過Web 界面進行訪問,同樣也可以通過本地運行的Perl 或java 程序進行訪問,使用很方便。
本教程將結(jié)合實例來介紹KEGG 數(shù)據(jù)庫的使用方法,希望能您能通過本教程了解KEGG 數(shù)據(jù)庫的基本使用方法。
二. 使用方法
1. 首頁 ● ● ● ●
PATHWAY (代謝途徑數(shù)據(jù)庫),可以查詢各種代謝途徑。
BRITE (代謝通路及同源基因數(shù)據(jù)庫),這個數(shù)據(jù)與PATHWAY 數(shù)據(jù)庫不同的是,可以查詢酶和底物之間的關(guān)系,也可以查詢某種酶的同源基因。 GENES (基因數(shù)據(jù)庫), 可以查詢不同的基因或基因組的信息。 LIGAND (配體數(shù)據(jù)庫), 可以查詢反應中各種化合物的信息。
打開的首頁,我們可以看到KEGG 提供的四個主要的數(shù)據(jù)庫(圖1箭頭所示)。
,博奧生物有限公司
生物芯片北京國家工程研究中心 北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:
圖1. KEGG數(shù)據(jù)庫首頁
如果點擊 KEGG2——KEGG Table of Contents 這個鏈接,則會出現(xiàn)一個類似于網(wǎng)站地圖的頁面,在這個頁面上,我們可以查詢各數(shù)據(jù)庫的更新信息,也可快速訪問KEGG 提供的各個數(shù)據(jù)庫。
點擊會列出KEGG 對各物種的代碼。KEGG 使用三個英文小寫字母來代表各個物種,例如人類Homo sapiens,代碼是hsa 。再如小鼠Mus Musculus則是mmu 。
2. PATHWAY 數(shù)據(jù)庫的使用
在首頁上點擊PA THWAY 的鏈接(或者先選擇KEGG2,再在出現(xiàn)的表格中Database 選項下選擇KEGG PATHWAY) 。您就會看到KEGG 收錄的所有代謝途徑信息(圖2)。
,博奧生物有限公司
生物芯片北京國家工程研究中心 北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:
圖2. PA THWAY 數(shù)據(jù)庫界面
例如如果想要查詢Glycolysis / Gluconeogenesis這個代謝途徑(圖2)。
1) 從首頁,或者KEGG2的表格界面中進入數(shù)據(jù)庫
2) 點擊Carbohydrate Metabolism中的
新頁面即顯示出此途徑的信息(圖3A )。方框中表示的是反應中的酶,例如2.7.1.41,這是酶的EC number ,國際酶學委員會的編號。小圓圈代表的是反應中的化合物,例如α-D-Glucose-1P 。箭頭代表的是反應的方向。虛線表示此反應可以通過中間產(chǎn)物與其他途徑發(fā)生聯(lián)系。
或者您也可以通過Search PATHWAY for這個選項直接搜索Glycolysis / Gluconeogenesis的信息。搜索的結(jié)果中會顯示出滿足條件的所有物種的pathway 。
,博奧生物有限公司
生物芯片北京國家工程研究中心 北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:
(A )
(B )
圖3. 代謝途徑圖片信息
A :Glycolysis / Gluconeogenesis途徑的全面信息 B:人類中Glycolysis / Gluconeogenesis途徑的信息
如果想要知道人類的Glycolysis / Gluconeogenesis途徑的具體信息。
,博奧生物有限公司
生物芯片北京國家工程研究中心
2) 點擊Go 北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.capitalbio.com 1) 點擊此界面左上角的下拉菜單。選擇人類 Homo Sapiens(human)
即可見圖3B 的畫面。綠色的方框代表人類含有這種酶,例3.1.3.9。你也可以通過下拉菜單旁的Select 按鈕自行設置下拉菜單中顯示的物種名稱。
點擊標有3.1.3.9的綠色方框,即可顯示人類中此酶的信息(圖4)。Entry 是KEGG 中此酶的ID 。Gene name是酶的簡化名。Definition 包括酶的通用名稱和EC number。KO 是在KEGG 數(shù)據(jù)中這種酶的同源序列號。Pathway 中列出了這種酶涉及的代謝途徑。此外,還有一些其他的信息,例如編碼這種酶的基因在基因組中的位置(Position ),編碼酶的基因序列(NT seq)和蛋白序列(AA seq)等。
圖4. 酶3.1.3.9的信息
3. LIGAND數(shù)據(jù)庫的使用 LIGAND 數(shù)據(jù)庫中,可以查詢到化合物,反應或者參與反應的酶??梢栽谏厦娴乃阉骺蛑羞M行名稱查詢,也可以在下面的Ligand Relational Database里進行配體或反應關(guān)系的查詢。
例如想要查詢數(shù)據(jù)庫中Pyruvate (丙酮酸鹽)的信息(圖5A )。
1) 在Search COMPAND的下拉菜單中選擇Name
2) 輸入Pyruvae
3) 點擊Go
就會出現(xiàn)圖5B 的畫面。在給出的結(jié)果中可見它的entry number (C00022),分子結(jié)構(gòu),化學式等屬性,也可以點擊Entry number后進入另一個界面查看它更多的信息。
,博奧生物有限公司
生物芯片北京國家工程研究中心 北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:
(A)
(B)
圖5. LIGAND 數(shù)據(jù)庫界面及Search Compound的使用
再例如,我們需要查詢Pyruvate (丙酮酸鹽)所涉及的化學反應的信息(圖6A )。
1) 在Search REACTION的下拉菜單選擇Reactant Entry
,博奧生物有限公司
生物芯片北京國家工程研究中心
2) 輸入Pyruvate 的entry number,C00022 北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.capitalbio.com
3) 點擊Go 就會出現(xiàn)Pyruvate 所涉及的反應(圖6B )。
(A )
(B )
圖6. Search REACTION的使用
,博奧生物有限公司
生物芯片北京國家工程研究中心
4.GENES 數(shù)據(jù)庫的使用
北京市昌平區(qū)生命科學園路18號 郵編:102206 電話:86-10-80726868 傳真:86-10-80726898 網(wǎng)址:http://www.capitalbio.com GENES 數(shù)據(jù)庫可以用來查詢基因及基因組的信息。
例如想要查詢gltA (檸檬酸鹽合成酶)這種基因的具體信息(圖7A )。
1) 在Search 的下拉菜單選擇Genes (默認,可不選)
2) 輸入gltA
3) 點擊Go
在出現(xiàn)的結(jié)果中即可查得所有編碼這種酶的基因(圖7B )。像是第一個結(jié)果eco:b0720,eco 是物種名(Escherichia coli K-12 MG1655), b0720是entry name。gltA 是基因名,之后還有基因的全稱,以及編碼的酶的EC number 等。物種名可以通過首頁上的KEGG Organisms 來查詢。
再例如我們想要查詢Bacillus subtilis中是否有g(shù)ltA 這種基因(圖7C )。
1) 在首頁的KEGG Organisms中找到Bacillus subtilis的縮寫為bsu
2) Search Organism中輸入bsu
3) 再輸入gltA
4) 點擊Go 即可查得相應信息
(A)