走入基因體時代
今年夏天在纖毛蟲的分子生物年會中,研究社群們率先得知以法國為首的歐洲研究群正對草履蟲 (Paramecium)基因體的定序工作如火如荼地進行中,並且隨著進展他們固定地更新資料庫、把結果公開。在這個同時,執基因體研究之牛耳地位的 The Institute for Genome Research (TIGR)也終於開始四膜蟲(Tetrahymena)的基因體定序工作。TIGR的計畫主持人Jonathon Eisen表示他們目前有能力很快完成初步定序,但是受限於聯邦研究經費播放的方式,工作要攤開成三年來做,到那時才能完成整個計畫。不過Eisen也承諾要跟歐洲的草履蟲定序計畫一樣,隨時公佈最近的進展。
然後兩三個月過去了,TIGR好像一點動靜都沒有,不知道進度如何。我的老闆等不及,跟他的老友抱怨一番。終於上個月的某一天,Eisen寄了一封 email告訴纖毛蟲的研究社群:TIGR已經讀取了超過八倍基因組涵蓋量(8x coverage)的鹽基數,並且完成初步的基因體骨架的組合。TIGR也設置了網頁,開放給大家進行搜尋與比對。
超過八倍基因體的涵蓋量是什麼意思呢?這必須解釋一下。TIGR對四膜蟲大核基因體的定序是採取「散彈槍法」(shotgun method)。這個定序策略是要先把整個基因體打散打斷成許多小片段,然後如同亂槍打鳥般大量地隨機去讀取這些小片段的序列,最後由電腦程式演算比對,組合出整個基因體來。這個方法要成功,就必須讀到足夠多量的序列資訊,電腦才有辦法依據上下文把片片段段組合起來。八倍的涵蓋量就表示他們累積了相當於整個基因體的八倍之多的訊息,也表示錯誤或遺漏掉某部分基因沒有讀到的機率應該不大。
換句話說,不知道TIGR最後到底是怎樣做了決定,反正四膜蟲大核基因組的初步定序工作完成了--不是原先說的三年,而是只花了三個月!知道這個消息的那天早上,老闆興奮不已,逢人就嚷嚷,簡直跟從浴缸中跑出來的阿基米得一樣。以前有許多實驗想做,但是受限於我們不知道纖毛蟲的基因體序列,所以只能丟在一邊不去妄想。如今沒有基因體序列不再是藉口,路上的大石頭已經搬開了。下一步呢?
下一步有太大的方便。過去我們要在纖毛蟲中找尋與選殖某些其他生物上相對應的基因,必須耗去數週甚至數月的時間,如果做不出來還不曉得究竟是纖毛蟲沒有這個基因,還是自己的實驗技術有問題。如今只要坐在電腦前搜尋比對一下,有沒有這個基因馬上就分曉,然後利用PCR技術短短幾天內就可以拿到想要的基因了。
下一步也有不小的困擾。搜尋過基因體序列之後,我們察覺到幾個過去認知的「事實」都必須修正。以前我們告訴人家說四膜蟲只有少數一兩種構成細胞骨架的蛋白質,現在我們竟然發現基因體中還有好幾個其他的同類蛋白。這些受限於當前偵測技術而沒被發現的東西到底在細胞裡做什麼呢?研究組織蛋白的同學也找到某個新的成員,這個以往未知的新組織蛋白對某個奇怪的現象可以提供比較直接簡單的解釋,果真如此,過去那種解釋模型就可能不對了。到底又真是這麼一回事嗎?
下一步更有太多的可能。由於選殖基因不再是大問題,打開期刊看到這個基因那個基因,過去只敢光看光聽光瞪眼的,現在通通都能動手試試看。也由於有了基因體的新資訊,我們也得小心地檢視過去,因為有些事情可能就不是原本以為那樣,應該重新檢討一番。有好多好多事情可以做、有好多好多事情值得做。哪個應該先做?
下一步還得繼續努力。目前完成的四膜蟲基因體定序只是初步的序列草稿,尚未開始進行註解(annotation)。所謂註解,就是把由ATGC四種鹽基字母組成的DNA語言訊息加以翻譯、詮釋、分析、整理。經過註解之後基因體序列才成為人類可以懂得、方便利用的資訊。現在光有序列草稿對於我們利用纖毛蟲當材料做研究的人來說當然已經是有大大的助益,但是對於其他的生物學家來說,經過整理分析比對的註解基因體才是真正有用處的。而且進一步的蛋白質體 (proteomics)研究,也必須要由註解過的基因體資訊來推導。
就這樣,If we HAD genome sequence 的假設語氣變成We HAVE genome sequence的肯定現在式。我們步入基因體時代。
0 個意見:
張貼留言
訂閱 張貼留言 [Atom]
<< 首頁