文/本報綜合報導
美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)研究人員宣布,已取得人類X染色體完整、無間隙、端對端的序列信息。這突破性發現公布在《自然》雜誌,正如醫學博士艾里克.格林所說:「這項成就開啟了基因組學術研究的新紀元。」
人類基因組(Human Genome),由23對染色體組成,其中包括22對體染色體,以及第23對的2條X染色體,或1條X和1條Y染色體。人類基因組計畫(Human Genome Project, HGP)是一項跨國的科學探索工程。目的在於測定組成人類染色體中所包含60億對組成的核苷酸序列,從而繪製人類基因組圖譜,辨識其載有的基因及其序列,以達到破譯人類遺傳信息的最終目的。基因組計畫可說是人類為了探索自身奧祕所邁出的重要一大步。
然而,承載人類遺傳的密碼並未被百分之百的破解,仍然存在大量的缺口。這些未知數為何遲遲無法破解?此次是什麼基因測序技術讓科學家獲得X染色體完整序列?剩餘的空白基因序列,能否順利破解?
人類基因組測序像拼圖
如果家裡有小朋友,或者本身是拼圖愛好者,挑戰更多片數、更大幅的拼圖必然是你期待的成就感。近幾年來,有一群不同國籍的科學家也正在挑戰一幅巨大的拼圖,然而這幅拼圖的碎片可能高達數10億片,是全球許多機構和科學家多年來一直努力要完成的作品,這就是人類基因組圖譜。DNA(去氧核醣核酸)裡儲存著生命的種族、血型及孕育、生長、凋亡等過程的全部信息。生物體的生長、衰老、病、死等一切生命現象都與DNA有關。
人類基因組非常長,包含約30億個鹼基對(base pair,簡稱bp),鹼基對是形成核酸DNA、RNA單體以及編碼遺傳信息的化學結構。透過定位這些鹼基對在DNA鏈上的準確位置,進而識別分析出各種基因及其功能,最終目的在使人類征服癌症、心臟病以及阿茲海默症等多種疾病。
然而,人類基因組並非僅對某一個人進行測序研究。DNA測序(DNA sequencing,或DNA定序)是指分析特定DNA片段的鹼基序列,就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)與鳥嘌呤(G)的排列方式。人類基因大體相似,無論你是男是女,黃皮膚或是藍眼睛,每個人都有自己的基因組「副本」,而且每個副本都略有不同。
因此,在基因組研究中,通常會採用「參考基因組」的概念。參考基因組是一個由科學家組裝的核酸序列數據庫,作為物種的基因組參考模版。基因組參考聯盟(GRC)負責對參考基因組進行不定期更新。目前參考基因組還不夠完整,其中DNA序列仍存在許多缺口等待填補。
「由於人類基因組太長了,目前任何測序技術都無法一次性讀取所有的序列信息。因此,科學家只能把基因組打碎成一個個小片段進行測序,最後再組裝起來。」南京醫科大學生物信息學系主任汪強虎教授說。在外人看來,這些科學家所做的工作就像是在「拼圖」。
在這幅「拼圖」中,有許多重複的序列,由於測序技術只能完成短片段讀取,重複序列就會導致許多看起來幾乎完全相同的短片段出現。「這就好比拼圖中的藍天、草原,其中的每一小塊都是藍色或綠色,但又沒有線索告訴我們這些片段如何拼接在一起。」汪強虎說,因此就形成了許多缺塊。
首攻的特殊X染色體
人類細胞中有一個細胞核,細胞核的遺傳物質就在23對染色體上,其中有一對決定性別的性染色體。如果是女性,這對性染色體就是XX,但如果是男性,就是XY。每個人的性染色體一半來自父親,一半來自母親。
「科學家選擇X染色體進行補缺測序是有原因的。」汪強虎說,X染色體在23對染色體中長度中等,但是又包含許多遺傳信息,一旦能將X染色體完整測序,將為以後其他染色體的完整測序提供參考。
「這並非說Y染色體就不重要。」汪強虎表示,Y染色體有27個特別的編碼基因,是X染色體沒有的,從這點看,男孩要比女孩多27個來自父方的編碼基因。
「Y染色體為男性特有,只能來自於父親的遺傳。」汪強虎說,就是祖父傳給父親,父親傳給兒子。因此,一個家族裡只要對一位男性的Y染色體進行檢測,就能夠知道這個家族其他男性的Y染色體具有什麼基因特質。而女性所繼承的兩條X染色體,一條來自母親,一條來自父親,但這兩條X染色體並不相同,它們的DNA序列包含許多差異。
這項研究中,研究人員沒有對人類正常細胞的X染色體進行測序。而是選用一種特殊的雌性細胞──具有兩條來源相同的X染色體,與僅具有一條X染色體的雄性細胞相比,這種細胞可提供更多的DNA進行測序,還可以避免分析典型雌性細胞的兩個X染色體時所產生的序列差異。
奈米技術:測序大功臣
與20年前獲得的人類基因組草圖相比,這次科學家將X染色體做了完整測序,最大功臣就是奈米孔測序技術。「這是第3代測序技術。」汪強虎介紹,1996年美國哈佛大學的丹尼爾.布蘭頓、加州大學的大衛.迪默等,在美國《國家科學院院刊》雜誌上首次發表論文指出,可以用膜通道檢測多核酸序列,成為奈米孔測序技術的起源。
此次研究使用的是一種特殊的奈米孔測序儀,它通過檢測單個DNA分子通過膜上的小孔(奈米孔)時電流的變化,對DNA進行測序。
「奈米孔測序技術可以獲得包含數10萬個鹼基對的『超長讀取』,這樣的長度可以跨越整個重複區域,從而繞過一些複雜的挑戰。」汪強虎指出,第1代基因測序技術一次只能讀取幾百個鹼基對,近20年來測序技術已有長足進步,讓那些曾經被認為十分棘手的重複序列測序,變得相對容易。
「這成果無疑是個里程碑。」汪強虎表示,通過分析X染色體的基因信息,科學家或許將很快解決一些複雜疑難的疾病。例如,X染色體上著名的基因F8(凝血因子8)和F9(凝血因子9),凝血因子8和9缺乏時會導致血友病。
因為男性只有一條X染色體,一旦出現問題,就無法正常產生凝血因子F8和F9。這也是為何血友病一般較常發生在男性身上的原因,女性基因帶有兩條X染色體,如果有一條染色體出現問題,而另一條正常,通常不會出現血友病的病症,但是會遺傳給下一代。
汪強虎認為,新的人類基因組序列填補了目前人類參考基因組中的許多缺口,為基因組研究開闢新的領域。但潛在的挑戰依然存在,例如,1號染色體和9號染色體的重複DNA片段比X染色體上的要長得多。這是科學家未來計畫繼續努力彌合的缺口區域。
正當此時,針對中國人種的多個基因組計畫也在實施之列,汪強虎介紹說:「目前人類參考基因組是以歐美人種族群為藍本,實事上,歐美人與中國人的基因還是存在些微差別。正如中國工程院院士、南京醫科大學沈洪兵教授透過全基因組關聯研究,找出與中國人肺癌有關的19個易感基因,作為中國人肺癌多基因遺傳風險評估指標,以此實現前瞻性的預防措施。」