某些動(dòng)物即使在基因組中隱藏了非常多的突變DNA的情況下仍能興旺繁育的發(fā)現,迫使我們重新思考進(jìn)化的一些基本原理。
撰文 | Adam Hargreaves
翻譯 | 李振宇
審校 | LYW 譚坤
來(lái)源 | 科研圈(ID:keyanquan)
體型肥碩的沙鼠是一種奇怪的生物。它生活在洞穴中,每天吃相當于其體重80%的樹(shù)葉,并且不喝水。但是關(guān)于這種沙鼠更為奇異之處在于它似乎丟失了許多 DNA。
毫無(wú)疑問(wèn)你一定已經(jīng)聽(tīng)說(shuō)過(guò)暗物質(zhì),一種被認為構成了宇宙的四分之一的物質(zhì)。我們知道它就在那里,但我們就是無(wú)法探測到它們。在基因組中也有類(lèi)似的情況。我和我的同事們把這種難以捉摸的遺傳物質(zhì)稱(chēng)為“暗 DNA”(Dark DNA )。我們對沙鼠的研究正在開(kāi)始逐漸揭示它的本質(zhì)。
暗 DNA 的發(fā)現是如此之新,以至于我們仍在試圖弄清楚它到底有多么廣泛存在,以及它是否有益于那些擁有它的物種。然而,它的特殊存在引發(fā)了一些關(guān)于遺傳學(xué)和進(jìn)化的基本問(wèn)題。我們可能需要重新審視在分子水平上的,這樣的適應是如何發(fā)生的。而更有爭議的是,暗 DNA 甚至可能是進(jìn)化的驅動(dòng)力量。
沙鼠(Psammomy sobesus)是一種原產(chǎn)于北非和中東的沙漠物種,但把它放在實(shí)驗室時(shí),奇怪的事情發(fā)生了。當給予“正?!憋嬍场磳?shí)驗室嚙齒類(lèi)動(dòng)物的標準食物時(shí)——沙鼠往往會(huì )變得肥胖,并發(fā)展為2型糖尿病。這一現象于20世紀60年代被發(fā)現,并使沙鼠成為對人類(lèi)營(yíng)養性糖尿病有興趣的生物學(xué)家的研究焦點(diǎn)。然而,在這么長(cháng)時(shí)間中,為什么這些沙鼠對這種疾病如此易感的謎團仍然沒(méi)有得到解答。
我的主要工作興趣是毒蛇。不可否認,我的興趣與沙鼠間的聯(lián)系十分微弱——盡最大的努力,也只能說(shuō)嚙齒動(dòng)物可以被看作蛇的晚餐——所以這個(gè)物種對我來(lái)說(shuō)并不是一個(gè)顯而易見(jiàn)的研究對象。但是我一直都很享受探究奧秘。我對沙鼠的了解的越多,我就越好奇。確鑿的證據似乎是一種叫做 Pdx1的基因。它編碼的 Pdx1蛋白有很多作用,包括促進(jìn)胰腺發(fā)育和控制胰島素基因的開(kāi)關(guān)。
我們需要重新思考,一個(gè)基因在承受多大的突變后仍能繼續發(fā)揮作用
這一基因對正常生理機能至關(guān)重要,人們也已經(jīng)在幾乎所有脊椎動(dòng)物中發(fā)現了它。然而,有趣的是,相關(guān)的遺傳學(xué)研究未能在沙鼠身上發(fā)現它。但是它們有一個(gè)正常的胰腺并且能夠分泌胰島素。這沒(méi)有道理。到底發(fā)生了什么?
幸運的是,我對這個(gè)悖論的癡迷恰巧與遺傳學(xué)的一次變革的發(fā)生不謀而合,這使得我們有機會(huì )對其進(jìn)行研究。我與華大基因在內的 9 個(gè)研究機構的 17 名研究人員進(jìn)行了合作,并對整個(gè)沙鼠基因組進(jìn)行了測序。更令人困惑的事情發(fā)生了,Pdx1 并不是唯一缺失的基因。事實(shí)上,在其他動(dòng)物的同一條染色體上存在的一大塊包含近 90 個(gè)基因的 DNA 片段,在沙鼠身上卻不見(jiàn)了蹤影。許多這樣的基因,如 Pdx1,都是生存所必需的。而更重要的是,我們卻發(fā)現了它們對應的 RNA 轉錄本(細胞作為模板制造蛋白質(zhì)的基因片段的轉錄產(chǎn)物,見(jiàn)下圖)。但基因去哪里了?
當我們仔細檢視這些 RNA 轉錄本時(shí),一條重要線(xiàn)索逐漸顯露出來(lái)。遺傳密碼由4個(gè)堿基編碼組成,即 A,T,G 和 C,而令人匪夷所思的是,這些轉錄本序列中的G和C含量是如此之高。我們之中沒(méi)有任何人見(jiàn)過(guò)這樣的情況。但我們意識到這也許可以解釋為什么對應的 DNA 片段似乎失蹤了——標準測序技術(shù)并不擅長(cháng)提取高 G 和 C 水平的 DNA 片段。所以我們提出用另一種不同的方法以揭示了難以捉摸的 DNA,即使用氯化銫超速離心法。這一方法將 DNA 片段在高鹽濃度的溶液中快速離心(至少4萬(wàn)轉每分鐘)三天,以使富含 G C 堿基高密度碎片沉到管底。把這部分分離出來(lái)之后,我們嘗試著(zhù)對其進(jìn)行單獨測序。
大約15%的鳥(niǎo)類(lèi)基因似乎都被忽視了
嘗試最終成功了。我們發(fā)現了一個(gè)突變熱點(diǎn)區域——一個(gè)存在大量突變的 DNA 區域,其中很多是由 A 或 T 突變?yōu)?G 或 C 堿基。例如,沙鼠Pdx1基因比我們所知的動(dòng)物王國里的任何其他版本都含有更多的突變——這使得其編碼的 Pdx1 蛋白質(zhì)僅僅在一個(gè)與 DNA 結合的關(guān)鍵區域就有至少 15 個(gè)氨基酸不同于正常的版本。
脊椎動(dòng)物在這一區域發(fā)生突變是極其罕見(jiàn)的。突變通常會(huì )破壞一個(gè)基因的功能,而這部分我們難以探測到的暗 DNA 中所攜帶的基因對于生存來(lái)說(shuō)是如此重要,以至于在進(jìn)化過(guò)程中它們幾乎沒(méi)有發(fā)生改變。然而,沙鼠的Pdx1基因,連同一些其他基因,在如此劇烈的突變的水平上仍能發(fā)揮作用。這一發(fā)現迫使我們重新審視我們的基因究竟能承受多大程度的改變并仍然能正常工作的觀(guān)點(diǎn)。
Pdx1 的極端差異可能有助于解釋為什么沙鼠會(huì )患上糖尿病,如果它們的 Pdx1蛋白質(zhì)沒(méi)有其他動(dòng)物的那么有效。這也解釋了為什么 Pdx1最初看起來(lái)似乎缺失了。但在解開(kāi) DNA 缺失之謎的過(guò)程中,我們提出了一個(gè)有趣的可能性。我們知道,標準的基因組測序在測序包含大量 G 和 C 堿基的 DNA 片段時(shí)遇到了麻煩,所以沙鼠也許不是唯一一個(gè)攜帶這種突變熱點(diǎn)的物種。暗 DNA 可能暗藏在基其它基因組中。
事實(shí)上,其他 12 種的沙鼠也明顯缺乏Pdx1,這提示它們也可能擁有暗 DNA。我們現在正在進(jìn)一步深入研究這個(gè)問(wèn)題。更重要的是,鳥(niǎo)類(lèi)似乎和沙鼠基因組有驚人的相似之處。迄今為止,已經(jīng)測得的許多鳥(niǎo)類(lèi)的基因組中似乎都有超過(guò) 270 個(gè)基因序列的缺失,這些基因存在于大多數其他脊椎動(dòng)物的基因組中,包括一些如編碼瘦素(一種調節饑餓感的激素)這樣重要的基因。
然而,來(lái)自德國慕尼黑大學(xué)的 Fidel Botero Castro 和他的同事們的最新研究表明,鳥(niǎo)類(lèi)確實(shí)會(huì )制造這些“缺失”基因的 RNA 轉錄本。更重要的是,這些序列的G和C堿基水平非常高。這聽(tīng)起來(lái)是不是很熟悉?事實(shí)上,研究人員估計,在以前的研究中,大約15%的鳥(niǎo)類(lèi)基因都被忽略了。
這暗示著(zhù)暗 DNA 的存在可能相當普遍。如果是這樣的話(huà),我們可能不得不重新思考一些關(guān)于基因組如何進(jìn)化的觀(guān)點(diǎn)。通過(guò)比較過(guò)去十年中被測序的成千上萬(wàn)個(gè)基因組(參見(jiàn)“破譯生命密碼”),生物學(xué)家正試圖找出哪些基因在某些譜系中丟失了,哪些新基因已經(jīng)誕生了。這有助于他們了解是什么造就了不同的生物種群間的差異,以及基因在分子水平上的適應是如何發(fā)生的。
如果暗 DNA 是普遍存在的,這就會(huì )給我們的工作帶來(lái)麻煩,因為我們從前認為缺失的基因可能實(shí)際上是存在的?,F在也許是時(shí)候重新審視一下已經(jīng)被測序的基因組了,以確定我們是否已經(jīng)得到了完整的圖景。至少在進(jìn)行新基因組測序時(shí),我們也應該警惕可能存在的暗 DNA。
或者,有些人可能會(huì )提出,如果暗 DNA 是廣泛存在的,我們早就應該發(fā)現它了。也許沙鼠和鳥(niǎo)類(lèi)只是極端的例子,暗 DNA 的分布在其他生物中遠沒(méi)有那么廣泛。這樣的爭論也很有趣,因為它提出了一個(gè)問(wèn)題,是什么使得沙鼠和鳥(niǎo)類(lèi)如此與眾不同。而對這個(gè)問(wèn)題的解答可能是理解暗 DNA 是如何形成的關(guān)鍵。兩組動(dòng)物的染色體數目在種內都存在巨大的差異——例如,在不同沙鼠中,染色體數量在 22 到 68 之間。這也許能夠成為一個(gè)線(xiàn)索,因為這表明,他們的染色體在進(jìn)化過(guò)程中傾向于斷裂。而在生殖細胞的形成過(guò)程中,染色體通常會(huì )通過(guò)斷裂和重新組合來(lái)促進(jìn)后代的遺傳多樣性。當這種情況發(fā)生時(shí),會(huì )發(fā)生一種被稱(chēng)為 GC 傾向的基因轉換的過(guò)程,導致基因相比 A 和 T 發(fā)生更多的 G 和 C 突變。這可能導致 G 和 C 堿基在特定的 DNA 區域聚集。而這是否會(huì )是導致那些存在易斷裂基因的物種中存在暗DNA的原因呢?我們不知道,但這是可能的。
暗DNA可能會(huì )影響進(jìn)化的方向
而更令人感興趣的是暗 DNA 是如何影響進(jìn)化的呢?大多數教科書(shū)將進(jìn)化描述為一個(gè)兩步過(guò)程。首先,一連串的穩定基因隨機突變創(chuàng )造了生物體 DNA 中的變異。然后,自然選擇就像一個(gè)過(guò)濾器,決定哪些突變被傳遞。這通常取決于它們是否具有某種優(yōu)勢,盡管不是在進(jìn)化過(guò)程中產(chǎn)生的所有東西都是具有適應性的-因此,自然選擇是推動(dòng)生物體進(jìn)化的唯一動(dòng)力。
但是當把暗 DNA 一起考慮時(shí),事實(shí)就不一定是這樣了。如果這些突變熱點(diǎn)中的基因比其他區域的基因突變的機率更高,它們就會(huì )朝自然選擇的作用方向發(fā)生更多的變異,因此它們被賦予的特性將會(huì )進(jìn)化得更快。換句話(huà)說(shuō),暗 DNA 可能會(huì )影響進(jìn)化的方向,并對突變起驅動(dòng)作用。事實(shí)上,我和我的同事們已經(jīng)提出,暗 DNA 的變異率是如此之快,以致于自然選擇的作用速度可能不足以快到以通常的方式去淘汰有害變異體。如果一個(gè)物種面臨新的環(huán)境挑戰,這些基因甚至可能在以后存在下去并變得適應。
雙重控制?
突變驅動(dòng)的進(jìn)化理論是存在爭議的,但并非沒(méi)有先例。自上世紀70年代中期之后,著(zhù)名分子生物學(xué)家根井正利(Masatoshi Nei)已經(jīng)提出,進(jìn)化行為背后最重要的推動(dòng)力量發(fā)生在分子水平,即由 DNA 突變所產(chǎn)生的變異。如果沒(méi)有這種自發(fā)的變化,自然選擇也將無(wú)所作為,這使得變異在進(jìn)化中重要性?xún)H次于自然選擇。暗 DNA 的發(fā)現為這種思維方式添加了證據。當然,這并不是要在突變和自然選擇之間做出直接選擇。例如,在沙鼠中,大量的暗 DNA 基因的高突變率,可能對物種的進(jìn)化軌跡產(chǎn)生巨大影響。然而,一些選擇行為也必須作用于這些基因,否則突變的泛濫成災會(huì )形成一個(gè)沒(méi)有功能基因的無(wú)意義區域,這樣物種也無(wú)法存活下來(lái)。
事實(shí)上,很難確定沙鼠是否已經(jīng)從它的突變熱點(diǎn)區域中受益。你可能會(huì )認為它的極端突變是一個(gè)問(wèn)題,否則為什么像 Pdx1 這樣的蛋白質(zhì)在其他動(dòng)物中會(huì )完全相同呢?但是,沙鼠的暗 DNA 可能會(huì )導致一些在正常情況下不會(huì )出現的適應行為。也許這些突變使得它能夠在幾乎無(wú)法獲得飲用水的情況下依賴(lài)如此營(yíng)養匱乏的食物生存下來(lái),并因此得以在惡劣的沙漠環(huán)境中茁壯成長(cháng),并鮮有競爭者。另一方面,如果沙鼠吃營(yíng)養豐富的食物,就會(huì )患上糖尿病并死亡的話(huà),就可能意味著(zhù)它們只能被迫在沙漠里生存了。因此,暗 DNA 對沙鼠而言,可能即扮演著(zhù)解放者又扮演著(zhù)囚禁者的角色。
總之,目前暗 DNA 的作用仍然成謎。不過(guò)有一件事是肯定的,在基因組是如何在分子水平上進(jìn)化的和該過(guò)程是如何在地球上產(chǎn)生如此令人驚嘆的生物多樣性的問(wèn)題上,我們仍有很多東西需要去了解。
破譯生命密碼
人類(lèi)全基因組測序在各方高度協(xié)作的基礎上用時(shí) 10 年時(shí)間,并花費了大約 27 億美元。自從該工程于 2003 年完工以來(lái),巨大的技術(shù)上的進(jìn)步使得測序速度更快,成本也更低。迄今為止,大約 15000 個(gè)物種的全基因組已經(jīng)被破譯。而這僅僅是開(kāi)始,全基因組測序的商業(yè)化的競爭是如此激烈,以至于我們可能很快就會(huì )對包括身在子宮內的胎兒在內的所有個(gè)體的基因藍圖進(jìn)行例行的基因解碼。
基因測序包括對沿著(zhù) DNA 鏈配對的被稱(chēng)為 A、T、G 和 C 的四種核苷酸或堿基的精確順序進(jìn)行推斷。先驅性的測序技術(shù)如弗雷德里克·桑格(Frederick Sanger)在上世紀70年代設計的那樣,大多是手工操作的。Sanger 測序需要使用單一DNA 鏈作為模板,以一次添加一個(gè)帶有特殊的標記堿基的速率在試管中合成出一條互補鏈,從而讀出序列。這種方法是準確的,但卻非常耗時(shí);一個(gè)熟練的工人可能最多也就能在一天內破譯 10,000 個(gè)堿基對。而人類(lèi)基因組約有 32 億個(gè)堿基對。
而現在,排序已基本上實(shí)現自動(dòng)化,所以過(guò)程要快得多。DNA 鏈的多份拷貝首先被隨機地分割成小片段(長(cháng)度通常在 100 到 150 個(gè)堿基之間),在匹配重疊片段的計算機程序將測序結果重新拼湊起來(lái)之前,分別對它們進(jìn)行排序。但存在一個(gè)問(wèn)題,這種“下一代”測序技術(shù)并不擅長(cháng)破解一段高 GC 含量的 DNA 片段,因為這使得對重疊的碎片進(jìn)行重組變得困難。因此,我們可能忽略了迄今為止已經(jīng)測得的基因組中的大量 DNA 片段。我和我的同事們把這樣的 DNA 稱(chēng)為“暗DNA”。
新一代的測序方法更為準確??梢詫?DNA 的片段的可讀長(cháng)度擴展到數千個(gè)堿基,從而減少了破譯重疊區域遇到的問(wèn)題。隨著(zhù)技術(shù)的快速改進(jìn),暗 DNA 將會(huì )逐漸進(jìn)入人們的視野。我們甚至可能在我們已經(jīng)認為被破譯的基因組中發(fā)現新的驚喜。
https://www.newscientist.com/article/mg23731680-200-dark-dna-the-missing-matter-at-the-heart-of-nature/