人類(lèi)的本質(zhì)是復讀機?從基因上看確實(shí)如此。不僅每個(gè)人體內都有過(guò)半的重復DNA序列,而且每個(gè)人重復的方式還都不一樣。重復多了,還可能得病。
只要在網(wǎng)上沖浪夠久,你總會(huì )遭遇靈魂一問(wèn):人類(lèi)的本質(zhì)到底是鴿子、檸檬、真香,還是復讀機?有意思的是,這個(gè)問(wèn)題有答案——從分子生物學(xué)上講,我們是復讀機。在人類(lèi)基因組中,有一種“自私的垃圾”DNA,它們包含大量類(lèi)似 GAGAGAGAGA 這樣的重復序列,甚至可以占據基因組的一半以上。所以如此聒噪、狂刷存在感,是要干啥?今天我們要講的就是這些“垃圾”DNA,看它是真垃圾,還是假垃圾。 從分子生物學(xué)上看,我們是復讀機。|來(lái)自網(wǎng)絡(luò )
常見(jiàn)的生物都有基因組,它是生物體中包含的DNA(部分病毒是RNA)中全部遺傳信息的總和。我們或許直覺(jué)地認為,物種越復雜,其基因組中包含的 DNA 就越多。比如,作為萬(wàn)物靈長(cháng)的人類(lèi),我們每一個(gè)細胞中所含的 DNA 一定超過(guò)很多簡(jiǎn)單的生物,才能編碼如此豐富的信息。但人們很快發(fā)現,事實(shí)并非如此:對不同物種,個(gè)體細胞中所含的 DNA 的量不僅差異巨大,而且與決定生物復雜性的基因數量似乎并無(wú)多少關(guān)系。*基因,是指有遺傳效應的DNA或RNA片段,其數量越多,生物功能越復雜。比如,蠑螈基因組的大小是人類(lèi)的幾十倍,基因數量卻并不比人多,也明顯不如人類(lèi)復雜。只會(huì )吃飯睡覺(jué)撓沙發(fā)的貓貓,基因組幾乎跟人類(lèi)一樣大。蠑螈的基因組比你大幾十倍。|University News
于是我們不禁納悶,那些多出來(lái)的DNA,是用來(lái)當擺設的嗎?1970年前后,科學(xué)家們發(fā)現,基因組上有一些 DNA 并不轉錄出 RNA(一般而言,蛋白質(zhì)都是由RNA翻譯,被稱(chēng)為“中心法則”),從而也不直接參與蛋白質(zhì)的合成,它們叫非編碼 DNA。對不同物種,非編碼DNA在基因組中所占比例有所差別,有時(shí)甚至占到九成以上。中心法則示意圖:基于DNA和RNA的生命遺傳信息的流動(dòng)方向或傳遞規律既然不編碼蛋白質(zhì),那非編碼DNA有什么用呢?難道是自然造物的時(shí)候走神啦?1980年,四位科學(xué)家在《自然》上發(fā)表文章,認為DNA可以分為兩種:特異性的和非特異性的。前者負責蛋白質(zhì)合成,在細胞里勤勤懇懇地工作,但只占一小部分。后者則有三個(gè)特點(diǎn):其一,基因組里的大部分 DNA 都是此類(lèi);其二,它們通過(guò)已有的 DNA 拷貝擴展而來(lái);其三,也是最重要的,無(wú)用!他們認為,非編碼 DNA 并沒(méi)有明顯的正面或負面作用,不過(guò)是DNA復制過(guò)程中不得不產(chǎn)生的副產(chǎn)物。它們如此堂而皇之地賴(lài)在細胞中,不干活還占地方,只是因為比較“自私”。不編碼蛋白質(zhì)的DNA就是自私的垃圾嗎?另一些科學(xué)家對此表示懷疑。一些證據顯示,這些“自私的DNA”并非完全無(wú)用。比如在一些物種中,基因組的大小跟細胞周期和世代時(shí)間(生物從一次繁殖結束到下一次繁殖結束的時(shí)間間隔)有關(guān)。所以,或許我們不應該急著(zhù)將這些冗余 DNA 扔進(jìn)垃圾桶。40多年后的今天,全基因組測序越來(lái)越便宜,也越來(lái)越普遍了,我們對人類(lèi)基因組的認識早已今非昔比??茖W(xué)家發(fā)現,人類(lèi)基因組里除了與編碼蛋白質(zhì)有關(guān)的特異性 DNA 序列之外,還有相當一部分重復DNA序列——正是它們決定了人類(lèi)的“復讀機”本質(zhì)。基因測序結果表明,在同一人類(lèi)個(gè)體的基因組中,這些序列有的重復幾次,有的重復成千上萬(wàn)次;其中既有長(cháng)達1000~200 000個(gè)堿基對的片段重復,也包括短的簡(jiǎn)單序列重復;重復的基本單位有時(shí)只有一個(gè)堿基(比如AAAAAAAAAA),有時(shí)包含幾個(gè)堿基(比如CACACACACAC和CAGCAGCAGCAG)。它們加起來(lái)甚至可以占到人類(lèi)基因組的一半以上!人類(lèi)的基因組包含特異性序列和重復序列。重復序列甚至可以占到人類(lèi)基因組的一半以上。|來(lái)源:Molecular biology of the cell人類(lèi)基因組中為何存在如此多的重復DNA序列?這種“復讀機”本質(zhì)對我們有哪些影響呢?科學(xué)家逐漸了解到,那些曾被認為是垃圾、自私且毫無(wú)用處的重復DNA序列,對基因表達和決定生物性狀至關(guān)重要。*基因表達,指基因通過(guò)指導蛋白質(zhì)合成,將自己表現出來(lái)。以簡(jiǎn)單序列重復(簡(jiǎn)稱(chēng)STR)為例,雖然它們只占人類(lèi)全基因組的3%,但分布極為廣泛。據估計,有超過(guò)10萬(wàn)個(gè)STR位點(diǎn)遍布基因組的各個(gè)角落。它們既可以直接出現在編碼序列中,直接影響DNA的翻譯產(chǎn)物蛋白質(zhì),又可以處于調控序列中,間接影響基因表達。有趣的是,STR 雖然是看似冗余的重復序列, 在每個(gè)人體內的重復方式卻并不一樣。即使是同一STR位點(diǎn),在不同個(gè)體中,其基本單位的重復次數也有較大差異。這就像是,我們的基因組雖然都有著(zhù)復讀機的本質(zhì),但每個(gè)人的復讀方式卻又獨一無(wú)二。同一STR位點(diǎn),在不同個(gè)體中,其基本單位的重復次數也有較大差異。|ScienceDirect實(shí)驗證實(shí),STR 與人體的數十種疾病有關(guān),且主要為神經(jīng)肌肉性疾病,比如舞蹈征、肯尼迪病、肌萎縮側索硬化等。其中與舞蹈征有關(guān)的 STR 位點(diǎn)位于一個(gè)特定基因中,如果它的基本單位的重復次數小于30次,患者就不發(fā)??;重復次數越多,則發(fā)病年齡越小,癥狀越嚴重。2021年1月13日,《自然》上發(fā)表的一項新研究還發(fā)現,STR的突變與自閉癥有關(guān)。研究人員分析了1637 個(gè)家庭的全基因組數據,結果發(fā)現,罹患自閉癥的兒童,他們基因組上的STR突變數量明顯比未患病的兄弟姐妹高出一截。而且與導致舞蹈征的STR突變不同,這些導致自閉癥的STR突變并不局限于一個(gè)特定的基因,而是與很多基因都相關(guān)。自閉癥與肥胖類(lèi)似,和遺傳因素有很大關(guān)系,并且難以確定到底是哪些基因在搗鬼,更別說(shuō)找出什么具體的突變。而STR突變的加入,為解釋自閉癥的遺傳根源增加了一個(gè)新維度。除了研究疾病,STR 序列還因為具有如指紋般的獨特性,在現實(shí)生活中有廣泛應用。比如身份認定、親子鑒定、產(chǎn)前檢查等。
2008年,美國洛杉磯的警察就曾通過(guò)比對嫌疑人和兇手的STR序列,追蹤到二十多年前一樁連環(huán)強奸殺人案的真兇。美國 FBI 則建立數據庫,在國家范圍內收集罪犯或失蹤人員的 STR 序列信息,以提高破案率。人類(lèi)基因組中仍蘊藏著(zhù)許多未知。|Chris Madden
眼下,基因測序已經(jīng)非常普及,要把每個(gè)人的基因組測個(gè)明明白白,并非難事。不過(guò),就像猴子可以打出一串字母,但并不知曉意思一樣,我們也遠未明白這些 DNA 序列的含義。它們與RNA、蛋白質(zhì)如何相互作用,又如何影響我們的生命特征,許多未知問(wèn)題仍有待嚴謹的生物醫學(xué)探索。
但,關(guān)于重復序列的價(jià)值討論早已沒(méi)有疑義:我們是復讀機,但不是垃圾。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。