欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
探索人類(lèi)基因組“荒漠”中的秘密(圖)

探索人類(lèi)基因組“荒漠”中的秘密(圖)

2012年10月01日 23:45
來(lái)源:中國科技網(wǎng)

ENCODE是“DNA組成元素百科全書(shū)”的縮寫(xiě),是繼人類(lèi)基因組計劃(HGP)之后的又一大型國際合作項目。來(lái)自英國、美國、西班牙、新加坡和日本32個(gè)研究機構的442名科學(xué)家歷時(shí)5年,耗資1.5億美元,獲得了迄今最詳細的人類(lèi)基因組分析數據,這也是“人類(lèi)基因組計劃”之后國際科學(xué)界在基因研究領(lǐng)域取得的又一重大進(jìn)展。該項目旨在識別出人類(lèi)基因組序列中的所有功能區,包括轉錄、轉錄因子聯(lián)合、染色質(zhì)結構和組蛋白修飾區,現在科學(xué)家們可以確認,人類(lèi)基因組中80%的成分至少有一種生化功能。

人類(lèi)基因組計劃與ENCODE計劃之間有著(zhù)承上啟下的關(guān)系。人類(lèi)基因組計劃發(fā)現基因組中僅有1.5%的序列是給蛋白質(zhì)編碼的,其余98.5%的序列以前被認為是“垃圾”。這些“垃圾”也被稱(chēng)作基因之間的“荒漠”,ENCODE計劃正是要探索這些“荒漠”中的秘密。

研究人員對147個(gè)細胞類(lèi)型進(jìn)行了計算機分析、生物化學(xué)試驗以及測序研究。他們在人類(lèi)DNA中發(fā)現了400萬(wàn)個(gè)位點(diǎn),作用相當于控制基因活性的開(kāi)關(guān)。這些開(kāi)關(guān)距離被它們調控的基因或近或遠,并作用于不同細胞類(lèi)型的不同結合體上,從而賦予了每個(gè)細胞類(lèi)型以獨特的基因組身份。在一個(gè)數據庫中,ENCODE已經(jīng)創(chuàng )建了一張圖譜以展示所有不同堿基的作用。

資助ENCODE的美國國家人類(lèi)基因組研究所項目主管埃利斯·范戈爾德說(shuō):“它就像人類(lèi)基因組的谷歌地圖?!崩霉雀璧貓D,一個(gè)人可以選擇不同的視角來(lái)查看景觀(guān)的不同方面。同樣,在ENCODE圖譜中,人們也能從染色體水平放大單個(gè)堿基,并且在查看這些堿基是否會(huì )產(chǎn)生RNA,或是否為DNA調控蛋白質(zhì)的結合位點(diǎn)之間切換。

深入基因組內部

“人類(lèi)基因組計劃”繪制出了人體生物學(xué)的藍圖,但人們很快發(fā)現,閱讀這份藍圖的指導手冊充其量只算是草稿。已標記的30億個(gè)編碼蛋白質(zhì)字母,只占人類(lèi)基因組的1%多一點(diǎn),包含約20000個(gè)基因——這只是在一大片未知的陌生環(huán)境中識別出一點(diǎn)稍微熟悉的事物而已。許多生物學(xué)家懷疑,真正體現人類(lèi)復雜性的,可能是那些藏在“荒漠”中的信息。

ENCODE計劃旨在完成人類(lèi)基因組計劃遺留的任務(wù),為潛藏在“荒漠”中的功能性DNA序列編制目錄,以了解它們會(huì )在什么時(shí)候、在哪些細胞里被激活,并追蹤它們對染色體包裝、調節和讀取產(chǎn)生的影響。

在人類(lèi)基因組測序終止前,美國國家人類(lèi)基因組研究所還在爭論是否要在項目中對DNA功能片段做出系統地識別。2003年,它邀請生物學(xué)家提出一個(gè)先期實(shí)驗項目,對基因組中1%的部分進(jìn)行深入研究,以確定哪些實(shí)驗技術(shù)可能對整個(gè)研究最有效。

先期實(shí)驗改變了生物學(xué)家對基因組的看法。他們發(fā)現只有少數DNA參與了制造編碼蛋白的信使RNA,許多基因組被“轉錄”成非編碼的RNA分子,而其中一些目前已知是非常重要的基因表達調節器,而且許多重要的調節序列也會(huì )迅速進(jìn)化。他們于2007年公布了這些發(fā)現,不久之后,美國國家人類(lèi)基因組研究所再次邀請科研人員將研究工作擴展到整個(gè)基因組。這一“升級”正像新一代測序機的開(kāi)始,數據采集變得更快、更便宜?!拔覀儸F在生產(chǎn)數據的速度是以往的5倍,而成本不變?!蔽餮艌D華盛頓大學(xué)的ENCODE研究員約翰·斯塔馬圖亞諾伯洛斯說(shuō)。

在全面研究中,研究人員對至少147種細胞類(lèi)型進(jìn)行了1648項實(shí)驗。他們將從基因組中轉錄的RNA進(jìn)行分離、測序,識別出約120種轉錄因子的DNA結合位點(diǎn)。他們還繪制了基因組中被甲基團覆蓋的區域圖,被甲基團覆蓋通常表明這里的基因是沉默的。他們還檢驗了組蛋白的化學(xué)修飾方式,這種修飾有助于將DNA包裝成染色體,增強或抑制信號區(基因表達區)。

斯塔馬圖亞諾伯洛斯和同事用了一種叫做DNaseI的酶繪制了125個(gè)細胞型中的調節區。這種酶對與組蛋白結合的DNA影響很小,卻會(huì )切斷與其他調節蛋白連接的DNA,如轉錄因子。對被切掉的DNA測序表明,在不同細胞類(lèi)型中,這里都是蛋白質(zhì)的結合位點(diǎn)。他們共發(fā)現了約290萬(wàn)個(gè)這種位點(diǎn)。其中約1/3發(fā)現于一種細胞類(lèi)型中,而所有細胞類(lèi)型都有的位點(diǎn)僅3700個(gè),這表明基因組在不同細胞之間調節的差異,是造成細胞與細胞之間差異的主要原因。而把不同的數據庫放在一起對比,讓研究人員能知道是哪種轉錄因子于何時(shí)、何地發(fā)生了結合。

現在,人們發(fā)現原來(lái)巨大的“荒漠區”居住著(zhù)數十萬(wàn)有著(zhù)基因調節功能的“住民”,而且每種細胞類(lèi)型通過(guò)這些功能的不同排列組合實(shí)現其特殊的生化功能。這也解釋了為何相對較少的編碼蛋白基因能產(chǎn)生大量的生物復雜性,來(lái)支持人體生長(cháng)及功能。領(lǐng)導部分數據分析工作的麻省理工大學(xué)計算遺傳學(xué)家馬諾里斯·克里斯說(shuō):“ENCODE計劃遠遠超過(guò)了部分相加之和?!?/p>

目前這一階段已近尾聲。研究人員已經(jīng)確認約80%的基因組都具備某種功能,包括7萬(wàn)多個(gè)“啟動(dòng)子”區,位于基因上游,負責與蛋白質(zhì)結合控制基因表達;近40萬(wàn)個(gè)“增強子”區,負責調節遠距離基因的表達。

ENCODE計劃所發(fā)布的數據已經(jīng)在幫助研究人員進(jìn)一步了解遺傳病。自2005年以來(lái),已經(jīng)發(fā)現上千個(gè)致病基因,其中一個(gè)字母的差異或變異就會(huì )導致疾病風(fēng)險。該計劃所繪制的基因圖譜揭示了許多與疾病相關(guān)的區域,包括“增強子”或其他功能序列,而細胞類(lèi)型也很重要?!耙兄xENCODE項目,我們現在才能對更復雜的疾病主動(dòng)出擊?!笨死锼拐f(shuō)。

許多人已經(jīng)從人類(lèi)基因庫的巨大數據流中獲益。ENCODE已經(jīng)照亮了人類(lèi)基因組的一些黑暗角落,為人們理解基因變異是怎樣影響人類(lèi)特征和疾病創(chuàng )造了機會(huì )。進(jìn)一步探索該項目所揭示的調節成分,將其序列與其他哺乳動(dòng)物做比較,有助于科學(xué)家重新理解人類(lèi)的進(jìn)化。

何處是終點(diǎn)?

在“人類(lèi)基因組計劃”中,人們只是對基因組進(jìn)行測序,現在開(kāi)始深入腹地探索其內部的秘密。但沒(méi)人知道基因組中還藏著(zhù)多少信息,這項研究何時(shí)才是盡頭。

“這不可能很快停下來(lái)?!庇=虼髮W(xué)計算生物學(xué)家克里斯·龐廷表示。他也支持該計劃目標,但他懷疑該計劃某些方面的研究能否帶來(lái)投資回報,這些研究據估計已經(jīng)超支1.85億美元。而另一位小組領(lǐng)導人、馬薩諸塞大學(xué)醫學(xué)院的喬伯·德克說(shuō),實(shí)現ENCODE的潛在利益需要耐心?!坝袝r(shí)要花很長(cháng)時(shí)間才知道,你能從某個(gè)數據庫中獲取多少利益?!?/p>

問(wèn)題是哪里才是終點(diǎn)?克里斯說(shuō),一些實(shí)驗方法可能會(huì )到達飽和點(diǎn):如果發(fā)現的速度低于某個(gè)界限,每個(gè)實(shí)驗的回報可能會(huì )變得太低而不值得追求??茖W(xué)家最終將積累足夠的數據,能預測那些尚未探索的序列的功能。這一過(guò)程稱(chēng)為歸因,但在很長(cháng)時(shí)間里其目標都是注解基因?!拔艺J為會(huì )有一個(gè)階段性的轉變,到那個(gè)時(shí)候歸因法會(huì )比實(shí)際實(shí)驗更有效,也更準確?!?/p>

然而,伴隨著(zhù)數千種細胞類(lèi)型需要測試,并且需要驗證的工具不斷增長(cháng),該計劃看起來(lái)在無(wú)休止地延長(cháng)。這一點(diǎn)讓許多人擔心。ENCODE的先期實(shí)驗已經(jīng)花了大約5500萬(wàn)美元;擴展項目大約1.3億美元;下一階段還可能投資1.23億美元。

一些研究人員認為,他們尚未看到可靠的投資回報。僅從一件事來(lái)說(shuō),要想了解ENCODE項目數據使用情況就很難。美國國家人類(lèi)基因組研究所項目程序主管麥克·帕金說(shuō),他檢索所有ENCODE數據在其中起著(zhù)重要作用的論文,發(fā)現其中有30多萬(wàn)篇并非來(lái)自ENCODE資助的實(shí)驗室,因為單詞“encode”在遺傳學(xué)和基因組學(xué)的論文中普遍存在。還有反對者認為,ENCODE并不像人類(lèi)基因組計劃那樣有著(zhù)清晰的終點(diǎn),它可能會(huì )無(wú)限制地擴展下去。

研究工作仍任重道遠

來(lái)自歐洲分子生物實(shí)驗室的英國歐洲生物信息研究所的計算生物學(xué)家、負責協(xié)調ENCODE計劃數據分析的伊萬(wàn)·伯尼說(shuō),研究工作還遠未完成,某些基因組繪制工作已到半途,而其中各成分的功能是什么,只完成了10%。目前正在進(jìn)行的第三階段研究,最終將完成閱讀人類(lèi)基因的指導手冊,并提供更多的細節。

伯尼想把他們過(guò)去5年來(lái)為ENCODE計劃收集的全部基因組數據打印出來(lái),但卻發(fā)現一個(gè)難題:沒(méi)有地方能存放它們——即使每平方厘米能容納1000個(gè)堿基對,打印材料也將達到16米高,至少30千米長(cháng)。

僅研究ENCODE項目現有的數據,就要花幾年時(shí)間,但是還有大量工作要做。美國加州大學(xué)圣克魯茲分校的網(wǎng)站上有一個(gè)生動(dòng)的圖畫(huà)展示了ENCODE項目的進(jìn)展:一個(gè)立體網(wǎng)格顯示了24個(gè)實(shí)驗類(lèi)型中哪些已經(jīng)開(kāi)展,180個(gè)細胞類(lèi)型中哪些已經(jīng)被檢驗?,F在的工作分布仍很稀疏。只有少數細胞系,包括實(shí)驗室的兩匹“快馬”HeLa和GM12878(細胞系名)的進(jìn)度還不錯。更多的只不過(guò)做了一次實(shí)驗而已。

科學(xué)家們將在第三階段中填補許多空白,而伯尼把這叫做“擴建”。但是他們打算增加更多實(shí)驗和更多細胞類(lèi)型。如此做的一種方法是,擴大一種叫做“染色質(zhì)免疫沉淀反應”(ChIP)技術(shù)的范圍,這一技術(shù)能找出與特定蛋白結合的所有序列,包括轉錄因子和修飾組蛋白。經(jīng)過(guò)一個(gè)辛苦的過(guò)程后,研究人員一個(gè)接一個(gè)地開(kāi)發(fā)出了這些DNA結合蛋白的對應抗體,然后用這些抗體將蛋白質(zhì)和任何相關(guān)DNA從細胞中分離出來(lái),最后再為這些DNA測序。

但至少,這是一個(gè)有限的問(wèn)題,因為這類(lèi)蛋白大約只有2000個(gè)(ENCODE已經(jīng)獲得了其中約1/10的樣本),更大的困難是算出來(lái)有多少細胞系需要分析。迄今為止,進(jìn)行的多數實(shí)驗都是針對適于在培養環(huán)境中生長(cháng)的細胞系,具有一些非自然的特點(diǎn)。比如細胞系GM12878,就是從血液細胞中培養出來(lái),并用一種病毒來(lái)驅動(dòng)細胞復制,組蛋白或其他因子可能會(huì )不正常地結合到擴增基因組中。HeLa細胞系是從50多年前的一個(gè)宮頸癌切片中培養出來(lái),并用基因重組技術(shù)改造。伯尼開(kāi)玩笑說(shuō),它稱(chēng)得上是個(gè)新物種。

ENCODE科學(xué)家現在想觀(guān)察直接取自人體的正常細胞。但許多這類(lèi)細胞在培養環(huán)境中無(wú)法分裂,樣本難以取得,實(shí)驗只能在少量DNA和諸如腦細胞組織中進(jìn)行。ENCODE協(xié)調人員也開(kāi)始討論,更深入地研究個(gè)體差異對基因組中的調節成分有哪些影響?!澳承┑胤酱嬖谝恍┬蛄胁町?,這意味著(zhù)轉錄因子在這里的結合方式有所不同?!币敶髮W(xué)新港分校計算生物學(xué)家馬克·格斯坦說(shuō),他協(xié)助設計了ENCODE的數據結構。最終,研究樣本將來(lái)自幾十到幾百個(gè)人不等。

大型研究計劃的經(jīng)驗

為了成功,科研聯(lián)盟需要清晰的管理和行動(dòng)守則,并要求參與人員為了共同利益而努力。伯尼說(shuō),由于該計劃的復雜性,它不可能像那些只有一兩個(gè)實(shí)驗室參與的研究那樣開(kāi)展。通常,在小規模的合作中,科學(xué)家都能充分發(fā)揮自己的能力,爭取資金、發(fā)表論文,這對科學(xué)研究、科學(xué)家的實(shí)驗室以及他們本人的發(fā)展都起到促進(jìn)作用。但這種模式在科研聯(lián)盟中并不奏效。

伯尼認為,一個(gè)大型科研聯(lián)盟要想成功,必須形成一個(gè)對每位參與者都透明的組織機構。這種機構應當足夠靈活,能隨時(shí)改變以容納多方資源,并將每位參與者作為個(gè)體對待,而不是把聯(lián)盟當成一個(gè)團體,允許預料之外的有創(chuàng )新性的參與者加入。在聯(lián)盟中,人們必須集中精力、盡可能地做出最好的數據庫,也許他們會(huì )用到這些數據,也許不會(huì ),重要的是公共資源,而非個(gè)人成功。這要求把編制數據的目標從發(fā)表論文轉變?yōu)楣怖?。反過(guò)來(lái),聯(lián)盟各方的成功也要得到認證,至少他們帶來(lái)了多少發(fā)現,就能在多大程度上促進(jìn)科學(xué)的發(fā)展。

大型生物科研聯(lián)盟如ENCODE、國際人類(lèi)基因組單體型圖計劃(HapMap)、千人基因組計劃(1000 Genomes Project)都是大規模的系統研究。這些研究會(huì )列出一份基礎資源的“清單”,而不是聚焦于某些興趣領(lǐng)域,并采用標準化方法、反應試劑和分析計劃。研究成本由其支持的科學(xué)范圍來(lái)決定——大到基因組分析,小到小規模的、假設驗證類(lèi)研究。

“我從1999年開(kāi)始參與各種水平參的研究。2004年,我成為ENCODE數據分析的協(xié)調人。我了解到,科研聯(lián)盟要想成功非常困難,因為它將那些可能會(huì )互相競爭的人組織在一起。讓競爭者公開(kāi)地、共同朝向一個(gè)目標合作很難,這有賴(lài)于所有人的良好意愿。ENCODE也讓我明白一點(diǎn),有效的科研聯(lián)盟要求所有參與者形成一個(gè)組織構架、一套行動(dòng)守則和一個(gè)目標:生成高質(zhì)量數據,讓全世界的科學(xué)家都能獲得有用的數據?!辈嵴f(shuō)。

成果:30篇論文聚焦人類(lèi)基因組功能

過(guò)去5年來(lái),ENCODE科研聯(lián)盟一直在構建這部DNA功能成分的百科全書(shū),希望它為整個(gè)科學(xué)界提供參考。最近,研究人員在《自然》《基因組研究》和《基因組生物學(xué)》3種雜志上發(fā)表了30篇公開(kāi)論文,關(guān)聯(lián)到大量過(guò)程分析和原始數據。這一形式或許還開(kāi)創(chuàng )了一種新的出版模式:在不同雜志之間進(jìn)行主題線(xiàn)索的交織。

1. 轉錄因子的足跡分析

對41種不同的細胞和組織類(lèi)型進(jìn)行基因組DNase I足跡分析,研究人員在DNA調節區內鑒定出4500萬(wàn)個(gè)轉錄因子結合事件,從而代表著(zhù)這些轉錄因子與840萬(wàn)個(gè)不同的短DNA序列元件存在差異性的結合。

2. 人類(lèi)基因組DNA元件集成百科全書(shū)

ENCODE項目系統性地描繪出人基因組上的轉錄區域、轉錄因子結合、染色質(zhì)結構和組蛋白修飾。根據這些數據,研究人員將生化功能分配到80%的人基因組,特別是在已得到很好研究的蛋白編碼序列之外的區域。

3. 人類(lèi)細胞轉錄全景圖

RNA是基因組編碼的遺傳信息的直接輸出。細胞的大部分調節功能都集中在RNA的合成、加工和運輸、修飾和翻譯之中。研究人員證實(shí),75%的人類(lèi)基因組能夠發(fā)生轉錄,并且觀(guān)察到幾乎所有當前已標注的RNA和上千個(gè)之前未標注的RNA的表達范圍與水平、定位、加工命運、調節區和修飾??傊?,這些觀(guān)察結果表明人們需要重新定義基因的概念。

4. 人類(lèi)基因組中可訪(fǎng)問(wèn)的染色質(zhì)全景圖

DNase I超敏感位點(diǎn)(DHSs)是調節性DNA序列的標記物。研究人員通過(guò)對125個(gè)不同的細胞和組織類(lèi)型進(jìn)行全基因組譜分析,鑒定出大約290萬(wàn)個(gè)人類(lèi)DHSs,并且首次大范圍地繪制出人類(lèi)DHSs圖譜。

5. 人類(lèi)基因組調控網(wǎng)絡(luò )結構

為了確定人類(lèi)轉錄調節網(wǎng)絡(luò )的作用原理,研究人員在450多項基因組實(shí)驗中研究了119個(gè)轉錄相關(guān)因子的結合信息。他們發(fā)現轉錄因子的組合性結合是高度環(huán)境特異性的:轉錄因子的不同組合結合在特異性的基因組位置上。他們對所有的轉錄因子進(jìn)行組裝而產(chǎn)生一個(gè)層次結構,并且將它與其他基因組信息整合在一起而形成一個(gè)嚴密又龐大的調節性網(wǎng)絡(luò )。

6. 基因啟動(dòng)子的遠距離相互作用全景圖

在ENCODE項目中,研究人員選擇1%的基因組作為項目試點(diǎn)區域,并且利用染色體構象捕獲碳拷貝(簡(jiǎn)稱(chēng)為5C)技術(shù)綜合分析了這個(gè)區域中轉錄起始位點(diǎn)和遠端序列元件之間的相互作用。

7. 果蠅和人類(lèi)的轉錄因子結合位點(diǎn)變異分析

研究人員將ENCODE項目產(chǎn)生的轉錄因子結合圖譜、之前發(fā)布的數據及其他人和果蠅等基因系中基因組變異數據來(lái)源結合在一起,來(lái)研究轉錄因子結合位點(diǎn)的變異性。

8. 轉錄因子TCF7L2通過(guò)GATA3結合到基因組上

TCF7L2轉錄因子與很多人類(lèi)疾病相關(guān)聯(lián),如Ⅱ型糖尿病和癌癥。研究人員利用高通量測序技術(shù)ChIP-seq在6個(gè)人類(lèi)細胞系中對TCF7L2進(jìn)行分析。他們鑒定出11.6萬(wàn)個(gè)非冗余性TCF7L2結合位點(diǎn),但是只有1864個(gè)位點(diǎn)在這6個(gè)細胞系中是相同的。

9. 構建定量模型研究染色質(zhì)特征和基因表達水平之間關(guān)系

通過(guò)構建出一個(gè)新的研究染色質(zhì)特征和基因表達水平之間關(guān)系的定量模型,研究人員不僅證實(shí)之前在多個(gè)細胞系的研究中發(fā)現的一般性關(guān)系,而且還對它們之間的關(guān)系提出了一些新的建議。

10. GENCODE假基因資源

作為GENCODE標注人基因組的一部分,研究人員基于大規模的人工標注和計算機運算,首次針對蛋白編碼的基因進(jìn)行全基因組假基因分配。他們將假基因標注和廣泛性的ENCODE功能性基因組學(xué)信息整合在一起,尤其是確定了每個(gè)假基因的表達水平、轉錄因子與RNA聚合酶Ⅱ結合以及與之相關(guān)聯(lián)的染色質(zhì)標記。

11. 對人類(lèi)啟動(dòng)子的轉錄因子結合位點(diǎn)進(jìn)行功能性分析

為了大規模地描述轉錄因子結合位點(diǎn)功能,研究人員預測了人類(lèi)啟動(dòng)子中的455個(gè)結合位點(diǎn),并對它們進(jìn)行突變。在4個(gè)不同的永生化人細胞系中,他們利用瞬時(shí)轉染和熒光素酶報告檢測在這些位點(diǎn)上對主要的轉錄因子進(jìn)行了功能測試。

12. 基于轉錄相關(guān)因子的結合位點(diǎn)對人類(lèi)基因組區域進(jìn)行分類(lèi)

研究人員通過(guò)機器學(xué)習方法構建出統計學(xué)模型,來(lái)捕獲3種匹配類(lèi)型的區域的基因組特征:活性結合或不活性結合的區域;極端高程度共同結合區域(HOT)和極端低程度共同結合區域(LOT);位于基因近端或遠端的調節性組件。

13. 利用RegulomeDB標注個(gè)人基因組中的功能性變異

研究人員開(kāi)發(fā)出一種新的方法和數據庫,即調節物組數據庫,指導人們理解人類(lèi)基因組中調節性序列上發(fā)生的變異。

14. 制定ChIP-seq工作標準和指導準則

根據研究人員進(jìn)行ChIP-seq實(shí)驗的經(jīng)歷,ENCODE和modENCODE(模式生物ENCODE)為經(jīng)常更新的ChIP-seq實(shí)驗制定出一套工作標準和指導準則。

15. 利用RT-PCR-seq和RNA-seq統計所有人類(lèi)基因組編碼的基因元件

在ENCODE項目中,GENCODE旨在通過(guò)人工管理和計算方法準確地標注人類(lèi)基因組中所有編碼蛋白的基因、假基因和非編碼性的轉錄座位。利用一種叫做RT-PCR-seq(先進(jìn)行RT-PCR擴增,然后進(jìn)行高通量多重測序)的方法來(lái)預測外顯子連接。驗證了73%的預測結果,從而證實(shí)了1168個(gè)新的基因,其中大多數是非編碼性的。

16. 細胞內RNA深度測序證實(shí)大多數RNA進(jìn)行共轉錄剪接

研究人員分析了K562細胞系中通過(guò)RNA-seq測序而獲得的細胞內RNA組分。他們發(fā)現,在人類(lèi)基因組中,RNA剪接主要是在轉錄期間完成的,并證實(shí)在細胞質(zhì)polyA+ RNA中,剪接幾乎完全完成。因此,大多數RNA在被轉錄的同時(shí)進(jìn)行剪接,即共轉錄剪接。

17. 發(fā)現上百個(gè)小鼠和人剪接來(lái)源的miRNA

非典型的miRNA模板并不適合經(jīng)常用來(lái)標注典型miRNA的策略。通過(guò)對737個(gè)小鼠和人類(lèi)小RNA數據集進(jìn)行大規模分析,研究人員采取嚴格且保守性的策略對237個(gè)小鼠剪接來(lái)源miRNA和240個(gè)人mirtrons進(jìn)行標注。

18. GENCODE:ENCODE項目的人類(lèi)基因組參照標注

GENCODE第七版公開(kāi)發(fā)布了基因組標注數據集,包含20687個(gè)蛋白編碼的RNA基因座位、9640個(gè)長(cháng)鏈非編碼RNA基因座位,并且擁有33977個(gè)在UCSC基因數據庫和RefSeq數據庫中不存在的編碼性轉錄本。它還對公開(kāi)獲得的長(cháng)鏈非編碼RNA進(jìn)行最全面的標注。

19. 發(fā)現人類(lèi)基因組中疾病相關(guān)的功能性SNP

研究人員系統性地研究了多種類(lèi)型的ENCODE數據與疾病相關(guān)基因SNP(即單核苷酸多態(tài)性)之間的關(guān)聯(lián)性,并且發(fā)現在當前鑒定出的疾病關(guān)聯(lián)當中,存在功能性SNP的顯著(zhù)性富集。

20. 在兩種人類(lèi)細胞系中,lncRNA很少表達

ENCODE項目發(fā)現被鑒定為lncRNA的9640多個(gè)人類(lèi)基因組位點(diǎn)中,迄今為止只有大約100個(gè)得到深入的研究以便確定它們在細胞中的作用。通過(guò)共同分析ENCODE項目最近產(chǎn)生的兩個(gè)數據集,發(fā)現大約92%的GENCODE第七版發(fā)布的lncRNA在細胞系K562和GM12878中并不表達。

21. 關(guān)于個(gè)人和群體的基因組調節性序列變異的基因組學(xué)

為了更好地界定人類(lèi)基因組調節性序列變異的模式,研究人員選擇了來(lái)自不同位置的53個(gè)人的全基因組序列,將他們的138個(gè)細胞和組織類(lèi)型的DNase I超敏感位點(diǎn)標記的全基因組調節性DNA序列圖譜結合起來(lái)。研究人員估計,相比于蛋白編碼的DNA序列,每個(gè)人可能擁有很多更加具有功能重要性的調節性DNA序列變異體,盡管平均而言,它們可能產(chǎn)生更加小的影響。

22. 利用開(kāi)放構象染色質(zhì)區域來(lái)預測細胞類(lèi)型特異性的基因表達

研究人員利用來(lái)自19項不同的人類(lèi)細胞類(lèi)型的DNase-seq數據來(lái)鑒定全基因組范圍的近端和遠端調節性序列元件。通過(guò)匹配表達數據,他們將基因分為三類(lèi):細胞特異性的上調表達的基因、細胞特異性的下調表達的基因和組成性表達的基因??傊?,他們成功地利用開(kāi)放構象染色質(zhì)的信息來(lái)解決利用調節性序列直接預測哺乳動(dòng)物細胞特異性表達時(shí)存在的問(wèn)題。

23. 探究ENCODE項目人類(lèi)RNA-seq數據中的RNA編輯

研究人員分析了來(lái)自ENCODE項目對14個(gè)人類(lèi)細胞系開(kāi)展研究所獲得的長(cháng)串RNA-seq數據(這些數據經(jīng)過(guò)PolyA選擇,沒(méi)有形成雙鏈,且經(jīng)過(guò)深度測序),以便鑒定出潛在的RNA編輯事件。他們發(fā)現,RNA編輯和特異性的基因之間存在較強的關(guān)聯(lián)。

24. 細胞類(lèi)型特異性的轉錄因子結合的序列和染色質(zhì)決定簇

為了研究DNA序列信號、組蛋白修飾和DNase對細胞類(lèi)型特異性的結合位點(diǎn)的可訪(fǎng)問(wèn)性所發(fā)揮的作用,研究人員分析了ENCODE項目所開(kāi)展的286項ChIP-seq實(shí)驗。與之前的研究相一致的是,他們發(fā)現DNase可訪(fǎng)問(wèn)性能夠解釋很多轉錄因子的細胞類(lèi)型特異性結合。

25. 119個(gè)人類(lèi)轉錄因子結合的基因組區域附近的序列特征和染色質(zhì)結構

通過(guò)對ENCODE項目在研究119個(gè)人類(lèi)轉錄因子時(shí)所獲得的大約457個(gè)ChIP-seq數據集進(jìn)行整合分析,研究人員在大多數數據集中鑒定出高度富集的序列基序,揭示出新的基序和驗證已知的基序。

26. 分析人類(lèi)lncRNA的基因結構、進(jìn)化和表達

研究人員分析了迄今為止最為完整的由GENCODE項目產(chǎn)生的人類(lèi)lncRNA標注:人工標注了產(chǎn)生14990個(gè)RNA轉錄本的9277個(gè)基因。他們的分析結果表明,lncRNA是通過(guò)類(lèi)似于蛋白編碼基因的轉錄途徑產(chǎn)生的;相對于蛋白編碼的基因,lncRNA通常較低地表達。

27. 染色質(zhì)信號存在廣泛的異質(zhì)性

在許多種細胞系中,研究人員將14個(gè)染色質(zhì)信號(12個(gè)染色質(zhì)標記、DNase和核小體定位)與119個(gè)DNA結合蛋白的結合位點(diǎn)相關(guān)聯(lián)在一起。他們開(kāi)發(fā)出一種被稱(chēng)作CAGT的方法,來(lái)解釋染色質(zhì)標記在信號強度、形狀和隱性鏈定位上的異質(zhì)性。

28. 對轉錄因子結合數據進(jìn)行整合分析來(lái)理解轉錄調節

利用對ENCODE項目產(chǎn)生的大量數據進(jìn)行統計學(xué)模型分析,來(lái)研究轉錄因子的轉錄調節。研究結果揭示,不同技術(shù)和RNA抽提實(shí)驗程序所捕獲的轉錄起始位點(diǎn)在表達水平的預測準確度上存在顯著(zhù)性的差異。

29. CTCF結合的廣泛可變性與DNA甲基化相關(guān)聯(lián)

CTCF是一個(gè)廣泛表達的調節因子。研究人員通過(guò)研究19項不同人類(lèi)細胞類(lèi)型的ChIP-seq數據來(lái)分析CTCF的全基因組結合模式。他們觀(guān)察到高度重復性的但同時(shí)可變性非常大的基因組結合全景圖,表明CTCF結合受到高度細胞選擇性的調節。

30. 細胞HepG2中高度整合的轉錄因子PPARGC1A結合網(wǎng)絡(luò )

PPARGC1A是一個(gè)轉錄共激活因子。它結合并共同激活多種轉錄因子來(lái)調節大多數基因的表達。在這項研究中,研究人員在經(jīng)過(guò)毛喉素處理的HepG2細胞中描述了一種核心的PPARGC1A轉錄調節網(wǎng)絡(luò )。他們利用ChIP-seq首次描繪了PPARGC1A的全基因組結合位點(diǎn),并且揭示出過(guò)多表達的對應于已知的和新的PPARGC1A網(wǎng)絡(luò )成員的DNA序列基序。重要的是,他們發(fā)現不同的轉錄因子組合結合到一套不同的功能性基因上,從而有助于揭示代謝性過(guò)程和其他細胞過(guò)程的組合性調節代碼。(記者 常麗君 綜合外電)《

《科技日報》(2012-09-030 二版)

本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
美國ENCODE計劃取得重要進(jìn)展
科學(xué)家揭開(kāi)“垃圾”DNA的神秘角色!
基因組測序17個(gè)里程碑最全盤(pán)點(diǎn)?。?001-2021)
“垃圾DNA”真的應該 扔進(jìn)垃圾桶嗎?
歷時(shí)17年ENCODE計劃三期完工,近百萬(wàn)人類(lèi)基因組調控元件被發(fā)現,單細胞時(shí)空組學(xué)或將登場(chǎng)
14篇Nature系列合集:DNA元件百科全書(shū)最新成果出爐,近6000項實(shí)驗、120萬(wàn)個(gè)功能性元件,挖掘基因開(kāi)關(guān)的奧秘
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久