人類基因組的絕大部分DNA序列(約98%)都不編碼蛋白質(zhì)。這些非編碼序列(noncoding sequence)具有何種功能以及一小部分非編碼序列如何進(jìn)化成為新的編碼蛋白質(zhì)的基因是現(xiàn)代生物學(xué)尚未解決的兩個(gè)重要問(wèn)題。近二十年的研究表明,絕大部分非編碼序列都被轉(zhuǎn)錄成為RNA,包括內(nèi)含子(intron),5’ 和 3’ 非翻譯區(qū)(untranslated region,UTR),以及長(zhǎng)鏈非編碼RNA(long noncoding RNA, lncRNA)。更加令人意外的是,越來(lái)越多的實(shí)驗(yàn)證據(jù)表明,所有這些非編碼序列都可以被翻譯成蛋白質(zhì)。絕大部分從非編碼序列產(chǎn)生的新蛋白質(zhì)都不具有明顯的功能,甚至對(duì)細(xì)胞有害。非編碼翻譯(noncoding translation)在人類細(xì)胞中廣泛存在,尤其是在腫瘤,衰老,和神經(jīng)退行性疾病中。
雖然我們目前并不清楚非編碼翻譯在這些疾病中的作用,值得一提的是,絕大多數(shù)腫瘤特異性抗原都是由非編碼序列翻譯產(chǎn)生的。這些抗原是細(xì)胞內(nèi)蛋白降解的產(chǎn)物,也是目前開發(fā)腫瘤疫苗和免疫療法的關(guān)鍵。細(xì)胞如何有效降解這些無(wú)功能的蛋白以及如何將其處理成抗原是當(dāng)前研究的一個(gè)熱點(diǎn)問(wèn)題。另一方面,雖然絕大部分非編碼序列翻譯產(chǎn)生的蛋白都是無(wú)功能的,其中一小部分會(huì)進(jìn)化成具有功能的蛋白。最新研究發(fā)現(xiàn)一個(gè)非常有意思的現(xiàn)象是這些新型功能蛋白通常都在膜上發(fā)揮作用,包括細(xì)胞膜和細(xì)胞器膜。非編碼進(jìn)化出來(lái)的新型蛋白如何定位到膜上是另外一個(gè)尚待解決的重要問(wèn)題。
2023年4月12日,美國(guó)哥倫比亞大學(xué)吳雪兵研究組在Nature雜志上以非常簡(jiǎn)潔的標(biāo)題Noncoding translation mitigation發(fā)表了他們?cè)谶@個(gè)領(lǐng)域的最新研究成果。通過(guò)整合全基因組CRISPR篩查(CRISPR screening)和大規(guī)模并行分析所有類型上萬(wàn)個(gè)人源非編碼序列和數(shù)百萬(wàn)隨機(jī)序列,該研究組發(fā)現(xiàn)了人類細(xì)胞降解所有類型非編碼翻譯產(chǎn)生的蛋白的統(tǒng)一機(jī)制。該機(jī)制可以同時(shí)解釋非編碼蛋白如何被處理成抗原以及非編碼進(jìn)化出來(lái)的新型蛋白如何定位到膜上這兩個(gè)問(wèn)題。
基因組由A/C/G/T四種堿基組成。在絕大部分真核生物的基因組中,編碼序列包含更多的G和C,而非編碼序列則包含更多的A和T(在RNA中是U)。早在十年前,吳雪兵教授及其合作者就在Nature和Cell發(fā)表兩篇論文,揭示了編碼序列和非編碼序列的這一區(qū)別通過(guò)導(dǎo)致RNA剪接(splicing)和多腺苷酸化(polyadenylation)的差異而抑制非編碼序列的轉(zhuǎn)錄,以及非編碼序列如何通過(guò)被轉(zhuǎn)錄而改變堿基組成進(jìn)而進(jìn)化成新的編碼基因。
在最新的這項(xiàng)研究中,吳雪兵教授課題組發(fā)現(xiàn)在普適的遺傳密碼(universal genetic code)中,含有U的密碼子傾向于編碼疏水氨基酸。作者們也注意到,所有四種非編碼序列(intron, 5’ UTR, 3’ UTR, lncRNA)翻譯所產(chǎn)生的新型蛋白,盡管部分蛋白其N端可以是編碼序列翻譯而來(lái),其C端都是由非編碼序列翻譯而來(lái)的。因此,非編碼序列翻譯產(chǎn)生的蛋白都傾向于有一個(gè)C端疏水區(qū)。通過(guò)大規(guī)模并行分析所有四種類型上萬(wàn)個(gè)人源非編碼序列和數(shù)百萬(wàn)隨機(jī)序列,作者們確認(rèn)大部分未經(jīng)過(guò)進(jìn)化的非編碼序列和隨機(jī)序列都傾向于包含C端疏水區(qū),同時(shí)C端疏水區(qū)導(dǎo)致蛋白被蛋白酶體(proteasome)降解。
為了進(jìn)一步揭示C端疏水區(qū)導(dǎo)致蛋白降解的機(jī)制,作者們用全基因組CRISPR 篩查系統(tǒng)性地測(cè)試逐一敲除每個(gè)人源基因?qū)Ψ蔷幋a蛋白降解的影響。他們發(fā)現(xiàn)BAG6膜蛋白質(zhì)量監(jiān)控系統(tǒng)特異性地識(shí)別非編碼蛋白上的C端疏水區(qū),進(jìn)而導(dǎo)致蛋白降解。BAG6系統(tǒng)是一個(gè)進(jìn)化上高度保守的C端跨膜蛋白質(zhì)量監(jiān)控系統(tǒng)。其底物具有和非編碼蛋白類似的C端疏水區(qū)。具有功能的C端跨膜蛋白會(huì)被定位到膜上,而未正常折疊的底物會(huì)被降解,其中一部分會(huì)被處理成抗原。這一發(fā)現(xiàn)不僅解釋了非編碼序列產(chǎn)生的蛋白如何被降解,也解釋了為什么多數(shù)從非編碼序列進(jìn)化而來(lái)的功能蛋白會(huì)被定位到膜上。
總的來(lái)說(shuō),這項(xiàng)研究揭示了人類基因組編碼序列與非編碼序列的一個(gè)本質(zhì)區(qū)別以及進(jìn)化中二者如何相互轉(zhuǎn)化的機(jī)制。該研究也為理解非編碼翻譯在腫瘤、衰老和神經(jīng)退行性疾病中的調(diào)控,以及開發(fā)新型的腫瘤免疫療法提供了基礎(chǔ)。
Jordan Kesner博士和陳子恒為本文的并列第一作者。值得一提的是,Jordan Kesner博士是吳雪兵教授在哥倫比亞大學(xué)指導(dǎo)的第一位博士畢業(yè)生。Jordan Kesner博士憑借此項(xiàng)研究成果獲得哥倫比亞大學(xué)醫(yī)學(xué)院博士畢業(yè)生最高榮譽(yù)——院長(zhǎng)卓越科研獎(jiǎng)(Dean’s Award for Excellence in Research)。陳子恒在哥倫比亞大學(xué)攻讀生物醫(yī)學(xué)工程碩士學(xué)位期間參與了此項(xiàng)研究。現(xiàn)于美國(guó)卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)攻讀博士學(xué)位,繼續(xù)神經(jīng)退行性疾病方向的研究。
原文鏈接:https://doi.org/10.1038/s41586-023-05946-4
文章轉(zhuǎn)自網(wǎng)絡(luò),如有侵權(quán)聯(lián)系刪除。