• <td id="46i6g"><rt id="46i6g"></rt></td>
    <td id="46i6g"><kbd id="46i6g"></kbd></td>
  • <xmp id="46i6g"><option id="46i6g"></option><option id="46i6g"><option id="46i6g"></option></option>
  • <td id="46i6g"></td>
    發布時間:2022-08-04 11:35 原文鏈接: BMCBiology:基于深度學習預測E3泛素連接酶識別位點

    真核細胞內蛋白質的降解依賴于自噬及泛素-蛋白酶體系統(2004年諾貝爾化學獎)。其中,泛素-蛋白酶體系統負責降解細胞內超過80%的蛋白,該系統的關鍵酶為E3泛素連接酶,負責識別要被降解的底物蛋白并將其泛素化。人體內表達600余種E3,這些E3以特定規則結合不同底物蛋白,從而實現降解過程的特異性。底物上的E3識別位點被稱為degron[1],degron是長度5-8個氨基酸的短肽,通過disorder-to-order轉換的方式與E3結合,使得底物被泛素化修飾進而被降解。因此,系統分析蛋白底物上的degron對于研究蛋白質的降解過程以及蛋白降解異常在疾病中的作用非常重要。

    近日,北京大學基礎醫學院李婷婷課題組在BMC Biology雜志上在線發表文章“Systematic Prediction of Degrons and E3 Ubiquitin Ligase Binding via Deep Learning”,開發了degron預測工具Degpred(http://degron.phasep.pro/)。

    在該工作中,作者構建了基于BERT預訓練模型的深度學習預測工具(圖1左),該預訓練模型為蛋白質上每個氨基酸輸出一個768維的特征向量。隨后,根據特征向量,作者利用長短時記憶網絡及全連接層來對每個氨基酸的degron可能性打分。

    首先,作者收集了ELM數據庫及其他文獻中報道的有實驗依據的303個degron。由于不同E3結合的degron有不同的一級序列偏好,作者將degron基于一級序列分為五組(圖1右),以四組為訓練集,一組為測試集的方式來探究不同序列模式的degron是否具有更高級別序列性質的相似性。在測試過程中作者發現,雖然訓練集和測試集的degron具有不同的一級序列特征,但模型在測試集上取得了較好的預測效果。這說明不同E3識別的degron具有相似的高級別序列性質。作者整合了五次訓練的模型,構建得到最終的degron預測模型—Degpred,并利用Degpred在人類蛋白質組上預測了46,000余個degron。

    圖1 左:模型框架;右:基于序列相似性將degron分為五組。

    以往研究發現degron趨向于定位在蛋白質無序區域(disorder region),并且是一類molecular recognition feature[2]。通過分析Degpred模型在人類蛋白質組上預測得到degron的相關屬性,作者發現預測得到的degron具有較高的無序序列特征、molecular recognition feature打分以及表面可及性等特征打分(圖2上)。此外,作者發現預測得到的degron相鄰蛋白序列富集賴氨酸以及泛素化修飾(圖2下),這說明預測得到的degron能夠促進相鄰賴氨酸的泛素化,這一發現與degron功能相符合。

    圖2 在人類蛋白組上比較利用Degpred以及其他工具預測的degron相關特征差異

    實現degron預測之后,作者基于Degpred以及從文獻中收集的E3底物相互作用網絡計算得到一系列E3 motif,并基于此構建了人類蛋白降解調控網絡(motif計算方法及網絡構建過程可參考原文)。為檢驗預測結果的可靠性,作者在CBX6上進行了實驗驗證。CBX6的第269-273位氨基酸(DARSS)被預測為E3酶SPOP識別的degron,但此degron并不屬于已知的SPOP motif。實驗發現,突變該degron顯著增加了CBX6的表達量,延長了CBX6的半衰期,并且減弱了CBX6與SPOP的結合(圖3)。這一實驗證明了Degpred模型預測結果的可靠性。

    圖3 CBX6上預測的SPOP結合degron驗證實驗

    最后,作者分析了degron在TCGA腫瘤患者中的突變情況。分析發現,腫瘤中的突變趨向于發生在degron及附近位置(圖4a),且degron相關突變往往有更高的發生頻率(圖4b)。作者進一步分析了不同腫瘤中degron突變比例,發現CTNNB1、NFE2L2、RXRA、EPAS1等上百個蛋白的突變趨向于發生在degron上(圖4d),degron突變可能導致這些蛋白高表達,進而導致相關通路激活而導致腫瘤。

    此外,基于多種預測腫瘤驅動(cancer driver)突變的方法,作者發現degron相關突變的腫瘤驅動突變比例更高(圖4e)。由于degron調控蛋白質降解,作者推測degron突變對短半衰期(short-lived)蛋白影響更大。為此,作者分析了來源于不同數據的短半衰期蛋白,發現這些蛋白上的degron突變更趨向于導致腫瘤(圖4f)。

    圖4 degron突變分析

    綜上,作者利用遷移學習預測蛋白底物上的degron,并基于計算得到的E3 motif分析 每個degron所結合的E3。進一步,作者從性質分析以及實驗等方面證明了預測結果的可靠性,并在腫瘤數據中發現短半衰期蛋白的degron突變更趨向于導致腫瘤。本工作中收集的數據以及預測得到的數據(degron,E3底物關系)可從http://degron.phasep.pro/查詢(圖5)。

    圖5 網站蛋白預測界面示意圖

    北京大學基礎醫學院李婷婷副教授為本文通訊作者,基礎醫學院八年制博士生侯超為本文第一作者。基礎醫學院博士生李雨軒和北京大學生命科學院博士王夢瑤負責了本文章中的實驗驗證部分,北京大學生命科學院吳虹教授為本課題提供了重要指導。李婷婷課題組致力于通過生物信息學手段研究相分離及蛋白質修飾過程,相關工作可以通過http://BioinfoLilab.phasep.pro/訪問。

    原文鏈接:https://bmcbiol.biomedcentral.com/articles/10.1186/s12915-022-01364-6

    1.Meszaros B, Kumar M, Gibson TJ, Uyar B, Dosztanyi Z: Degrons in cancer. Sci Signal 2017, 10(470).

    2.Guharoy M, Bhowmick P, Sallam M, Tompa P: Tripartite degrons confer diversity and specificity on regulated protein degradation in the ubiquitin-proteasome system. Nat Commun 2016, 7:10239.


  • <td id="46i6g"><rt id="46i6g"></rt></td>
    <td id="46i6g"><kbd id="46i6g"></kbd></td>
  • <xmp id="46i6g"><option id="46i6g"></option><option id="46i6g"><option id="46i6g"></option></option>
  • <td id="46i6g"></td>
    亚洲日本va中文字幕久久道具