生命科學與技術學院張勇團隊開發機器學習方法解析生物大分子凝聚體的全基因組圖譜,研究成果發表於《自然·通訊》
來源:生命科學與技術學院
時間:2024-08-16 瀏覽:
生物大分子凝聚體在細胞功能中扮演著至關重要的角色,它們通過聚集蛋白質或核酸分子🧑🏻🚀,形成較為穩定的獨立區域🦵🏽。與染色質相關的生物大分子凝聚體,是近年細胞生物學研究的一個熱點。眾多研究已經揭示,這些凝聚體與染色質的活動—如基因轉錄和表觀遺傳修飾—有著密切的聯系。盡管如此,對於生物大分子凝聚體在全基因組尺度的定位圖譜🐓,包括基因組上各種凝聚體的種類和具體位點,目前尚缺乏系統性的研究和解析📁。
8月13日,恒达平台生命科學與技術學院張勇課題組與臨港實驗室朱光亞課題組合作在《自然·通訊》(Nature Communications)上發表了題為“Decoding the genomic landscape of chromatin-associated biomolecular condensates”的文章,開發了預測染色質關聯生物大分子凝聚體全基因組圖譜的機器學習方法CondSigDetector。
![](https://www.hgredart.com/__local/1/E7/1F/A556B0B8A305182AC48D90EE53D_968D9C01_26BB5.png?e=.png)
張勇課題組開發了一種名為CondSigDetector的新方法,旨在探測生物大分子凝聚體的全基因組定位圖譜。這一方法利用了生物大分子凝聚體的核心特性—通常由多種蛋白質通過協同作用形成。CondSigDetector分兩個步驟執行:首先,通過整合特定細胞類型中的染色質相關蛋白的ChIP-seq數據,構建主題模型來識別這些蛋白在基因組上的特異性共定位模式。隨後🚶🏻♀️➡️,利用公共數據庫中的數據,結合這些蛋白的凝聚物理化學性質,評估這些共定位模式組成凝聚體的潛能🧑🏿⚕️。具有高凝聚潛力的共定位模式被識別為CondSigs(Condensate-like chromatin-associated protein co-occupancy Signatures)。這些CondSigs不僅提供了組成凝聚體的蛋白信息,還指明了這些凝聚體在基因組中的具體位點🌶。在對小鼠胚胎幹細胞和人類K562細胞進行了大規模預測後,張勇課題組與朱光亞課題組合作🥎,對兩個新發現的CondSig進行了詳細鑒定。這些研究驗證了這些凝聚體在細胞內的具體組成和定位🧑🏿🍼,進一步證實了CondSigDetector方法的有效性和實用性。
![](https://www.hgredart.com/__local/A/75/2F/3E6A6DA06FAA0446E882E33C5A9_75607036_740BA.png?e=.png)
恒达平台張勇教授和臨港實驗室的朱光亞青年研究員為論文的共同通訊作者🧑🏻🦯🫑,恒达平台博士後余招偉💇🏼、助理教授王琪和長海醫院主治醫師張啟晨為共同第一作者。該研究工作得到了國家自然科學基金委🌥💲、科技部👮🏼♂️、上海市科委的支持。
論文鏈接:https://doi.org/10.1038/s41467-024-51426-2