AI蛋白技術解析基因變異,個性化基因療法迎新機遇
(相關資料圖)
近期,由我國科學家牽頭發起,多國科學家共同參與的“靈長類基因組計劃”取得重大進展,相關研究成果在權威學術期刊《科學》上發表。其中,由時任基因測序巨頭Illumina Senior Fellow、分子之心創始人許錦波教授與Illumina人工智能實驗室聯合完成的《The landscape of tolerated genetic variation in humans and primates》一文,借助AI蛋白技術分析靈長類動物基因組的變異,了解個體的基因變異和遺傳風險,為個性化基因醫學的發展帶來重要機遇。
“靈長類基因組計劃”由中國科學院昆明動物研究所率先提出,中、美、德、英等多個國家的100多位科學家共同參與,是一項跨國、跨學科的科學探索工程。該計劃擬通過測定地球上已知500多種靈長類動物的基因序列,繪制靈長類基因組圖譜,破譯人類“近親”的遺傳信息,為靈長類動物的保護及生命科學、醫學等領域的發展奠定基礎。
眾所周知,基因是決定遺傳特征的基本單位。人類基因組中有很多基因發生了微小的變異,但人們并不完全了解這些變異對人類健康的影響。由于基因組的復雜性和多樣性,這些變異中只有極小一部分被科學家們認為與疾病相關,其他的變異則一直沒有明確的解釋。科學家們一直在努力尋找方法來準確解讀這些變異,以確定人類遺傳變異的影響及其對疾病風險的影響,從而實現個性化醫療。為更好地理解人類基因組中的變異,科學家們轉向靈長類動物進行研究。多數靈長類物種的基因信息與人類基因密切相關,比如黑猩猩和人類具有99.4%的蛋白質序列同一性。因此,可以根據人類密切相關的靈長類物種信息來推斷與其直系同源的人類變異的致病性。
科學家們對來自211種靈長類動物的703個個體進行了測序,并將這些與之前研究的數據進行了匯總,確定了430萬個獨特的錯義(蛋白質改變)變體。在靈長類動物中觀察到的錯義變異在ClinVar數據庫中的評估中更有可能被認為是無害的,也就是說,這些變異并不會對人們的健康產生不良影響,這與自然選擇和基因組適應性有關,表明它們被自然選擇所容忍。這一發現為進一步研究人類基因組的變異提供了重要線索。
為了進一步分析和解釋人類基因組中的變異,研究團隊開發了PrimateAI-3D的深度學習網絡。該網絡利用蛋白質的多序列比對和3D結構作為輸入,通過3D卷積識別蛋白質結構中關鍵的變異區域,經過AI訓練,能夠準確分類良性和未知的人類變異,預測基因變異的致病性。
據悉,PrimateAI-3D為科學家們解讀基因變異的功能和影響提供了新的工具。比如,研究人員利用PrimateAI-3D模型對STK11基因進行了深入分析,研究人員通過PrimateAI-3D模型的預測,可以對STK11基因中的變異進行分類,判斷其可能的致病性,便于進一步理解STK11基因的功能和與Peutz-Jeghers綜合征的關系,為臨床診斷和治療提供指導。而通過對靈長類動物基因的研究,科學家們將在個性化基因醫學領域取得重要突破。通過更準確地解釋人類基因組中的變異,醫生和研究人員可以更好地理解患者的遺傳特征,并為其提供更加個性化和精準的醫療護理,為全人類健康帶來福祉。
標簽: