科學家開發新的適體生成計算模型,應用廣泛
來自日本的研究人員近開發了 RaptGen,這是一種重要的計算模型,可用于新的適體生成
適體是通過指數富集 (SELEX) 系統進化配體產生的單鏈寡核苷酸。它們具有廣泛的應用,但計算方法對于有效識別候選適體是必要的。來自日本的一組研究人員現已開發出 RaptGen,這是一種變分自動編碼器,可有效發現輸入 SELEX 數據集中未包含的新適配體。這種新穎的計算模型有朝一日可能成為適體生成的標準方法。
寡核苷酸是合成 DNA 或 RNA 的短單鏈。盡管很小,但這些分子在分子和合成生物學應用中發揮著重要作用。一種寡核苷酸——適體——可以選擇性地與特定靶標結合,例如蛋白質、肽、碳水化合物、病毒、毒素、金屬離子甚至活細胞。由于它們與抗體相似,它們在生物傳感器、和診斷領域具有多種用途。然而,與抗體相比,適體不會在我們體內引起免疫反應,并且易于合成和修飾。此外,適配體的三維折疊結構使其能夠與更廣泛的目標結合。
適體通常由體外選擇和擴增技術產生,稱為指數富集配體系統進化,或 SELEX。簡而言之,SELEX 基于核苷酸的結合、分離和擴增的重復循環。這個過程會產生一個豐富的核苷酸序列庫,然后對其進行分析以進行候選選擇。高通量 SELEX (HT-SELEX) 可以生成大量候選適體,但目前實際適用的測序僅允許我們評估有限數量的這些候選物(大約 10 6)。因此,計算過程對于優化新適體的發現至關重要。
據報道,基于變分自動編碼器(VAE,一種機器學習方法)的化合物設計有利于發現其他小分子。現在,由日本早稻田大學高等科學與工程研究生院的 Michiaki Hamada 教授領導的一組研究人員介紹了 RaptGen,這是一種可用于適體生成的 VAE。在他們于 2022 年 6 月 2 日在Nature Computational Science上發表的論文中,他們描述了 RaptGen 如何使用帶有輪廓隱藏馬爾可夫模型解碼器的 VAE 來創建序列可以形成簇的潛在空間。通過使用這種潛在表示,RaptGen 能夠生成甚至不包含在原始測序數據或 HT-SELEX 數據集中的適配體。
當被問及 RaptGen 究竟如何促進適體發現時,Hamada 教授說:“ RaptGen 首先用序列基序可視化一個潛在空間,然后通過這個潛在空間生成多個新的適體序列。例如,它通過在分析序列子集的活動后考慮附加信息,在潛在空間中搜索優化的適體序列。此外,RaptGen 能夠設計縮短(或截斷)的適體序列。”
該團隊還通過使用來自兩個獨立 HT-SELEX 數據集的數據成功地評估了 RaptGen 的性能。RaptGen 可以以活動引導的方式生成適體衍生物,并提供優化其活動的機會。“這很重要,因為這意味著 RaptGen 可以生成具有所需特性的序列,例如抑制某些酶或蛋白質-蛋白質相互作用, ” Hamada 教授解釋說。這些分子的應用可能會在未來打開許多大門。
展望未來,該團隊計劃進行廣泛的研究,評估替代模型是否可以提高 RaptGen 的性能,以及 RaptGen 是否可以通過使用 RNA 序列來促進 RNA 適體的生成。使用 RaptGen 的缺點是計算成本高和訓練時間增加,這兩者都可以在進一步的研究中得到改進。
Hamada 教授總結說:“據我們所知,RaptGen 是可以直接從 HT-SELEX 數據設計和優化截斷適配體的數據驅動方法。我們相信,在適當的時候,RaptGen 將被公認為高效適體發現的關鍵工具。”
這是他們對擁有更好療法的健康長壽社會的愿景!
參考
作者: Natsuki Iwano 1、 Tatsuo Adachi 2、 Kazuteru Aoki 2、 Yoshikazu Nakamura 2和Michiaki Hamada 1,3,4
原始論文標題: Generative aptamer discovery using RaptGen
期刊: Nature Computational Science
DOI: 10.1038 / s43588-022-00249 -6
隸屬關系
1 :早稻田大學科學與工程研究生院
2 : 東京 RIBOMIC Inc.
3 :國立先進工業科學技術研究院 (AIST)計算生物大數據開放創新實驗室 (CBBD-OIL )
4 : 研究生院日本醫科大學醫學系