科技日?qǐng)?bào)記者 馬愛平
記者27日從中國農(nóng)業(yè)科學(xué)院獲悉,該院農(nóng)業(yè)基因組研究所農(nóng)業(yè)基因編輯技術(shù)研發(fā)與應(yīng)用創(chuàng)新團(tuán)隊(duì)構(gòu)建了全球規(guī)模最大的實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)集,并基于此開發(fā)出多模態(tài)機(jī)器學(xué)習(xí)模型AlphaCD。該模型不僅能高效預(yù)測超過2萬余種胞嘧啶脫氨酶的酶活特征,還能設(shè)計(jì)出新型高性能堿基編輯工具。相關(guān)成果日前發(fā)表于國際期刊《細(xì)胞研究》。
胞嘧啶堿基編輯器是一種基因編輯工具,廣泛應(yīng)用于疾病治療、動(dòng)植物育種等研究領(lǐng)域?!叭欢?,傳統(tǒng)胞嘧啶堿基編輯器研發(fā)依賴大量試錯(cuò)實(shí)驗(yàn),成本高、周期長,且難以系統(tǒng)優(yōu)化酶活特征。”論文通訊作者、中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)基因組研究所研究員左二偉表示。為破解這一難題,研究團(tuán)隊(duì)歷時(shí)三年,實(shí)驗(yàn)測試了1100種胞嘧啶脫氨酶變體的催化效率、脫靶效應(yīng)等核心指標(biāo),首次建立了覆蓋多維功能特征的大規(guī)模實(shí)驗(yàn)數(shù)據(jù)庫。
利用機(jī)器學(xué)習(xí)模型AlphaCD表征21335個(gè)胞嘧啶脫氨酶(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)基因組研究所供圖)
基于該數(shù)據(jù)庫,團(tuán)隊(duì)整合蛋白質(zhì)序列、三維結(jié)構(gòu)、理化性質(zhì)等多模態(tài)數(shù)據(jù),開發(fā)出人工智能模型AlphaCD。經(jīng)嚴(yán)格驗(yàn)證,該模型在預(yù)測胞嘧啶脫氨酶催化效率、脫靶活性、靶向窗口及基序偏好等關(guān)鍵指標(biāo)時(shí),準(zhǔn)確性顯著優(yōu)于傳統(tǒng)方法。
“AlphaCD突破了當(dāng)前AI大模型依賴超算資源的局限?!弊蠖ソ榻B,研究團(tuán)隊(duì)采用隨機(jī)森林算法發(fā)現(xiàn),在個(gè)人計(jì)算機(jī)上即可完成模型訓(xùn)練。這一輕量化設(shè)計(jì)使學(xué)術(shù)機(jī)構(gòu)低成本開展高通量功能預(yù)測成為可能,降低了技術(shù)門檻,為資源有限的科研團(tuán)隊(duì)提供了新思路。
本文鏈接:http://jphkf.cn/news-2-3469-0.html多模態(tài)機(jī)器學(xué)習(xí)模型AlphaCD創(chuàng)新基因編輯工具設(shè)計(jì)路徑
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇:世界首例!中國團(tuán)隊(duì)將基因編輯豬肺成功移植人體
下一篇:電子加速器裝置:縮短作物育種周期
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕