近日,中山大學(xué)醫(yī)學(xué)院施莽教授團隊與阿里云李兆融團隊在《細胞》雜志(Cell)發(fā)表論文,報告了全球范圍共180個超群、16萬馀種RNA(核糖核酸)病毒的發(fā)現(xiàn),大幅擴展了全球RNA病毒的多樣性。該研究將人工智能技術(shù)應(yīng)用于病毒鑒定,發(fā)現(xiàn)了傳統(tǒng)研究方法未能發(fā)現(xiàn)的病毒“暗物質(zhì)”,探索了病毒學(xué)研究的新路徑。據(jù)悉,研究團隊開發(fā)的LucaProt人工智能算法,能夠深度學(xué)習(xí)病毒和非病毒基因組序列,并在數(shù)據(jù)集中自主判斷病毒序列。利用這套算法,研究團隊在來自全球生物環(huán)境樣本的10487份RNA測序數(shù)據(jù)中,發(fā)現(xiàn)了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超群存在。
“人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,這種能力在疾病防控和新病原的快速識別中尤為重要。特別是在疫情暴發(fā)時,人工智能的速度和精度可以幫助科學(xué)家更快地鎖定潛在病原體。”施莽介紹說。
通過進一步分析,研究團隊報告了迄今最長的RNA病毒基因組,其長度達到47250個核甘酸;發(fā)現(xiàn)了超出以往認知的基因組結(jié)構(gòu);識別到多種病毒功能蛋白,特別是與細菌相關(guān)的功能蛋白,進一步表明還有更多類型的RNA噬菌體亟待探索。這些新病毒的發(fā)現(xiàn),刷新著科學(xué)家對病毒圈的認識。