人工智慧(AI)技術對於多元領域的研究大有幫助,近期已協助完成醫療領域的蛋白質研究。新創公司如Evozyne使用NVIDIA預先訓練好的AI模型,創造出兩種在醫療保健與清潔能源方面具有巨大發展潛力的蛋白質。在日前發表的一篇合著論文中描述了該過程及其產生的生物構成原料。一個旨在治療先天性疾病,另一個則是用於消耗二氧化碳以減緩全球暖化。這些初步成果在於能夠協助科學家們找到能夠加快發現藥物,及進行其他研發活動的新方法。
Evozyne公司共同創辦人,同時也是參與該合著論文的作者Andrew Ferguson表示,即使此研究首次研發,AI模型同樣能產生跟天然蛋白質一樣良好的合成蛋白質,也確保這個模型正確地學習了大自然的設計規則。
Evozyne使用NVIDIA的ProtT5執行整個專案項目,ProtT5是NVIDIA BioNeMo裡的部分Transformer模型,用於協助醫療保健領域建立AI模型的軟體架構與服務。該模型是ProT-VAE的工作流程核心,可將BioNeMo與充當篩檢器的變分自動編碼器相互結合。
NVIDIA的Transformer模型讀取蛋白質中的數百萬種氨基酸序列的技術,像學生讀書一樣,都是使用神經網路來理解文字的意涵。藉由這樣的方式,能進一步了解與掌握大自然是如何組成這些生物的。然後,該模型能夠接著預測要如何配合Evozyne,進而找出解決的功能以生成新的蛋白質。
機器學習有助於一一排查可以使用的海量蛋白質序列,並有效地識別出最有用的序列。傳統的蛋白質生成方式稱為定向進化,用的是一種碰運氣的緩慢方法,且通常一次只能改變幾個氨基酸的序列。
相較之下,Evozyne的方法可以在同一輪中改變蛋白質裡半數以上的氨基酸。這相當於進行了數百次突變。Evozyne預計使用這個新進展來生成一系列的蛋白質,以用來對抗疾病和氣候變遷。