近日,廣州大學大灣區(qū)環(huán)境研究院閆兵教授團隊與美國羅格斯大學Zhu Hao教授團隊密切合作,在納米材料信息化和智能預(yù)測方面取得重要突破,構(gòu)建了世界首個基于納米材料結(jié)構(gòu)數(shù)字化的納米生物效應(yīng)數(shù)據(jù)庫。論文在線發(fā)表于Nature Communications(https://www.nature.com/articles/s41467-020-16413-3)。

近年來,以數(shù)據(jù)驅(qū)動的人工智能方法,在材料科學研究中得到了廣泛的應(yīng)用。通過機器學、深度學習等人工智能方法對材料大數(shù)據(jù)進行訓練,可以構(gòu)建材料結(jié)構(gòu)與其性質(zhì)之間的定量構(gòu)效關(guān)系模型,利用這些模型,許多還沒有實驗和理論數(shù)據(jù)的材料性質(zhì)可以被預(yù)測出來,這將大大加速新材料發(fā)現(xiàn)及相關(guān)研究。在這一過程中,包含材料原子結(jié)構(gòu)的數(shù)據(jù)庫(類似小分子數(shù)據(jù)庫PubChem和生物大分子數(shù)據(jù)庫Protein Data Bank)是一個必要前提和核心要素。而在納米生物效應(yīng)經(jīng)歷了30年的研究后,并沒有一個這樣的數(shù)據(jù)庫,以致于科研工作者們雖然坐擁龐大的納米生物效應(yīng)大數(shù)據(jù),卻不能有效的從中提取關(guān)鍵信息。

這項研究通過計算方法,從原子層面對實驗測得的納米材料結(jié)構(gòu)進行分析,將其轉(zhuǎn)換并存儲為計算機可以直接讀取的電子文件。利用這些電子文件,可以得到納米結(jié)構(gòu)的詳細三維結(jié)構(gòu)圖像,這為我們提供了有關(guān)納米材料表面化學和理化性質(zhì)的直觀解析。進一步利用所構(gòu)建的新型納米描述符,以及機器學習和深度學習方法,我們就可以對多種納米材料的不同理化性質(zhì)與生物效應(yīng)的關(guān)聯(lián)進行建模和準確預(yù)測。這個數(shù)據(jù)庫通過網(wǎng)站(http://www.pubvinas.com/)向全世界研究人員開放,這些進展將大大加速納米材料結(jié)構(gòu)和生物效應(yīng)大數(shù)據(jù)到關(guān)鍵信息的轉(zhuǎn)換。
澳大利亞著名化學信息學家David A. Winkler評價“這個研究課題十分重要。十多年來,涉及納米安全評估、納米材料設(shè)計等科研項目所追求的一個重要目標,就是構(gòu)建一個包含有關(guān)納米材料組成、結(jié)構(gòu)、理化性質(zhì)和生物效應(yīng)等信息的數(shù)據(jù)庫?!?/span>
該項工作得到了國家重點研發(fā)計劃、國家自然科學基金以及廣東省“珠江計劃”引進創(chuàng)新創(chuàng)業(yè)團隊等資助。