【中國團隊歷時8年打造最強化學大腦】在中國科學技術大學的機器化學家實驗室,可以看見頗具科技感的一幕——一個體型“敦實”但動作靈活的機器人,在操作臺之間穿梭,伸出機械手臂配制試劑。實驗室另一邊,年輕科研人員正輸入指令,對機器人進行“隔空”控制。大部分情況下,這臺機器人會自主思考實驗的步驟和方案,像個不知疲憊的“小化學家”。
這是中國科學技術大學化學物理系教授江俊團隊的“作品”,該團隊開發了全球首個集閱讀文獻、自主設計實驗、覆蓋材料開發全流程的機器化學家平臺,從數以億計的可能組合中找到最優解來加快材料研發。“實驗數據經處理后,輸入到平臺獨有的計算大腦中,產生理實交融的人工智能模型,幫助科研人員優化實驗方案。”江俊說。
(資料圖)
江俊團隊有近30位成員,其中多數是90后、95后。10月上旬,團隊又添科研進展——通過開發和集成移動機器人、化學工作站、智能操作系統、科學數據庫,他們研制出數據智能驅動的全流程機器化學家。
該研究成果論文已在最新一期《國家科學評論》學術期刊發表。國際審稿人評價說,該成果的“機器人系統、工作站和智能化學大腦都是最先進的”“將對化學科學產生巨大影響”。業內專家認為,機器化學家的研究工作脫離了傳統試錯研究范式的限制,展現出“最強化學大腦”指導的智能新范式的巨大優勢,引領化學研究朝著知識理解數字化、操作指令化、創制模板化的未來趨勢前進。
那么,一個“聰明”到會做化學實驗的機器人是如何誕生的,其背后凝聚了年輕人怎樣的努力和心血?中青報·中青網記者進行了采訪。
“打造中國人自己的材料數據庫”
隨著化學研究的對象日益復雜化、高維化,傳統研究范式成本高、周期跨度長的問題日益突出。近年來,科技界逐漸意識到數據對于學術研究和產業創新發展的重要意義,而大數據科學與人工智能技術結合的手段,也在先進材料研發中嶄露頭角。
團隊核心成員肖恒宇是1995年生人,他本科就讀于中國科學技術大學少年班學院,出于興趣自學了人工智能。一次,他編寫的一個智能程序出現問題,于是向時任班主任的江俊請教。江俊一針見血地指出,“算法沒有問題,但算法依賴的實驗數據過于片面”。
江俊發現,一段時間以來,我國科研團隊會將科研數據寫進英文論文,在國外期刊上發表,但等到要引用數據時,還得額外花錢去買。
“做中國人自己的材料數據庫”,成了江俊的夢想。在他的影響下,肖恒宇等人一起踏上實現這個夢想的道路。
肖恒宇的同學霍姚遠、馮超,學的是數學和化學,喜歡研究數據。2014年開始,三人收集數據、挖掘文獻、尋找架構,江俊提供原理指導和研究資源。2016年,他們搭建了第一代材料數據檢索平臺,但使用反饋不太理想,有老師抱怨“數據不準確”。
肖恒宇等人意識到,數據不僅要多,還要優質。他們的數據庫缺了最重要的一環——知識圖譜,這導致數據質量良莠不齊,無法進行高效檢索。
建立知識圖譜并非易事,同學們要用專業知識區分數據的關聯性,為圖像打上識別標簽,讓電腦知道每個數據背后的物理意義。
團隊成員、博士生張百成記得,最初全靠幾位同學自己“打標簽”,沒日沒夜地標注了幾個星期,大家讀文獻讀得頭昏腦漲,卻只完成了任務量的1%,幾近絕望。
為此,江俊找到中國科大校團委,開展有獎讀文獻比賽,聯合更多有專業背景的大學生參與。由此,他們產生了第一批高質量的標記數據。
“眾人拾柴火焰高,大數據時代,要融合眾智、整合資源。”張百成說,利用這批數據訓練智能算法,他們實現了第一代化學命名實體識別程序,后續的標注任務,可以先讓計算機自動識別,再進行人工檢驗,極大提升了效率。
最終,他們打磨出我國第一代材料科學知識圖譜。2021年,團隊用圖譜賦予機器人“小來”科學思維,團隊的自然語言處理技術也隨之“鳥槍換炮”,機器自動閱讀和識別的準確度提高到90%。
“將數據變為實際生產力”
2016年,肖恒宇參加互聯網+創新創業大賽,獲安徽省冠軍、全國銀獎。投資機構為他和團隊提供第一筆創業資金。成立公司后,團隊3次迭代知識圖譜,建立了含9000萬個化合物、1100萬條化學反應路徑的大規模材料數據庫。團隊還借此幫助一些科研單位解決技術難題。
譬如,某航天企業發現組合發動機中的金屬配件材料需要改進,嘗試多種方案都未能實現。肖恒宇等人用數據平臺模擬出燃燒流場、大渦流場,并找到記憶金屬設計配方,這為該企業節省成本4300多萬元。
肖恒宇團隊還迎來了意外之喜——他們在為該企業解決問題的過程中,收集了10萬種合金演化結構數據和金屬原子間相互作用能數據,這些反過來豐富和完善了他們已有的數據庫平臺體系。
“以往做研究時,有人習慣將數值往自己想要的方向去調整,但是研究需要數據多樣性,要記錄偏見、有誤差的數據。”江俊堅信,數據是科研和產業的共同語言,數據庫平臺就是連接科研與產業的橋梁,要產生更多高標準的數據反哺科研,將數據變為實際生產力。
目前,該團隊又建立了材料基因創新研究平臺,建成亞洲最大的材料數據庫平臺——機數大材庫。
江俊介紹,機器化學家平臺具有更強的化學智能和廣泛的新材料開發能力,涵蓋光催化與電催化材料、發光分子、光學薄膜材料等領域,適用范圍將隨平臺升級和拓展繼續擴大。
“從不擺爛,從不應付交差”
每周開組會時,江俊只需要提出希望機器人解決的問題,學生們就會自己討論實施方案。設備沒有底層驅動程序,學生們就會攻關智能化升級。再后來開會時,江俊只能坐在一旁聽著,甚至插不上話。
讓他欣慰的是,幾位有交叉學科背景的年輕在讀博士,已經成長為團隊“頂梁柱”:肖恒宇設計軟件框架;張百成編寫程序,讓機器人讀論文、提出科學假設、形成實驗報告和方案;趙路遠主攻電化學測試,負責烘干儀器、光譜儀等硬件的驅動程序開發。
25歲的趙路遠學電子科學技術出身。在她看來,克服科研難題主要靠毅力。她和師弟曹嘉祺一起編寫某驅動程序時,由于信息掌握不充足,無法準確理解調用接口,“我們反復聯系儀器廠商和代理商,沒有回應。我們決定自力更生。”
3周時間,兩人就像兩個機器人,除了吃飯睡覺外,重復做了3000次發送信號、等待反饋、記錄響應等嘗試,一點一點逆向試出了底層控制邏輯,成功實現了對機器人的遠程控制。
“此時,儀器代理商主動找到我們,想要購買我們的驅動程序,我們覺得特別自豪。”趙路遠說。
2021年,團隊信心滿滿地開始機器人的首次試運行,不料,化學設備單獨運行正常,但參與系統聯調時卻無法使用。大家排查到半夜仍然沒有頭緒。
這時,肖恒宇突然意識到化學設備和機械臂均使用了紅外探測設備,可能會互相干擾。于是,他將機械臂換一個朝向,輕松解決了問題。
“往后的開發調試中,不同領域的儀器設備,不同系統的代碼協議間,都出現了類似的‘磨合’難題,而我們通過交叉學科思維,將它們逐一擊破。”肖恒宇說。
“一個方案受挫,大家不會擺爛,不會應付交差,而是反復測試,看看究竟哪個環節出了問題。”肖恒宇說,科研伙伴身上有著相似特質——對流程和技術的執著。完成任務時,團隊成員總會想的比自己更多一點,不僅拿出方案,還會想好替代方案和若干發散選項。
在他看來,從開發測試,到改進迭代,再到升級,一個實驗分支由一人全部負責,每個人都成長為“全能人才”。肖恒宇說,全身心投入科研時,所有知識都有用武之地。他一直自學3D動畫。課題組拍攝科普片時,他還包辦了分鏡頭和腳本撰寫。
肖恒宇曾在寧夏回族自治區海原縣一中支教。他利用閑置的傳感器等儀器,搭建了兩個小型實驗室,帶學生學化學、物理、信息,激發孩子們的科學興趣。他一直有個夢想,希望帶動更多年輕人合作研發更高水平、更具科研智慧的實驗平臺,讓中國的智能化學閃耀世界。(中國青年報 王海涵 王磊)
標簽: 中國團隊歷時8年打造最強化學大腦
- 全球播報:貴州大方:非遺傳人高光友獲“貴州工匠”稱號
- 世界通訊!用包裹著火焰的詩句,撫平時光的皺紋|“娜夜詩選”首發
- 2000千克是多少噸?1噸等于多少磅?
- 含“相接”的成語有哪些?人山人海出自哪里?
- 描寫潮水的四字成語有哪些?悶雷滾動近義詞都在這兒!
- 中國最嚇人的一本古籍是什么?為什么現在中醫不學本草綱目?
- (V面日報11.15)彩虹醬哇、鈴宮鈴、阿薩獲漲粉、營收、人氣榜榜首
- 干燥劑怎么重復利用?與壓片型干燥劑類似的干燥劑有哪些?
- 世界微資訊!疫情午報|31省區市昨日新增1.9萬余例,詳情匯總
- 環球今日訊!國內旅游市場再迎利好 出行信心恢復仍需時間
- 焦點精選!2022“閱讀北京·十佳優讀空間”評選結果出爐
- 全球新資訊:衢江區“一庫一策”動態清零病險水庫
- 世界熱文:安化縣退休交警給村民送頭盔
- 每日熱文:?衢州“烏引”建設高速互聯“智能引水網”
- 速讀:黃山風景區探索"信用游" 能否成旅游業趨勢?
- WTA發布明年1至8月賽歷 澳網農歷春節期間舉行
- 每日速讀!女生“順”走養殖園一只兔子,江山市賀村第一小學順勢推出“動物領養制”
- 環球動態:南縣市場監督管理局開展醫療美容機構專項檢查
- 熱資訊!上海迪士尼樂園酒店將于11月17日起恢復運營
- 12.32%!前三季度衢州規上工業產值實現兩位數增長
- 世界微資訊!觀治湖工程,憶艱苦歲月——記爛泥湖治理工程紀念館之旅
- 今日快看!衢州市碳賬戶金融亮相聯合國氣候變化大會
- 天天觀熱點:世界杯:民宿包小院看球 影音房預訂增長超1倍
- 【環球播資訊】益陽南縣:推進集體經濟商標注冊,助力鄉村全面振興
- 全球今日訊!11月新基發行名將掛帥同臺競技,嘉實姚志鵬領銜“積極配置”
- 【世界聚看點】識帥|兒時替體育老師上課 米赫涅維奇一直夢想執掌波蘭隊
- 世界最資訊丨識帥|功勛老帥馬蒂諾 期待帶隊首次突破16強
- 世界觀點:祝賀!谷神星一號遙四運載火箭發射成功
- 世界熱消息:年內并購重組過會率近九成 是否符合宏觀政策成關注新焦點
- 【天天新視野】中國睡眠經濟市場規模超4000億 先聲藥業引進全球抗失眠創新藥