您的當(dāng)前位置:首頁 > 知識 > 科大訊飛登上Nature子刊:AI解化學(xué)奧賽題超越人類選手平均水平 正文
時間:2025-12-19 23:17:47 來源:網(wǎng)絡(luò)整理 編輯:知識
近日,國際學(xué)術(shù)期刊《通訊-化學(xué)》Communications Chemistry)刊發(fā)了一項引發(fā)業(yè)界關(guān)注的研究成果。來自科大訊飛研究院與認(rèn)知智能全國重點實驗室的聯(lián)合團(tuán)隊,構(gòu)建了一套面向化學(xué)領(lǐng)域的多模態(tài)
近日,科大刊國際學(xué)術(shù)期刊《通訊-化學(xué)》(Communications Chemistry)刊發(fā)了一項引發(fā)業(yè)界關(guān)注的訊飛研究成果。來自科大訊飛研究院與認(rèn)知智能全國重點實驗室的登上聯(lián)合團(tuán)隊,構(gòu)建了一套面向化學(xué)領(lǐng)域的解均水多模態(tài)評測基準(zhǔn),系統(tǒng)檢驗了當(dāng)前主流大模型的化學(xué)科學(xué)推理能力,并首次揭示了AI在處理科學(xué)圖像時存在的奧賽“視覺失配”現(xiàn)象。
這一發(fā)現(xiàn)被認(rèn)為對未來科學(xué)智能的題超發(fā)展具有重要參考價值。
讓AI“看懂”化學(xué)圖表,越人難在哪里?類選
化學(xué)研究離不開分子結(jié)構(gòu)式、反應(yīng)機(jī)理圖、手平實驗裝置示意圖等視覺信息。科大刊與普通圖像識別不同,訊飛理解這些科學(xué)圖像需要AI同時具備符號解析與邏輯推演能力——這恰恰是登上當(dāng)前多模態(tài)大模型的薄弱環(huán)節(jié)。
研究團(tuán)隊構(gòu)建的解均水USNCO-V評測基準(zhǔn),收錄了二十余年美國化學(xué)奧林匹克競賽中的化學(xué)473道圖文結(jié)合題目,覆蓋分子結(jié)構(gòu)、實驗裝置、反應(yīng)曲線等多種類型。這一基準(zhǔn)填補了AI for Science領(lǐng)域在化學(xué)視覺推理系統(tǒng)性分析方向的空白。
測試結(jié)果:頂尖模型超越人類選手平均成績
研究對包括GPT-5、OpenAI o3、Gemini-2.5-Pro在內(nèi)的40款主流多模態(tài)大模型進(jìn)行了系統(tǒng)評估。結(jié)果顯示,表現(xiàn)最佳的GPT-5以93.2%的準(zhǔn)確率位居榜首,顯著超越參賽選手44.6%的平均成績。
然而,研究也發(fā)現(xiàn)了一個耐人尋味的現(xiàn)象:部分模型在移除圖像輸入后,答題準(zhǔn)確率反而提升。這一“視覺干擾效應(yīng)”表明,當(dāng)前AI在處理科學(xué)圖像時,視覺與語言模塊尚未實現(xiàn)真正的協(xié)同工作。
業(yè)內(nèi)專家指出,這一發(fā)現(xiàn)對于改進(jìn)下一代多模態(tài)模型具有重要指導(dǎo)意義。
人工智能國家隊的AI for Science版圖
作為國內(nèi)人工智能領(lǐng)域的代表性企業(yè),科大訊飛近年來在AI for Science方向持續(xù)布局。依托認(rèn)知智能全國重點實驗室和國家新一代人工智能開放創(chuàng)新平臺,該公司已在多個科學(xué)領(lǐng)域取得進(jìn)展。
據(jù)公開資料顯示,科大訊飛與中國科學(xué)院共建的“星火科研助手”平臺,目前已服務(wù)全國1300余所高校的17萬余名科研人員;在化工領(lǐng)域,其與中科院大連化物所合作研發(fā)的智能化工大模型已迭代至3.0版本;在核聚變研究方向,其團(tuán)隊聯(lián)合中國科學(xué)技術(shù)大學(xué)在《Nuclear Fusion》發(fā)表的PaMMA-Net模型,突破了等離子體磁測量演化建模的技術(shù)瓶頸。
值得關(guān)注的是,科大訊飛在推進(jìn)全國產(chǎn)技術(shù)路線方面的努力。該公司強(qiáng)調(diào)其星火大模型實現(xiàn)了全棧自主可控,從底層算力到上層應(yīng)用均采用國產(chǎn)化方案,這在當(dāng)前國際技術(shù)競爭背景下具有特殊意義。
從“語言理解”到“科學(xué)理解”
有分析人士認(rèn)為,此次研究成果的發(fā)表,標(biāo)志著國內(nèi)大模型企業(yè)正從通用智能向科學(xué)智能縱深拓展。當(dāng)AI不僅能夠處理日常對話,還能理解復(fù)雜的科學(xué)圖表、進(jìn)行專業(yè)領(lǐng)域的邏輯推演時,其應(yīng)用價值將發(fā)生質(zhì)的飛躍。
不過,研究也坦承當(dāng)前技術(shù)仍存在明顯短板——在分子結(jié)構(gòu)識別與實驗裝置理解等任務(wù)上,即便是最先進(jìn)的模型也表現(xiàn)欠佳。這意味著AI真正成為科學(xué)家的得力助手,仍有相當(dāng)長的路要走。
隨著國內(nèi)多家科技企業(yè)加速布局AI for Science賽道,這一領(lǐng)域的競爭正在升溫。而此次Nature子刊論文的發(fā)表,或許只是國內(nèi)人工智能國家隊在科學(xué)智能領(lǐng)域發(fā)力的一個縮影。
抖音上線“長輩防走失模式”:離開設(shè)定范圍就會彈窗提醒2025-12-19 23:17
用戶禁止數(shù)據(jù)收集后 掃地機(jī)器人竟然被遠(yuǎn)程指令“殺死”!2025-12-19 22:48
蘋果iOS 26.2 Beta1上線:日版開放側(cè)載2025-12-19 22:47
現(xiàn)代汽車設(shè)計主管吐槽車載大屏:用來替代按鍵并不合理2025-12-19 22:35
內(nèi)網(wǎng)穿透:云計算不可或缺的技術(shù) 及軟件選擇推薦2025-12-19 22:33
菁彩Vivid搭載車量超百萬 攜手車企迎來車載應(yīng)用新里程碑!2025-12-19 22:30
下載速度飛起!百度網(wǎng)盤SVIP會員雙十一腰斬探底:162元/年2025-12-19 22:00
vivo OriginOS 6公測招募開啟:支持X200、iQOO 13等10款機(jī)型2025-12-19 21:52
AI賦能內(nèi)容分發(fā) 華為信息流攜手伙伴共建鴻蒙內(nèi)容新生態(tài)2025-12-19 21:25
華為全能表王!華為WATCH Ultimate 2非凡探索明天預(yù)售:全球首發(fā)北斗衛(wèi)星語音消息2025-12-19 20:42
NVIDIA RTX PRO 5000 72GB正式上市!顯存狂增50%、性能提升3.5倍2025-12-19 22:56
歷時兩年半 已有210多款中國車搭載高通驍龍數(shù)字底盤2025-12-19 22:51
Ultra 7小鋼炮!微星Cubi NUC AI迷你電腦圖賞2025-12-19 22:50
新問界M7首發(fā)搭載 華為靳玉志詳解艙內(nèi)激光:巴掌大小 一鏡雙模2025-12-19 22:28
“世界文化遺產(chǎn)”平遙古城的現(xiàn)代“應(yīng)急術(shù)”2025-12-19 22:27
華碩天選6 Pro游戲本續(xù)航測試:酷睿i72025-12-19 21:51
用戶禁止數(shù)據(jù)收集后 掃地機(jī)器人竟然被遠(yuǎn)程指令“殺死”!2025-12-19 21:37
699元 小米米家智能氣囊足浴器2開售 按摩+泡腳一機(jī)搞定2025-12-19 21:30
豆包大模型1.8發(fā)布:三大能力顯著增強(qiáng) 媲美全球頂尖模型2025-12-19 21:04
歷時兩年半 已有210多款中國車搭載高通驍龍數(shù)字底盤2025-12-19 20:36