您的當前位置:首頁 > 百科 > Gemini 3中文測評結(jié)果發(fā)布:首超GPT 正文
時間:2025-12-18 03:10:39 來源:網(wǎng)絡(luò)整理 編輯:百科
11月19日消息,2025年末全球AI競技場再掀波瀾,測評機構(gòu)SuperCLUE最新報告顯示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基準測評中獲得了70.80
11月19日消息,中文2025年末全球AI競技場再掀波瀾,測評測評機構(gòu)SuperCLUE最新報告顯示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基準測評中獲得了70.80的結(jié)果總分。
它超越 GPT-5(high) 1.43 分,發(fā)布較GPT-5.1(high)落后1.71分,首超位居全球第二。中文Gemini-2.5-Pro目前排名全球第七。測評
Gemini-3-Pro-Preview的結(jié)果推理效率相較于Gemini-2.5-Pro有些許提升,從平均每題花費32.2秒降低到31.9秒。發(fā)布推理成本從24.5元/百萬Tokens上升到32.0元/百萬Tokens。首超
據(jù)了解,中文本次測評覆蓋六大核心維度,測評數(shù)學推理、結(jié)果科學推理、發(fā)布代碼生成(含web開發(fā))、首超智能體Agent(多輪工具調(diào)用)、幻覺控制、精確指令遵循。
與GPT-5.1(high)相比,Gemini-3-Pro-Preview的優(yōu)勢集中體現(xiàn)在幻覺控制,科學推理旗鼓相當,而在其他四個方面全面落敗。
2025小米人車家全生態(tài)合作伙伴大會召開 盧偉冰宣布小米全球用戶規(guī)模達7.42億2025-12-18 03:08
劉嘉玲喊話淘寶天貓侵權(quán)梁朝偉 涉事店鋪已搜索不到 淘寶客服回應(yīng)2025-12-18 03:04
廣東現(xiàn)超大地鐵卡能當扇子用 網(wǎng)友:再也不怕丟卡了2025-12-18 01:53
為賺200元外快 6座面包車嚴重超員:下來7個人 拉開門還有8個2025-12-18 01:20
廣西發(fā)改委主任白松濤:廣西將著力打造兩個萬億級產(chǎn)業(yè)集群2025-12-18 01:19
首發(fā)3229元起 小米年度旗艦智能門鎖M40 Pro開售:AI掌靜脈識別 隔空刷掌開鎖2025-12-18 01:15
小鵬團隊曾拒絕女性機器人當場脫衣割肉:不被信任哭笑不得2025-12-18 01:08
2299元 百度旗下小度AI眼鏡Pro正式開售:支持AI翻譯、4K拍照2025-12-18 01:05
京東自提全國正式上線:即提即走 再減1元2025-12-18 01:02
(粵港澳全運會)國家體育總局青少司:推廣普及體育,青少年一個都不能少2025-12-18 00:56
支付寶碰一下發(fā)布“碰e計劃” 助力展會行業(yè)數(shù)字化升級2025-12-18 02:55
榮耀測試兩款10000mAh新機:打破手機電池容量紀錄2025-12-18 02:50
(粵港澳全運會)十五運會開幕式上智能機器人敲響千年青銅樂器2025-12-18 02:29
2000余名跑者福建霞浦競逐馬拉松 臺胞:用腳步感受大陸發(fā)展2025-12-18 02:16
OpenAI正與亞馬遜談判:融資至少100億美元 計劃上亞馬遜AI芯片2025-12-18 02:09
聯(lián)想首款自研芯片AI平板!手寫筆Pro第二代:AI賦能書寫革命 加99元贈打印機2025-12-18 02:04
日本北海道一汽車遭熊襲擊:引擎蓋一巴掌被扇凹陷2025-12-18 02:00
疾速7400MB/s!長江存儲致態(tài)TiPlus7100s 2TB SSD圖賞2025-12-18 01:40
何小鵬:當前沒有AI泡沫 未來AI市場有巨大機遇2025-12-18 00:53
2000余名跑者福建霞浦競逐馬拉松 臺胞:用腳步感受大陸發(fā)展2025-12-18 00:50