您的當(dāng)前位置:首頁(yè) > 知識(shí) > Kimi最強(qiáng)開(kāi)源思考模型 Kimi K2 Thinking發(fā)布:推理等超越GPT 正文
時(shí)間:2025-12-18 04:07:40 來(lái)源:網(wǎng)絡(luò)整理 編輯:知識(shí)
11月7日消息,日前,月之暗面宣布發(fā)布Kimi K2Thinking,這是Kimi 迄今能力最強(qiáng)的開(kāi)源思考模型。目前,該模型已上線kimi.com和最新版Kimi手機(jī)應(yīng)用的常規(guī)對(duì)話模式。據(jù)了解,Kim
11月7日消息,最強(qiáng)日前,開(kāi)源月之暗面宣布發(fā)布Kimi K2 Thinking,思考這是模型Kimi 迄今能力最強(qiáng)的開(kāi)源思考模型。
目前,布推該模型已上線kimi.com和最新版Kimi手機(jī)應(yīng)用的最強(qiáng)常規(guī)對(duì)話模式。
據(jù)了解,開(kāi)源Kimi K2 Thinking原生掌握“邊思考,思考邊使用工具”的模型能力,在人類(lèi)最后的布推考試(Humanity's Last Exam)、自主網(wǎng)絡(luò)瀏覽能力(BrowseComp)、最強(qiáng)復(fù)雜信息收集推理(SEAL-0)等多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到SOTA水平,開(kāi)源超越GPT-5。思考
在Agentic搜索、模型Agentic編程、布推寫(xiě)作和綜合推理能力等方面也取得全面提升。
據(jù)介紹,該模型無(wú)需人類(lèi)干預(yù),即可自主實(shí)現(xiàn)高達(dá)300輪的工具調(diào)用和持續(xù)穩(wěn)定的多輪思考能力,從而幫助用戶解決更復(fù)雜的問(wèn)題。
人類(lèi)最后的考試是一項(xiàng)涵蓋100多個(gè)專(zhuān)業(yè)領(lǐng)域的終極封閉式學(xué)術(shù)測(cè)試。
在允許使用工具——搜索、Python、網(wǎng)絡(luò)瀏覽工具的同等情況下,Kimi K2 Thinking在這項(xiàng)基準(zhǔn)評(píng)測(cè)中取得了44.9%的SOTA成績(jī)。
根據(jù)官方示例顯示,Kimi K2 Thinking經(jīng)過(guò)5輪搜索和推理,結(jié)合每輪搜索到的新信息,層層深入,最終推理出了答案:
此外,在復(fù)雜搜索和瀏覽場(chǎng)景中,Kimi K2 Thinking模型也表現(xiàn)出色。
BrowseComp是由OpenAI發(fā)布的一個(gè)專(zhuān)門(mén)評(píng)估AI Agent網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試,這項(xiàng)測(cè)試的初衷是衡量AI Agent在信息過(guò)載環(huán)境中展現(xiàn)出的堅(jiān)持性與創(chuàng)造力,即能否像人類(lèi)研究員一樣“刨根問(wèn)底”。
在這項(xiàng)極具挑戰(zhàn)的任務(wù)上,人類(lèi)平均只能達(dá)到29.2%的成績(jī)。
Kimi K2 Thinking在這項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出極強(qiáng)的鉆研能力,以60.2%的成績(jī)成為新的SOTA模型。
在長(zhǎng)程規(guī)劃和自主搜索能力的驅(qū)動(dòng)下,Kimi K2 Thinking可借助多達(dá)上百輪的“思考→搜索→瀏覽網(wǎng)頁(yè)→思考→編程”動(dòng)態(tài)循環(huán),持續(xù)地提出并完善假設(shè)、驗(yàn)證證據(jù)、進(jìn)行推理,并構(gòu)建出邏輯一致的答案。
這種邊主動(dòng)搜索邊持續(xù)思考的能力,使Kimi K2 Thinking能夠?qū)⒛:议_(kāi)放式的問(wèn)題分解為清晰、可執(zhí)行的子任務(wù)。
在官方示例中,Kimi K2 Thinking經(jīng)過(guò)兩輪搜索和思考,先根據(jù)股票回購(gòu)的已知信息找到了這家制造快速的公司,然后在美國(guó)證券交易委員會(huì)(SEC)的官網(wǎng)上找到了股票回購(gòu)公告信息,得出了準(zhǔn)確的答案:
意想不到!AMD突然發(fā)布RX 9060 XT LP顯卡:降至140W功耗2025-12-18 03:02
網(wǎng)友稱莫言適合做新媒體運(yùn)營(yíng):沉迷網(wǎng)絡(luò)數(shù)小時(shí) 每條回復(fù)都是梗2025-12-18 03:01
虎牙2025年Q3財(cái)報(bào):收入16.9億元 直播企穩(wěn)回升2025-12-18 02:51
董明珠:鮮花放在格力冰箱里25天還是鮮花 這是全球唯一的獨(dú)有技術(shù)2025-12-18 02:34
Arctic發(fā)布迄今最牛散熱硅脂:全新配方 降溫2.3℃2025-12-18 02:34
閃存價(jià)格太離譜:PNY直接取消所有優(yōu)惠2025-12-18 02:30
星巴克之后,漢堡王也“牽手”中資機(jī)構(gòu)2025-12-18 02:18
硬核科技 眼見(jiàn)為實(shí) 京東采銷(xiāo)直播首次探廠3D打印農(nóng)場(chǎng)2025-12-18 01:35
能當(dāng)PC用的平板電腦!小米平板8 Pro測(cè)評(píng):驍龍8至尊打造的安卓平板生產(chǎn)力天花板2025-12-18 01:30
大張偉稱曾在荷蘭遭砸車(chē)盜竊:調(diào)監(jiān)控要花4.1萬(wàn) 還以為節(jié)目組整蠱2025-12-18 01:25
為家里還債40余萬(wàn) 腦癱美妝博主被質(zhì)疑裝病 母親回應(yīng)2025-12-18 03:54
現(xiàn)象級(jí)爆款! 海爾Leader三筒洗衣機(jī)京東銷(xiāo)量破20萬(wàn)臺(tái)2025-12-18 03:42
世界知識(shí)產(chǎn)權(quán)組織推出工業(yè)設(shè)計(jì)百年紀(jì)念畫(huà)冊(cè):小米電動(dòng)滑板車(chē)、MIX Fold 2入選2025-12-18 03:39
年薪千萬(wàn)!雷軍親自挖人 95后AI天才少女羅福莉宣布入職小米2025-12-18 03:34
中國(guó)健美冠軍王昆突然去世引熱議 年僅30歲:曾獲職業(yè)賽8連冠2025-12-18 03:17
凱迪仕雙十一斬獲雙冠王:全渠道GMV第一 品牌聲量破50億2025-12-18 02:28
AOC新款27寸雙模顯示器首發(fā)1799元:4K 144Hz/FHD 288Hz任意切換2025-12-18 02:16
微盟集團(tuán):AI已成電商大促“新基建” 雙十一WAI商家使用次數(shù)提升超20%2025-12-18 02:05
羅永浩:很多人被PUA慣了 總說(shuō)是平臺(tái)成就了個(gè)人2025-12-18 01:55
年薪千萬(wàn)!雷軍親自挖人 95后AI天才少女羅福莉宣布入職小米2025-12-18 01:24