您的當(dāng)前位置:首頁 > 百科 > AI進(jìn)化成人的速度 可能比你想象的還慢 正文
時(shí)間:2025-12-18 03:30:13 來源:網(wǎng)絡(luò)整理 編輯:百科
吹了這么久AI,到底嘛時(shí)候才能超越人類?。科鋵?shí),圈內(nèi)人對 AI 都有一個(gè)終極期望,就是實(shí)現(xiàn) AGI 通用人工智能),說白了,就是造出“和人一樣聰明的AI”。咱去馬斯克的社交平臺
吹了這么久AI,進(jìn)化到底嘛時(shí)候才能超越人類啊?成人
其實(shí),圈內(nèi)人對 AI 都有一個(gè)終極期望,速度可的還就是想象實(shí)現(xiàn) AGI (通用人工智能),說白了,進(jìn)化就是成人造出“和人一樣聰明的AI”。
咱去馬斯克的速度可的還社交平臺上逛一圈,會發(fā)現(xiàn)他三句不離AGI。想象。進(jìn)化
OpenAI的成人奧特曼也在瘋狂預(yù)言,AGI即將到來,速度可的還也就這三五年的想象事兒了。
但這玩意,進(jìn)化到底咋衡量呢?成人俗話說得好,人和人的速度可的還區(qū)別,比人和豬的區(qū)別還大。。到底啥水平,才能和人一樣聰明啊?
就連天天為了AGI吵架的大佬們,也根本說不出來,AGI到底是個(gè)啥。。
合著都在這虛空對線是吧。
所以最近,一幫頂尖大佬看不下去了,幾十號人聯(lián)手發(fā)了篇論文,作者還是全明星陣容,包括圖靈獎得主、谷歌前 CEO 等等,他們聯(lián)合起來,給出了目前為止第一個(gè) AGI 的量化定義。
他們也順便用GPT模型做了個(gè)測試,結(jié)果顯示,如果AGI是100分,GPT-5只有58分,不及格的水平。
這幫大佬的核心觀點(diǎn)是:AGI,就是一種能達(dá)到“一個(gè)受過良好教育的成年人”的能力的人工智能。
他們把心理學(xué)中一個(gè)最權(quán)威的理論,CHC 理論,給AI搬過來了。
CHC 的觀點(diǎn),簡單來說,就是智力這玩意,不是一個(gè)單一的標(biāo)準(zhǔn)能衡量的東西,需要多維度考察。
說白了,這就和高考差不多。一門課強(qiáng)根本不夠,你得門門都強(qiáng),才證明你厲害。
所以,他們把 AI 的能力分成了 10 個(gè)核心能力,每個(gè)占了 10% 的分。它們分別是:
(K) 通識知識、(RW) 讀寫能力、(M) 數(shù)學(xué)能力、(R) 即時(shí)推理、(WM) 工作記憶、(V) 視覺處理、(A) 聽覺處理、(S) 反應(yīng)速度、(MS) 長期記憶存儲、 (MR) 長期記憶檢索。
這里面比較抽象的,可能就是工作記憶和長期記憶了。
工作記憶,其實(shí)就是短期記憶,就是說我剛剛提過的東西,你現(xiàn)在還能記得起來;而長期記憶就是,AI通過跟我的對話,永久性學(xué)到了新東西,就像你上過學(xué),即使你畢業(yè)了,“奇變偶不變”還刻在你DNA里一樣。。
每一種能力,他們都會叫AI測試,也就是寫他們精心準(zhǔn)備的測試題。比如(R) 即時(shí)推理這一塊,他們就專門找了些略微燒腦的問題,比如:
“David認(rèn)識張先生的朋友Jack,Jack認(rèn)識David的朋友林女士。認(rèn)識Jack的人都有碩士學(xué)位,認(rèn)識林女士的人都是上海人。所以誰既是上海人又有碩士學(xué)位?”(測試你是不是AI的時(shí)候到了)
他們找了OpenAI的兩員大將,GPT-4(2023)和 GPT-5(2025)來考試。結(jié)果,GPT-4 總分 27。 GPT-5 總分 58,合計(jì)也沒達(dá)到100分。
而且,咱來看看這成績單,有拉滿的,也有拉褲兜的,純純嚴(yán)重偏科。
比如 GPT-5,在通識(K)、讀寫(RW)、數(shù)學(xué)(M)這幾項(xiàng)上,直奔 9 分 10 分。所以說目前來看,這幾項(xiàng)是AI的強(qiáng)項(xiàng)。
而 (MS) 長期記憶存儲這項(xiàng),GPT-5純純大光頭,3-4分的也有一堆。而GPT-4更不用說,好幾項(xiàng)都是0分。
這一項(xiàng)其實(shí)考的是, AI 能不能持續(xù)學(xué)習(xí)獲得信息。因?yàn)檎撐陌l(fā)現(xiàn),現(xiàn)在的 AI 根本就是個(gè)健忘癥,你今天教它的東西,明天它就忘得一干二凈。
他們做測試的方法,就是第一天跟AI講一些東西,然后第二天單開一個(gè)對話,再讓AI回想。
都不用猜,包想不起來的,大伙用過都知道,新開窗口就會清空記憶,那得分不是0就怪了。。
有的人會反駁,現(xiàn)在的AI早就有永久記憶了。但文章中其實(shí)譴責(zé)了這一點(diǎn),現(xiàn)在AI的記憶,根本不是真正的記憶,他們只是在假裝自己有記憶。
作者們把這招叫做 “能力扭曲” ,即利用某些領(lǐng)域的優(yōu)勢來彌補(bǔ)其他領(lǐng)域的嚴(yán)重弱點(diǎn),創(chuàng)造出一種“AI真有能力”的錯覺。像現(xiàn)在的AI記憶,其實(shí)就是在瘋狂卷上下文長度,或者通過知識庫來實(shí)現(xiàn),實(shí)際上就是外掛,模型本身是一點(diǎn)記憶都沒有。
除了記憶力,長期記憶檢索ai們也很拉,說白了,就是檢測幻覺,別睜眼說瞎話。
當(dāng)然,還有一項(xiàng)大伙都很拉的功能,(V) 視覺處理。 GPT-4是0分, 而GPT-5進(jìn)化過后,也只來到4分。
它考的不是簡單的“這圖里有啥”,考的是視覺推理。這對大模型來說,可就難多了。比如說,咱來試一道:
“下面這 4 個(gè) 2D 展開圖里,哪一個(gè)不能折成左邊那個(gè)立方體?”
還真有點(diǎn)難度,但我們?nèi)祟惿约铀妓?,還是能做出來的。我也去求證了下Gemini,結(jié)果確實(shí)是無法戰(zhàn)勝。
這也說明,AI的眼睛和腦子,目前配合的不是很好,還沒有人類這種,邊看邊想就解決問題的能力。
當(dāng)然,這份報(bào)告,肯定還是不夠完美的。除了這十個(gè)維度,人腦還有聯(lián)想等其他難以名狀的能力,人類可太復(fù)雜了,不是幾道題就能測明白的。
但它最大的價(jià)值,是給當(dāng)下的 AI 做了一次全面診斷:AI現(xiàn)在還是瘸腿,在一些人類最基本的認(rèn)知能力上,仍然有嚴(yán)重的缺陷。
而且,現(xiàn)在的 AI 廠商會還用一些捷徑,來掩蓋這些弱點(diǎn)。
因此,這篇文章也在給大家敲警鐘:這樣搞出來的 AI,是到不了 AGI 的。
但奧特曼在前一陣的直播里還說了,AGI在路上了,我只能說,走著瞧了。
當(dāng)然,俺覺得,這套標(biāo)準(zhǔn)本身也有不小的槽點(diǎn)。
人家AGI ,憑啥非要模仿人類?。克芸赡苁且环N完全不同的智能。硬拿人類的 CHC 理論去套 AGI,是否有點(diǎn)刻舟求劍的意味了。
而且,這標(biāo)準(zhǔn)定得也有點(diǎn)高了。講實(shí)話,AI 要能達(dá)到一個(gè)“沒受過教育的小孩”的水平,就已經(jīng)無敵了。更別提有相當(dāng)一部分人類,自己都通不過這個(gè)測試。。
不過,不管怎么吐槽,有人提出標(biāo)準(zhǔn)就是好事。
它最大的意義,是終于把 AGI 這個(gè)話題從玄學(xué)的范疇,拉回到了一個(gè)可以討論的具體問題上。
就算這個(gè)標(biāo)準(zhǔn)不完美,它也會逼著整個(gè)行業(yè)開始思考,我們到底在追求什么,以及我們到底缺了什么。
這總比大家都在吹牛,說自己快要實(shí)現(xiàn) AGI要強(qiáng)得多。
什么手機(jī)能拍實(shí)況 這幾款最值得入手2025-12-18 03:20
SSD價(jià)格4個(gè)月暴漲50%!2026年所有NAND閃存已經(jīng)售罄 還會繼續(xù)漲價(jià)2025-12-18 03:04
中國光伏行業(yè)協(xié)會聲明:與惡意做空光伏斗爭到底2025-12-18 02:44
《王者榮耀》真改匹配機(jī)制啦:挑戰(zhàn)強(qiáng)敵有額外加分2025-12-18 02:29
廣西發(fā)改委主任白松濤:廣西將著力打造兩個(gè)萬億級產(chǎn)業(yè)集群2025-12-18 02:09
AMD Zen7有望支持4大新技術(shù):滿血AVX10指令集 Intel都羨慕2025-12-18 01:53
專業(yè)設(shè)備采購迎爆發(fā)!京東3C政企業(yè)務(wù)商用設(shè)備顯卡等品類增長超120%2025-12-18 01:33
中科曙光將出任中電標(biāo)協(xié)數(shù)據(jù)存儲專委會當(dāng)值會長單位2025-12-18 01:03
我國發(fā)現(xiàn)全新礦物!中文名“金秀礦”2025-12-18 01:02
存儲芯片漲價(jià)風(fēng)暴前所未有!大摩上調(diào)三星、SK海力士目標(biāo)價(jià)2025-12-18 00:45
何小鵬:當(dāng)前沒有AI泡沫 未來AI市場有巨大機(jī)遇2025-12-18 03:29
(粵港澳全運(yùn)會)十五運(yùn)會摔跤比賽進(jìn)入第二個(gè)比賽日 廣西隊(duì)獲得兩枚金牌2025-12-18 03:10
(粵港澳全運(yùn)會)樊振東談晉級八強(qiáng):不管對手是誰,先準(zhǔn)備好自己2025-12-18 03:03
索泰助力巔模王“愛樂酷”杯云南首屆模型比武大會圓滿收官2025-12-18 02:45
臨門一腳被叫停!日本版GPS系統(tǒng)衛(wèi)星發(fā)射緊急停止2025-12-18 02:29
美團(tuán)宣布騎手委屈關(guān)懷計(jì)劃正式發(fā)布:最高5萬元委屈安撫金2025-12-18 02:27
鎧俠推出新款低功耗PCIe 4.0 SSD:最低3.8W 首發(fā)549元起2025-12-18 02:09
可靈2.5 Turbo模型上線首尾幀功能2025-12-18 02:03
野豬闖入高速致越野車嚴(yán)重?fù)p毀 法院判了:高速管理方全責(zé)賠7萬2025-12-18 01:52
小米、華為中國唯二上榜!雷軍轉(zhuǎn)發(fā)比心2025-12-18 01:33