破譯水平接近專家!谷歌AI解讀古籍核心錯誤率僅0.56%
11月16日消息,破譯據(jù)媒體報道,水平谷歌旗下AI Studio平臺正在測試一款未命名的接近解讀AI模型,在破譯難辨認歷史手稿方面取得重要進展。谷歌古籍該模型在核心字符識別上的核心錯誤率僅為0.56%,準(zhǔn)確率已接近該領(lǐng)域的錯誤專業(yè)研究人員水平。
歷史學(xué)家Mark Humphries利用專門構(gòu)建的率僅基準(zhǔn)數(shù)據(jù)集對模型進行了系統(tǒng)評估。在測試涵蓋的破譯五份18至19世紀高難度手稿中,模型整體字符錯誤率約為1.7%,水平其中大部分錯誤出現(xiàn)在標(biāo)點符號和大小寫規(guī)范等非核心問題上,接近解讀并未影響單詞本身的谷歌古籍正確識別。
若排除這些非關(guān)鍵性錯誤,核心模型的錯誤字符錯誤率可進一步降至0.56%,相當(dāng)于每轉(zhuǎn)寫200個字符僅出現(xiàn)一處實質(zhì)性錯誤,率僅其表現(xiàn)已與專注于文獻轉(zhuǎn)寫的破譯專業(yè)工作者相當(dāng)。
測試手稿涵蓋了多樣化的書寫風(fēng)格,包括字跡潦草、拼寫非標(biāo)準(zhǔn)和語法不一致等復(fù)雜情況,充分驗證了模型的強適應(yīng)能力。更值得注意的是,該模型不僅能完成文字轉(zhuǎn)寫,還展現(xiàn)出一定的上下文推理能力。
例如,在處理一份18世紀商人日記時,模型遇到一條未標(biāo)注單位的購糖記錄“145”。它通過反向核對賬目總額,結(jié)合當(dāng)時英國的貨幣與重量單位體系,成功推斷出該數(shù)字代表“14磅5盎司”。
Humphries也指出當(dāng)前評估仍存在一定局限。由于該模型僅以A/B測試形式零星出現(xiàn),難以進行大規(guī)模系統(tǒng)性驗證,目前僅完成基準(zhǔn)數(shù)據(jù)集中約10%樣本的評估工作。
相關(guān)推薦
- 魏建軍:隱藏式門把手風(fēng)阻降了0.001但增重8公斤 后來我們就不用了
- 男子花8萬元網(wǎng)購70平海景房引熱議 回應(yīng):房子已成功過戶
- 魔搭社區(qū)成中國最大AI開源社區(qū) 已服務(wù)全球超2000萬開發(fā)者
- 卷完光源卷鏡頭!當(dāng)貝X7 Max投影儀評測:純?nèi)す庖哑占?鏡頭移軸新賽道出現(xiàn)!
- 打破終端形態(tài)邊界 三星Galaxy Z TriFold不在便攜與大屏之間做單選
- 棋枰論道恒山下 “晚報杯”巔峰對決落子山西渾源
- 一次訂閱 N種精彩!華為Petal One大會員讓你的數(shù)字生活更省心
- 兩部門:儲蓄國債(電子式)納入個人養(yǎng)老金產(chǎn)品范圍
企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶



