亚洲精品xxxxx,特级淫片欧美高清视频蜜桃,亚洲毛片儿,视频免费1区二区三区,91在线视频免费看,91亚洲视频在线,蜜芽亚洲欧美一区二区电影

企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶

更懂你的AI伙伴!科大訊飛發(fā)布多模態(tài)超擬人交互

在2025年科大訊飛全球1024開(kāi)發(fā)者節(jié)的更懂現(xiàn)場(chǎng),數(shù)字人“小飛”正與三人暢聊。大訊TA會(huì)聽(tīng)能看,伙互記得住對(duì)話人的伴科布多身份、歷史信息并給出貼心提醒,模態(tài)觀察細(xì)節(jié)之后能給出詳細(xì)的超擬信息介紹與位置導(dǎo)覽,甚至一鍵幫忙訂票;TA能說(shuō)會(huì)道,人交高情商回復(fù)既自然又靈動(dòng),更懂還能用外語(yǔ)和外國(guó)朋友談天說(shuō)地。大訊TA還化身為數(shù)字人林黛玉,伙互形象清麗、伴科布多語(yǔ)氣惟妙惟肖。模態(tài)

特別是超擬在多人聊天時(shí),“小飛”還能理解和分辨到底是人交在和自己對(duì)話,還是更懂多人之間相互聊天,從而判斷是否接話和插話。

這一系列流暢、自然且充滿“人情味”的互動(dòng),標(biāo)志著多模態(tài)超擬人交互技術(shù)已從概念探索邁入可用、好用的新階段。

這一前沿技術(shù)展示的背后,離不開(kāi)堅(jiān)實(shí)的技術(shù)積淀與產(chǎn)業(yè)共識(shí)的支撐。就在不久前,國(guó)際電信聯(lián)盟(ITU-T SG21)在瑞士日內(nèi)瓦召開(kāi)全體會(huì)議,由科大訊飛與中國(guó)信通院共同參與編輯的兩項(xiàng)數(shù)字人國(guó)際標(biāo)準(zhǔn)——ITU-T F.748.63(基礎(chǔ)模型增強(qiáng)的數(shù)字人系統(tǒng)框架及通用技術(shù)要求)與ITU-T F.748.64(數(shù)字人服務(wù)平臺(tái)要求)——順利通過(guò)結(jié)項(xiàng),計(jì)劃于2026年正式發(fā)布。這意味著,推動(dòng)產(chǎn)業(yè)發(fā)展的技術(shù)實(shí)踐,正在凝聚成全球公認(rèn)的規(guī)范。

一、技術(shù)內(nèi)核:多模態(tài)超擬人交互,讓“更懂你”

“小飛”所展現(xiàn)的驚艷體驗(yàn),源于其在感知、認(rèn)知與表達(dá)三大層面的技術(shù)協(xié)同突破。

信息感知層面,系統(tǒng)具備了“耳聰目明”的能力。此次展示的多模態(tài)交互系統(tǒng)具備5米0dB遠(yuǎn)場(chǎng)高噪語(yǔ)音識(shí)別能力,在嘈雜環(huán)境中也能精準(zhǔn)識(shí)別,更加貼合真實(shí)的使用和交互場(chǎng)景?;诙嗄B(tài)語(yǔ)音增強(qiáng)技術(shù),系統(tǒng)能融合語(yǔ)音、人臉、姿態(tài)等信息,結(jié)合說(shuō)話人站位鎖定多人對(duì)話中的目標(biāo),實(shí)現(xiàn)音頻與說(shuō)話人的綁定,攻克了多人高噪場(chǎng)景下的識(shí)別難題。同時(shí),訊飛創(chuàng)新性地提出說(shuō)話人引導(dǎo)的注意力增強(qiáng)方案,實(shí)現(xiàn)對(duì)交互區(qū)域的細(xì)粒度視覺(jué)信息感知,讓視覺(jué)信息更加準(zhǔn)確;進(jìn)一步提出局部檢索增強(qiáng)技術(shù),通過(guò)視覺(jué)思維鏈提取局部關(guān)鍵區(qū)域,實(shí)現(xiàn)遠(yuǎn)場(chǎng)條件下的局部物體檢索增強(qiáng)識(shí)別。

認(rèn)知與理解層面,數(shù)字人開(kāi)始“讀懂心意”。多人交互理解技術(shù)融合對(duì)話歷史、語(yǔ)音活動(dòng)狀態(tài)等信息,加強(qiáng)了模型對(duì)多人復(fù)雜場(chǎng)景的理解能力,更好地把握和用戶的交互時(shí)機(jī),以及交互意圖的精準(zhǔn)判斷,實(shí)現(xiàn)了響應(yīng)速度和響應(yīng)質(zhì)量的平衡,既不“搶答”也不“亂答”。另外,多模態(tài)交互系統(tǒng)能夠?qū)崿F(xiàn)分鐘級(jí)情感解析、深度共情,讀懂對(duì)話人的真實(shí)心緒,回應(yīng)“心領(lǐng)神會(huì)”的默契瞬間。

表達(dá)與輸出層面,交互變得更有溫度。超擬人數(shù)字人能通過(guò)多模態(tài)前端定位說(shuō)話人方位,像真人一樣能視線跟隨看向當(dāng)前交互的對(duì)象,增強(qiáng)交互的真實(shí)感;數(shù)字人的回復(fù)也更加自然、共情,得益于多情感語(yǔ)音合成技術(shù)創(chuàng)新性研發(fā)了多輪上下文信息建模方案,能夠?qū)φZ(yǔ)音交互中的歷史多輪QA音頻和文本進(jìn)行編碼、感知對(duì)話人的情感變化,再通過(guò)語(yǔ)音合成大模型的自適應(yīng)情感合成能力,讓數(shù)字人的回復(fù)合成聲音情緒語(yǔ)氣隨之變化,給出恰當(dāng)?shù)那楦谢貞?yīng),在聲音的自然度、情感表達(dá)、節(jié)奏停頓等細(xì)節(jié)上表現(xiàn)更好,尤其是在多輪交互中的效果提升顯著。

值得一提的是,此次發(fā)布會(huì)上首發(fā)的個(gè)性化記憶能力也加入了超擬人交互系統(tǒng),通過(guò)分層式動(dòng)態(tài)記憶體架構(gòu),實(shí)現(xiàn)了長(zhǎng)短期協(xié)同的精準(zhǔn)用戶記憶。結(jié)構(gòu)化推理方案的設(shè)計(jì),確保了模型在個(gè)性化任務(wù)中進(jìn)行嚴(yán)謹(jǐn)?shù)倪壿嬐评?;借助?qiáng)化學(xué)習(xí)在對(duì)齊用戶個(gè)人偏好上持續(xù)優(yōu)化,實(shí)現(xiàn)了從“內(nèi)容個(gè)性化”到“溝通風(fēng)格個(gè)性化”的進(jìn)化,增強(qiáng)了多模態(tài)交互的個(gè)性化回復(fù)能力。

二、標(biāo)準(zhǔn)筑基:從技術(shù)實(shí)踐到國(guó)際規(guī)范制定

技術(shù)上的領(lǐng)跑為規(guī)則制定提供了關(guān)鍵依據(jù)。此次科大訊飛能夠主導(dǎo)國(guó)際標(biāo)準(zhǔn)的制定,離不開(kāi)它在人工智能領(lǐng)域長(zhǎng)期的技術(shù)積累和廣泛的產(chǎn)品應(yīng)用。

科大訊飛自主研發(fā)的星火大模型為數(shù)字人提供了深層的認(rèn)知理解基礎(chǔ),而在語(yǔ)音、自然語(yǔ)言處理等領(lǐng)域的全棧式AI技術(shù)積累,則為實(shí)現(xiàn)自然流暢的人機(jī)交互奠定了基石。此前,科大訊飛的AI虛擬人交互平臺(tái)通過(guò)了中國(guó)信通院人工智能研究所組織的大模型數(shù)字人基礎(chǔ)能力分級(jí)測(cè)試,并獲得最高等級(jí)L5認(rèn)證,也進(jìn)一步證明了訊飛AI虛擬人交互平臺(tái)技術(shù)方案的先進(jìn)性與成熟度。這些扎實(shí)且經(jīng)過(guò)市場(chǎng)檢驗(yàn)的技術(shù)能力,為其參與國(guó)際標(biāo)準(zhǔn)討論與制定提供了重要依據(jù),也將中國(guó)的技術(shù)實(shí)踐融入了全球數(shù)字人產(chǎn)業(yè)發(fā)展的藍(lán)圖。

三、場(chǎng)景落地:雙平臺(tái)驅(qū)動(dòng)產(chǎn)業(yè)智能應(yīng)用

技術(shù)的終極價(jià)值在于應(yīng)用??拼笥嶏w通過(guò)訊飛智作訊飛AI虛擬人交互平臺(tái),將前沿技術(shù)轉(zhuǎn)化為可規(guī)模落地的產(chǎn)品與服務(wù)。

訊飛智作作為一站式虛擬人音視頻內(nèi)容生產(chǎn)平臺(tái),不僅提供豐富多元的形象與聲音,還支持僅憑一張照片、一句話快速生成專屬數(shù)字人,目前已構(gòu)建超10萬(wàn)數(shù)字分身,500萬(wàn)的聲音復(fù)刻,廣泛賦能教培、金融、文旅、政企等多個(gè)業(yè)務(wù)領(lǐng)域。

訊飛AI虛擬人交互平臺(tái)則聚焦全棧式虛擬人多場(chǎng)景應(yīng)用服務(wù),讓數(shù)字IP不僅“動(dòng)起來(lái)”,更能“交互起來(lái)”。平臺(tái)支持零代碼快速嵌入小程序、導(dǎo)游機(jī)等終端,更提供智能交互機(jī)、移動(dòng)數(shù)字人、AI 虛擬人直播機(jī)等軟硬一體化方案,同時(shí)通過(guò)終端 SDK、服務(wù)端 API、公有云 API 及私有化部署等靈活接入方式,可適配 APP、Web、小程序等多種產(chǎn)品形態(tài)。

從多模態(tài)超擬人交互的技術(shù)突破,到參與國(guó)際標(biāo)準(zhǔn)制定的能力認(rèn)證,再到雙平臺(tái)推動(dòng)的產(chǎn)業(yè)賦能,科大訊飛在數(shù)字人領(lǐng)域形成了從技術(shù)到市場(chǎng)、從實(shí)踐到標(biāo)準(zhǔn)的閉環(huán)。未來(lái),隨著“AI+行業(yè)”的持續(xù)深入,更智能、更自然的數(shù)字人有望在更多領(lǐng)域成為人類的智能伙伴。我們也將繼續(xù)在多模態(tài)超擬人交互技術(shù)上踏實(shí)前行、持續(xù)進(jìn)階,不斷帶來(lái)新的驚喜。

#訊飛智作 #訊飛AI虛擬人交互平臺(tái) #數(shù)字人 #多模態(tài)超擬人交互 #科大訊飛

贊(3)
未經(jīng)允許不得轉(zhuǎn)載:>企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 » 更懂你的AI伙伴!科大訊飛發(fā)布多模態(tài)超擬人交互
镇宁| 都安| 南溪县| 辽中县| 祁东县| 龙里县| 阳高县| 舞阳县| 金阳县| 广东省| 正定县| 揭西县| 大宁县| 汉阴县| 隆子县| 额济纳旗| 光山县| 如东县| 科技| 长葛市| 闵行区| 格尔木市| 上犹县| 鲁山县| 云和县| 陇西县| 张家川| 疏勒县| 阳西县| 浠水县| 黑龙江省| 洛浦县| 晴隆县| 贵港市| 建平县| 绥中县| 武定县| 连江县| 山东| 兰州市| 舒城县|