11月18日,京東集團(tuán)(納斯達(dá)克股票代碼:JD,港交所股票代號(hào):9618)對(duì)外發(fā)布了2021年第三季度業(yè)績。從2017年初全面向技術(shù)轉(zhuǎn)型以來,京東持續(xù)加大了對(duì)基礎(chǔ)科學(xué)與底層技術(shù)的投入力度,推動(dòng)基礎(chǔ)設(shè)施建設(shè)的數(shù)量與效率的雙向提升,京東體系已在技術(shù)上累計(jì)投入已近750億元。
在第三季度,京東探索研究院人工智能團(tuán)隊(duì)?wèi){借多模態(tài)交互數(shù)字人技術(shù)、跨模態(tài)分析技術(shù)在第29屆ACM國際多媒體頂級(jí)會(huì)議(ACM International Conference on Multimedia,簡稱ACM Multimedia)上榮獲兩項(xiàng)大獎(jiǎng)。這些獲得國際學(xué)術(shù)界頂尖榮譽(yù)的領(lǐng)先技術(shù)正在通過京東云這個(gè)統(tǒng)一平臺(tái)輸出服務(wù)各行各業(yè)。其中,基于多模態(tài)交互數(shù)字人技術(shù)研發(fā)的“虛擬數(shù)字人”能助力京東智能客服言犀提升智能接待、服務(wù)和虛擬助手的體驗(yàn),比如與某銀行合作落地應(yīng)用,打造了全國第一個(gè)交互式數(shù)字人項(xiàng)目“數(shù)字柜員”。
斬獲國際AI頂會(huì)雙項(xiàng)大獎(jiǎng) 京東云推動(dòng)越來越智能的數(shù)字浪潮
今年三季度以來,京東探索研究院與各大實(shí)驗(yàn)室繼續(xù)在可信人工智能、超級(jí)深度學(xué)習(xí)、量子機(jī)器學(xué)習(xí)等基礎(chǔ)科學(xué)領(lǐng)域持續(xù)推進(jìn)創(chuàng)新研究,并取得累累碩果。
近日,京東探索研究院AI團(tuán)隊(duì)?wèi){借多模態(tài)交互數(shù)字人技術(shù)、跨模態(tài)分析技術(shù),在國際AI頂會(huì)第29屆ACM Multimedia上分別斬獲2021年最佳演示獎(jiǎng)及最佳開源項(xiàng)目獎(jiǎng),充分證明了京東在人工智能視覺與人機(jī)交互領(lǐng)域的全球領(lǐng)先性。
ACM Multimedia是計(jì)算機(jī)科學(xué)領(lǐng)域中多媒體領(lǐng)域的首要國際會(huì)議,1993年以來每年召開一次,已成為多媒體領(lǐng)域頂級(jí)盛典,大會(huì)致力于推動(dòng)多媒體的研究和應(yīng)用,京東探索研究院的兩項(xiàng)獲獎(jiǎng)技術(shù)均為ACM Multimedia頒發(fā)的該技術(shù)領(lǐng)域唯一獎(jiǎng)項(xiàng),分量十足。
在傳統(tǒng)的AI認(rèn)知中,視覺領(lǐng)域、語音領(lǐng)域、自然語言領(lǐng)域等領(lǐng)域之前是獨(dú)立演進(jìn)的技術(shù)和應(yīng)用,可以認(rèn)為是單模態(tài)技術(shù),而人是一個(gè)看、聽、說多模態(tài)共同工作的智能體,所以多模態(tài)技術(shù)是未來人工智能應(yīng)用發(fā)展的方向。京東探索研究院的多模態(tài)交互數(shù)字人技術(shù)ViDA-Man致力于打造具備多感官交互能力的人機(jī)交互系統(tǒng),深入多模態(tài)交互技術(shù)研究,專注于人機(jī)交互的消費(fèi)科技產(chǎn)品打造?;谠摷夹g(shù)開發(fā)的多模態(tài)交互數(shù)字人形象引擎,能夠提供快速的形象定制能力,從外觀的數(shù)字化逐漸深入到行為的交互化、情緒的智能化。
近年來,數(shù)字浪潮的推動(dòng)讓人工智能技術(shù)已經(jīng)實(shí)現(xiàn)從不可用到可用。AI產(chǎn)品化時(shí)期,諸如智能語音識(shí)別技術(shù)、智能圖片處理技術(shù)、基于用戶興趣的算法引擎推薦、智能審核技術(shù)、AR/VR技術(shù)、5G技術(shù)等成為了AI落地的抓手,掀起了科技創(chuàng)新的新浪潮。京東探索研究院這些前沿技術(shù)的持續(xù)探索,也正陸續(xù)通過京東云這個(gè)統(tǒng)一平臺(tái)對(duì)外輸出,助力產(chǎn)業(yè)數(shù)字化。
VTM數(shù)字員工“加盟”銀行網(wǎng)點(diǎn),京東云助力銀行網(wǎng)點(diǎn)數(shù)智化升級(jí)
在銀行行業(yè),傳統(tǒng)銀行服務(wù)網(wǎng)點(diǎn)存在運(yùn)營成本高、網(wǎng)點(diǎn)高峰期排隊(duì)、遠(yuǎn)程柜員接待能力不足等痛點(diǎn),制約了業(yè)務(wù)的擴(kuò)展。
基于多模態(tài)交互數(shù)字人技術(shù),京東智能客服言犀與某銀行合作,推出VTM數(shù)字員工,提升智能接待、服務(wù)和虛擬助手的體驗(yàn)。區(qū)別于過往咨詢問答式機(jī)器人,雙方共同打造的VTM數(shù)字員工可獨(dú)立閉環(huán)完成交易業(yè)務(wù)全流程,在交互方式上,采用擬人化的對(duì)話方式與親和的形象,為用戶提供了良好的服務(wù)體驗(yàn),在交易場景中邁出了重大的一步。該數(shù)字人通過與VTM機(jī)、助農(nóng)設(shè)備打通,形成了多渠道、全場景、端到端的VTM數(shù)字人解決方案。在傳統(tǒng)渠道升級(jí)方面,該數(shù)字人解決方案用智能化技術(shù)幫助傳統(tǒng)服務(wù)渠道,為傳統(tǒng)服務(wù)網(wǎng)點(diǎn)和無人網(wǎng)點(diǎn)建立了人資調(diào)配的通道,很好的提升了銀行的服務(wù)體驗(yàn)和效率。在場景支持方面,拓展了數(shù)字人在銀行場景中的應(yīng)用邊界,從傳統(tǒng)的咨詢、查詢、導(dǎo)覽拓展到了取款、開戶、密碼重置等交易場景中;在區(qū)域客戶的滲透方面,將通過便捷易操作的服務(wù)及與助農(nóng)設(shè)備的互通,為適老化能力的建設(shè)和鄉(xiāng)村金融服務(wù)的街鄉(xiāng)級(jí)滲透提供新路徑。
京東智能客服言犀將數(shù)字人技術(shù)一方面融合了前沿的AI技術(shù),包含NLP、TTS、ASR、虛擬形象、圖像識(shí)別等多項(xiàng)技術(shù),具備感知、認(rèn)知、交流、服務(wù)的能力,同時(shí),還打通了VTM機(jī)系統(tǒng),使得該項(xiàng)目可勝任各類金融服務(wù)場景;生動(dòng)的3D形象配以親和的面部表情和肢體動(dòng)作,充分模擬人與人之間真實(shí)的對(duì)話方式,打造的可媲美真人的VTM數(shù)字員工,為用戶提供接近于真人體驗(yàn)的可視化服務(wù)。目前該項(xiàng)目已在銀行多個(gè)網(wǎng)點(diǎn)部署,并取得了良好的效果。
隨著人工智能的深入發(fā)展,像虛擬數(shù)字人這樣的AI技術(shù)早已走出了實(shí)驗(yàn)室,與現(xiàn)實(shí)的產(chǎn)業(yè)場景不斷融合。京東AI技術(shù)之所以能取得如此優(yōu)異的成績,是其在真實(shí)復(fù)雜場景的有效實(shí)踐和千錘百煉。作為整個(gè)京東集團(tuán)對(duì)外提供技術(shù)服務(wù)的核心平臺(tái),京東云不僅是政府、企業(yè)、家庭數(shù)字化轉(zhuǎn)型全生命周期合伙人,并基于人工智能、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)、區(qū)塊鏈、隱私計(jì)算等技術(shù),通過數(shù)智化全鏈條技術(shù)服務(wù),助力千行百業(yè)數(shù)字化轉(zhuǎn)型,激發(fā)產(chǎn)業(yè)無限可能。