場景驅動技術迭代:京東言犀斬獲ACM Multimedia 2021年最佳演示獎
來源:中金在線
?
2021-11-03 12:04:04
隨著人工智能的深入發展,技術早已走出了實驗室,與場景不斷融合,同時,在適配場景的過程中進行技術迭代和算法創新,形成技術+場景“雙輪驅動”的良性循環。
近日,第29屆ACM國際多媒體頂級會議ACM圓滿結束,京東探索研究院AI團隊憑借多模態交互數字人技術斬獲“ACMMultimedia2021年最佳演示獎”。這項技術在京東已經廣泛用于智能客服場景。得到國際頂級學術領域的認可,也意味著京東智能客服言犀也已經從單純的技術突破過渡到了技術與場景雙向循環的階段。未來,言犀將依托京東深厚的場景優勢,在更多場景不斷實踐落地,推動技術與實體經濟的深度融合。
500)this.width=500" align="center" hspace=10 vspace=10 alt="場景驅動技術迭代:京東言犀斬獲ACMMultimedia2021年最佳演示獎">
據悉,ACM國際多媒體頂級會議(ACMInternationalConferenceonMultimedia,簡稱ACMMultimedia)自1993年以來每年召開一次,已成為多媒體領域的頂級盛典。大會致力于推動多媒體的研究和應用,是人工智能多模態研究領域的頂級國際學術會議。
該論文提出了一種具備多模態交互能力的虛擬數字人ViDA-MAN,為即時語音查詢提供實時視聽響應。與傳統的基于文本或語音的系統相比,ViDA-MAN可以生成生動的語音、自然的面部表情和身體姿勢;在給定語音請求的條件下,ViDA-MAN能夠以亞秒級延遲響應高質量視頻。ViDA-MAN無縫集成了多模態技術,包括聲學語音識別(ASR)、多輪對話、文本到語音(TTS)、談話頭部視頻生成等,提供身臨其境的用戶體驗。ViDA-MAN能夠與用戶就多個話題進行對話,包括聊天、天氣、設備控制、新聞推薦、預訂酒店,以及通過結構化知識回答問題。
500)this.width=500" align="center" hspace=10 vspace=10 alt="場景驅動技術迭代:京東言犀斬獲ACMMultimedia2021年最佳演示獎">
目前多模態交互數字人技術,正通過京東云這個統一平臺在零售、金融等多個場景大規模落地。在零售領域,虛擬主播帶貨已廣泛應用,通過數字人多模態交互技術,包含語音、情緒、視覺形象等,以“擬人化”的形象為商品配上帶貨主播和專屬客服。在金融領域,京東智能客服言犀推出的VTM數字員工,是全國首個能獨立全程辦理銀行真實交易的數字人,拓展了數字人在銀行場景中的應用邊界,實現了數字人應用場景從傳統的咨詢、查詢、導覽到業務辦理的突破,重塑了銀行網點的用戶體驗和服務方式,大幅提升了銀行業遠程銀行的接待能力與服務效率,降低了運營成本。
多模態交互數字人是京東智能客服言犀的一大應用場景。在今年11.11,京東智能客服也正發揮積極作用,涵蓋售前、售中、售后、物流等零售的各個服務環節,為消費者提供7×24小時全天候的咨詢服務。在京東11.11開場10分鐘,京東智能客服累計咨詢服務量超181萬次,同比提升165%。
京東是一家同時具備實體企業基因和屬性、擁有數字技術和能力的新型實體企業,擁有豐富的場景和產業Know-how。未來,京東智能客服·言犀將依托前沿的AI技術和深厚的場景優勢,為客戶提供涵蓋客戶服務、營銷導購、流程自動化的整體智能化解決方案,并據應用場景不斷適配技術,進行跨場景、多模態的交互與融合,技術上推動人工智能技術從感知智能和認知智能到決策智能的跨越,應用上推動服務、營銷、運營一體化創新,不僅為京東逾5億用戶提供智能化咨詢服務,同時也為零售、政務、金融、交通、制造等行業提供產品與解決方案,助力政企數智化升級。
近日,第29屆ACM國際多媒體頂級會議ACM圓滿結束,京東探索研究院AI團隊憑借多模態交互數字人技術斬獲“ACMMultimedia2021年最佳演示獎”。這項技術在京東已經廣泛用于智能客服場景。得到國際頂級學術領域的認可,也意味著京東智能客服言犀也已經從單純的技術突破過渡到了技術與場景雙向循環的階段。未來,言犀將依托京東深厚的場景優勢,在更多場景不斷實踐落地,推動技術與實體經濟的深度融合。
據悉,ACM國際多媒體頂級會議(ACMInternationalConferenceonMultimedia,簡稱ACMMultimedia)自1993年以來每年召開一次,已成為多媒體領域的頂級盛典。大會致力于推動多媒體的研究和應用,是人工智能多模態研究領域的頂級國際學術會議。
該論文提出了一種具備多模態交互能力的虛擬數字人ViDA-MAN,為即時語音查詢提供實時視聽響應。與傳統的基于文本或語音的系統相比,ViDA-MAN可以生成生動的語音、自然的面部表情和身體姿勢;在給定語音請求的條件下,ViDA-MAN能夠以亞秒級延遲響應高質量視頻。ViDA-MAN無縫集成了多模態技術,包括聲學語音識別(ASR)、多輪對話、文本到語音(TTS)、談話頭部視頻生成等,提供身臨其境的用戶體驗。ViDA-MAN能夠與用戶就多個話題進行對話,包括聊天、天氣、設備控制、新聞推薦、預訂酒店,以及通過結構化知識回答問題。
目前多模態交互數字人技術,正通過京東云這個統一平臺在零售、金融等多個場景大規模落地。在零售領域,虛擬主播帶貨已廣泛應用,通過數字人多模態交互技術,包含語音、情緒、視覺形象等,以“擬人化”的形象為商品配上帶貨主播和專屬客服。在金融領域,京東智能客服言犀推出的VTM數字員工,是全國首個能獨立全程辦理銀行真實交易的數字人,拓展了數字人在銀行場景中的應用邊界,實現了數字人應用場景從傳統的咨詢、查詢、導覽到業務辦理的突破,重塑了銀行網點的用戶體驗和服務方式,大幅提升了銀行業遠程銀行的接待能力與服務效率,降低了運營成本。
多模態交互數字人是京東智能客服言犀的一大應用場景。在今年11.11,京東智能客服也正發揮積極作用,涵蓋售前、售中、售后、物流等零售的各個服務環節,為消費者提供7×24小時全天候的咨詢服務。在京東11.11開場10分鐘,京東智能客服累計咨詢服務量超181萬次,同比提升165%。
京東是一家同時具備實體企業基因和屬性、擁有數字技術和能力的新型實體企業,擁有豐富的場景和產業Know-how。未來,京東智能客服·言犀將依托前沿的AI技術和深厚的場景優勢,為客戶提供涵蓋客戶服務、營銷導購、流程自動化的整體智能化解決方案,并據應用場景不斷適配技術,進行跨場景、多模態的交互與融合,技術上推動人工智能技術從感知智能和認知智能到決策智能的跨越,應用上推動服務、營銷、運營一體化創新,不僅為京東逾5億用戶提供智能化咨詢服務,同時也為零售、政務、金融、交通、制造等行業提供產品與解決方案,助力政企數智化升級。