歡迎體驗(yàn)得助產(chǎn)品
手機(jī)號碼
歡迎注冊得助智能
注冊尚未完成
現(xiàn)在離開將導(dǎo)致注冊失敗確定要退出嗎?
填寫時(shí)間過長
頁面已停止響應(yīng)
請?jiān)?0分鐘內(nèi)完成填寫
登錄成功
請選擇您感興趣的產(chǎn)品
得助大模型平臺(tái)
一站式服務(wù)簡化大模型訓(xùn)推評全流程
高效、低成本構(gòu)建大模型企業(yè)級應(yīng)用
知識(shí)管理
為財(cái)富顧問提供一站式智能問答服務(wù)
組合式AI打造大模型企業(yè)知識(shí)助手
智能客服
全渠道全媒體、一站式AI+呼叫中心
外呼大模型加持,聽得準(zhǔn)確說得自然
即時(shí)文本對話,自研知識(shí)引擎
大模型擬真,千人千面沉浸式AI對練
智能運(yùn)營
全場景自研AI+RTC實(shí)時(shí)音視頻服務(wù)
高精度、高安全的圖文檢測識(shí)別服務(wù)
AI+RPA深度融合,賦能企業(yè)自動(dòng)化
全鏈路生物數(shù)據(jù)核驗(yàn),守衛(wèi)安全防線
大模型賦能合規(guī),金融級多模態(tài)質(zhì)檢
自然語言交互,可視化智能分析數(shù)據(jù)
企業(yè)出海
企業(yè)跨語種無界溝通,贏占國際市場
多語言國際服務(wù),跨時(shí)區(qū)溝通無障礙
多語言智能交互助力全球營銷與服務(wù)
大模型賦能國際企業(yè)多模態(tài)質(zhì)檢服務(wù)
智能營銷
智能營銷服引擎,高效轉(zhuǎn)化私域流量
打通營銷全鏈路,賦能企業(yè)增速業(yè)務(wù)
打造超低延遲、超穩(wěn)定的直播平臺(tái)
其他
為企業(yè)提供多場景、高質(zhì)量專業(yè)服務(wù)
安全穩(wěn)定、應(yīng)用多場景的線路服務(wù)
描述具體需求(選填)
歡迎微信掃碼咨詢
中關(guān)村科金得助智能-小得
公司新聞
2022-12-23 10:17:01
閱讀量:1638
文章目錄
“小X同學(xué),請打開電視”、“小X小X,請播放音樂”......如今,很多年輕人的生活不再像以前一樣,只需要?jiǎng)觿?dòng)嘴,就可以控制家里的各種設(shè)備。根據(jù)全球著名調(diào)研咨詢機(jī)構(gòu)IDC發(fā)布的《中國全屋智能設(shè)備和解決方案市場回顧和展望》,2021年中國智能家居設(shè)備出貨量超過2.2億臺(tái),同比增長9.2%;2022年中國全屋智能市場銷售額將突破百億,預(yù)計(jì)同比大幅增長近55%;到2023年,智能家居將會(huì)成為物聯(lián)網(wǎng)支出最高的領(lǐng)域之一。
而想要實(shí)現(xiàn)通過語音對話的方式來控制家中智能設(shè)備,對話式AI技術(shù)是必不可少的一環(huán)。
任務(wù)型多輪對話,是對話式AI的必由之路
目前,對話式AI主要應(yīng)用的場景有三種,分別是閑聊型、問答型和任務(wù)型。
閑聊型:多用于情感陪伴,但由于整體技術(shù)水平還未達(dá)到人們的心理預(yù)期,現(xiàn)階段商業(yè)化并不太成功;
問答型:多見于客服系統(tǒng),能夠解決用戶的一些事實(shí)性問題,但功能上較為局限;
任務(wù)型:多用于B2C類應(yīng)用,能夠?qū)⒎墙Y(jié)構(gòu)化數(shù)據(jù)充分利用起來,沉淀企業(yè)知識(shí),是企業(yè)數(shù)字化轉(zhuǎn)型賽道上的關(guān)鍵技術(shù)。
由于目前的技術(shù)水平還處于弱人工智能階段,全面實(shí)現(xiàn)對話式AI比較困難。任務(wù)型多輪對話因具有較好的可解釋性,且易于把控,是以點(diǎn)及面實(shí)現(xiàn)完整的對話式AI的理想途徑。
任務(wù)型多輪對話是對話式AI的外延之一,專注于封閉域下的問題解決。任務(wù)型多輪對話的定義是:根據(jù)上下文內(nèi)容,進(jìn)行連續(xù)的、以達(dá)到解決某一類特定任務(wù)為目的的對話。需要注意的是,任務(wù)型多輪對話有三個(gè)關(guān)鍵要素,多輪、連續(xù)性、封閉域。
多輪:與單輪的問答不同,多輪對話解決復(fù)雜條件下的問答,需要結(jié)合上下文理解多項(xiàng)約束條件,每一次應(yīng)答都與上下文有強(qiáng)關(guān)聯(lián)關(guān)系。
連續(xù)性:對話需要具備連貫性,一旦捕獲到用戶意圖,則將以完成此任務(wù)為目標(biāo),進(jìn)行持續(xù)性的對話。
封閉域:某一類特定問題表明了對話是受限的,即這是一個(gè)封閉域上的問題。對話系統(tǒng)僅負(fù)責(zé)某個(gè)領(lǐng)域下已知的一系列任務(wù),比如說訂機(jī)票,訂外賣,或者查天氣等等。
任務(wù)型多輪對話系統(tǒng)的,技術(shù)架構(gòu)設(shè)計(jì)
目前主流的任務(wù)型多輪對話系統(tǒng)依然沿用了模塊化的方法,其技術(shù)架構(gòu)如下所示,包含以下幾個(gè)模塊:
輸入模塊:接收用戶傳達(dá)的信息,包括語音、圖像、文本等。對于語音類信息,通常使用語音識(shí)別(Automatic Speech Recognition, ASR)技術(shù)轉(zhuǎn)化為文本。而對于圖像類信息,目前研究較少,可行的方案包括通過文字識(shí)別(Optical Character Recognitionm, OCR)技術(shù)將識(shí)別圖像中的文字轉(zhuǎn)化為文本,或者使用機(jī)器學(xué)習(xí)訓(xùn)練編碼器,將圖像轉(zhuǎn)化成視覺語義編碼。
解析模塊:對輸入的信息進(jìn)行解析,轉(zhuǎn)化為機(jī)器可理解的語義表示。以文本信息及框架語義表示為例,此模塊依賴于自然語言理解(Natural Language Understanding, NLU)技術(shù),需要從文本信息中識(shí)別出用戶的意圖(Intent)以及該意圖下的語義槽(Slot)。例如”附近有什么比較火的粵菜館?“,用戶意圖是”搜尋餐廳“,語義槽是”地點(diǎn)“為”附近“,”熱度“為“高”,“菜系”為“粵菜”。
對話管理模塊:根據(jù)解析模塊輸出的語義表示,更新對話狀態(tài),并根據(jù)策略選擇應(yīng)答動(dòng)作。此模塊主要包括對話狀態(tài)跟蹤(Dialogue State Tracker, DST)和對話策略學(xué)習(xí)(Dialogue Policy Learning, DPL)。對話狀態(tài)跟蹤負(fù)責(zé)維護(hù)多輪對話的狀態(tài),根據(jù)歷史對話狀態(tài)、解析模塊當(dāng)前的輸入以及背景知識(shí)庫綜合得到新的對話狀態(tài)。此模塊的主要功能就是記憶與預(yù)測,通過與用戶間的不斷交流,逐漸完善對用戶狀態(tài)的觀察。對話策略學(xué)習(xí)根據(jù)DST模塊輸出的當(dāng)前對話狀態(tài),來決策系統(tǒng)采取的動(dòng)作。例如解析模塊的例子,此模塊則會(huì)選擇“搜索”動(dòng)作,查詢以用戶當(dāng)前定位為中心,一定范圍內(nèi)的高瀏覽量粵菜餐廳。
解碼模塊:與解析模塊相反,此模塊的任務(wù)是將系統(tǒng)結(jié)果以人類可以理解的方式解碼,通常就是轉(zhuǎn)化為自然語言。例如系統(tǒng)查詢到的餐館在數(shù)據(jù)表中ID為"r008",轉(zhuǎn)化為自然語言可以是“您好,附近熱度最高的粵菜館是金鼎軒,位于xxx路xxx號,距您1.1km。"
輸出模塊:此模塊以輸入模塊相同的形式將解碼模塊產(chǎn)生的結(jié)果反饋給用戶,如聊天框、麥克風(fēng)等。而自然語言想要轉(zhuǎn)化為語音,則需要使用到語音合成(Text To Speech, TTS)技術(shù)。
業(yè)內(nèi)主流的任務(wù)型多輪對話系統(tǒng)平臺(tái)
經(jīng)過多年的發(fā)展,任務(wù)型多輪對話領(lǐng)域涌現(xiàn)了眾多優(yōu)秀的公司,盡管基礎(chǔ)技術(shù)差異不大,但在鉆研方向上各家卻有著自身的特色,下面介紹幾個(gè)典型案例。
谷歌LaMDA是工業(yè)級端到端的預(yù)訓(xùn)練對話模型。眾所周知,目標(biāo)決定方向,如何定義模型的訓(xùn)練任務(wù)與損失函數(shù),將決定訓(xùn)練方向與最終效果。谷歌重新定義了三個(gè)評價(jià)指標(biāo),Sensibleness, Specificity, Interestingness(是否合理、符合上下文、有創(chuàng)造力)、Safety(是否有風(fēng)險(xiǎn)、不公正)、Groundedness、Informativeness(在知識(shí)型問答中,是否包含真實(shí)的信息、并引用相關(guān)鏈接),并借此構(gòu)建分類任務(wù)精調(diào)模型,提升了模型的對話能力。
相比其他對話系統(tǒng),LaMDA具有蘊(yùn)含知識(shí)、回復(fù)更加靈活等優(yōu)勢,但其不可控性、邏輯能力差等缺點(diǎn)也是極為明顯的。然而就在大眾對于此類“人工智障”逐漸失望之際,12月openAI推出的同類型的大模型chatGPT著實(shí)讓人驚艷,或許此類對話系統(tǒng)依然是通往終點(diǎn)的一條途徑。
Senseforth成立于2017年,是一家印度對話式人工智能服務(wù)商。根據(jù)Gartner統(tǒng)計(jì),目前Senseforth的企業(yè)級對話式人工智能平臺(tái)每月處理超過1.9億次對話,準(zhǔn)確率超過96%。
通過大量行業(yè)實(shí)踐,Senseforth創(chuàng)建了對話式人工智能機(jī)器人商店,該商店擁有行業(yè)預(yù)建模型和領(lǐng)域知識(shí),適用于一系列垂直行業(yè),包括銀行、保險(xiǎn)、零售、醫(yī)療保健、電信和酒店等。Senseforth尤其專注于NLU模塊,將意圖與實(shí)體分開訓(xùn)練,支持快速新增、修改意圖,其解決方案中包含4萬多意圖與大量的預(yù)置意圖庫。
除了對話式人工智能機(jī)器人外,Senseforth還涉足對話式分析、對話式營銷、代理協(xié)助、知識(shí)管理和智能搜索等技術(shù)服務(wù)。
Cognigy是一家總部位于德國的對話式AI服務(wù)提供商,成立于2016年,旨在提高企業(yè)客戶服務(wù)團(tuán)隊(duì)的工作效率。通過將對話式AI技術(shù)與商業(yè)智能、客戶關(guān)系管理、企業(yè)資源規(guī)劃工具整合,Cognigy幫助企業(yè)用戶通過簡單對話形式訪問實(shí)時(shí)數(shù)據(jù),實(shí)現(xiàn)無縫連接關(guān)鍵操作觸點(diǎn)。
Cognigy亦專注于低代碼平臺(tái)搭建,結(jié)合流程自動(dòng)化技術(shù),允許企業(yè)使用智能AI機(jī)器人和聊天機(jī)器人自動(dòng)化客戶和員工通信。
任務(wù)型多輪對話,在中關(guān)村科金的實(shí)踐
目前任務(wù)型多輪對話系統(tǒng)的技術(shù)框架、各模塊的細(xì)化技術(shù)選型都已經(jīng)較為成熟,但是在實(shí)際實(shí)踐中,我們發(fā)現(xiàn)依然存在著定制化程度高、回答生硬、使用門檻高等諸多問題。
定制化程度高:任務(wù)型多輪對話依賴專家經(jīng)驗(yàn),需要預(yù)先梳理出領(lǐng)域本體結(jié)構(gòu),用戶的意圖及每個(gè)意圖對應(yīng)的槽位,針對每個(gè)任務(wù)還需要設(shè)計(jì)其對應(yīng)的故事線,因此不同行業(yè)、甚至不同公司都需要根據(jù)具體情況來定制。
非生成式應(yīng)答生硬:任務(wù)型多輪對話的應(yīng)答通常是非生成式的,采用的方法往往是枚舉、模板等,因此,回復(fù)會(huì)顯得比較生硬,影響客戶體驗(yàn)。
難以適應(yīng)語言環(huán)境的變化速度:自然語言的創(chuàng)造力很強(qiáng),變化也非???,例如“碳交易”、“元宇宙”、“預(yù)制菜”、“政銀擔(dān)”等等,新詞的出現(xiàn)對于對話系統(tǒng)是很大的考驗(yàn),需要考慮如何設(shè)計(jì)產(chǎn)品以跟上快速變化的語言環(huán)境。
系統(tǒng)使用門檻高:對于系統(tǒng)使用人員來說,構(gòu)建一個(gè)完整的任務(wù)型對話機(jī)器人具有一定的專業(yè)門檻,其中涉及到大量的機(jī)器學(xué)習(xí)模型,如何訓(xùn)練模型、優(yōu)化模型等,難度都會(huì)比較大。
針對任務(wù)型多輪對話系統(tǒng)中存在的挑戰(zhàn),中關(guān)村科金提出了自己的解決方案。
針對定制化程度高、非生成式應(yīng)答生硬的問題,中關(guān)村科技的解決方法是定義完善的標(biāo)簽體系與領(lǐng)域?qū)嵺`模板,將知識(shí)進(jìn)行沉淀。
據(jù)了解,目前中關(guān)村科金基于數(shù)億人機(jī)對話語料,構(gòu)建了100+通用實(shí)體與意圖,幫助客戶快速搭建自身領(lǐng)域的標(biāo)簽體系。另外,在某些特定領(lǐng)域,例如金融行業(yè),中關(guān)村科金積累了大量行業(yè)標(biāo)注語料,形成了自有的領(lǐng)域?qū)嵺`模板,同領(lǐng)域的客戶可以直接應(yīng)用“現(xiàn)有模板”,避免從0到1的冷啟動(dòng)階段,加速項(xiàng)目落地應(yīng)用。
如果我們把多輪對話看作流程,借助流程挖掘技術(shù),就可以從海量數(shù)據(jù)中繪制出流程圖,輔助專家抽象領(lǐng)域SOP。而基于已有SOP的實(shí)踐,又可以通過流程挖掘的Replay技術(shù),完成對關(guān)鍵話術(shù)節(jié)點(diǎn)、風(fēng)險(xiǎn)對話節(jié)點(diǎn)等的感知與預(yù)測,針對性的優(yōu)化改進(jìn),進(jìn)一步完善領(lǐng)域SOP,助力客戶業(yè)務(wù)增長。
在實(shí)際的應(yīng)用中,流程挖掘已經(jīng)成為中關(guān)村科金幫助客戶實(shí)現(xiàn)領(lǐng)域標(biāo)準(zhǔn)對話程序的關(guān)鍵技術(shù)。
多輪對話依賴于底層知識(shí)庫與模型,中關(guān)村科金通過人機(jī)閉環(huán)鏈路,實(shí)現(xiàn)了非專業(yè)運(yùn)營的智能化迭代優(yōu)化。
對于知識(shí)庫,通過知識(shí)發(fā)現(xiàn)、知識(shí)細(xì)化、知識(shí)優(yōu)化、知識(shí)淘汰四步,運(yùn)營人員僅需對部分新知識(shí)進(jìn)行審核,即可實(shí)現(xiàn)知識(shí)庫的快速迭代更新。
而在模型方面,中關(guān)村科金自研的自訓(xùn)練平臺(tái),提供了業(yè)務(wù)中積累的大量規(guī)則、模型算子,通過少量的配置,運(yùn)營人員即可實(shí)現(xiàn)模型的優(yōu)化,降低了學(xué)習(xí)成本,解決了對話系統(tǒng)使用門檻高的問題。
作為領(lǐng)先的對話式AI解決方案提供商,中關(guān)村科金深耕行業(yè)八年,先后服務(wù)500余家行業(yè)頭部企業(yè)的200多個(gè)應(yīng)用場景,在自然語言處理、機(jī)器視覺、語音技術(shù)、深度學(xué)習(xí)等人工智能核心技術(shù)領(lǐng)域擁有深厚的積累,自主研發(fā)了文本機(jī)器人、語音機(jī)器人、數(shù)字人、智能質(zhì)檢、智能助手、智能陪練等多款對話式AI產(chǎn)品。
以零售行業(yè)為例,某世界500強(qiáng)企業(yè)旗下的高品質(zhì)購物中心,其線上業(yè)務(wù)面臨重復(fù)性問題繁多、人力工作時(shí)長有限、數(shù)據(jù)價(jià)值難以被有效利用等痛點(diǎn)。得助智能文本機(jī)器人運(yùn)用自然語言處理、知識(shí)圖譜、流程挖掘等技術(shù),實(shí)現(xiàn)企業(yè)知識(shí)沉淀,輔助構(gòu)建客服場景下的SOP樹,解決客戶在購物中心遇到的85%以上的問題。依賴于閉環(huán)迭代,文本機(jī)器人能在與客戶溝通中自主學(xué)習(xí),不斷強(qiáng)化處理問題的能力,滿足客戶的多元個(gè)性化需求。
以營銷行業(yè)為例,中關(guān)村科金基于對話式AI技術(shù),通過將MAP平臺(tái)、智能外呼機(jī)器人、文本機(jī)器人、RPA結(jié)合,構(gòu)建一體化營銷云產(chǎn)品。在為某消金線上業(yè)務(wù)服務(wù)中,將營銷的SOP流程標(biāo)準(zhǔn)化后沉淀下來,配置在營銷自動(dòng)化模塊中,基于用戶分層實(shí)現(xiàn)自動(dòng)化群發(fā)、自動(dòng)化回復(fù)、自動(dòng)化標(biāo)簽等,打造全新的私域自動(dòng)化運(yùn)營體系,營銷轉(zhuǎn)化率提升30%、人力成本下降60%,幫助客戶實(shí)現(xiàn)降本增效。
任務(wù)型多輪對話的未來發(fā)展趨勢
因其可控性,在可預(yù)見的未來任務(wù)型多輪對話依然將是對話系統(tǒng)的主要表現(xiàn)形式之一。隨著技術(shù)的不斷提高,中關(guān)村科金認(rèn)為以下三個(gè)方面會(huì)是任務(wù)型多輪對話的未來發(fā)展方向。
1)冷啟動(dòng)始終是AI所不可避免的問題,如何基于現(xiàn)有的大量未標(biāo)注數(shù)據(jù),快速實(shí)現(xiàn)對話系統(tǒng)的搭建值得深入研究;
2)機(jī)器學(xué)習(xí)模型目前還停留在感知智能的階段,并沒有真正理解對話中的含義,同時(shí)欠缺對于領(lǐng)域知識(shí)、常識(shí)知識(shí)的應(yīng)用。引入領(lǐng)域知識(shí)和常識(shí)知識(shí),并且能夠進(jìn)行知識(shí)的推理,將極大的提高對話系統(tǒng)的實(shí)用性與競爭力;
3)語言不是唯一的交互途徑,人類的表達(dá)方式是多種多樣的,人機(jī)對話系統(tǒng)的交互方式必將向多模態(tài)的方向發(fā)展。
未來,中關(guān)村科金將不斷提升多模態(tài)對話式AI,尤其是任務(wù)型對話的技術(shù)實(shí)力與場景落地能力,抓住這一企業(yè)數(shù)字化轉(zhuǎn)型賽道上的關(guān)鍵技術(shù),助力企業(yè)數(shù)字化變革。
無論是銀行遠(yuǎn)程面簽,還是保險(xiǎn)雙錄,流暢、穩(wěn)定的音視頻通信都是保障業(yè)務(wù)順利開展、提升客戶滿意度的關(guān)鍵。...
2025年3月24日-25日,2025華為云中企出海全球峰會(huì)在重慶舉行。在全球化進(jìn)程面臨新挑戰(zhàn)的背景...
3月13日,由中關(guān)村科金與上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合主辦的"DeepSeek企業(yè)應(yīng)用之道——2025...
隨著AI Agent技術(shù)加速滲透千行百業(yè),中關(guān)村科金自主研發(fā)的得助大模型平臺(tái)以"0代碼構(gòu)建企業(yè)級AI...
3月13日,中關(guān)村科金&得助智能聯(lián)合上海市人工智能協(xié)會(huì)舉辦'DeepSeek企業(yè)應(yīng)用之道--2025...
近日,得助智能客服系統(tǒng)迎來重大進(jìn)展,成功引入國產(chǎn)DeepSeek大模型。這一舉措意義非凡,堪稱得助智...