「回顧」智變中的美團客服

本文PPT,在微信公眾號「DataFunTalk」,回復「先行者」領取


導讀:當NLP遇上客服系統確實會發生一些美妙的事情,下面我分享的內容將圍繞美團客服系統中一些比較前沿的技術展開,希望能對大傢有所啟發。

今天分享的內容主要分為以下幾個方面,第一部分首先對美團的客服系統進行簡單介紹,第二部分是本次分享的重點,包括我們采用瞭什麼樣的技術方案,技術方案的具體的技術組件是怎樣實現的,背後有著怎樣的思考等等,第三部分展示我們所做的工作在美團客服系統的落地效果,第四部分對本次分享做一個總結。總體上來說,客服不是一個純靠人可以解決的問題,也不是一個純靠算法可以解決的問題,而是需要人機協同解決的問題。同時,它也不是一個靜態的系統,它需要不斷地進化不斷地運營。


01 客服系統簡介

首先我們回顧一下客服系統的演變歷史。客服系統的原始階段是語音呼叫中心,這種客服系統純靠人工服務,且支持語音電話,效率低成本高。第二階段進化到瞭網頁在線客服,這種客服系統基於網頁會話,服務形式支持文本和語音,同時還利於對流量數據進行挖掘。隨著移動互聯網的興起,便有瞭SaaS客服系統,這種客服系統支持多渠道接入,有瞭豐富的輔助功能和知識庫管理。如今客服系統進化到瞭智能客服,它最大的特點就是人機協同,許多簡單問題都可以由機器自主解決,這個系統可以自主學習不斷進化。回顧客服系統的演變歷史可以發現,智能化是客服系統的一個演變趨勢。

bec90faa8cbcd36d38402880b0967726

然後我介紹一下對話系統。對話系統主要包括四類:問答型對話、任務型對話、閑聊型對話、圖譜型對話。在問答型對話中,我們使用QABot機器人完成簡單任務,這種對話通常是與上下文無關的單輪對話。在任務型對話中,TaskBot機器人完成特定場景下的復雜任務。另外還有ChatBot閑聊型機器人,這種對話通常不以解決實際問題為目的,我們的客服系統也有用到這種機器人。最後是圖譜型機器人KBQA,這種機器人可能更多地用在金融、醫療等領域,但還未有成熟的系統,這方面我們也還處於探索中。

根據智能客服機器人的智能水平,可以將其分為四個檔次:簡單檢索機器人、語義識別機器人、場景導向機器人、智慧機器人。簡單檢索機器人隻支持特定類型的檢索,隻要說法稍微一變可能就不能正確識別,匹配性較差。語義識別機器人基於知識庫,可以更智能地理解所檢索的問題。場景導向機器人根據不同場景量身定制機器人,機器人的聰明程度與場景有關。智慧機器人是智能程度最高的機器人,甚至可以達到擬人的程度。現在來看,大多數機器人還隻是停留在第二個階段,能達到第三個階段的還是少數。

美團的業務種類繁多,不同的業務所需要的客服系統也不盡相同,這無疑給我們提出瞭嚴峻的技術挑戰。上圖是客服系統的整體框架圖,藍色部分代表瞭前面提到的nlp技術對原來客服系統的改進。在用戶端我們設置瞭QABot、TaskBot、ChatBot等機器人,在座席端運用瞭話術提示、轉接提示、情感分析等技術。

--

02 智變之路

下面進入本次分享的第二部分:智變之路,主要聚焦於我們在這個過程中做瞭哪些工作以及我們背後的思考。

原來的客服系統系統中客戶將請求傳送到客服服務器,然後客服操作平臺就會分配相應的人工客服處理相應的客戶請求,客服操作平臺隻具備簡單的知識管理功能。這種客服系統最大的問題就是效率低,需要的人力成本高。對於這樣的客服系統來說,實際上需要的人工客服數目和訂單數目是成正比的。美團現在的業務正處於飛速的發展過程中,現在就有近萬名客服人員,如果不對客服系統進行改進,可以想象未來這個隊伍還會擴充很多倍。基於原來客服系統的這些缺點,我們對這個架構進行瞭改進,增添瞭會話管理服務,後面連接著QABot、TakBot、ChatBot等機器人以及人工服務,有一個專門的知識管理平臺來支撐QABot、TakBot、ChatBot,AI訓練師對知識管理平臺設計離線學習和自動訓練的算法。除此之外我們還設計瞭話術提醒、輿情監控、轉接提示等模塊來輔助人工客服。

我們也研究過做字典的必要性。以上圖片來源於對外賣的日志數據分析,可以看出隻是“外賣配送超單”這一個問題對應的問法就有16000多種,原客服系統的簡單檢索很明顯不能滿足這種需求,讓檢索系統具有一定的語義識別能力十分必要。

要做好一個AI系統必須滿足這樣的條件:要有大量業務專傢、要有強大算法團隊、要有大規模GPU計算引擎、要有海量場景數據,這些條件在美團都是滿足的,這無疑給瞭我們使智能客服系統落地的信心。

這是我們智變的思路,我們采用三級漏鬥的方式,把問題分為瞭三類,第一類簡單咨詢問題由QABot解決,第二類高頻相關的復雜場景下的問題由TaskBot解決,最後TaskBot解決不瞭的任務再借助人工客服來解決。我們算法的目標就是隨著時間的演進,不斷地把更多的任務轉向機器解決。

這是我們的系統架構,當一個請求來臨時,先進入我們的意圖識別領域,然後被識別到對應的業務領域中,把對應的知識點識別出來。如果識別出來的是一個比較簡單的問題,直接檢索就可以得到答案,如果它是和用戶訂單狀態或者行為有關系的復雜問題,需要根據場景生成不同的答案。比如對於催單問題,訂單狀態不一樣所需要的回應也不一樣,如果用戶剛下訂單就要催單,此時告訴用戶騎手的位置比較合適,但用戶是在等瞭一個小時的情況下催單,此時需要先安撫客戶的情緒。而對於多輪的任務,如客戶支付寶支付無法使用,這種任務需要調用好多層才能完成,此時就會調用TaskBot。

接下來介紹一下單輪會話的QABot。它主要由兩部分構成,其中一部分是線上的語義識別,另一部分是線下的客服運營,運營的目的是發現更多的標準問題以及更多的關聯問題。另外後面還有一個交互層,交互層有可能觸發Task或者直接生成答案。

語義識別主要指把不同的問法規整到標準的問法上去,感受一下上面的例子,不同的細節表述其實都是在說餐品有質量問題,而語義識別的目的就是要找到檢索問題的標準表述。為瞭解決這個問題,我們綜合運用瞭搜索技術、翻譯技術、圖譜技術、深度學習和統計學習技術。

語義識別的流程模擬瞭人解決問題的思路。人類在解決一個問題的時候會首先考慮以前有沒有類似的問題,對應於語義識別中我們也首先采用搜索檢索的方法。在找尋相似問題的過程中,人類通常會考慮:“我們要找的到底是哪些問題呢?”,對應於語義識別中,這是一個對問題進行候選篩選的過程。當人類發現一些問題明顯和意圖無關,通常要把他們去掉,對應於語義識別中,這就是要進行意圖識別從而篩選問題。面臨最後挑選出的幾個問題,人類通常要對其進行優先級排序,對應於語義識別中,這就是Rank的過程。最後人類可能還會對結果進行檢查:“問的確實是這個問題嘛?”,這就是語義識別中的語義完整性檢查。這整個過程中運用瞭各種各樣的模型來達成語義識別的目的。

先介紹一下基於匹配的識別。基於匹配的識別利用拓展問與標準問的並行數據作為訓練語料,把拓展問Ngram特征串作為關鍵詞建立倒排,Ngram特征分佈作為權重,在外賣的例子中隻用Top20就能達到99.76%的權重。這一步的篩選為後面模型節省瞭很多時間。

下面介紹一種深度模型—DSSM模型。DSSM模型是一個雙塔模型,它在句子embedding上效果很好,因此我們也借鑒瞭這一模型。我們把標準問與拓展問語義相同的句子對作為正例,把標準問與拓展問語義不同的句子對作為反例,訓練瞭DSSM模型。模型訓練後,對於任給的一個問題,可以得到它的embedding結果,和其他標準問embedding結果相對比就可以算出相似度。比如拓展問“我的外賣怎麼還沒到”可以計算出一個Sentence Vector,而標準問“配送超時催單”和“餐品有質量問題”分別有一個Sentence Vector,通過計算可得,“我的外賣怎麼還沒到”和“配送超時催單”的相似度為0.98,我的外賣怎麼還沒到”和“餐品有質量問題”的相似度是0.62,所以可以把“我的外賣怎麼還沒到”的語義識別為“配送超時催單”。

還有一個效果很好的深度模型—Seq2seq模型。Seq2seq模型本身是一個生成模型,但是我們把它用來計算句子之間的相似度,我們把它encoder和attention的結果和不同的候選做loss計算,把loss作為一種度量結果,Loss越小代表輸入和候選越接近。以上兩個深度模型是我們嘗試過的深度模型中效果最好的兩個。

我們還采用瞭一種基於圖譜的識別方法。因為美團積累瞭很多圖譜信息,美團大腦項目裡面有億級的實體數量,相互之間的關系超過5億,實體與實體之間的關系可以做一個embedding,這樣實體就可以變成一個向量表示,而這種向量可以作為一種特征和其他顯示特征聯合在一起提供給聚類分類算法,這樣會使算法效果有很大的提升。

還有一種對知識圖譜的用法,我們從圖譜中抽取一些近義詞上下位等關系作為並行語料放入一些模型中去,這樣對原有語料進行瞭很好的擴充。

05b562556a4c9ff1801515a42e34773b

還有一種模型:基於實例的翻譯。Nagao1984年時提出過這樣一個理論:人類在翻譯簡單句子時不會進行深層次的語義分析。這是一種很簡單的思想:從已知的實體中找到和問題最接近的,把它的答案作為問題的答案。

f11936cc5fbd25b962e7859eba3a994b

這是一個簡單的例子。我們的語言庫裡面已經有“怎麼都沒人接單啊”、“怎麼還沒人接單呀”、“怎麼今天沒人接單”等句子,庫裡面這些問題的答案都是“無騎手接單”,此時來瞭一個新的問題“怎麼會沒人接單呢”,通過相似性可以推斷出它的答案也應該是“無騎手接單”。

下面介紹一個進行意圖識別的模型。我們根據業務邏輯進行建模,對於外賣來說,可以把問題分為幾個大類,比如配送類、紅包類、支付類、賬戶類等等,不同大類之間的問題關系可以依據業務邏輯分別被定義為互斥或者相容,根據這些關系可以對候選問題進行語義層面的篩選。根據篩選結果對候選問題進行過濾。

上面介紹的都是QABot用到的模型,下面介紹一下TaskBot的整體框架。TaskBot在我們這裡被定義為一個執行引擎,在架構上它是這樣的,請求來臨後,先進行意圖識別,出發對應的Task,Task把對應的決策樹load到內存裡邊,然後它會對決策樹的節點狀態進行記錄,之後調用情感識別、語義識別、實體識別等服務進行分析決定節點之間的狀態流轉。

--

03 閑聊機器人

ChatBot不以解決實際問題為目的,主要用來和用戶進行情感交流。我們采用兩種方式來做ChatBot,第一種是檢索式,構建一個閑聊庫,檢索給出答案,第二種是生成式模型,從閑聊庫中學習生成模型。生成式比較具有挑戰性,因為客服系統是一個比較嚴肅公開的平臺,必須保證會話的可控性。

這是我們QABot的落地情況,數據來自於外賣場景,每天解決72,000個問題,算法離線準確率達到92%,在線智能解決率83%。

這是TaskBot的落地效果,業務場景是打車領域,針對打車司機平臺派單少這一問題,TaskBot的上線方便瞭司機自助地解決問題,大大提升瞭這一問題的智能解決率和智能解決量。

--

04 總結

最後,對本次分享做一下總結。智能化是客服系統發展的趨勢,是解決有限的客服資源與不斷增長的海量用戶服務請求矛盾的唯一選擇。實踐證明,智能化客服確實可以大量消除人的重復勞動,業務專傢也可以從繁雜中解脫出來,可以有更多的時間進行方案優化。最重要的一點,智能化客服系統不是一個純人的系統,也不是一個純算法的系統,也不是一個靜態的系統,它需要人機協同,自主學習不斷進化。還有一點,客服系統現在還主要用於售後方面,我們現在也在售前的相關研究,後面我們也會把它用於智能營銷、導購等流程中,這方面我們也在探索。


今天的分享就到這裡,謝謝大傢。

閱讀更多技術幹貨文章、下載講師PPT,請關註微信公眾號“DataFunSummit”。


分享嘉賓:劉學梁老師

編輯整理:趙富旺同學

內容來源:2018AI先行者大會《智變中的美團客服》

出品社區:DataFun


分享嘉賓

劉學梁,美團AI平臺部NLP中心客服算法團隊負責人,研發的智能客服系統已上線服務於外賣、打車等領域。曾就職於微信,從事機器翻譯、語音識別相關基礎算法研究工作。


報名看直播 免費領PPT

---【DataFunSummit2022:自然語言處理峰會】

  1. 時間:7月30日9:00-18:10

2. 地點:DataFunTalk直播間

3. 報名:添加小助手報名觀看

誠邀各位粉絲朋友們參加本次直播峰會!峰會結束後我們會在公眾號【DataFunSummit】更新所有講師的PPT資料,屆時可回復關鍵字【20220730】免費下載!



歡迎轉載分享,轉載請私信留言。

发表回复

相关推荐

意大利白色小鎮阿爾貝羅貝洛Alberobello,浪漫到不行

說到意大利,大傢想到的一定是羅馬、佛羅倫薩、威尼斯、米蘭。意大利除瞭這些大城市的精致,更有小鎮上別致的美。之前Reacho...

· 2分钟前

什么是弱势文化?

弱势文化其实不是一种文化,是弱势思维的别称,也可以称之为傻子文化、逗逼思维、弱智行为等等,反正喜欢就好,怎么称乎无所 ...

· 5分钟前

2022年試驗檢測師和助理試驗檢測師報名必須具備三個條件

一、學歷、工作年限、工作單位證明三者必須具備1. 大專分全日制和非全日制(函授、自考 、電大 網絡教育)2. 本科分全日制和...

· 8分钟前

2023年投影儀推薦選購攻略、避坑攻略,最全面攻略 | 小米、明基、愛普生、堅果、極米、大眼橙、傢用客廳臥室投影儀、高清、4K 投影儀推薦

前文概要結論先行(左邊標粗為推薦款):年度最新款/熱賣款投影儀介紹區體驗檔(2000~3000)極米NEW Z6X在同價位裡,性能表現...

· 11分钟前

婚姻輔導是什麼東西?婚姻問題找婚姻傢庭咨詢師真的有用嗎?

[婚姻輔導是什麼東西?]“婚姻輔導” 這四個字,聽瞭就好像感覺要出問題瞭!其實恰恰相反 它會幫助你減少許多問題。有些人會...

· 11分钟前