呼叫中心技術(shù)及其發(fā)展
王琦
中國電信集團(tuán)北京研究院技術(shù)部
摘要: 一般看來呼叫中心似乎是企業(yè)在最外層加上了一個服務(wù)層,實際上它不僅僅為外部用戶,也為整個企業(yè)內(nèi)部的管理、服務(wù)、調(diào)度、增值起到非常重要的統(tǒng)一協(xié)調(diào)作用……
Abstract:
Key words :
1 引言
現(xiàn)代呼叫中心是一種基于CTI技術(shù)、充分利用通信網(wǎng)和計算機(jī)網(wǎng)的多項功能集成,并與企業(yè)連為一體的一個完整的綜合信息服務(wù)系統(tǒng),利用現(xiàn)有的各種先進(jìn)的通信手段,有效地為客戶提供高質(zhì)量、高效率、全方位的服務(wù)。一般看來呼叫中心似乎是企業(yè)在最外層加上了一個服務(wù)層,實際上它不僅僅為外部用戶,也為整個企業(yè)內(nèi)部的管理、服務(wù)、調(diào)度、增值起到非常重要的統(tǒng)一協(xié)調(diào)作用。
2 呼叫中心概述
中國引入呼叫中心的概念在20世紀(jì)90年代中后期,1998年以前,中國呼叫中心產(chǎn)業(yè)主要集中在電信業(yè)的一些服務(wù)領(lǐng)域,1998年以后,對信息化應(yīng)用程度較高的行業(yè),如銀行、證券、保險和以服務(wù)導(dǎo)向為驅(qū)動的市場化行業(yè),如IT業(yè)、家電、遠(yuǎn)程購物等行業(yè)也開始不同程度的應(yīng)用呼叫中心提供服務(wù)。
隨著呼叫中心技術(shù)的成熟和功能的發(fā)展,金融、電信、大型企業(yè)等行業(yè)對于呼叫中心均加大了投入,而且已經(jīng)成為企業(yè)整體發(fā)展戰(zhàn)略不可或缺的組成部分,其在企業(yè)中的角色也逐漸從成本中心演變?yōu)闃I(yè)務(wù)平臺和贏利中心。
呼叫中心的發(fā)展大致經(jīng)歷了如下三個階段:
第一代:熱線電話。該方式實現(xiàn)簡單,但是功能單一,擴(kuò)展性差。
第二代:計算機(jī)+板卡?;诎蹇ǖ暮艚兄行氖怯上到y(tǒng)集成商按照客戶的具體需求,將不同廠家的板卡集成到一個系統(tǒng)中,按照客戶要求的專項定制,其成本低廉、設(shè)計靈活,但其實現(xiàn)的功能較專用,功能的升級以及規(guī)模的穩(wěn)定性難于保障。
中國引入呼叫中心的概念在20世紀(jì)90年代中后期,1998年以前,中國呼叫中心產(chǎn)業(yè)主要集中在電信業(yè)的一些服務(wù)領(lǐng)域,1998年以后,對信息化應(yīng)用程度較高的行業(yè),如銀行、證券、保險和以服務(wù)導(dǎo)向為驅(qū)動的市場化行業(yè),如IT業(yè)、家電、遠(yuǎn)程購物等行業(yè)也開始不同程度的應(yīng)用呼叫中心提供服務(wù)。
隨著呼叫中心技術(shù)的成熟和功能的發(fā)展,金融、電信、大型企業(yè)等行業(yè)對于呼叫中心均加大了投入,而且已經(jīng)成為企業(yè)整體發(fā)展戰(zhàn)略不可或缺的組成部分,其在企業(yè)中的角色也逐漸從成本中心演變?yōu)闃I(yè)務(wù)平臺和贏利中心。
呼叫中心的發(fā)展大致經(jīng)歷了如下三個階段:
第一代:熱線電話。該方式實現(xiàn)簡單,但是功能單一,擴(kuò)展性差。
第二代:計算機(jī)+板卡?;诎蹇ǖ暮艚兄行氖怯上到y(tǒng)集成商按照客戶的具體需求,將不同廠家的板卡集成到一個系統(tǒng)中,按照客戶要求的專項定制,其成本低廉、設(shè)計靈活,但其實現(xiàn)的功能較專用,功能的升級以及規(guī)模的穩(wěn)定性難于保障。
第三代:基于CTI,排隊機(jī)+計算機(jī)網(wǎng)絡(luò)+三層數(shù)據(jù)庫訪問結(jié)構(gòu)?;谝惑w化的呼叫中心既有電信級的穩(wěn)定性和強(qiáng)大的交換功能,又有開發(fā)實施便捷和成本相對較合理的優(yōu)點。隨著越來越多的企業(yè)應(yīng)用呼叫中心,企業(yè)面臨著如何使呼叫中心在技術(shù)發(fā)展上更進(jìn)一步的問題?,F(xiàn)代通訊系統(tǒng)技術(shù)、互聯(lián)網(wǎng)技術(shù)和交互式視頻信號系統(tǒng)的發(fā)展將作用于呼叫中心,使其向著智能化、個人化、多媒體化、網(wǎng)絡(luò)化、移動化發(fā)展?;ヂ?lián)網(wǎng)呼叫中心、多媒體呼叫中心以及虛擬呼叫中心在未來中國市場,也將隨著企業(yè)對呼叫中心認(rèn)識程度的進(jìn)一步提高、客戶關(guān)系管理市場及設(shè)備制造商的全力推動而得到推廣。
新一代呼叫中心的系統(tǒng)結(jié)構(gòu)如圖1所示。
3 呼叫中心關(guān)鍵技術(shù)
雖然隨著技術(shù)的進(jìn)展Web、E-mail、傳真等多種接入方式出現(xiàn),但就實際應(yīng)用而言,這些先進(jìn)的接入方式應(yīng)用得還很少,傳統(tǒng)的電話接入處理和IVR應(yīng)答仍然是使用率最高的技術(shù)方式。所以,可以將語音和數(shù)據(jù)融合的技術(shù)就成為呼叫中心的關(guān)鍵技術(shù),最重要的主要有如下三種:文語轉(zhuǎn)換(TTS)技術(shù)、語音識別(ASR)技術(shù)和Voice
XML。這幾種技術(shù)對呼叫中心的自動語音服務(wù)和電話與計算機(jī)、Internet的結(jié)合起著至關(guān)重要的作用。
3.1 TTS技術(shù)
語音合成,又稱為文語轉(zhuǎn)化(Text-to-Speech),涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、多媒體等多種學(xué)科,是中文信息處理領(lǐng)域的一項前沿技術(shù)。語音合成技術(shù)解決的主要問題是:如何將電子化文本的文字信息轉(zhuǎn)化為能夠播放的聲音信息。近代語音合成技術(shù)是隨著計算機(jī)技術(shù)和數(shù)字信號處理技術(shù)的發(fā)展而發(fā)展起來的,目的是讓計算機(jī)能夠產(chǎn)生高清晰度、高自然度的連續(xù)語音,近幾十年來國際和國內(nèi)的研究主要集中在按規(guī)則文語轉(zhuǎn)換,即將書面語言轉(zhuǎn)換成口頭語言。
在語音合成技術(shù)應(yīng)用之前,錄音回放一直是呼叫中心自動語音服務(wù)中所采用的主要手段,但是隨著多媒體信息需求的增大,語音服務(wù)系統(tǒng)中近年來應(yīng)用TSS技術(shù)得到了迅速發(fā)展。
TSS和錄音回放相比具有以下優(yōu)勢:
(1)就工作量而言,錄音需要大量的人力,在信息量以幾何級數(shù)增長的今天,錄音往往無法滿足信息的供給,而語音合成將絕大多數(shù)工作由機(jī)器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。
(2)對于動態(tài)的信息,尤其是對實時性要求很高的信息,如股票行情等,如果讓錄音員錄音則至少在半小時后才能對外提供,而語音合成可以實現(xiàn)實時的轉(zhuǎn)換,每分鐘可刷新一次。
(3)由于信息的高速增長,錄音數(shù)據(jù)存放和查詢也存在問題。將信息以文本形式存儲在計算機(jī)中可節(jié)約大量系統(tǒng)資源再結(jié)合計算機(jī)技術(shù)對數(shù)據(jù)庫中的信息進(jìn)行搜索和整理將輸出的結(jié)果用語音合成轉(zhuǎn)換成聲音,這樣就可以解決信息服務(wù)中海量信息的存儲和查詢的問題。
(4)錄音的信息維護(hù)、修改的工作量比較大。而文本信息的維護(hù)和修改相對要容易得多,通過語音合成技術(shù)只需對文本信息進(jìn)行修改就可以完成信息內(nèi)容的更改和維護(hù)工作。
新一代呼叫中心的系統(tǒng)結(jié)構(gòu)如圖1所示。
3 呼叫中心關(guān)鍵技術(shù)
雖然隨著技術(shù)的進(jìn)展Web、E-mail、傳真等多種接入方式出現(xiàn),但就實際應(yīng)用而言,這些先進(jìn)的接入方式應(yīng)用得還很少,傳統(tǒng)的電話接入處理和IVR應(yīng)答仍然是使用率最高的技術(shù)方式。所以,可以將語音和數(shù)據(jù)融合的技術(shù)就成為呼叫中心的關(guān)鍵技術(shù),最重要的主要有如下三種:文語轉(zhuǎn)換(TTS)技術(shù)、語音識別(ASR)技術(shù)和Voice
XML。這幾種技術(shù)對呼叫中心的自動語音服務(wù)和電話與計算機(jī)、Internet的結(jié)合起著至關(guān)重要的作用。
3.1 TTS技術(shù)
語音合成,又稱為文語轉(zhuǎn)化(Text-to-Speech),涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、多媒體等多種學(xué)科,是中文信息處理領(lǐng)域的一項前沿技術(shù)。語音合成技術(shù)解決的主要問題是:如何將電子化文本的文字信息轉(zhuǎn)化為能夠播放的聲音信息。近代語音合成技術(shù)是隨著計算機(jī)技術(shù)和數(shù)字信號處理技術(shù)的發(fā)展而發(fā)展起來的,目的是讓計算機(jī)能夠產(chǎn)生高清晰度、高自然度的連續(xù)語音,近幾十年來國際和國內(nèi)的研究主要集中在按規(guī)則文語轉(zhuǎn)換,即將書面語言轉(zhuǎn)換成口頭語言。
在語音合成技術(shù)應(yīng)用之前,錄音回放一直是呼叫中心自動語音服務(wù)中所采用的主要手段,但是隨著多媒體信息需求的增大,語音服務(wù)系統(tǒng)中近年來應(yīng)用TSS技術(shù)得到了迅速發(fā)展。
TSS和錄音回放相比具有以下優(yōu)勢:
(1)就工作量而言,錄音需要大量的人力,在信息量以幾何級數(shù)增長的今天,錄音往往無法滿足信息的供給,而語音合成將絕大多數(shù)工作由機(jī)器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。
(2)對于動態(tài)的信息,尤其是對實時性要求很高的信息,如股票行情等,如果讓錄音員錄音則至少在半小時后才能對外提供,而語音合成可以實現(xiàn)實時的轉(zhuǎn)換,每分鐘可刷新一次。
(3)由于信息的高速增長,錄音數(shù)據(jù)存放和查詢也存在問題。將信息以文本形式存儲在計算機(jī)中可節(jié)約大量系統(tǒng)資源再結(jié)合計算機(jī)技術(shù)對數(shù)據(jù)庫中的信息進(jìn)行搜索和整理將輸出的結(jié)果用語音合成轉(zhuǎn)換成聲音,這樣就可以解決信息服務(wù)中海量信息的存儲和查詢的問題。
(4)錄音的信息維護(hù)、修改的工作量比較大。而文本信息的維護(hù)和修改相對要容易得多,通過語音合成技術(shù)只需對文本信息進(jìn)行修改就可以完成信息內(nèi)容的更改和維護(hù)工作。
目前TTS技術(shù)已經(jīng)十分成熟,現(xiàn)在的研究主要集中在生成的漢語語音的清晰度和自然度上,而且通過一些參數(shù)做到語氣語調(diào)的調(diào)整,使得語音更接近真人播音。
3.2 ASR技術(shù)
語音識別的研究工作大約開始于20世紀(jì)50年代,當(dāng)時AT&;T Bell實驗室實現(xiàn)了第一個可識別10個英文數(shù)字的語音識別系統(tǒng)?Audry系統(tǒng)。在隨后的幾十年間實驗室的研究一直處于不斷進(jìn)展中,但是畢竟語音識別是一項復(fù)雜的技術(shù),特別對于漢語語音識別尤其如此,因此,盡管多年前就有眾多公司和研究機(jī)構(gòu)開始了語音識別技術(shù)的研究,但直到最近幾年,在國內(nèi)才開始出現(xiàn)商業(yè)化產(chǎn)品。
應(yīng)用于呼叫中心領(lǐng)域的語音識別技術(shù)有別于一般PC系統(tǒng)所使用的語音識別技術(shù),其面臨的困難體現(xiàn)為:電話錄音質(zhì)量差,識別率要求高,系統(tǒng)不能對電話用戶進(jìn)行訓(xùn)練;另外,系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求,這就對應(yīng)用于呼叫中心領(lǐng)域的語音識別技術(shù)在功能和性能上要有更高要求。由于存在上面列舉的種種困難,使得應(yīng)用于呼叫中心領(lǐng)域的ASR技術(shù)不可能像應(yīng)用于PC的ASR技術(shù)一樣,能夠隨心所欲地識別用戶所說的任何詞匯。目前基于電話的語音識別應(yīng)用主要是非特定人的命令識別,該技術(shù)的應(yīng)用有效的解決了電話用戶按鍵輸入范圍有限,操作不方便的問題。目前ASR的廠商均支持中文普通話、英文的識別,而且只要普通話標(biāo)準(zhǔn),識別正確率可以達(dá)到90%以上,部分廠商支持中英文混讀和其它語種(主要是粵語)的識別。
但是目前ASR技術(shù)在實際應(yīng)用中仍舊存在的主要問題是漢語的方言多種多樣,口音千差萬別,很多地方的普通話說得很不標(biāo)準(zhǔn),給識別帶來很大困難。
3.2 ASR技術(shù)
語音識別的研究工作大約開始于20世紀(jì)50年代,當(dāng)時AT&;T Bell實驗室實現(xiàn)了第一個可識別10個英文數(shù)字的語音識別系統(tǒng)?Audry系統(tǒng)。在隨后的幾十年間實驗室的研究一直處于不斷進(jìn)展中,但是畢竟語音識別是一項復(fù)雜的技術(shù),特別對于漢語語音識別尤其如此,因此,盡管多年前就有眾多公司和研究機(jī)構(gòu)開始了語音識別技術(shù)的研究,但直到最近幾年,在國內(nèi)才開始出現(xiàn)商業(yè)化產(chǎn)品。
應(yīng)用于呼叫中心領(lǐng)域的語音識別技術(shù)有別于一般PC系統(tǒng)所使用的語音識別技術(shù),其面臨的困難體現(xiàn)為:電話錄音質(zhì)量差,識別率要求高,系統(tǒng)不能對電話用戶進(jìn)行訓(xùn)練;另外,系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求,這就對應(yīng)用于呼叫中心領(lǐng)域的語音識別技術(shù)在功能和性能上要有更高要求。由于存在上面列舉的種種困難,使得應(yīng)用于呼叫中心領(lǐng)域的ASR技術(shù)不可能像應(yīng)用于PC的ASR技術(shù)一樣,能夠隨心所欲地識別用戶所說的任何詞匯。目前基于電話的語音識別應(yīng)用主要是非特定人的命令識別,該技術(shù)的應(yīng)用有效的解決了電話用戶按鍵輸入范圍有限,操作不方便的問題。目前ASR的廠商均支持中文普通話、英文的識別,而且只要普通話標(biāo)準(zhǔn),識別正確率可以達(dá)到90%以上,部分廠商支持中英文混讀和其它語種(主要是粵語)的識別。
但是目前ASR技術(shù)在實際應(yīng)用中仍舊存在的主要問題是漢語的方言多種多樣,口音千差萬別,很多地方的普通話說得很不標(biāo)準(zhǔn),給識別帶來很大困難。
此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。