《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 從開(kāi)放域機(jī)器人構(gòu)建出發(fā),聊聊如何與機(jī)器人吹水

從開(kāi)放域機(jī)器人構(gòu)建出發(fā),聊聊如何與機(jī)器人吹水

2020-02-13
來(lái)源:搜狐科技
關(guān)鍵詞: 開(kāi)放域 機(jī)器人 吹水

  作者從自己的實(shí)際工作出發(fā),以兒童機(jī)器人場(chǎng)景為例,從多個(gè)角度對(duì)如何構(gòu)建閑聊機(jī)器人進(jìn)行了闡述,并分享了與機(jī)器人“吹水的”價(jià)值、方式方法以及背后原理。

1.jpeg

  一、機(jī)器人概述

  機(jī)器人按照對(duì)話方式,可以分為“問(wèn)答機(jī)器人”、“任務(wù)對(duì)話機(jī)器人”、“開(kāi)放閑聊機(jī)器人”。但機(jī)器人的落地使用過(guò)程中,往往需要不同作用的機(jī)器人進(jìn)行結(jié)合。

  拿電器類客服機(jī)器人舉例來(lái)說(shuō),會(huì)有如下對(duì)話:

  用戶:“包安裝嗎”

  機(jī)器人:”我們是包安裝的哦,親“

  以上是我們最常見(jiàn)的問(wèn)答場(chǎng)景,機(jī)器人通過(guò)檢索方式,找出query對(duì)應(yīng)的answer返回給用不。

  再比如:

  用戶:“我要查物流”

  機(jī)器人:“您要查詢的是哪個(gè)訂單”(提供訂單A&訂單B&訂單C)

  用戶:選擇A

  機(jī)器人:該貨品目前已經(jīng)由順豐發(fā)出。

  在以上場(chǎng)景中,機(jī)器人需要通過(guò)多輪方式完成查物流的任務(wù)。

  這就像咱人一樣,在工作中,不僅需要有決策和解決問(wèn)題的能力,還需要有日常溝通能力,任何一項(xiàng)都是不可或缺的。

  由于工作中接觸了各類機(jī)器人,對(duì)于開(kāi)放域聊天內(nèi)容的感觸比較深的是,閑聊本身在機(jī)器人的場(chǎng)景中,作用會(huì)相對(duì)弱一些,但大部分時(shí)候,又屬于機(jī)器人的基本能力,屬于典型的“得不到的永遠(yuǎn)在騷動(dòng),得到的有恃無(wú)恐”。

  而目前市面上的機(jī)器人介紹文檔,一方面關(guān)于閑聊的內(nèi)容不多,絕大部分是任務(wù)型和檢索性的文章;另一方面,閑聊的介紹更偏向于技術(shù)實(shí)現(xiàn)方式。但小七我認(rèn)為,想要做好開(kāi)放域聊天,其實(shí)不能只考慮技術(shù)實(shí)現(xiàn),而應(yīng)該從產(chǎn)品本身出發(fā)。

  所以今天,小七結(jié)合之前做開(kāi)放域機(jī)器人的實(shí)操過(guò)程,主要以兒童機(jī)器人場(chǎng)景為例子,從不同角度來(lái)闡述如何構(gòu)建閑聊機(jī)器人,跟著我燥起來(lái)!

  二、吹水的價(jià)值

  閑聊,俗稱“吹水”。朋友間吹水,講究開(kāi)心就好。所以,閑聊是一個(gè)雙方都帶有情感訴求的過(guò)程,可以是解悶逗樂(lè),也可以是哭訴慰藉。

  基于此,如果用戶與機(jī)器人進(jìn)行閑聊互動(dòng),必定是希望機(jī)器人能引起其情感的共鳴和變化。如下對(duì)話是用戶跟“小愛(ài)同學(xué)”(小米音箱)的對(duì)話:

  用戶:小愛(ài)同學(xué),放個(gè)屁

  robot:矮油,人家是女孩紙,怎么會(huì)做這么羞羞的事情。既然主人想要聽(tīng)放屁,我就勉為其難放一個(gè),放的不好可不許怪我哦。

  噗~~

  用戶在這次對(duì)話中,讓小愛(ài)同學(xué)放屁,純粹是逗樂(lè)找趣。同時(shí),機(jī)器人的反應(yīng)也是有一定套路,讓用戶感受到,這是一個(gè)可以給自己帶來(lái)樂(lè)趣的朋友。

  當(dāng)一個(gè)朋友情商特別高,能夠在自己傷心時(shí)給予安慰,無(wú)聊時(shí)帶來(lái)樂(lè)趣,開(kāi)心時(shí)互相分享,任何一個(gè)人都會(huì)很感激有這樣的益友,讓人離不開(kāi)。

  比如用戶面前有一個(gè)娛樂(lè)機(jī)器人,前者習(xí)慣性會(huì)以人與人交流的形式來(lái)進(jìn)行對(duì)話。這時(shí)候,機(jī)器人不能而不是“直男”,顧著解決問(wèn)題,也應(yīng)該是一個(gè)情商高的朋友,感知用戶的情感,并在回復(fù)時(shí)伴隨著相應(yīng)的情感,讓用戶感受到樂(lè)趣和溫度。

  只有這樣子,用戶才能與機(jī)器人做更多交互,提高用戶粘性,而不是“仰天嘲笑出門(mén)去,AI都是智障人”?

  三、如何吹水

  用戶如果有意和機(jī)器人扯犢子吹水,必然會(huì)有”像人“的期望值。這個(gè)標(biāo)準(zhǔn)說(shuō)起來(lái)簡(jiǎn)單,做起來(lái)相當(dāng)?shù)秒y,畢竟nlp技術(shù)還真沒(méi)達(dá)到完全理解人類的水平。

  如果我們換個(gè)角度,如《西部世界》中所講,機(jī)器人如果擁有了記憶,便開(kāi)始進(jìn)化成有意識(shí)的生物了。同樣的,對(duì)于【像人】(類似有意識(shí))這個(gè)狀態(tài),我們可以抽象出一些特質(zhì),機(jī)器人如果擁有了這些特征后,能讓用戶覺(jué)得還不錯(cuò),愿意聊下去。

  那以下是筆者從過(guò)往做閑聊機(jī)器人過(guò)程中所抽象出的特質(zhì),下面會(huì)一一做介紹。

2.png

  1. 人設(shè)一致性

 ?。?)人設(shè)一致性的意義

  每個(gè)社會(huì)人都有自己統(tǒng)一的人設(shè),包括身份、性別、形象、性格、愛(ài)好等,人與人之間也是基于這個(gè)“本”在對(duì)話。即使是路上的陌生人問(wèn)路,也會(huì)先根據(jù)對(duì)方的形象、性別稱呼,比如路上經(jīng)常有人找我問(wèn)路,都會(huì)說(shuō):“你好,帥哥”。而這稱呼,本身就是一個(gè)人物設(shè)定的表現(xiàn)。如果一個(gè)人人設(shè)不一致,有時(shí)候東,有時(shí)候西,那要么是這個(gè)人太戲精,要么就是神經(jīng)錯(cuò)亂,比如下面這個(gè)人:

  A:你是誰(shuí)

  B:我是來(lái)自廣東的產(chǎn)品經(jīng)理

  A:那你平時(shí)工作都在干嘛

  B:我在畫(huà)建筑設(shè)計(jì)圖,敲代碼,修空調(diào)。

  A:(這恐怕是個(gè)假的產(chǎn)品經(jīng)理吧)

  機(jī)器人也一樣,需要立個(gè)人設(shè)在用戶前面,才能讓后者有真實(shí)感,安全感。如果機(jī)器人沒(méi)有人設(shè),會(huì)讓聊天變得異常怪異。有時(shí)候回答不上來(lái)、有時(shí)候亂回答,有時(shí)候上句不接下句,用戶會(huì)認(rèn)為亂七八糟,溝通不了。就如Cathy Pearl在《語(yǔ)言用戶界面設(shè)計(jì)》中所說(shuō):“人物模型的一致性,使人們能夠在與它們溝通時(shí)得以預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么”。

 ?。?)設(shè)計(jì)方式

  那我們要如何設(shè)定機(jī)器人的人設(shè)呢?平時(shí)我們要了解一個(gè)人,一般會(huì)從其背景信息出發(fā),如名字、家鄉(xiāng)、職業(yè)、愛(ài)好等;其次,通過(guò)其談吐舉止,也可以了解一個(gè)人的性格特征。

  關(guān)于機(jī)器人的背景,我們需要給到它一個(gè)故事?!段鞑渴澜纭分校總€(gè)機(jī)器人都有自己的身份和劇本。但用戶會(huì)問(wèn)機(jī)器人的哪些背景信息呢?事實(shí)是,不大可能枚舉出一個(gè)人的所有背景信息,就連人都可能忘了自己很多以前的事兒。

  這里我們可以從日常提問(wèn)(高頻問(wèn)題)入手。以兒童機(jī)器人為例,在我們之前做的項(xiàng)目中,從線上交互數(shù)據(jù)看出,咨詢機(jī)器人背景信息的query占了所有交互數(shù)據(jù)的10%以上。這類問(wèn)題包括:

  機(jī)器人的身份是什么?姓名、年齡、生日、星座、家鄉(xiāng)等

  機(jī)器人的能力是什么?

  機(jī)器人的愛(ài)好是什么?

  機(jī)器人的家庭背景、社交背景是怎么樣的?

  另一方面,我們需要設(shè)計(jì)機(jī)器人的性格特點(diǎn),以此來(lái)體現(xiàn)其談吐。性格特點(diǎn)可以是風(fēng)趣、自信、忠誠(chéng),亦或是調(diào)皮、溫暖、腹黑。

  最終我們可以有這么一個(gè)故事:

  我們要?jiǎng)?chuàng)造一個(gè)兒童機(jī)器人,叫小七,男生,獅子座,關(guān)鍵很帥,來(lái)自泰坦星永恒一組,由于星球?yàn)l臨滅絕,爸爸媽媽送他到了地球,所以他留在地球和人類愉快地生活。小七性格幽默,樂(lè)于助人,但有時(shí)候也有些腹黑,還有些喜歡掉書(shū)袋,教育小朋友。

  (3)產(chǎn)品舉例

  筆者也找了市面上做botframework的平臺(tái),這類產(chǎn)品的側(cè)重點(diǎn)主要在于技能定制及模型訓(xùn)練,而對(duì)于人設(shè)很少涉及。后面發(fā)現(xiàn)以下兩個(gè)平臺(tái)有相關(guān)設(shè)定,其中:圖靈機(jī)器人涉及到的屬性有性別、年齡、星座、爸爸媽媽;海知涉及的屬性包括姓名、性別、生日、喜好和爸爸媽媽。人設(shè)內(nèi)容不多,但這類機(jī)器人基礎(chǔ)配置,還是必不可少的。

  圖靈機(jī)器人人設(shè)頁(yè)面:

3.png

  海知ruyi機(jī)器人人設(shè)頁(yè)面:

4.png

  2. 語(yǔ)言風(fēng)格設(shè)定

 ?。?)意義與設(shè)計(jì)方式

  語(yǔ)言風(fēng)格首先要符合人設(shè)特點(diǎn)。幽默的性格,機(jī)器人的回復(fù)就需要搞笑輕松一些,若是嚴(yán)謹(jǐn)?shù)男愿?,機(jī)器人說(shuō)話就需要嚴(yán)肅。想象一下,一個(gè)在法院的政務(wù)機(jī)器人,當(dāng)你問(wèn)它你會(huì)啥的時(shí)候,它說(shuō)會(huì)泡妞撩妹,那場(chǎng)面真的會(huì)難以控制。

  比如前面提到的小七喜歡掉書(shū)袋,那我們可以在小孩子玩游戲很久之后,提醒小朋友需要休息一下,然后看看書(shū),或者引導(dǎo)其來(lái)學(xué)習(xí)古詩(shī)詞。

  確定了語(yǔ)言風(fēng)格之后,就需要將這種性格特點(diǎn)體現(xiàn)在機(jī)器人的對(duì)話中。我們可以從用戶所有query中,抽象高頻場(chǎng)景進(jìn)行針對(duì)性設(shè)定,使得機(jī)器人人設(shè)和說(shuō)話風(fēng)格一致,更像一個(gè)人在聊天,這也是我們最終的預(yù)期效果。

  而在這個(gè)過(guò)程中,為了讓機(jī)器人顯得更加擬人化,我們也嘗試加入了一些類似口頭禪的feature,比如有的人習(xí)慣以“呃”來(lái)開(kāi)始,有的人喜歡說(shuō)“然后”來(lái)銜接。

 ?。?)產(chǎn)品舉例

  在以往例子中,我們所發(fā)現(xiàn)的其中一個(gè)高頻場(chǎng)景是:用戶會(huì)重復(fù)問(wèn)同一個(gè)問(wèn)題(不知道是不是都是一些智能程度檢驗(yàn)師在聊天,尷尬)。這種情況是極不建議機(jī)器人一直是單一回復(fù),那就成了一個(gè)對(duì)話復(fù)讀機(jī)了。而微軟小冰對(duì)于用戶這種互動(dòng),結(jié)合了她自己的人設(shè)和語(yǔ)言風(fēng)格來(lái)回應(yīng)(比如:撒嬌、傲氣)。

  我們可以探索下微軟小冰的策略:

5.png

6.png

  小冰的策略是,針對(duì)同個(gè)問(wèn)題,給出不同的回復(fù)。若用戶重復(fù)太多次,小冰會(huì)有情緒的變化,慢慢地顯得不耐煩,并且開(kāi)始責(zé)怪用戶,到最后干脆不回答了,直到用戶說(shuō)其他內(nèi)容,就回復(fù)“你終于不說(shuō)重復(fù)的話啦~”。從中我們可以看出,小冰的語(yǔ)言是很活動(dòng)調(diào)皮并且較為傲嬌的。

  也只有這樣豐富的語(yǔ)言體現(xiàn),用戶才更相信對(duì)面是個(gè)可以聊天的朋友,而不是一個(gè)無(wú)聊的智障機(jī)器人。

  3. 個(gè)性化

 ?。?)個(gè)性化意義

  如同政治課本中的一句話:世界上不會(huì)有完全一樣的葉子。即使如雙胞胎,也會(huì)有各自的個(gè)性。我們過(guò)往發(fā)生的每件事情,讓我們形成了特有的世界觀,價(jià)值觀,人生觀。三觀決定了每個(gè)人的思想不同,而語(yǔ)言是思想的折射,從而讓每個(gè)人談吐都是與眾不同的。

  相應(yīng)的,機(jī)器人也應(yīng)該有自己的過(guò)往記憶,從而形成自己與眾不同的三觀。 這樣,每個(gè)機(jī)器人都是個(gè)性化的,就跟我們不同性格的朋友一樣。

 ?。?)設(shè)計(jì)方式

  當(dāng)然,如果要記住所有的事情,對(duì)于機(jī)器人來(lái)說(shuō)是困難的,也會(huì)顯得沒(méi)有意義,畢竟人也有記性差的時(shí)候。那機(jī)器人需要有什么記憶呢?除了剛才的背景信息,最重要的,是要記住它的主人,即用戶。

  也就是說(shuō),機(jī)器人需要能記住自己主人相關(guān)的信息,包括姓名、性別、愛(ài)好等方面,甚至某些過(guò)往的交互行為。這樣,當(dāng)某個(gè)用戶A擁有了一款能記住機(jī)子的機(jī)器人,即使市面上有其他機(jī)器人,對(duì)用戶來(lái)說(shuō),這個(gè)機(jī)器人小伙伴都是獨(dú)一無(wú)二的。

  那要記住用戶,首先得有個(gè)收集用戶畫(huà)像的過(guò)程。這各場(chǎng)景就跟男生想要了解妹紙一樣,要么是自己主動(dòng)了解(撩),要么是自己通過(guò)細(xì)心觀察(備胎式方案),被動(dòng)了解。

  1)主動(dòng)了解型

  如果機(jī)器人想主動(dòng)去了解用戶,就需要找準(zhǔn)時(shí)機(jī),否則會(huì)顯得十分突兀,甚至讓用戶產(chǎn)生防備心理。

  一般來(lái)說(shuō),最好的時(shí)機(jī),應(yīng)該是兩個(gè)朋友相互了解的時(shí)候。具體我們可以看以下例子:

  用戶:你叫什么名字呀?

  機(jī)器人:我叫小七。主人你呢?

  用戶:我叫小八,你好呀。

  機(jī)器人:你好,小八。我知道自己主人叫啥了,好開(kāi)心!

  用戶:你會(huì)做什么呢?

  機(jī)器人:唱歌跳舞,啥都會(huì)呢。小八,你平時(shí)喜歡干什么呢?

  用戶:我也喜歡唱歌呢。

  機(jī)器人在這樣的互動(dòng)中,能夠了解到用戶的興趣愛(ài)好,并記憶下來(lái)。而用戶也會(huì)覺(jué)得這個(gè)機(jī)器人真的像自己的玩伴,從而更愿意與其玩下去。

  2)細(xì)心觀察型

  當(dāng)然,如果機(jī)器人能夠細(xì)心留意用戶以往說(shuō)的話,也可以從中了解很多信息,從而做出很驚艷的交互表現(xiàn)。比如:

 ?。ㄔ缟希?/p>

  用戶:早上好

  機(jī)器人:早上好,小八。今天周末天氣很好,小八有打算去哪里玩嗎?

  用戶:今天要跟爸爸媽媽去動(dòng)物園。

  機(jī)器人:聽(tīng)起來(lái)很棒呀。要玩得開(kāi)心哦

  (晚上)

  用戶:晚上好。

  機(jī)器人:小八呀,今天去動(dòng)物園玩了一天,能跟我講講都玩了什么了嗎

  用戶:我今天看了斑馬、獅子、孔雀。。。。

  機(jī)器人:好像很好玩呀。下次小八帶著小七一起去,好不好

  機(jī)器人不僅能記憶,而且記性也好,讓小朋友感覺(jué)真的有在關(guān)注自己,也讓家長(zhǎng)相信機(jī)器人確實(shí)是一個(gè)好陪伴,讓孩子不會(huì)孤單。

  通過(guò)這樣的記憶,讓每個(gè)機(jī)器人都成為特有的存在。每個(gè)小朋友都有陪伴自己成長(zhǎng)的專屬的玩伴。

  P.S.當(dāng)家里有兩個(gè)小朋友的時(shí)候,如果希望機(jī)器人能夠記住用戶是誰(shuí),我們也可以通過(guò)聲紋識(shí)別方式記住不同用戶的名稱。

  4. 主動(dòng)引導(dǎo)

  (1)意義

  一個(gè)相對(duì)智能的吹水機(jī)器人算是擺在這里了。但事實(shí)告訴我們,如果只是這樣,用戶不會(huì)一直和他聊下去。市面上很多機(jī)器人會(huì)宣稱自己有很多能力,可以陪伴小孩子,還可以教小朋友數(shù)學(xué)、英語(yǔ)等等。咱先不說(shuō)這些能力有沒(méi)有用,好不好玩,到底能不能被用戶觸發(fā),才是首要考慮的問(wèn)題。

  想象一下,兩個(gè)人在聊天,永遠(yuǎn)是其中一方在找話題,另一方只是在附和,就算話癆也不可能永遠(yuǎn)有話題。而且,用戶往往不知道要和機(jī)器人聊啥,尷尬的氣氛會(huì)讓前者失去聊下去的興趣。所以,通過(guò)機(jī)器人主動(dòng)引導(dǎo)來(lái)找話題,從而讓用戶不斷來(lái)聊天,便顯得尤為重要。

 ?。?)設(shè)計(jì)方式

  設(shè)計(jì)主動(dòng)引導(dǎo)的時(shí)候,產(chǎn)品經(jīng)理需要講究策略,主要解決三個(gè)關(guān)鍵點(diǎn):內(nèi)容、時(shí)機(jī)、話術(shù)。

  1)引導(dǎo)內(nèi)容

  選擇引導(dǎo)什么內(nèi)容,這個(gè)取決于機(jī)器人的能力和定位,比如一個(gè)寓教于樂(lè)的機(jī)器人,應(yīng)該多讓小朋友做數(shù)字游戲、詩(shī)詞游戲等互動(dòng)。同時(shí),機(jī)器人如果學(xué)習(xí)(上線)了一些新的能力,也需要及時(shí)引導(dǎo)用戶來(lái)體驗(yàn),保證用戶的活躍度。

  2)引導(dǎo)時(shí)機(jī)

  對(duì)于時(shí)間點(diǎn)的問(wèn)題,我們可以選擇在開(kāi)頭、過(guò)程中以及結(jié)尾三個(gè)timing去觸發(fā)。

  比較常見(jiàn)會(huì)在用戶喚醒機(jī)器人時(shí)候去引導(dǎo)其體驗(yàn)?zāi)芰Γ缦耤ase便是小度音箱在過(guò)年期間的能力引導(dǎo),會(huì)在用戶開(kāi)始閑聊之后,直接推薦響應(yīng)技能。

  user:小度小度,晚上好

  小度:晚上好呀。先來(lái)看看明天的天氣吧,稍后還有精彩節(jié)目等著你哦~

  小度:明天天氣xxxxx

  小度:我為您整理了一些收聽(tīng)率很高的節(jié)目,聽(tīng)聽(tīng)看吧,覺(jué)得不喜歡可以跟我說(shuō)“換個(gè)臺(tái)”

  但如果每次都在喚醒時(shí)引導(dǎo)就會(huì)顯得特別生硬。我們想象一下,兩個(gè)朋友在扯皮吹水,一般是從一個(gè)話題突然想到其他話題就開(kāi)聊了。同理,用戶跟機(jī)器人聊天,也應(yīng)該允許雙方聊著聊著就扯到其他話題的。

  我們也不必在所有聊天內(nèi)容中去想辦法做話題引導(dǎo)。首先,應(yīng)該找出用戶的高頻聊天場(chǎng)景中,比如小朋友會(huì)經(jīng)常讓機(jī)器人講笑話,講完后就可以引導(dǎo)做其他寓教于樂(lè)的游戲。當(dāng)然,實(shí)際情況不可能如此簡(jiǎn)單暴力,觸發(fā)條件需要做權(quán)重計(jì)算,包括用戶各類技能的觸發(fā)次數(shù)、其他引導(dǎo)場(chǎng)景的觸發(fā)頻率、歷史引導(dǎo)的用戶反饋(如用戶說(shuō):我不喜歡)等。

  最后就是在結(jié)尾的timing做引導(dǎo),也就是當(dāng)雙方都陷入沉默的尷尬氣氛的時(shí)候。拿小米音箱舉例,由于是全雙工喚醒,當(dāng)用戶每隔15s沒(méi)有說(shuō)話,則會(huì)主動(dòng)引導(dǎo)一次,連續(xù)三次引導(dǎo)無(wú)果才會(huì)退出喚醒狀態(tài)。比如:“主人你去哪兒了?告訴你哦,我最近新學(xué)了一項(xiàng)技能,要不要跟我一起玩呢”。這樣可以引起用戶聊下去的興趣,開(kāi)始新的話題,保證cps的數(shù)據(jù)上漲。

  3)引導(dǎo)話術(shù)

  至于最后的引導(dǎo)話術(shù),因?yàn)椴煌瑘?chǎng)景的話術(shù)是不一樣的,所以要保證與我們先前講的語(yǔ)言風(fēng)格一致,至少不能讓一個(gè)很嚴(yán)肅的學(xué)霸型機(jī)器人突然撒嬌說(shuō):“跟人家聊點(diǎn)別的東東嘛~”

  5. 趣味性

  所謂好看的皮囊千篇一律,有趣的靈魂萬(wàn)里挑一。說(shuō)到底,一個(gè)chatbot如果不好玩,再怎么折騰也沒(méi)用。另一方面,聊天機(jī)器人始終是一個(gè)To C的產(chǎn)品,通過(guò)運(yùn)營(yíng)好玩的內(nèi)容,保證活躍和留存是相當(dāng)重要的。這往往能給到用戶意想不到的驚喜,從而產(chǎn)生持續(xù)對(duì)話的興趣。

  如何讓閑聊變得好玩,就不得不提小冰的套路了。一方面,小冰日常會(huì)更新技能,不斷刺激用戶去體驗(yàn);另一方面,也會(huì)在各種聊天中皮一皮,讓用戶相信這是個(gè)有趣的“朋友”,比如上文提到的對(duì)于用戶故意使壞,一直重復(fù)單句的場(chǎng)景。

  再比如,小冰曾經(jīng)更新一個(gè)“讀心術(shù)”的技能,也就是在15個(gè)問(wèn)題之內(nèi)猜出用戶心里想的人物是誰(shuí)。利用ID3決策樹(shù)等算法先將人物及特征作為訓(xùn)練樣本,再讓小冰反問(wèn)用戶,為每個(gè)特征分類,最后選中用戶的“心上人”。

  通過(guò)這一個(gè)個(gè)的小游戲,可以讓用戶不斷產(chǎn)生愉悅感及下次的期待感,朋友之間也是這樣,總有一些共同話題和興趣活動(dòng),才能讓雙方成為知己。

  之前設(shè)計(jì)閑聊機(jī)器人時(shí),小七也設(shè)定了某些套路策略。比如情人節(jié)前后的土味情話,每天用戶開(kāi)始進(jìn)行互動(dòng)的時(shí)候,以主動(dòng)消息的方式來(lái)發(fā)土味情話。當(dāng)時(shí)每天的土味情話在情人節(jié)期間還是帶來(lái)了不少的留存和活躍的。在實(shí)現(xiàn)方式上也比較簡(jiǎn)單,直接利用規(guī)則設(shè)定即可,ROI還是挺高的。

  user:打開(kāi)聊天女仆

  bot:主人你好呀。啊,你有沒(méi)有聞到什么味道?

  user:沒(méi)有啊/什么味/…

  bot:怎么你一出來(lái)空氣就甜炸了啊

  同樣的,兒童機(jī)器人更需要這樣的趣味性和新鮮感,畢竟兒童天性就是“喜新厭舊”。如果小玩伴每天都是玩同樣的游戲,說(shuō)同樣的話,到最后一定“沒(méi)朋友”。所以可以加入寓教于樂(lè)的兒童游戲,日常更新的兒童笑話,兒童故事,來(lái)吸引小朋友的注意,讓孩子喜歡上這個(gè)玩伴。

  6. 情感

  根據(jù)馬斯洛的需求層次理論,情感和歸屬(love and belonging)的需要是極為強(qiáng)烈的,缺乏該需求的人,往往會(huì)因?yàn)闆](méi)有感受到身邊人的關(guān)懷,而認(rèn)為沒(méi)有價(jià)值活在這世界上。而對(duì)于開(kāi)放域聊天機(jī)器人,市場(chǎng)往往會(huì)將其定位為陪伴,以提供一定程度的情感需求。因此,如何讓機(jī)器人感知用戶的喜怒哀樂(lè)并做情感陪伴,就有很大的必要性了。

  這里分為兩塊,其一是如何識(shí)別用戶情緒;其二是機(jī)器人如何做情感反饋。

 ?。?)情緒識(shí)別

  我們暫不討論情感識(shí)別的技術(shù)識(shí)別,而是從產(chǎn)品側(cè)分析機(jī)器人要識(shí)別哪些情緒,從數(shù)據(jù)角度,就是劃分哪些數(shù)據(jù)作為情感分類。

  情感有很多種,態(tài)度上有喜歡和討厭,心情上有悲傷和快樂(lè),人際上有疏遠(yuǎn)和冷漠,等等。選擇哪些情感場(chǎng)景做反饋,主要取決于兩點(diǎn):

  機(jī)器人定位:比如兒童陪伴場(chǎng)景,機(jī)器人對(duì)用戶的大部分情緒都應(yīng)該有敏感的識(shí)別,才能讓兒童感受到陪伴的意義;而法律機(jī)器人的閑聊場(chǎng)景,很多情感問(wèn)題可以不用太注重,機(jī)器人選擇統(tǒng)一回復(fù)即可。

  機(jī)器人回復(fù)內(nèi)容的顆粒度:比如在兒童場(chǎng)景中,小朋友罵了臟話,其實(shí)不需要了解具體罵的啥內(nèi)容,都應(yīng)該先引導(dǎo)小朋友文明用詞,所以臟話內(nèi)容的分類不需要太細(xì),只要是臟話就做統(tǒng)一回復(fù)即可。

  (2)情感反饋策略

  當(dāng)知道了用戶開(kāi)心、失望還是憤怒的情緒之后,身為“朋友”的機(jī)器人就需要有所回應(yīng)。針對(duì)不同的情緒分類,機(jī)器人可以有不同的策略。這里我們可以列一下兒童場(chǎng)景中集中回復(fù)策略:

  用戶生氣(說(shuō)臟話):小朋友不可以說(shuō)臟話哦,這樣我就不想跟你玩了,我只想跟文明的小孩做朋友呢~(教育策略)

  用戶生氣(無(wú)臟話):怎么了?有人惹你不開(kāi)心了嗎?沒(méi)事,有小七陪著你舒緩心情呢~不如跟我一起聽(tīng)首好聽(tīng)的兒歌放松放松吧(引導(dǎo)兒童場(chǎng)景)

  用戶失落:主人,成長(zhǎng)路上有不開(kāi)心的事情,也會(huì)有開(kāi)心的事情呢~至少小七一直陪著主人。對(duì)咯,我剛聽(tīng)了一個(gè)笑話,可笑死我了,我也讓主人開(kāi)心一下吧~(引導(dǎo)笑話場(chǎng)景)

  用戶害怕:主人你抱著我,就沒(méi)啥好怕的了,我們一起變勇敢!

  用戶開(kāi)心:主人開(kāi)心,小七就更開(kāi)心啦。但是,但是,你要陪小七讀詩(shī)詞的呢,不要忘了哦~(引導(dǎo)詩(shī)詞場(chǎng)景)

  總而言之,機(jī)器人的情感陪伴的最終效果,應(yīng)該是真正做到:不許騙我、罵我,要關(guān)心我;別人欺負(fù)我時(shí),你要在第一時(shí)間出來(lái)幫我;我開(kāi)心時(shí),你要陪我開(kāi)心;我不開(kāi)心時(shí),你要哄我開(kāi)心。嗯,最佳損友!

  7. 特別說(shuō)明:敏感詞處理

  根據(jù)2017年國(guó)家頒布的《網(wǎng)絡(luò)安全法》第47條和68條的規(guī)定,企業(yè)要保證自己的網(wǎng)絡(luò)運(yùn)營(yíng)平臺(tái)內(nèi)容安全,若出現(xiàn)敏感詞等違規(guī)行為將會(huì)收到行政處罰,甚至被勒令停業(yè)整改。而作為聊天機(jī)器人的產(chǎn)品設(shè)計(jì)者,需要保證機(jī)器人不亂說(shuō)話,否則牽連成本巨大。

  所以一般我們會(huì)設(shè)計(jì)一個(gè)敏感詞庫(kù),并且做日常維護(hù)更新。有了敏感詞庫(kù)之后,我們來(lái)看機(jī)器人的回復(fù)語(yǔ)料來(lái)源,主要由三種渠道:(1)人工添加;(2)網(wǎng)上爬?。?3)自動(dòng)生成。對(duì)于(1)(2),我們會(huì)考慮在錄入回復(fù)的地方做敏感詞過(guò)濾;而對(duì)于自動(dòng)生成的回復(fù),一般會(huì)在生成回復(fù)的時(shí)候,過(guò)濾掉敏感詞。

  嗯,做個(gè)聰明的機(jī)器人,知道什么該說(shuō),什么不該說(shuō)。

  四、吹水是怎么練成的

  這一章主要聊的是機(jī)器人的實(shí)現(xiàn)方式,除非是算法類的產(chǎn)品經(jīng)理,其他AI產(chǎn)品經(jīng)理的重點(diǎn)還在于用戶場(chǎng)景,所以這塊我們簡(jiǎn)單聊一下即可(畢竟說(shuō)了好多了,在這段感情中累了)。

  1. 檢索式閑聊實(shí)現(xiàn)

  基于對(duì)話式檢索的閑聊主要使用匹配句子相似度的方式,比如先將用戶消息及對(duì)話庫(kù)的分類轉(zhuǎn)換為句向量,再計(jì)算兩者之間的余弦距離以得到語(yǔ)義相似度,最終將相似度最高的分類對(duì)應(yīng)回復(fù)話術(shù)返回給用戶。

  想要轉(zhuǎn)換為句向量,由詞向量通過(guò)監(jiān)督方法或者無(wú)監(jiān)督方法獲得?,F(xiàn)在主流的詞向量模型有Word2Vec、BERT等。當(dāng)獲得了詞向量之后,可以通過(guò)各類模型獲得,如CNN、跳躍思維向量、快速思維向量。

  整體流程可以概括為:

 ?。?)將query做分詞等預(yù)處理,再通過(guò)Word2Vec、BERT等模型將分詞結(jié)果轉(zhuǎn)化為詞向量,再利用快速思維向量、跳躍思維向量等方式獲取句向量

 ?。?)將生成的句向量與模型模型已經(jīng)處理過(guò)的分類匹配,計(jì)算兩者余弦相似度,獲得相似度分值;

 ?。?)根據(jù)分值排序,選擇最佳相似問(wèn)句,將對(duì)應(yīng)answer返回。

  當(dāng)然,之前算法大大分享過(guò):由于語(yǔ)料庫(kù)巨大,如果每一條語(yǔ)料都與query計(jì)算,匹配效率會(huì)賊低。所以可以用一個(gè)高效的搜索引擎做粗粒度的篩選,選出候選答案,再進(jìn)行向量方式處理。

  2. 生成式閑聊實(shí)現(xiàn)

  生成式聊天機(jī)器人采用端到端的深度學(xué)習(xí)模型,如seq2seq,會(huì)從海量對(duì)話數(shù)據(jù)中學(xué)習(xí)到問(wèn)題和回復(fù),從而對(duì)每條query都自動(dòng)生成回復(fù)。翻譯過(guò)來(lái)就是,回復(fù)內(nèi)容不必預(yù)設(shè),全部讓機(jī)器人自己來(lái)生成。

  一般可以通過(guò)LSTM等模型將輸入的序列映射為固定長(zhǎng)度的向量,然后使用深度LSTM從向量中解碼得到目標(biāo)輸出序列。

  業(yè)界的觀點(diǎn)中,目前seq2seq的生成模型往往會(huì)出現(xiàn)安全回答的問(wèn)題、機(jī)器人個(gè)性不一致的問(wèn)題和多輪對(duì)話中的對(duì)話連續(xù)性問(wèn)題。我司算法大大跟我說(shuō)過(guò),這類情況也不是沒(méi)辦法解決,一般會(huì)在生成模型中加入外部知識(shí)(如小冰的話題模型以及情感分類模型)來(lái)讓回復(fù)更有意義。

  當(dāng)然,在小七的觀點(diǎn)中,生成模型不只是會(huì)出現(xiàn)這三個(gè)問(wèn)題,我們剛才講到的吹水策略,才是閑聊機(jī)器人的重點(diǎn)價(jià)值體現(xiàn)。生成式雖然可以保證每條消息都能有所答復(fù),但朋友間的閑聊,不在于有話必應(yīng),而在于用心溝通,用心交往。

  當(dāng)然,我也曾經(jīng)天真地設(shè)想過(guò)一個(gè)方案:利用檢索式滿足策略回復(fù)同時(shí),對(duì)于大量長(zhǎng)尾的query,可以用生成回復(fù),并引用情感等模型來(lái)保證回復(fù)內(nèi)容更有意義,這個(gè)顧全大局但ROI賊低的方案活生生就被算法大大一句“天真”懟回來(lái)了,哈哈哈哈哈~

  五、怎么知道吹得好不好

  當(dāng)我們將一個(gè)閑聊機(jī)器人構(gòu)建完成并且上線了,不代表產(chǎn)品經(jīng)理的工作就完成了。我們需要通過(guò)數(shù)據(jù),了解機(jī)器人吹水能力是不是OK的,是不是真的達(dá)到用戶預(yù)期。

  平日里我們說(shuō)一個(gè)人溝通能力強(qiáng),能夠和任何人談笑風(fēng)生,但并沒(méi)有一個(gè)標(biāo)準(zhǔn),往往都是主觀判斷。而機(jī)器人是一個(gè)產(chǎn)品,產(chǎn)品經(jīng)理始終需要找到可以衡量?jī)r(jià)值的指標(biāo),才能證明這個(gè)閑聊機(jī)器人是否真的滿足用戶需求。

7.png

  如上圖所示,從不同的目標(biāo)來(lái)看,產(chǎn)品經(jīng)理需要關(guān)注不同的指標(biāo),比如我們?cè)O(shè)計(jì)了一款兒童陪伴硬件機(jī)器人,從上往下都有不同的指標(biāo)。

  對(duì)于企業(yè)來(lái)說(shuō),首先關(guān)注的就是好不好賣。產(chǎn)品經(jīng)理就需要根據(jù)銷售量情況,去設(shè)計(jì)場(chǎng)景和亮點(diǎn),保證產(chǎn)品側(cè)對(duì)銷售量的提升。

  從用戶角度來(lái)說(shuō),產(chǎn)品經(jīng)理就需要關(guān)注其使用情況,大部門(mén)閑聊場(chǎng)景都是To C,所以避免不了要關(guān)注留存、活躍,也只有這兩個(gè)指標(biāo)上去了,才能體現(xiàn)機(jī)器人陪伴的意義。其次,我們也需要關(guān)注每次對(duì)話的輪次,來(lái)了解用戶是否愿意聊下去,也就是業(yè)界所說(shuō)的CPS(單輪對(duì)話次數(shù))。

  從功能來(lái)說(shuō),產(chǎn)品經(jīng)理需要考慮每個(gè)技能的使用情況,包括每個(gè)技能、場(chǎng)景的觸發(fā)率、完成率、留存率。這類指標(biāo)可以說(shuō)是對(duì)整體留存、活躍、CPS的深層次現(xiàn)象探究,比如哪些場(chǎng)景的觸發(fā)率高,從而提升了cps;哪些技能完成率低,導(dǎo)致整體活躍降低。

  最后,機(jī)器人是一個(gè)智能化系統(tǒng),自身也應(yīng)該有一些客觀標(biāo)準(zhǔn)來(lái)衡量其智能化程度。因?yàn)槲覀冇懻摰闹饕腔跈z索式的閑聊系統(tǒng),其常用評(píng)判標(biāo)準(zhǔn)有召回率、精準(zhǔn)率和F-測(cè)度。

  本文由 @steseven 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。