本發(fā)明涉及人工智能及醫(yī)療健康,尤其涉及一種情緒識別方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、近年來,隨著人工智能的不斷發(fā)展,人工智能技術(shù)被廣泛應(yīng)用于金融及醫(yī)療健康等各個領(lǐng)域,如何根據(jù)用戶語音識別用戶情緒就是其中的一項重要課題。例如:在醫(yī)療健康領(lǐng)域,如何有效識別客戶情緒以更好的為客戶進(jìn)行服務(wù)是智能醫(yī)療客服的關(guān)鍵。
2、現(xiàn)有技術(shù)中,在根據(jù)用戶語音進(jìn)行情緒識別時,主要采用以下方法:
3、(1)使用實(shí)時信號處理技術(shù)和深度學(xué)習(xí)模型,對聲音信號進(jìn)行實(shí)時情緒識別,例如使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional?neural?networks,cnn)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrentneural?network,rnn)從聲音信號中提取特征,并進(jìn)行情緒分類。
4、該方法使用深度學(xué)習(xí)方案,屬于端到端學(xué)習(xí)方案,沒有采取有效的特征工程,導(dǎo)致訓(xùn)練需要的數(shù)據(jù)量巨大,且魯棒性差,精度也很難提升,實(shí)際使用效果差。
5、(2)結(jié)合聲音、文本和視覺信息進(jìn)行情緒識別,使用深度學(xué)習(xí)模型進(jìn)行多模態(tài)特征融合。
6、該方法雖然看起來不錯,但是語料獲取、標(biāo)注成本巨大,并且很多場景(比如呼叫中心場景)并無視覺信息,使用場景受到約束。
7、(3)提取聲音信號的音高、音強(qiáng)、語速等特征,使用支持向量機(jī)(support?vectormachine,svm)進(jìn)行分類。
8、該方法屬于傳統(tǒng)的機(jī)器學(xué)習(xí),通常是二分類,沒有充分反映出過程變化體現(xiàn)的情緒,因此不但效果不佳,場景適用性也很差。
9、綜合上述幾種方法可知,現(xiàn)有語音識別情緒的方案均未充分考慮時序變化代表的情緒變化,例如有的人天生講話快速、大聲,并不能判定為憤怒或急躁。并且,單一方法導(dǎo)致精度容易達(dá)到瓶頸且難以再進(jìn)一步提升,精度的gap(global?average?processing?time,全局平均處理時間)導(dǎo)致實(shí)際應(yīng)用中難以令業(yè)務(wù)方滿意,因此難以真正投產(chǎn)落地產(chǎn)生效益。
技術(shù)實(shí)現(xiàn)思路
1、鑒于以上內(nèi)容,有必要提供一種情緒識別方法、裝置、設(shè)備及介質(zhì),旨在解決情緒識別準(zhǔn)確率低的問題。
2、一種情緒識別方法,所述情緒識別方法包括:
3、確定語音判定錨點(diǎn),及確定多個預(yù)測因子;
4、構(gòu)建與每個預(yù)測因子對應(yīng)的訓(xùn)練集,并利用每個預(yù)測因子對應(yīng)的訓(xùn)練集分別訓(xùn)練情緒識別模型;
5、利用提升樹對訓(xùn)練得到的多個情緒識別模型進(jìn)行集成學(xué)習(xí),得到目標(biāo)情緒識別模型;
6、響應(yīng)于對目標(biāo)用戶的情緒識別指令,按照所述語音判定錨點(diǎn)采集所述目標(biāo)用戶的語音信息作為待識別語音;
7、將所述待識別語音輸入至所述目標(biāo)情緒識別模型,并獲取所述目標(biāo)情緒識別模型中每個樹的識別結(jié)果;
8、根據(jù)所述情緒識別指令確定識別類型;
9、根據(jù)所述識別類型對每個樹的識別結(jié)果進(jìn)行處理,得到所述目標(biāo)用戶的情緒識別結(jié)果。
10、一種情緒識別裝置,所述情緒識別裝置包括:
11、確定單元,用于確定語音判定錨點(diǎn),及確定多個預(yù)測因子;
12、訓(xùn)練單元,用于構(gòu)建與每個預(yù)測因子對應(yīng)的訓(xùn)練集,并利用每個預(yù)測因子對應(yīng)的訓(xùn)練集分別訓(xùn)練情緒識別模型;
13、學(xué)習(xí)單元,用于利用提升樹對訓(xùn)練得到的多個情緒識別模型進(jìn)行集成學(xué)習(xí),得到目標(biāo)情緒識別模型;
14、采集單元,用于響應(yīng)于對目標(biāo)用戶的情緒識別指令,按照所述語音判定錨點(diǎn)采集所述目標(biāo)用戶的語音信息作為待識別語音;
15、輸入單元,用于將所述待識別語音輸入至所述目標(biāo)情緒識別模型,并獲取所述目標(biāo)情緒識別模型中每個樹的識別結(jié)果;
16、所述確定單元,還用于根據(jù)所述情緒識別指令確定識別類型;
17、處理單元,用于根據(jù)所述識別類型對每個樹的識別結(jié)果進(jìn)行處理,得到所述目標(biāo)用戶的情緒識別結(jié)果。
18、一種計算機(jī)設(shè)備,所述計算機(jī)設(shè)備包括:
19、存儲器,存儲至少一個指令;及
20、處理器,執(zhí)行所述存儲器中存儲的指令以實(shí)現(xiàn)所述情緒識別方法。
21、一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)中存儲有至少一個指令,所述至少一個指令被計算機(jī)設(shè)備中的處理器執(zhí)行以實(shí)現(xiàn)所述情緒識別方法。
22、由以上技術(shù)方案可以看出,本發(fā)明能夠利用每個預(yù)測因子對應(yīng)的訓(xùn)練集分別訓(xùn)練情緒識別模型,并利用提升樹對訓(xùn)練得到的多個情緒識別模型進(jìn)行集成學(xué)習(xí)得到目標(biāo)情緒識別模型,避免了單一模型的魯棒性差、不能充分考慮到個體差異性等問題,實(shí)現(xiàn)一個多維信息、多個模型提升樹提升增強(qiáng)、全面使用聲音變化和語義信息的大聲音情緒判定模型;按照語音判定錨點(diǎn)采集目標(biāo)用戶的語音信息作為待識別語音,將待識別語音輸入至目標(biāo)情緒識別模型,并根據(jù)識別類型對每個樹的識別結(jié)果進(jìn)行處理得到目標(biāo)用戶的情緒識別結(jié)果,通過配置語音判定錨點(diǎn)能夠避免字詞層面過短的語音判斷,從而大幅降低判定噪聲,提高了情緒識別的準(zhǔn)確性。
1.一種情緒識別方法,其特征在于,所述情緒識別方法包括:
2.如權(quán)利要求1所述的情緒識別方法,其特征在于,所述確定語音判定錨點(diǎn),及確定多個預(yù)測因子包括:
3.如權(quán)利要求1所述的情緒識別方法,其特征在于,所述構(gòu)建與每個預(yù)測因子對應(yīng)的訓(xùn)練集,并利用每個預(yù)測因子對應(yīng)的訓(xùn)練集分別訓(xùn)練情緒識別模型包括:
4.如權(quán)利要求1所述的情緒識別方法,其特征在于,所述利用提升樹對訓(xùn)練得到的多個情緒識別模型進(jìn)行集成學(xué)習(xí),得到目標(biāo)情緒識別模型包括:
5.如權(quán)利要求4所述的情緒識別方法,其特征在于,所述利用新增的情緒識別模型擬合當(dāng)輪模型的殘差包括:
6.如權(quán)利要求1所述的情緒識別方法,其特征在于,所述方法還包括:
7.如權(quán)利要求1所述的情緒識別方法,其特征在于,所述根據(jù)所述識別類型對每個樹的識別結(jié)果進(jìn)行處理,得到所述目標(biāo)用戶的情緒識別結(jié)果包括:
8.一種情緒識別裝置,其特征在于,所述情緒識別裝置包括:
9.一種計算機(jī)設(shè)備,其特征在于,所述計算機(jī)設(shè)備包括:
10.一種計算機(jī)可讀存儲介質(zhì),其特征在于:所述計算機(jī)可讀存儲介質(zhì)中存儲有至少一個指令,所述至少一個指令被計算機(jī)設(shè)備中的處理器執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至7中任意一項所述的情緒識別方法。