本公開涉及車輛,尤其涉及一種語音控制方法及裝置、車輛、電子設(shè)備和存儲介質(zhì)。
背景技術(shù):
1、車載語音是一種車載智能交互系統(tǒng),它可以通過語音識別、自然語言理解和語音合成等技術(shù),實現(xiàn)人機對話和車輛控制。與傳統(tǒng)的車載語音系統(tǒng)相比,現(xiàn)代車載語音系統(tǒng)可以實現(xiàn)多輪對話,即在每輪會話后,即使語音界面退出了,在一定時間內(nèi),用戶也可以通過語音控制的返回結(jié)果,再次向車機發(fā)送控制指令。
2、相關(guān)技術(shù)中的語音多輪是封閉域的多輪,即進入語音多輪之后車輛接收選擇、翻頁、確認(rèn)的指令,拒絕識別其他指令,用戶體驗不好。并且在車載語音系統(tǒng)進入多人對話場景時,車內(nèi)乘客可參與當(dāng)前語音多輪對話以實現(xiàn)對車輛的控制,但不能開啟新的語音多輪對話實現(xiàn)對車輛的其他功能進行控制,從而不能滿足不同用戶通過語音多輪對話實現(xiàn)不同的功能需求。
技術(shù)實現(xiàn)思路
1、本公開提供了一種語音控制方法及裝置、電子設(shè)備和存儲介質(zhì)。其主要目的在于解決進入語音多輪之后車輛接收選擇、翻頁、確認(rèn)的指令,拒絕識別其他指令,用戶體驗不好,及當(dāng)車載語音系統(tǒng)處于多終端交互場景時,車內(nèi)其他顯示終端無法開啟新的語音交互界面,進而無法通過語音對車輛進行控制的問題。
2、根據(jù)本公開的第一方面,提供了一種語音控制方法,其中,包括:
3、響應(yīng)于第一語音請求指令,根據(jù)請求指令與垂域的對應(yīng)關(guān)系查找所述第一語音請求指令對應(yīng)的第一垂域;
4、基于所述第一垂域?qū)⑺龅谝徽Z音請求指令對應(yīng)的第一列表頁面注冊到對話管理模塊,并在第一顯示終端及其他顯示終端輸出所述第一列表頁面的第一注冊處理結(jié)果,所述對話管理模塊用于存儲所述請求指令與垂域的對應(yīng)關(guān)系及列表頁面,所述第一顯示終端為觸發(fā)所述第一語音請求指令的顯示終端;
5、響應(yīng)于第二語音請求指令,根據(jù)所述請求指令與垂域的對應(yīng)關(guān)系查找所述第二語音請求指令對應(yīng)的第二垂域;
6、基于所述第二垂域?qū)⑺龅诙Z音請求指令對應(yīng)的第二列表頁面注冊到對話管理模塊,并在第二顯示終端輸出所述第二列表頁面的第二注冊處理結(jié)果,所述第二顯示終端為觸發(fā)所述第二語音請求指令的顯示終端;
7、接收并執(zhí)行對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的目標(biāo)操作指令,所述目標(biāo)操作指令攜帶對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的第一顯示終端標(biāo)識或第二顯示終端標(biāo)識。
8、可選地,在接收并執(zhí)行對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的目標(biāo)操作指令之前,所述方法包括:
9、響應(yīng)于第三語音請求指令,執(zhí)行所述第三語音請求指令,其中,所述第三語音請求指令為無需輸出對應(yīng)的注冊處理結(jié)果的語音請求指令,用于直接控制車輛狀態(tài)。
10、可選地,所述根據(jù)請求指令與垂域的對應(yīng)關(guān)系查找所述第一語音請求指令對應(yīng)的第一垂域,包括:
11、將所述第一語音請求指令識別為對應(yīng)的目標(biāo)語義意圖信息;
12、根據(jù)語義意圖信息與垂域的對應(yīng)關(guān)系查找所述目標(biāo)語義意圖信息對應(yīng)的第一垂域;
13、將所述第一語音請求指令發(fā)送至所述第一垂域。
14、可選地,所述基于所述第一垂域?qū)⑺龅谝徽Z音請求指令對應(yīng)的第一列表頁面注冊到對話管理模塊,包括:
15、基于所述第一垂域查找所述第一語音請求指令的對應(yīng)的第一列表頁面;
16、將所述第一列表頁面注冊到對話管理模塊。
17、可選地,所述接收并執(zhí)行對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的目標(biāo)操作指令;包括:
18、接收目標(biāo)操作指令,所述目標(biāo)操作指令包括語音指令、觸摸指令或凝視指令中的至少一種;
19、確定所述目標(biāo)操作指令攜帶的第一顯示終端標(biāo)識或第二顯示終端標(biāo)識;
20、若確定所述顯示終端標(biāo)識是第一顯示終端標(biāo)識,則將所述第一注冊處理結(jié)果確定為目標(biāo)注冊處理結(jié)果;
21、若確定所述顯示終端標(biāo)識是第二顯示終端標(biāo)識,則將所述第二注冊處理結(jié)果確定為目標(biāo)注冊處理結(jié)果;
22、對目標(biāo)注冊處理結(jié)果執(zhí)行所述目標(biāo)操作指令。
23、可選地,所述對目標(biāo)注冊處理結(jié)果執(zhí)行所述目標(biāo)操作指令,包括:
24、在確定所述第二注冊處理結(jié)果為目標(biāo)注冊處理結(jié)果的情況下,在對目標(biāo)注冊處理結(jié)果執(zhí)行所述目標(biāo)操作指令后,所述第二顯示終端顯示所述第一列表頁面的第一注冊處理結(jié)果。
25、可選地,所述根據(jù)所述第一列表頁面的變化,確定對所述第一列表頁面執(zhí)行響應(yīng)的注銷或注冊新列表頁面,包括:
26、判斷所述語音請求指令的目標(biāo)類別,所述第一注冊處理結(jié)果具備對第一類別語音請求指令的控制權(quán)限,及所述第二注冊處理結(jié)果具備對第二類別語音請求指令的控制權(quán)限,所述第一類別包含所述第二類別;
27、若確定所述語音請求指令的目標(biāo)類別不屬于所述第二類別,則控制第一注冊處理結(jié)果執(zhí)行所述語音請求指令。
28、根據(jù)本公開的第二方面,提供了一種語音控制裝置,包括:
29、第一查找單元,用于響應(yīng)于第一語音請求指令,根據(jù)請求指令與垂域的對應(yīng)關(guān)系查找所述第一語音請求指令對應(yīng)的第一垂域;
30、第一注冊單元,用于基于所述第一垂域?qū)⑺龅谝徽Z音請求指令對應(yīng)的第一列表頁面注冊到對話管理模塊;
31、第一輸出單元,用于在第一顯示終端及其他顯示終端輸出所述第一列表頁面的第一注冊處理結(jié)果,所述對話管理模塊用于存儲所述請求指令與垂域的對應(yīng)關(guān)系及列表頁面,所述第一顯示終端為觸發(fā)所述第一語音請求指令的顯示終端;
32、第二查找單元,用于響應(yīng)于第二語音請求指令,根據(jù)所述請求指令與垂域的對應(yīng)關(guān)系查找所述第二語音請求指令對應(yīng)的第二垂域;
33、第二注冊單元,用于基于所述第二垂域?qū)⑺龅诙Z音請求指令對應(yīng)的第二列表頁面注冊到對話管理模塊;
34、第二輸出單元,用于在第二顯示終端輸出所述第二列表頁面的第二注冊處理結(jié)果,所述第二顯示終端為觸發(fā)所述第二語音請求指令的顯示終端;
35、第一執(zhí)行單元,用于接收并執(zhí)行對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的目標(biāo)操作指令,所述目標(biāo)操作指令攜帶對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的第一顯示終端標(biāo)識或第二顯示終端標(biāo)識。
36、在本技術(shù)的一個實施例中,所述裝置還包括第二執(zhí)行單元,所述第二執(zhí)行單元用于:
37、在接收并執(zhí)行對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的目標(biāo)操作指令之前,響應(yīng)于第三語音請求指令,執(zhí)行所述第三語音請求指令,其中,所述第三語音請求指令為無需輸出對應(yīng)的注冊處理結(jié)果的語音請求指令,用于直接控制車輛狀態(tài)。
38、在本技術(shù)的一個實施例中,所述第一查找單元包括:
39、識別模塊,用于將所述第一語音請求指令識別為對應(yīng)的目標(biāo)語義意圖信息;
40、查找模塊,用于根據(jù)語義意圖信息與垂域的對應(yīng)關(guān)系查找所述目標(biāo)語義意圖信息對應(yīng)的第一垂域;
41、發(fā)送模塊,用于將所述第一語音請求指令發(fā)送至所述第一垂域。
42、可選地,所述第一注冊單元包括:
43、獲取模塊,用于基于所述第一垂域獲取所述第一語音請求指令的對應(yīng)的第一列表頁面;
44、注冊模塊,用于將所述第一列表頁面注冊到對話管理模塊。
45、在本技術(shù)的一個實施例中,所述第一執(zhí)行單元包括:
46、接收模塊,用于接收目標(biāo)操作指令,所述目標(biāo)操作指令包括語音指令、觸摸指令或凝視指令中的至少一種;
47、第一確定模塊,用于確定所述目標(biāo)操作指令攜帶的第一顯示終端標(biāo)識或第二顯示終端標(biāo)識;
48、第二確定模塊,用于若確定所述顯示終端標(biāo)識是第一顯示終端標(biāo)識,則將所述第一注冊處理結(jié)果確定為目標(biāo)注冊處理結(jié)果;
49、第三確定模塊,用于若確定所述顯示終端標(biāo)識是第二顯示終端標(biāo)識,則將所述第二注冊處理結(jié)果確定為目標(biāo)注冊處理結(jié)果;
50、執(zhí)行模塊,用于對目標(biāo)注冊處理結(jié)果執(zhí)行所述目標(biāo)操作指令。
51、在本技術(shù)的一個實施例中,所述裝置還包括判斷單元,所述判斷單元包括:
52、判斷模塊,用于在根據(jù)請求指令與垂域的對應(yīng)關(guān)系查找所述第一語音請求指令對應(yīng)的第一垂域之前,判斷所述語音請求指令的目標(biāo)類別,所述第一注冊處理結(jié)果具備對第一類別語音請求指令的控制權(quán)限,及所述第二注冊處理結(jié)果具備對第二類別語音請求指令的控制權(quán)限,所述第一類別包含所述第二類別;
53、控制模塊,用于若確定所述語音請求指令的目標(biāo)類別不屬于所述第二類別,則控制第一注冊處理結(jié)果執(zhí)行所述語音請求指令。
54、根據(jù)本公開的第三方面,提供了一種電子設(shè)備,包括:
55、至少一個處理器;以及
56、與所述至少一個處理器通信連接的存儲器;其中,
57、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行前述第一方面所述的方法。
58、根據(jù)本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,所述計算機指令用于使所述計算機執(zhí)行前述第一方面所述的方法。
59、根據(jù)本公開的第五方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)如前述第一方面所述的方法。
60、本公開提供的語音控制方法及裝置、車輛、電子設(shè)備和存儲介質(zhì),響應(yīng)于第一語音請求指令,根據(jù)請求指令與垂域的對應(yīng)關(guān)系查找所述第一語音請求指令對應(yīng)的第一垂域;基于所述第一垂域?qū)⑺龅谝徽Z音請求指令對應(yīng)的第一列表頁面注冊到對話管理模塊,并在第一顯示終端輸出及其他顯示終端所述第一列表頁面的第一注冊處理結(jié)果,所述對話管理模塊用于存儲所述請求指令與垂域的對應(yīng)關(guān)系及列表頁面,所述第一顯示終端為觸發(fā)所述第一語音請求指令的顯示終端;響應(yīng)于第二語音請求指令,根據(jù)所述請求指令與垂域的對應(yīng)關(guān)系查找所述第二語音請求指令對應(yīng)的第二垂域;基于所述第二垂域?qū)⑺龅诙Z音請求指令對應(yīng)的第二列表頁面注冊到對話管理模塊,并在第二顯示終端輸出所述第二列表頁面的第二注冊處理結(jié)果,所述第二顯示終端為觸發(fā)所述第二語音請求指令的顯示終端;接收并執(zhí)行對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的目標(biāo)操作指令,所述目標(biāo)操作指令攜帶對所述第一注冊處理結(jié)果或第二注冊處理結(jié)果的第一顯示終端標(biāo)識或第二顯示終端標(biāo)識。與相關(guān)技術(shù)相比,本公開提供的語音控制方法,可實現(xiàn)在進入一個多輪對話中,可以繼續(xù)響應(yīng)不同用戶的多輪對話請求指令活或單輪對話請求指令,通過目標(biāo)操作指令攜帶顯示終端標(biāo)識的方法實現(xiàn)多終端交互場景時并行支持多個單輪對話或多個多輪對話,以滿足不同用戶的不同需求。
61、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本技術(shù)的實施例的關(guān)鍵或重要特征,也不用于限制本技術(shù)的范圍。本技術(shù)的其它特征將通過以下的說明書而變得容易理解。