小鵬P7行業(yè)首創(chuàng)的全語音車載系統(tǒng)
在去年的1024智能日上,小鵬汽車發(fā)布了全場景語音功能,使其智能語音助手小P不僅做到了識別精準、反應(yīng)速度超快,而且可以實現(xiàn)連續(xù)對話、語義打斷、高精度語音控制等高級交互能力,是當(dāng)前車載智能語音之中功能最強的產(chǎn)品。但是,當(dāng)前的智能語音助手小P在聲音方面,采用與市場主流方案相同的小型離線拼接引擎,只支持16k的采樣精度,在長時間的收聽下顯得不夠悅耳。因此,小鵬汽車再次精進,采用了行業(yè)領(lǐng)先的“全新一代超大規(guī)模在線神經(jīng)網(wǎng)絡(luò)引擎+小型離線拼接引擎”技術(shù)組合,推出了小P全新AI聲音。
全新AI聲音采用了24K采樣技術(shù),實現(xiàn)了高保真音質(zhì),并擁有包括助理、聊天、客服、愉快、溫和、親熱、抒情、新聞、嚴肅、不滿、生氣、害怕、悲傷、冷靜等14種強烈情緒的變換能力,聲音細膩動聽,生動自然,有真人般的氣息頓挫,能表達更多情緒,幾乎與真人無異。根據(jù)語音質(zhì)量評測指標MOS(Mean Opinion Score)驗證,小P全新AI聲音的得分為4.49分,是目前微軟MOS語音質(zhì)量評測得分最高的車載語音助手。MOS是一項國際通用語音質(zhì)量評測方法,它是在與真人聲音對比評估下,判斷這個機器聲音多大程度像真實人聲,滿分為5分,分數(shù)越高證明聲音越完美,越接近真人,越令人舒適。
為了讓小P全新AI聲音能順利帶給用戶,小鵬汽車解決了時延、網(wǎng)絡(luò)抖動、如何與應(yīng)用結(jié)合等多方面技術(shù)難題,并利用智能網(wǎng)絡(luò)預(yù)測算法預(yù)測車輛當(dāng)下的網(wǎng)絡(luò)情況,智能選擇在線神經(jīng)網(wǎng)絡(luò)引擎或離線引擎進行聲音合成,通過端云融合的語音合成方案,已做到97%的超高在線率,弱網(wǎng)和無網(wǎng)情況下也不用擔(dān)心音質(zhì)受損,給用戶最極致的語音體驗。據(jù)悉,全新AI聲音預(yù)計將于7月通過整車OTA首先搭載在小鵬P7上,并適用于小鵬P7全系車型。
責(zé)任編輯 萬燕