時間:2017-08-19 11:15:45 作者:琪琪 瀏覽量:93
語音識別令人滿意
就在昨天老羅的錘子新機發(fā)布會上,科大訊飛的語音輸入又被帶起了一波節(jié)奏,出于對所謂各種發(fā)布會慣常性夸大其辭的質(zhì)疑,我們特別親身對這款輸入法的識別效果進行了一個簡單的測試,看看是不是真的得出和老羅一樣的效果。
經(jīng)過測試我們發(fā)現(xiàn),在正常的語速環(huán)境下,訊飛輸入法的識別效果還是讓人滿意的,這段文本是我們使用語音輸入得出的結(jié)果。鑒于測試者的普通話水平還是比較靠譜的,所以具備一定的參考價值:
“北京時間10月19日消息,維基解密創(chuàng)始人阿桑奇早前承諾,將會在11月7日之前曝光一批新的美國總統(tǒng)大選文檔。現(xiàn)在爆料來了,其中一批文檔顯示,希拉里團隊擬定的副總統(tǒng)人選名單里,蘋果CEO庫克的名字赫然在列。”
慢語速下結(jié)果(左)和快語速下結(jié)果(右)
可以看到在前面較慢的語速下,訊飛輸入法的識別是100%的還原了文檔,而在較快的語速中則出現(xiàn)了部分錯誤。這部分錯誤經(jīng)過我們的回溯,主要是由于發(fā)音的連讀導致的,也就是說即使是在較快的語速中,訊飛輸入法在單個音節(jié)的識別上仍然不會有什么問題,但是如果連音較嚴重的話,就會出現(xiàn)偏差。
所以結(jié)論就是,如果你在使用語音輸入文本時,可以語速較快,但需要避免出現(xiàn)連音,尤其是北京話那種嘟嘟囔囔的發(fā)音方式,很容易出現(xiàn)偏差。
中英混輸是硬傷
那么是否就是說通過語音就能完全解決的輸入需求了呢?答案是否定的,因為我們在體驗的過程中還是發(fā)現(xiàn)了一些“硬傷”。其中之一就是英語的穿插使用。
簡單來說就是在我們當前的輸入環(huán)境中,經(jīng)常會遇到中文中夾雜英文的情況,比如下面這段文本,我們用訊飛語音輸入得到的就是這樣一個結(jié)果:
“蘋果今年在秋季發(fā)布會上發(fā)布了一款非常小巧的無線藍牙耳機,取名AirPods,不過有一個細節(jié),讓Beats粉絲非常失望,因為并沒有取名BeatsPods。其實蘋果早在2014年就收購了Beats這個品牌,近兩年來似乎并沒有大動作。但是通過蘋果不斷的擴充iTunes,我們似乎可以預測到之后蘋果的大招。”
英文部分幾乎全折
需要說明的是,我們特意在英文的部分進行了慢語速的著重拼讀,但對比之后我們還是發(fā)現(xiàn),所有的英文部分都出現(xiàn)了問題,沒有一個是對得上號的。
我們在語言選項里只找到了普通話和英文這兩個獨立的選項,并沒有能夠?qū)崿F(xiàn)中英文混合輸入。這一點上我們想說微軟做得非常好,如果你體驗過Windows的Cortana就應該知道,比如同是用語音說“幫我打開Steam”,Cortana就真的是顯示“幫我打開Steam”并完成啟動程序,而訊飛這里顯示的是“幫我打開視頻”。
最后一點要說的其實并不是說是語音輸入法單個的問題,只是這個問題在語音輸入法中變得尤為明顯,那就是詞庫的豐富度。我們知道平常打字時也會遇到一些名詞或是短語,這些詞在詞庫中并沒有收錄,所以需要我們一個字一個字的在候選欄中篩選出來。
但這個問題到了語音輸入法中就變成比較嚴重的問題了,一旦遇到詞庫中不曾收錄的詞或短語,識別就必然出現(xiàn)問題,但是要知道語音輸入可沒有候選詞讓你選,這時候你就需要手動再打字去更正。這個問題同樣出現(xiàn)在訊飛輸入法上,比如我們說“肥倫的脫口秀今天你看了嗎”“半血亞彌達拉有人來嗎”“菲董新歌你聽了嗎”得到的就是下面的結(jié)果:
識別結(jié)果
當然我不是要故意刁難語音輸入法,只是說這確實是一個比較突出的問題,盡管在測試的過程中訊飛還是給了我不少“這詞都有”的驚訝(比如然并卵、艾吉奧艾迪托雷、騷當、瑞奇與叮當?shù)鹊龋,但是仍然不適合在有生僻詞時使用。
總的來說這次測試下來,訊飛的整體效果還是讓人滿意的,尤其是在語音的識別上,但是語義方面的識別仍然需要加強,尤其是中英文混合輸入是一個亟待解決的痛點?傊褪,功能比較強大,但是放到具體的復雜的語言環(huán)境中,仍然難以替代打字輸入,或是說難以完全脫離打字輸入獨立運轉(zhuǎn)。