電話:0551-62672521
Q Q:455743647
郵箱:455743647@qq.com
網址:www.xhylaser.cn
實驗表明智能手機語音識別錄入比打字快
發布日期:2016-08-30 14:45:27
舊金山時間8月24日,中美研究人員聯手完成的一項最新實驗表明,智能手機搭載語音識別軟件,用于錄入短信或其他文字信息,速度是打字的3倍左右,同時輸入的差錯率顯著降低。
來自美國斯坦福大學、華盛頓大學和中國百度公司研究人員以美國蘋果公司出產的手機為硬件,搭載百度公司硅谷人工智能實驗室去年發布的“深度語音2”軟件,對32名年齡介于19歲至32歲的“打字手”開展了這項實驗。
斯坦福大學計算機科學系教授詹姆斯·蘭迪解釋,“這些人從小打字,所以我們讓語音識別軟件與這些人所擅長的打字比拼”。
實驗對象分別以打字方式和語音方式錄入大約100條取自文本研究“標準題庫”的日常短語,譬如“為了安全,請系好保險帶”、“物理和化學不容易”和“周末愉快”等。打字錄入過程中,半數實驗對象用手機觸摸屏上的英文字母軟鍵盤錄入英文,另一半研究對象借助蘋果手機操作系統所包含的漢語拼音輸入法錄入中文。無論語音還是打字,都由后臺測試軟件記錄錄入速度和準確率。
無論是以英文還是中文錄入,實驗結果都出乎意料:英文錄入,語音識別比打字速度快3倍,差錯率低20.4%;中文錄入,語音識別比打字快2.8倍,差錯率低63.4%。
參與研究并以第一作者身份撰寫相關論文的斯坦福大學計算機科學系博士研究生阮珊珊說:“我們先前知道語音識別相當不錯,預期(錄入)速度會相對更快一些,實際卻大為吃驚,居然比在鍵盤上打字幾乎快3倍。”
蘭迪、阮珊珊以及百度首席科學家、斯坦福大學兼職教授吳恩達等人合作的論文24日由美國康奈爾大學圖書館網絡論文平臺發表。
雖然這項實驗使用的是百度語音識別軟件,研究人員推測,其他一些新版本高準確度語音識別軟件的效果處于同一水平。蘭迪說:“過去兩至三年間,得益于大數據和深度(人工智能)學習,語音識別確實改善不少,可以取得更快和更精確的結果。”
研究人員憑借實驗所獲數據,以定量方式為語音識別技術“正名”,旨在鼓勵工程師運用這項技術,為更多應用軟件開發語音操作界面。