語音識別呈現(xiàn)怎樣的發(fā)展趨勢?
發(fā)布日期:2021-12-11
點擊次數(shù):2444
語音識別是發(fā)展未來人工智能(點擊閱讀:我國人工智能產(chǎn)業(yè)現(xiàn)狀及發(fā)展前景分析)的重要組成部分之一,是達到人機交互目的第一步,簡單來說,是機器或程序完成接受口令、解釋聲音含義、理解和執(zhí)行口頭指令所需的技術(shù)。本文將從行業(yè)政策環(huán)境、產(chǎn)業(yè)鏈、行業(yè)競爭格局、投資現(xiàn)狀等角度來剖析語音識別產(chǎn)業(yè)的發(fā)展現(xiàn)狀。
01
行業(yè)政策環(huán)境
近年來,隨著科技的進步,人工智能這一新興領(lǐng)域取得了快速發(fā)展,相關(guān)政策相繼出臺。
表1:人工智能相關(guān)政策匯總
02
來源:火石創(chuàng)造根據(jù)公開資料整理
在“十四五”的大背景和智能經(jīng)濟形態(tài)下,目前已有多個省市響應(yīng)中央號召,相繼發(fā)布人工智能相關(guān)規(guī)劃或?qū)m椪?,以人工智能為技術(shù)手段,發(fā)揮當?shù)禺a(chǎn)業(yè)集群優(yōu)勢,促進產(chǎn)學研融合及協(xié)同發(fā)展。同時,語音識別技術(shù)屬于中國AI領(lǐng)域中最為成熟落地的技術(shù)之一,預計未來能夠繼續(xù)加速在各垂直行業(yè)進行滲透和布局。
02
產(chǎn)業(yè)鏈分析
03
科大訊飛:科大訊飛是國內(nèi)領(lǐng)先的智能語音技術(shù)主要提供商之一,在語音識別等智能語音技術(shù)領(lǐng)域擁有國際先進的成果,主要業(yè)務(wù)包含智能語音和語言技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務(wù)及電子政務(wù)系統(tǒng)集成,為企業(yè)、政府和個人提供智能應(yīng)用??拼笥嶏w技術(shù)優(yōu)勢在同行業(yè)中出眾,擁有自主知識產(chǎn)權(quán)的智能語音技術(shù),推出覆蓋大型電信級應(yīng)用到小型嵌入式應(yīng)用以及滿足不同應(yīng)用環(huán)境的軟硬件產(chǎn)品??拼笥嶏w在中文語音技術(shù)市場和語音合成產(chǎn)品市場都占有較大份額,應(yīng)用于電信、金融、電力、社保等主流行業(yè)??拼笥嶏w結(jié)合自己核心的智能語音技術(shù)和人工智能的研究,已經(jīng)實現(xiàn)AI產(chǎn)品化的布局。在To B端,科大訊飛面向教育、政法、醫(yī)療、汽車和客服等多個行業(yè)提供相應(yīng)的解決方案。在To C端,科大訊飛提供面向消費者的家庭、汽車、翻譯等個人消費品,包括硬件產(chǎn)品如訊飛學習機、訊飛翻譯機、智能辦公本等,以及軟件產(chǎn)品如訊飛輸入法、AI電視助手等。
騰訊:騰訊云語音識別目前主要應(yīng)用于微信、王者榮耀、騰訊視頻等內(nèi)部業(yè)務(wù),外部應(yīng)用布局于錄音質(zhì)檢、會議實時轉(zhuǎn)寫、法庭及審訊記錄、語音輸入法等場景。技術(shù)提供主要功能為開放實時語音識別、一句話識別和錄音文件識別,支持云端和嵌入式兩種服務(wù)模式。騰訊云語音識別的主要優(yōu)勢在于有大量的用戶基礎(chǔ)和數(shù)據(jù)積累可應(yīng)用于豐富的行業(yè)場景,收費價格較低,自準率高達97%,支持多語言識別能力,有領(lǐng)先的算法。
百度:百度在AI開放平臺上提供語音識別的技術(shù),共享AI領(lǐng)域的應(yīng)用場景和解決方案,產(chǎn)品包括短語音識別、實時語音識別、遠場語音識別、音頻文件轉(zhuǎn)寫、語音自訓練平臺等,應(yīng)用于手機應(yīng)用如語音輸入、機器人對話、語音內(nèi)容分析和實時語音轉(zhuǎn)寫等場景。百度的語音識別技術(shù)優(yōu)勢在于領(lǐng)先的語音識別技術(shù),提供自助訓練專屬模型,可簡單快速地接入API及多種SDK接口,提供穩(wěn)定性保障,且收取費用較低。
04
圖1:語音識別產(chǎn)業(yè)圖譜
來源:火石創(chuàng)造根據(jù)公開資料整理
中國人工智能語音識別產(chǎn)業(yè)鏈主要分為上游、中游、下游。
上游:基礎(chǔ)層技術(shù)提供算力與數(shù)據(jù)方面的強力支持——包含算力與AI數(shù)據(jù)服務(wù)。語音識別模型在運行過程中訓練數(shù)據(jù)量和計算量需求極大,由于傳統(tǒng)的CPU或者單一處理器進行語音識別運算的處理時間過長,所以無法滿足海量數(shù)據(jù)計算的實時性需求。目前,主流語音識別公司的模擬訓練和語音識別基本都在云端采用GPU等計算芯片并行架構(gòu)或異構(gòu)計算方案進行。
中游:技術(shù)層提供理論與技術(shù)支撐——包含基礎(chǔ)理論技術(shù)以及算法模型相關(guān)解決方案的形成,升級為相關(guān)軟硬件產(chǎn)品。
下游:應(yīng)用層提供技術(shù)落地應(yīng)用場景——包含企業(yè)端、消費端、其他端場景。其中,企業(yè)端主要應(yīng)用于醫(yī)療、公檢法等;消費端主要應(yīng)用于智能家居、智慧教育等。
03
行業(yè)競爭格局
中國的人工智能語音識別主流廠商大致可分為互聯(lián)網(wǎng)IT廠商、語音技術(shù)廠商兩類?;ヂ?lián)網(wǎng)IT廠商典型包括阿里巴巴、騰訊、搜狗、百度等。這類廠商重視以流量導向和滿足龐大用戶群體驗和創(chuàng)新需求為導向去做AI開發(fā),更多以流量和用戶體驗為導向,同時,會比傳統(tǒng)的語音技術(shù)廠商更加注重創(chuàng)新實踐。語音技術(shù)廠商典型包括科大訊飛、捷通華聲等擁有自身核心語音芯片以及相關(guān)軟件系統(tǒng)的傳統(tǒng)語音技術(shù)廠商,還有云知聲、思必馳等側(cè)重于某些垂直領(lǐng)域的語音技術(shù)和產(chǎn)品的創(chuàng)業(yè)廠商。在眾多廠商中,科大訊飛、騰訊、百度為典型競爭力代表。
科大訊飛:科大訊飛是國內(nèi)領(lǐng)先的智能語音技術(shù)主要提供商之一,在語音識別等智能語音技術(shù)領(lǐng)域擁有國際先進的成果,主要業(yè)務(wù)包含智能語音和語言技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務(wù)及電子政務(wù)系統(tǒng)集成,為企業(yè)、政府和個人提供智能應(yīng)用??拼笥嶏w技術(shù)優(yōu)勢在同行業(yè)中出眾,擁有自主知識產(chǎn)權(quán)的智能語音技術(shù),推出覆蓋大型電信級應(yīng)用到小型嵌入式應(yīng)用以及滿足不同應(yīng)用環(huán)境的軟硬件產(chǎn)品??拼笥嶏w在中文語音技術(shù)市場和語音合成產(chǎn)品市場都占有較大份額,應(yīng)用于電信、金融、電力、社保等主流行業(yè)??拼笥嶏w結(jié)合自己核心的智能語音技術(shù)和人工智能的研究,已經(jīng)實現(xiàn)AI產(chǎn)品化的布局。在To B端,科大訊飛面向教育、政法、醫(yī)療、汽車和客服等多個行業(yè)提供相應(yīng)的解決方案。在To C端,科大訊飛提供面向消費者的家庭、汽車、翻譯等個人消費品,包括硬件產(chǎn)品如訊飛學習機、訊飛翻譯機、智能辦公本等,以及軟件產(chǎn)品如訊飛輸入法、AI電視助手等。
騰訊:騰訊云語音識別目前主要應(yīng)用于微信、王者榮耀、騰訊視頻等內(nèi)部業(yè)務(wù),外部應(yīng)用布局于錄音質(zhì)檢、會議實時轉(zhuǎn)寫、法庭及審訊記錄、語音輸入法等場景。技術(shù)提供主要功能為開放實時語音識別、一句話識別和錄音文件識別,支持云端和嵌入式兩種服務(wù)模式。騰訊云語音識別的主要優(yōu)勢在于有大量的用戶基礎(chǔ)和數(shù)據(jù)積累可應(yīng)用于豐富的行業(yè)場景,收費價格較低,自準率高達97%,支持多語言識別能力,有領(lǐng)先的算法。
百度:百度在AI開放平臺上提供語音識別的技術(shù),共享AI領(lǐng)域的應(yīng)用場景和解決方案,產(chǎn)品包括短語音識別、實時語音識別、遠場語音識別、音頻文件轉(zhuǎn)寫、語音自訓練平臺等,應(yīng)用于手機應(yīng)用如語音輸入、機器人對話、語音內(nèi)容分析和實時語音轉(zhuǎn)寫等場景。百度的語音識別技術(shù)優(yōu)勢在于領(lǐng)先的語音識別技術(shù),提供自助訓練專屬模型,可簡單快速地接入API及多種SDK接口,提供穩(wěn)定性保障,且收取費用較低。
04
投資現(xiàn)狀
國內(nèi)人工智能產(chǎn)業(yè)發(fā)展較國外發(fā)展較晚,直至2011年方才展露出發(fā)展苗頭。語音識別作為人工智能產(chǎn)業(yè)中極其重要的一個組成部分,擔任著人機交互應(yīng)用時的輸入和輸出接口,也相應(yīng)地受到產(chǎn)業(yè)風口的影響,受到一眾投資機構(gòu)的追捧。截至2021年2月,語音識別行業(yè)投資事件達150多件,投資金額達180億元左右。
免責聲明: 本文章轉(zhuǎn)自其它平臺,并不代表本站觀點及立場。若有侵權(quán)或異議,請聯(lián)系我們刪除。謝謝! |