互聯(lián)網(wǎng)巨頭布局智能語(yǔ)音 小企業(yè)仍有生存空間

發(fā)布時(shí)間:2021-08-13 11:49:38  |  來(lái)源:搜狐科技  

“市場(chǎng)真正需要的是解決問(wèn)題的綜合方案,要利用它的特點(diǎn)找到不同的技術(shù)來(lái)融合。這個(gè)融合應(yīng)該是能解決問(wèn)題的融合,不能為融合而融合。”在本期沙龍上,清華大學(xué)人工智能研究院聽(tīng)覺(jué)智能研究中心主任鄭方教授在談到智能語(yǔ)音技術(shù)融合發(fā)展的趨勢(shì)時(shí)說(shuō)到。

鄭方認(rèn)為,技術(shù)的發(fā)展離不開(kāi)市場(chǎng)的土壤,而現(xiàn)在用單一技術(shù)去解決市場(chǎng)的需求有很大的難度,這也是一些 AI 公司面臨困境的重要原因之一。

他還提到,不同的語(yǔ)音技術(shù)分支,發(fā)展程度不同,語(yǔ)音識(shí)別、語(yǔ)音合成等相對(duì)成熟,但也有口音、低資源語(yǔ)種等問(wèn)題。但目前成熟的分支存在比較嚴(yán)重的同質(zhì)化問(wèn)題,在技術(shù)上是方法同質(zhì)化,并帶來(lái)了市場(chǎng)的惡性競(jìng)爭(zhēng)。

在智能語(yǔ)音企業(yè)商業(yè)化過(guò)程中,如何選擇適合自身的發(fā)展模式?鄭方認(rèn)為,模式的好壞取決于三個(gè)因素:一由市場(chǎng)需求決定,包括痛點(diǎn)(解決最受關(guān)注的問(wèn)題)和癢點(diǎn)(突破創(chuàng)新的東西);二是由技術(shù)來(lái)決定,技術(shù)是否成熟,是否具有一定領(lǐng)先性等;三是由競(jìng)爭(zhēng)關(guān)系決定。企業(yè)最后采取什么樣的商業(yè)模式,都需要根據(jù)這幾個(gè)因素來(lái)綜合決定。

對(duì)于目前智能語(yǔ)音行業(yè)的生態(tài),鄭方提到,雖然巨頭在資金、人才、數(shù)據(jù)、算法、算力上都占據(jù)了優(yōu)勢(shì),但隨著第三代人工智能的到來(lái),小企業(yè)仍有一定發(fā)展空間,把方向找對(duì),把力量用對(duì),就能夠在競(jìng)爭(zhēng)中處于有利地位。

他還呼吁,語(yǔ)音行業(yè)在中國(guó)仍然屬于一個(gè)小眾行業(yè),要想做得好就要避免惡性競(jìng)爭(zhēng)。一方面,語(yǔ)音企業(yè)需要找到自身定位,避免重復(fù)投入;同時(shí)技術(shù)研發(fā)人員和用戶之間也要達(dá)成比較好的互動(dòng),前者專注在技術(shù)層面創(chuàng)新,后者則在場(chǎng)景方面有創(chuàng)新,兩個(gè)結(jié)合起來(lái)才能形成比較好的生態(tài)。

他指出,目前市場(chǎng)上出現(xiàn)了一種不良競(jìng)爭(zhēng)的情況,用戶在發(fā)現(xiàn)提供商比較多后,就會(huì)通過(guò)讓企業(yè)“內(nèi)斗”壓價(jià),壓得很低甚至沒(méi)有利潤(rùn)。他認(rèn)為,這會(huì)使得企業(yè)沒(méi)有錢做研發(fā),最后受損的是整個(gè)市場(chǎng)。

以下是鄭方教授分享實(shí)錄(經(jīng)刪減整理)

目前智能語(yǔ)音處在什么樣的發(fā)展階段?不同技術(shù)存在很大的差異,對(duì)于這種差距怎么看?

鄭方:語(yǔ)音處理技術(shù)包含很多分支,語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、情感識(shí)別,信號(hào)分類等等。不同的技術(shù)處于不同的發(fā)展階段,語(yǔ)音合成、語(yǔ)音識(shí)別,目前相對(duì)比較成熟,但也有很多問(wèn)題需要解決,比如口音問(wèn)題,比如低資源的語(yǔ)種問(wèn)題。音頻情感識(shí)別、聲音信號(hào)健康診斷等新技術(shù),還在進(jìn)行研究。

但相對(duì)已經(jīng)成熟的分支存在一個(gè)問(wèn)題,就是同質(zhì)化比較嚴(yán)重。方法同質(zhì)化,帶來(lái)惡性競(jìng)爭(zhēng)。原因在哪兒?我們有時(shí)候過(guò)多跟蹤別人的技術(shù),而疏于做深度分析。

不少觀點(diǎn)提到,單一的技術(shù)無(wú)法讓 AI 企業(yè)在激烈的市場(chǎng)環(huán)境中生存發(fā)展起來(lái),那智能語(yǔ)音應(yīng)該怎么去做融合發(fā)展?

鄭方:不同的問(wèn)題可能需要用不同的技術(shù)綜合來(lái)解決,比如身份認(rèn)證,尤其網(wǎng)上遠(yuǎn)程或者無(wú)監(jiān)督情況下的身份認(rèn)證,可能會(huì)用到聲紋識(shí)別、語(yǔ)音識(shí)別、鑒偽、情感識(shí)別等技術(shù)。市場(chǎng)真正需要的是解決問(wèn)題的綜合方案,要利用它的特點(diǎn)找到不同的技術(shù)來(lái)融合。這個(gè)融合應(yīng)該是“能解決問(wèn)題的融合”,不能“為融合而融合”。

現(xiàn)在很多 AI 企業(yè)包括智能語(yǔ)音企業(yè)會(huì)出現(xiàn)很多轉(zhuǎn)型,比如最開(kāi)始只是做語(yǔ)音技術(shù),后來(lái)開(kāi)始去做 AI 芯片、操作系統(tǒng)等,怎么看待這種嘗試?

鄭方:從我個(gè)人來(lái)看,對(duì)技術(shù)也好,對(duì)產(chǎn)品也好,應(yīng)該術(shù)業(yè)有專攻,堅(jiān)定不移地做技術(shù)改進(jìn),不斷升級(jí)突破。但在企業(yè)發(fā)展過(guò)程中,根據(jù)一些戰(zhàn)略的需求或者市場(chǎng)的需求,做一些主動(dòng)的轉(zhuǎn)型,這是應(yīng)該的,也是可取的。但有些轉(zhuǎn)型,我覺(jué)得是在資本的壓力下做的一種被動(dòng)轉(zhuǎn)型。如果一個(gè)主要做算法研究的人去搞芯片,他其實(shí)沒(méi)有那方面的特長(zhǎng),非要做,為什么呢?因?yàn)槭杖霛M足不了投資方的需求,被迫做轉(zhuǎn)型,這種不可取,雖然可以理解。

AI 企業(yè)經(jīng)過(guò)轉(zhuǎn)型后大概形成四種商業(yè)模式:賣技術(shù)、賣產(chǎn)品、賣服務(wù)、賣解決方案。智能語(yǔ)音企業(yè)如何選擇適合自身的商業(yè)模式,哪種模式會(huì)更容易跑通?

鄭方:模式的好壞有三方面的決定因素。第一取決于市場(chǎng)需求,痛點(diǎn)和癢點(diǎn)。痛點(diǎn)是解決基本的最受關(guān)注的問(wèn)題,癢點(diǎn)就是想要做一些突破創(chuàng)新的東西。第二,由技術(shù)來(lái)決定,技術(shù)是否成熟,是否具有一定的領(lǐng)先性,能不能解決實(shí)際問(wèn)題。第三,由競(jìng)爭(zhēng)關(guān)系決定,廠商之間的競(jìng)爭(zhēng)關(guān)系是什么樣的程度,如果競(jìng)爭(zhēng)比較激烈,可能帶來(lái)相互壓價(jià)或者惡性競(jìng)爭(zhēng)。

企業(yè)最后采取什么樣的商業(yè)模式,都是根據(jù)這幾個(gè)因素來(lái)綜合決定的。比較成熟、市場(chǎng)也覺(jué)得比較容易接受的技術(shù),那就可以用產(chǎn)品或服務(wù)的模式直接銷售。一些不太成熟的,如用聲音看病,那就可能用技術(shù)驅(qū)動(dòng),在雙方合作的過(guò)程中去完善它,根據(jù)不同情況采取不同的模式來(lái)做可能比較好。

很多互聯(lián)網(wǎng)巨頭都在布局智能語(yǔ)音,如何看待和這些巨頭的競(jìng)爭(zhēng),希望智能語(yǔ)音行業(yè)能夠形成怎樣的生態(tài)?

鄭方:巨頭在資金、人才、數(shù)據(jù)、算法、算力上都占據(jù)了優(yōu)勢(shì),小企業(yè)是不是就沒(méi)有空間了?我覺(jué)得不是。人工智能進(jìn)入到第三代,就是把前兩代的知識(shí)和數(shù)據(jù)結(jié)合起來(lái),研究可解釋性,研究魯棒性(系統(tǒng)的穩(wěn)健性)。但是可解釋性不是完全靠大數(shù)據(jù)能解決的,有些問(wèn)題并不依賴大數(shù)據(jù),反而是用小數(shù)據(jù)解決的。這個(gè)可能是巨頭們不一定有的優(yōu)勢(shì),小企業(yè)把方向找對(duì),把力量用對(duì),就能夠在競(jìng)爭(zhēng)中處于有利地位。

需要特別強(qiáng)調(diào)一點(diǎn)的是,我們要維護(hù)一個(gè)良好秩序,技術(shù)人員(如科研機(jī)構(gòu)、科技公司)專注在技術(shù)層面創(chuàng)新,用戶企業(yè)(如銀行等)則在場(chǎng)景方面有創(chuàng)新,兩個(gè)結(jié)合起來(lái)才能形成比較好的生態(tài),要杜絕惡性的競(jìng)爭(zhēng)。

語(yǔ)音行業(yè)在中國(guó)仍然屬于一個(gè)小眾行業(yè),要想做得好就要避免惡性競(jìng)爭(zhēng),企業(yè)都找好自己定位,在擅長(zhǎng)的方面做得好、做到精、做到第一,甚至國(guó)際上拿到 NO.1,避免重復(fù)投入。企業(yè)之間也需要良性競(jìng)爭(zhēng),現(xiàn)在有一種不好的情形,用戶一旦發(fā)現(xiàn)技術(shù)、產(chǎn)品或服務(wù)提供商多了,就會(huì)通過(guò)讓這些企業(yè)“內(nèi)斗”來(lái)壓價(jià),壓得很低甚至沒(méi)有利潤(rùn),企業(yè)沒(méi)錢做研發(fā),最后受損的是整個(gè)市場(chǎng)。在價(jià)格方面,用戶應(yīng)該有正確的觀念和判斷,就像不能用拖拉機(jī)的預(yù)算去買奧迪。

在智能語(yǔ)音發(fā)展過(guò)程中,應(yīng)該如何保護(hù)用戶的個(gè)人隱私?

鄭方:這需要多方努力才能解決,首先用戶要有保護(hù)自己隱私的意識(shí),在這個(gè)前提下還需要兩方面的努力。第一是法律法規(guī)。我們國(guó)家最近剛剛頒布了《數(shù)據(jù)安全法》,對(duì)數(shù)據(jù)保護(hù)做了要求,也需要推進(jìn)標(biāo)準(zhǔn)規(guī)范。以后哪些數(shù)據(jù)能傳,哪些不能傳,數(shù)據(jù)怎么留存,留存多長(zhǎng)時(shí)間必須銷毀,是否要得到用戶的明示同意等,這些都要有明確規(guī)范。

第二,對(duì)企業(yè)一定要有技術(shù)上面的要求。企業(yè)應(yīng)該有一些社會(huì)責(zé)任感,在做技術(shù)研發(fā)的時(shí)候,從源頭階段就要按照規(guī)范來(lái)做,做到從采集、傳輸、存儲(chǔ)、使用到最后銷毀的全生命周期都能保證用戶隱私得到保護(hù)。

關(guān)鍵詞: 互聯(lián)網(wǎng)巨頭 智能語(yǔ)音 小企業(yè) 生存空間

 

網(wǎng)站介紹  |  版權(quán)說(shuō)明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com