智能語音重塑科技巨頭盈利新引擎

制作/新業務評論

img_pic_1564122830_0.jpg

最近,大西洋彼岸的一份報告成為許多人關注的焦點。

美國著名投資機構Mangrove Capital Partners發布的《2019年語音技術報告》(以下簡稱報告)指出,2025年語音經濟規模可達1萬億美元,正式超越移動應用經濟。

人們已經發現了某種信號。

在過去幾年中,谷歌,微軟,亞馬遜,百度等全球科技巨頭紛紛打賭音軌。此前預測的還有明星語音產品 Echo智能音箱,Siri智能語音助手,谷歌助手谷歌語音助手Cortana(微軟小娜)人工智能助手,Alexa語音識別引擎,百度小助手(DuerOS)。

一種明顯的感覺是語音識別正在成為人與互聯網之間新的主流通信方式。

究竟什么是聰明的聲音?它從何而來?你要去哪里?

一個

技術巨頭急于發出聰明的聲音

從歷史來看,找到關于語音技術的“集群”并不困難。

雷,那么這個被稱為世界上最偉大的實驗室可以看作是它的出發點。

兩年后,在1954年,藍色“巨人”小發貓與喬治城語言學家合作開發了一種可以將60個俄語單詞翻譯成英語的機器。不久之后,第一個基于計算機的語音合成系統被引入,語音技術開始與越來越多的想象力疊加。

人類最缺乏兩種能力,一種是想象力,另一種是創造力。然而,在使用數十年之后,當它被使用時,很難預測語音技術的發展軌跡。

當然,更難以認為這將成為一個全球舞臺。

對于智能語音技術,有一個相當具體的遙控中心類比。如今,一切都變得越來越具有代表性,聲音自然成為下一個產品形式的“苔蘚代碼”。誰可以制定密碼規則,誰可以控制整個情況。

這是一場持久戰。

在全球智能語音交互市場的當前主要參與者中,百度自2010年以來一直從事語音技術,現在已經有近十年的時間了。亞馬遜亞馬遜Alexa已經用了22年;即使是最新的Google Google智能助理也已經存放了近十年的數據。

一千英里不是一天的工作。隱藏在現在智能的Siri,Google智能助手,微軟小娜和百度小都背后是業界的高科技技術護城河。

今年年初,百度在語音領域宣布了四項重大技術突破。其中,世界上第一個流媒體多級截斷注意模型(SMLTA,全稱“Streaming trancated multi-layer attention”),得到了業界的認可。技術突破被評為技術領域的“登月計劃”。

在最近的AI開發者大會上,百度展示了“全雙工免費喚醒”功能,再次刷新了目前人機語音交互智能的上限。全雙工免費喚醒功能是Small Assistant 5.0的重要技術創新。在全雙工狀態下,除了無喚醒詞的持續對話之外,還有一個非常關鍵的技術突破,稱為“拒絕回應”,也就是說,當你知道如何回應和執行任務時,當你只需要傾聽,不要說話,不要回應。簡單地說,語音技術的突破使得機器的性能更接近“真人”。

在現場,觀眾只能感受到更平滑的對話,更明智的感覺,但背后是一系列學術問題。

在去年宣布的第20屆中國專利評審結果中,百度與語音,機器翻譯和無人駕駛汽車相關的三項專利在人工智能領域獲得了政府最高獎項。其中,涉及“語音專利”的新語音識別模型采用深度學習算法,在24小時內對數百億的大規模數據進行實時分析,高性能計算使語音識別的準確性得以提高。技術達到97%解決了語音識別領域的關鍵和常見技術問題,被麻省理工學院評為“2016年世界十大突破技術”。

在人工智能開發者大會上,百度還推出了用于遠場語音交互的宏盛芯片,可以實現遠場陣列信號的實時處理,高精度超低誤報警語音喚醒和離線語音承認。另一方面,百度的明星產品 - 小型智能揚聲器在今年第一季度達到了330萬臺的超高出貨量,在中國市場排名第一。顯然,百度正在構建從硬件底層芯片到上層智能硬件系統到系統軟件,語音客戶端,語音服務器和后端交互的全鏈路語音交互技術。

可以肯定的是,語音技術將成為未來十年的新決定性主題。

兩個

“技術+場景”是王者。

人工智能的發展經歷了三次浪潮。

第一波使用該算法構建推薦引擎,提供對互聯網服務的訪問,并促進谷歌,亞馬遜和Facebook的崛起。

第二次浪潮幫助公司使用結構化數據來優化決策過程,推動像Palantir這樣的大數據公司的出現,這些公司利用大量結構化數據來查找人類和人類難以找到的信息相關性。

現在第三波人工智能已經出現,人工智能已經獲得了眼睛,耳朵和無數其他感官,收集了前所未有的新數據,然后利用這些數據推動更復雜的過程自動化。

這種變化明顯不同于過去。正如李艷紅最近在《人民日報》發表的一篇文章中所說,“作為引領這一變革的戰略技術,人工智能將比以往的工業革命對世界產生更大的影響。”

確實如此。在人工智能的大潮中,許多領域的現有模型已經被重塑,應用場景不斷被顛覆,生產關系已經開始重新制定。

其中,聲音是一個非常重要的部分。

從語言和屏幕的限制中解脫出來,語音技術從根本上改變了人們與軟件交互的方式,并且可以完全取代移動應用程序作為未來的主要通信方式。

如果人和移動應用程序之間的交互現在是二維的,那么語音交互是三維的。而這種競爭的競爭也糾纏在互聯網的商機中。

語音技術領域不斷增加的融資額是最明顯的例子。根據報告數據,語音技術創業公司今年的融資額達到7.86億美元,遠超2018年的5.81億美元和2017年的2.98億美元,各項融資規模也在大幅上升。

百度是當之無愧的領導者。

作為最早部署人工智能的技術公司之一,百度擁有基于超大規模神經網絡,萬億級參數和數千億個樣本的人工智能算法,依靠數十萬臺服務器的計算能力和中國最大的GPU集群;作為中國最大的搜索引擎公司,百度還收集了大量中文(特別是普通話)的音頻數據,為百度語音識別系統Deep Speech 2技術提供了基本的數據優勢和支持。

百度美國人工智能實驗室負責人亞當科茨表示,截至2017年2月,Deep Speech 2的短語識別詞錯誤率降至3.7%,轉錄某些聲音的能力基本上是“超人”。 “,可以比母語人士更準確地轉錄較短的查詢。

吸引外界關注的是基于語音識別,圖像識別,自然語言處理,用戶肖像等技術能力的小型人工智能語音助手(DuerOS會話人工智能系統).百度技術大師。

從2017年的“秘密”到2017年發布的DuerOS,到2018年發布的一系列小型智能硬件產品,小型人工智能語音助手保持穩定的迭代率并不斷整合新功能開啟態度建立一個軟硬的人工智能生態系統能夠更好地服務于合作伙伴,成為名副其實的“智能中心”。

從技術到產品,從產品到下游合作伙伴,可以看出百度的智能語音系統已初具規模。技術與特定場景相結合,在智能語音交互技術領域,百度正在扮演著“標準”的角色。

語音,煽動未來業務的關鍵

通用電氣的前任首席執行官杰克韋爾奇被認為是二十世紀最杰出的首席執行官,他在自傳中寫道:“如果你想讓汽車加速十公里,只需加油門,提高速度。”加倍,有必要改變賽道。“

事實是商業軌道正在轉變。

《2019語音技術報告》有這樣一種觀點:“語音交互顛覆了過去人機交互的存在,并開始建立基于用戶和設備之間語音交互的新關系。就像之前從互聯網到移動互聯網,其新要求也在醞釀之中。“

從業務發展模型的角度來看,有兩種類型的變化,一種是自上而下,另一種是自下而上。前者需要市場快速調整其地位,并迅速采用新的安排來應對新的變化;后者重新體驗,形狀變化更安靜,但更堅韌,更耐用。

語音技術對業務形式的影響就像后者。

讓我們對未來的商業原型做出預測:在未來的某個時刻,我們不再需要打字,但我們可以使用語音盒手勢,鍵盤基本上消失了,在語音技術的祝福下,產品形式將會徹底改變了。無屏智能手機,語音電子商務,語音廣告,個性化品牌聲音.

這種預測正在發展成為現實。

根據瞻博網絡的數據,在美國和英國,語音電子商務將在未來幾年內引發集中爆發,規模將從2018年的20億美元增加到2022年的400億美元。

亞馬遜的語音廣告業務也在同一頁面上。有消息稱,亞馬遜正計劃開發Alexa語音助手的商業價值,然后建立大型數字廣告業務,測試各種廣告產品,包括視頻,以準備2018年廣告收入的增長。

頻繁布局的背后是確定語音技術的商業價值。

雖然目前智能語音技術還存在許多問題,但此時,布局先進,技術基礎已經建成。當波浪再次出現時,它將能夠利用這種情況。

可以預見,中國智能語音市場也將成為推動這一浪潮不可或缺的重要力量。正如在中國徒步三個月的英國部長邁克貝茨所說,“這片土地從未缺乏奇跡。”

湖北赖子麻将下载