国产在线精品无码二区欧洲,午夜在线观看免费高清在线,亚洲bt欧美bt日本bt,亚洲精品成人av观看在线,无码精品人妻一区二区三区免费看

10/04
2025

有價(jià)值的財經(jīng)大數據平臺

投稿

精品專(zhuān)欄

對標GPT-4o,科大訊飛正以大模型重塑語(yǔ)音產(chǎn)業(yè)

每個(gè)科技時(shí)代,都有每個(gè)時(shí)代的“入口”和“推手”。

在PC時(shí)代,瀏覽器和搜索引擎是主要入口,用戶(hù)通過(guò)鍵盤(pán)和鼠標進(jìn)行交互。移動(dòng)互聯(lián)時(shí)代,APP和應用商店成為典型入口,用戶(hù)用手指和觸摸屏進(jìn)入互聯(lián)網(wǎng)世界。而在眼下的AI時(shí)代,業(yè)內已經(jīng)把語(yǔ)音交互當做重要入口,它提供了一種更為豐富、自然和便捷的交互體驗。

縱觀(guān)歷史,每一個(gè)抓住入口、推動(dòng)時(shí)代發(fā)展的企業(yè),反過(guò)來(lái)也能掌握競爭主動(dòng)權,獲得長(cháng)期發(fā)展動(dòng)力。比如,PC時(shí)代的谷歌,移動(dòng)互聯(lián)時(shí)代的蘋(píng)果等等。

因此,如今很多大廠(chǎng)都在圍繞語(yǔ)音交互展開(kāi)深度布局,力圖搶占AI時(shí)代的戰略要地。其中,就國外和國內而言,OpenAI和科大訊飛成為最受關(guān)注的兩家企業(yè)。

今年5月,OpenAI 發(fā)布GPT-4o,展現出更為強勁的語(yǔ)音交互能力。比如,更快的響應速度、更自然的語(yǔ)音等等。但遺憾的是,GPT-4o目前還沒(méi)有向國內用戶(hù)開(kāi)放,大部分人無(wú)法親自感受各種體驗。

很多人不知道的是,國內的科大訊飛不僅做到了對標GPT-4o的語(yǔ)音交互體驗,而且還能讓人搶先體驗。

今年8月19日,科大訊飛發(fā)布了星火極速超擬人交互技術(shù),在響應和打斷速度、情緒感知情感共鳴、語(yǔ)音可控表達、人設扮演四個(gè)方面實(shí)現巨大突破。這項技術(shù)將于今年8月底在訊飛星火App上全民開(kāi)放使用,普通用戶(hù)也能親自感知。

在最近的科大訊飛2024年上半年業(yè)績(jì)說(shuō)明會(huì )上,《一點(diǎn)財經(jīng)》觀(guān)察到科大訊飛董秘江濤親自演示星火極速超擬人交互技術(shù),由此更直觀(guān)地看到了這項技術(shù)的操作體驗。

不得不說(shuō),科大訊飛雖然在研發(fā)上大力投入,但在宣傳上的力度著(zhù)實(shí)不夠。其實(shí),這項技術(shù)能對行業(yè)變革產(chǎn)生深度影響。與此同時(shí),科大訊也在積攢技術(shù)勢能,未來(lái)預計會(huì )釋放出強勁的發(fā)展動(dòng)能。

語(yǔ)音交互的“理想”與“現實(shí)”

2014年,一部講述人類(lèi)與AI愛(ài)情的電影《Her》收獲了超高人氣,還獲得了奧斯卡最佳原創(chuàng )劇本獎。

電影中,男主角西奧多的工作是給不善表達感情的人代寫(xiě)情書(shū)。他有語(yǔ)音操控的隨身設備,能夠直接用語(yǔ)音輸入信件內容、進(jìn)行打印等等。日常生活中,他還能通過(guò)語(yǔ)音收聽(tīng)歌曲、接收郵件和新聞。

讓很多觀(guān)眾浮想聯(lián)翩的是,西奧多遇到了一個(gè)AI機器人“薩曼莎”,她擁有溫情的聲線(xiàn),不僅非常體貼還很懂西奧多。在跟“薩曼莎”的長(cháng)期語(yǔ)音交流中,西奧多墜入愛(ài)河,開(kāi)始了一段“人機戀”。

十年以來(lái),這部電影里的科幻場(chǎng)景不斷照進(jìn)現實(shí),各種語(yǔ)音交互產(chǎn)品和技術(shù)持續迭代,豐富著(zhù)用戶(hù)的語(yǔ)音交互體驗。

不過(guò),很多用戶(hù)還是感覺(jué)跟想象中的體驗有落差。因為市面上語(yǔ)音交互技術(shù)普遍存在痛點(diǎn),包括響應遲鈍、難以共情、個(gè)性化不足、端點(diǎn)檢測困難等問(wèn)題。

簡(jiǎn)而言之,現在許多語(yǔ)音交互技術(shù)機器的味道還是太重,擬人的感覺(jué)不足,沒(méi)能提供足夠的情緒價(jià)值。這一方面導致用戶(hù)體驗不佳,另一方面阻礙了行業(yè)發(fā)展,需要有企業(yè)來(lái)破除痛點(diǎn),充當行業(yè)發(fā)展的推手。

目前來(lái)看,科大訊飛就是一個(gè)重要的推手。其推出的星火極速超擬人交互技術(shù)在四個(gè)方面極大提升了用戶(hù)體驗——“響應和打斷速度、情緒感知情感共鳴、語(yǔ)音可控表達、人設扮演”,總結下來(lái)就是:

不僅在響應上有速度,而且在情感上有溫度,能夠提供更多的情緒價(jià)值。

1、響應上的速度

用戶(hù)進(jìn)行語(yǔ)音交互的過(guò)程中,都想獲得更快的響應,達到“召之即來(lái)”的效果。并且在中途頻繁打斷的情況下,希望能夠迅速重新響應。

然而,目前主流的語(yǔ)音交互應用中,從用戶(hù)提出問(wèn)題到應用響應大多需要2-2.5秒,會(huì )明顯感覺(jué)到停頓,中途打斷后響應的時(shí)間更長(cháng),這就會(huì )影響用戶(hù)的交互節奏和智能體驗。

而星火極速超擬人交互技術(shù)帶給人的首個(gè)感受就是“快”,其讓響應時(shí)間縮短到了0.9秒,幾乎感覺(jué)不到停頓。另外,用戶(hù)還可以隨時(shí)打斷、插話(huà),它依然能做到迅速響應。

這意味著(zhù),通過(guò)星火極速超擬人交互技術(shù),用戶(hù)可以獲得更加貼近日常對話(huà)的現實(shí)體驗。

2、情感上的溫度

在語(yǔ)音交互過(guò)程中,如果能夠及時(shí)響應,但回應的卻是冷冰冰的話(huà)語(yǔ),用戶(hù)的交互欲望和熱情必然會(huì )降低,因為沒(méi)有人愿意面對一個(gè)沒(méi)有溫度的機器。

傳統指令型語(yǔ)音技術(shù),只能通過(guò)對某些特定發(fā)音的識別給出響應,情緒感知能力不足,而星火極速超擬人交互技術(shù)進(jìn)行了明顯的提升。其不僅能夠根據語(yǔ)音判斷用戶(hù)情緒,包括高興、悲傷、生氣、害怕等等,還能識別咳嗽、寵物叫聲等非語(yǔ)言信號,跟用戶(hù)之間產(chǎn)生更深層次的情感共鳴。

如果只能分別情緒,不能情緒化地回應,用戶(hù)的感知度也不會(huì )很明顯。星火極速超擬人交互技術(shù)在表達方式上更加靈活,可以根據用戶(hù)的指令控制數十種情感、風(fēng)格、方言,甚至自動(dòng)調節語(yǔ)速、語(yǔ)氣和情緒,讓對話(huà)更有溫度從而直入人心。

另外,星火極速超擬人交互還有一個(gè)優(yōu)勢就是能夠“選角色”,其支持多種人設的任意切換,用戶(hù)可以與孫悟空、蠟筆小新、小豬佩奇等角色進(jìn)行互動(dòng),感受到跟不同角色對話(huà)的樂(lè )趣。

可以說(shuō),以往的語(yǔ)音交互技術(shù)體驗起來(lái)更像機器,而星火極速超擬人交互更像人類(lèi),大大提升了用戶(hù)體驗。這種進(jìn)化背后,在于科大訊飛進(jìn)行了長(cháng)期的技術(shù)研發(fā)和積累。

語(yǔ)音交互進(jìn)化史:技術(shù)才是硬道理

語(yǔ)音交互進(jìn)化史,就是一部技術(shù)迭代史。

最早的語(yǔ)音交互技術(shù),可以追溯到上世紀60年代。當時(shí)的語(yǔ)音交互技術(shù)主要基于規則,也就是將語(yǔ)音按照語(yǔ)法等規則進(jìn)行分析和生成,然后根據設定好的語(yǔ)句進(jìn)行回應。

這種方法的智能度和靈活度都很低,只能進(jìn)行某些特定任務(wù),比如查詢(xún)天氣、訂票等,稍微復雜一些的指令就無(wú)法操作。

上世紀90年代,語(yǔ)音交互技術(shù)進(jìn)入新的階段,也就是基于統計模型。這種方法不再依賴(lài)于固定規則,而是利用概率論建立交互模型,根據上下文生成最合適的回應。這種方法相對可以處理更多指令,也能適應不同的場(chǎng)景需求。

2006年,隨著(zhù)深度學(xué)習技術(shù)興起,語(yǔ)音交互技術(shù)有了質(zhì)的飛躍,可以自動(dòng)學(xué)習語(yǔ)音信號的復雜特征,從而進(jìn)入DNN(深度神經(jīng)網(wǎng)絡(luò ))時(shí)代。比如,RNN(循環(huán)神經(jīng)網(wǎng)絡(luò ))是一種能夠處理序列數據的神經(jīng)網(wǎng)絡(luò )。它具有長(cháng)期記憶能力,可以用于處理連續的語(yǔ)音特征,從而提高識別準確率。

此后,語(yǔ)音交互技術(shù)在持續進(jìn)化,比如CNN(卷積神經(jīng)網(wǎng)絡(luò ))、DFCNN(深度全序列卷積神經(jīng)網(wǎng)絡(luò ))等等,用戶(hù)體驗也在持續升級。在技術(shù)進(jìn)化浪潮中,科大訊飛一直站在潮頭浪尖。

早在2012年,科大訊飛就將BN-feature和NDD-HMM兩套深度學(xué)習方案上線(xiàn)了訊飛輸入法和語(yǔ)音開(kāi)放平臺,由此成為國內首個(gè)上線(xiàn)深度學(xué)習語(yǔ)音識別商業(yè)系統的機構,將實(shí)際場(chǎng)景中語(yǔ)音識別的準確率從60%提升到了88%左右。

到現在,星火極速超擬人交互采用的是統一神經(jīng)網(wǎng)絡(luò ),直接實(shí)現語(yǔ)音到語(yǔ)音端到端建模,這是一種被驗證為能力更強的技術(shù)方案。

因為傳統的語(yǔ)音識別系統一般由多個(gè)模塊組成,包括聲學(xué)模型、語(yǔ)言模型和發(fā)音詞典等。而端到端建模將這些模塊合并為一個(gè)整體,實(shí)現了原始語(yǔ)音信號到最終文本的直接映射,這就給語(yǔ)音交互帶來(lái)了許多提升。

首先,端到端建模簡(jiǎn)化了傳統語(yǔ)音識別系統的復雜度、減少了模塊之間的集成難度。其次,它可以更好地外理語(yǔ)音信號中的噪聲和變異,提高了系統的魯棒性,即抵御外界干擾和保持穩定的能力。此外,它還具有更快的訓練和推理速度,適用于實(shí)時(shí)場(chǎng)景。

星火極速超擬人交互的技術(shù)優(yōu)勢背后,在于科大訊飛持續進(jìn)行研發(fā)投入和積累。

根據科大訊飛最新發(fā)布的2024年上半年財報,報告期內其營(yíng)收93.25億元,比上年同期增長(cháng)18.91%。值得注意的是,公司研發(fā)投入21.9億元,同比增長(cháng)32.23%,占營(yíng)收比重達23.5%。

在企業(yè)發(fā)展因子中,營(yíng)銷(xiāo)、宣傳等淺層次的是“快變量”。短期內,它們能夠發(fā)揮一時(shí)的成效,但也會(huì )呈現不穩定和低門(mén)檻的特征。

深層次則是“慢變量”,比如技術(shù)、研發(fā)等等。它們前期需要大量的投入,就像推動(dòng)一個(gè)靜止的輪子,投入到一定程度后輪子會(huì )越轉越快,從而迸發(fā)出“飛輪效應”,最終轉化為出色的技術(shù)和產(chǎn)品以及堅固的護城河。此次,科大訊飛推出星火極速超擬人交互技術(shù)就是一個(gè)典型。有時(shí)候,“慢”反而意味著(zhù)“快”。

其實(shí),星火極速超擬人交互技術(shù)背后的大模型能力,同樣具備龐大的想象空間。

眺望未來(lái):大模型重塑語(yǔ)音產(chǎn)業(yè)

如今,“大模型+”就像當年的“互聯(lián)網(wǎng)+”給與市場(chǎng)無(wú)限想象力。

在大模型的熱風(fēng)之下,許多產(chǎn)業(yè)都值得被重塑一遍,其中就包括汽車(chē)、機器人、消費電子、家電等領(lǐng)域。在大模型落地方面,科大訊飛通過(guò)星火大模型云邊端一體化、軟硬件一體化的全場(chǎng)景布局,這讓其能夠滿(mǎn)足多個(gè)復雜場(chǎng)景對大模型的需求,進(jìn)而摘取多元的產(chǎn)業(yè)紅利。

先說(shuō)汽車(chē)領(lǐng)域。今年上半年,中國汽車(chē)產(chǎn)銷(xiāo)量分別達1389.1萬(wàn)輛和1404.7萬(wàn)輛,依然保持全球第一。出口總量達348萬(wàn)輛,同比增長(cháng)25%,火熱態(tài)勢依舊。目前,中國汽車(chē)出海十強企業(yè)中,有8家企業(yè)和科大訊飛合作。未來(lái),汽車(chē)的趨勢必然是智能化。而大模型的賦能,可以提升智能座艙、智能駕駛等多個(gè)方面的用戶(hù)體驗,助力中國汽車(chē)產(chǎn)業(yè)的增長(cháng)。

比如,自2011年科大訊飛率先完成汽車(chē)語(yǔ)音國產(chǎn)化,車(chē)載語(yǔ)音已經(jīng)成為中國汽車(chē)市場(chǎng)的標配,但在海外仍受制于單一語(yǔ)種的制約。今年星火語(yǔ)音大模型發(fā)布72個(gè)語(yǔ)種/方言免切換對話(huà),并通過(guò)云邊端及軟硬一體化解決方案可以大大提升智能座艙體驗。另外,科大訊飛還研發(fā)出基于星火大模型的用車(chē)助手,能夠實(shí)時(shí)監測理解車(chē)輛狀況,精準解答用戶(hù)對用車(chē)的問(wèn)題。

科大訊飛方面透露,公司汽車(chē)智能化產(chǎn)品合作已覆蓋90%以上的中國主流自主品牌和合資品牌車(chē)廠(chǎng)。最新財報顯示,科大訊飛汽車(chē)業(yè)務(wù)也延續了強勁的增長(cháng)勢頭,上半年實(shí)現營(yíng)收3.5億元,同比增長(cháng)65.49%。

跟汽車(chē)一樣,機器人同樣是未來(lái)的重要趨勢。

尤其是人形機器人的前景非??捎^(guān),據《人形機器人產(chǎn)業(yè)研究報告》預測,2024年中國人形機器人市場(chǎng)規模將達到約27.6億元,到2029年達到750億元,將占世界總量的32.7%,占比位居世界第一。

大模型的思維鏈推理能力,能夠明顯提升機器人對于復雜任務(wù)的理解能力,并提供符合常識的任務(wù)拆解與規劃。尤其是具身感知模型與具身決策模型的結合,能夠進(jìn)一步提升人形機器人在真實(shí)場(chǎng)景下的多模態(tài)感知與理解能力。

在復雜任務(wù)拆解、開(kāi)放場(chǎng)景物體識別、多模態(tài)感知與理解等方面,星火大模型明顯提升了人形機器人的智能水平。在最近的在2024世界機器人大會(huì ),科大訊飛亮相了“大模型+具身智能”的人形機器人最新進(jìn)展:

整體運動(dòng)性能提升2倍,復雜任務(wù)拆解成功率超過(guò)95%,交互能力、運動(dòng)性能進(jìn)一步提升。

另外在產(chǎn)業(yè)賦能上,訊飛機器人超腦平臺已賦能420家機器人企業(yè),深度鏈接1.5萬(wàn)機器人開(kāi)發(fā)者,與優(yōu)必選、宇樹(shù)科技、智元機器人、銀河通用等人形機器人企業(yè)形成廣泛合作,未來(lái)預計有著(zhù)充足的想象空間和強勁的產(chǎn)業(yè)推動(dòng)力。

除了機器人,大模型浪潮也正在向消費電子終端和家電領(lǐng)域蔓延。

包括智能手機、智能辦公本、學(xué)習機等在內的消費電子終端的規模非常龐大,《2024年數字經(jīng)濟報告》顯示到2029年全球物聯(lián)網(wǎng)設備數量將增至390億部。如果用大模型讓每臺終端都變得更智能,從而提升用戶(hù)體驗,也能創(chuàng )造更大的市場(chǎng)空間。中商產(chǎn)業(yè)研究院預測,2023年中國智能硬件市場(chǎng)規模將達到14031億元,預計2024年增至達15033億元。

以科大訊飛智能辦公本X3為例,其搭載了最新的訊飛星火智能技術(shù),實(shí)現語(yǔ)音轉文字、智能筆記整理、多語(yǔ)種翻譯等高效辦公功能。用戶(hù)只需簡(jiǎn)單操作,就能將會(huì )議內容、演講要點(diǎn)等語(yǔ)音信息實(shí)時(shí)轉化為文字記錄。這不僅大大提高了用戶(hù)工作效率,也助力了科大訊飛智能硬件業(yè)務(wù)的增長(cháng)。根據最新發(fā)布的2024年半年報,科大訊飛智能硬件業(yè)務(wù)實(shí)現營(yíng)收9億元,同比增長(cháng)56.61%,增速遠超行業(yè)平均水平。

隨著(zhù)新一輪以舊換新熱潮來(lái)襲,家電市場(chǎng)也迎來(lái)新的市場(chǎng)增量。而家電與大模型的結合,能夠為用戶(hù)創(chuàng )造更智慧的家居生活,也能為家電廠(chǎng)商、技術(shù)提供商帶來(lái)新的增長(cháng)點(diǎn)。

比如,搭載訊飛星火認知大模型的電視語(yǔ)音助手將升級為全能的家庭中心,能夠輕松應對日程管理、智能家居控制等操作,也能讓孩子跟電視語(yǔ)音助手直接對話(huà),練習口語(yǔ)、獲取知識等等,打造出新的教育場(chǎng)景。三星就結合訊飛星火認知大模型的能力,讓電視語(yǔ)音助手具備深層次理解、內容生成和知識問(wèn)答等能力,極大提升了用戶(hù)體驗。

如今,星火大模型正成為教育、醫療、能源、汽車(chē)、家電、機器人等多個(gè)重要領(lǐng)域落地的首選。其不僅為AI時(shí)代的入口探索出更多可能性,也在結合實(shí)際場(chǎng)景進(jìn)行應用落地,為用戶(hù)真正帶來(lái)技術(shù)紅利,為企業(yè)創(chuàng )造經(jīng)濟效益,其本身也能夠獲得發(fā)展動(dòng)能。

結語(yǔ)

《底層邏輯》一書(shū)中提出“戰略勢能”的概念,形象地說(shuō)把一塊石頭抬到較高的山頂上就儲備了勢能。石頭向下滾動(dòng)時(shí),勢能就轉化為了動(dòng)能。

現在的科大訊飛,正處在積蓄戰略勢能的時(shí)候,需要克服困難大量投入。隨著(zhù)各項技術(shù)的深入和落地,戰略勢能將持續轉化為發(fā)展動(dòng)能,其未來(lái)是值得期待的。


AI財評
科大訊飛通過(guò)星火極速超擬人交互技術(shù)的發(fā)布,展現了其在A(yíng)I語(yǔ)音交互領(lǐng)域的深厚技術(shù)積累和創(chuàng )新能力。該技術(shù)不僅在響應速度和情感共鳴上實(shí)現了突破,還通過(guò)端到端建模簡(jiǎn)化了系統復雜度,提升了用戶(hù)體驗。從財經(jīng)視角看,科大訊飛的持續高研發(fā)投入(2024年上半年研發(fā)投入占營(yíng)收23.5%)為其技術(shù)領(lǐng)先地位提供了堅實(shí)支撐,這種“慢變量”策略有望在未來(lái)轉化為強勁的“飛輪效應”。 此外,科大訊飛通過(guò)星火大模型的云邊端一體化布局,成功賦能汽車(chē)、機器人、消費電子和家電等多個(gè)產(chǎn)業(yè),顯示出其在大模型應用落地方面的廣泛潛力。特別是在汽車(chē)智能化領(lǐng)域,科大訊飛已覆蓋90%以上的中國主流汽車(chē)品牌,上半年汽車(chē)業(yè)務(wù)營(yíng)收同比增長(cháng)65.49%,展現出強勁的增長(cháng)勢頭。 總體而言,科大訊飛憑借技術(shù)優(yōu)勢和產(chǎn)業(yè)賦能能力,正在A(yíng)I時(shí)代構建堅實(shí)的競爭壁壘,未來(lái)有望在多領(lǐng)域持續釋放增長(cháng)動(dòng)能,值得長(cháng)期關(guān)注。
国产在线精品无码二区欧洲,午夜在线观看免费高清在线,亚洲bt欧美bt日本bt,亚洲精品成人av观看在线,无码精品人妻一区二区三区免费看