國產(chǎn)大模型又添一把“火”,燒起來(lái)了!
每一個(gè)“哈利波特”迷都渴望有一個(gè)進(jìn)入魔法世界的9?站臺。
而每一個(gè)進(jìn)入魔法世界的魔法師又都想進(jìn)入“有求必應屋”,在那里一切的難題都有解決辦法,海倫娜形容它:如果你還需要問(wèn),就永遠不會(huì )明白;如果你明白,你只需要開(kāi)口問(wèn)。
對于提供捷徑的“萬(wàn)事通”,人們一直向往。
權謀劇《瑯琊榜》中有至高無(wú)上的情報機構“瑯琊閣”,主打“衡量天下大事,盤(pán)點(diǎn)世間英雄”,所有的疑難事在這里也都有答案。
這些天馬行空的想象因為科技正在變成現實(shí)。
2023年開(kāi)年,ChatGPT“提問(wèn)、回答”模式刷新了人們對AI的認知,之后大模型就一直處于最熱的風(fēng)口。
國內互聯(lián)網(wǎng)企業(yè)們先后發(fā)布了文心一言、通義千問(wèn)等大模型,給賽道添火加溫,而成立20多年的“人工智能第一股”科大訊飛發(fā)布的認知大模型——“星火”,則把多模態(tài)大模型的想象拓展到新的層級。
大模型賽道越來(lái)卷。
一 體驗一把星火大模型,挺香!
國產(chǎn)大模型真的太卷。
卷到就連名字都是各種引經(jīng)據典,文心一言、通義千問(wèn)、混元、言犀……在這些兼具氣勢和野心的名字里,“訊飛星火”顯得有點(diǎn)過(guò)于樸素。
24年前,中國的語(yǔ)音市場(chǎng)被國際巨頭占領(lǐng),為了實(shí)現“中文語(yǔ)音要做到世界最好”的目標,6個(gè)中科大在校大學(xué)生開(kāi)始了艱難的創(chuàng )業(yè)之路,才有了今天的科大訊飛。
“燃燒最亮的火把,要么率先燎原,要么最先熄滅?!边@句當初的創(chuàng )業(yè)口號至今還刻在科大訊飛總部大樓的墻上。
取名“星火”,既是致敬當初創(chuàng )業(yè)的初心,更是對AI二次創(chuàng )業(yè)的信心和決心,星星之火必將燎原。
星火發(fā)布會(huì )現場(chǎng)解釋“星火”的含義
那么星火大模型能力究竟如何?對比其他大模型有什么不同?我們分別對“ChatGPT”“星火”、“文心一言”從文字編排能力、中文輸出能力和邏輯能力三個(gè)方面進(jìn)行了實(shí)測。
測試1:寫(xiě)一個(gè)無(wú)法拒絕的請假條。
ChatGPT的回答
訊飛星火的回答
文心一言的回答
面對基礎的語(yǔ)言文字問(wèn)題,三款AI工具都可以看似按照需求的完成任務(wù),其中訊飛星火的語(yǔ)法和措辭更為接近國人的口吻,不僅說(shuō)出了原因,還給到請假之后的解決方案。
領(lǐng)導看到這樣的請假條,確實(shí)“無(wú)法拒絕”。
測試2:以“我掛斷了跨越時(shí)間的電話(huà)”為開(kāi)頭,發(fā)揮想象,寫(xiě)一篇故事。
ChatGPT的回答
訊飛星火的回答
文心一言的回答
想象力上三款AI工具各有千秋,都有跨越時(shí)空的情節,ChatGPT的回答符合西方的科幻情節,訊飛星火和文心一言的更符合中文語(yǔ)境下的時(shí)空想象,其中訊飛星火的回答中“電話(huà)”的線(xiàn)索一直都在,且首尾呼應,像一篇成熟的短篇小說(shuō)。
測試3:同時(shí)拋擲兩枚質(zhì)地均勻的硬幣,正面向上和反面向上的概率分別是多少?
考驗的是邏輯能力。
ChatGPT的回答
訊飛星火的回答
文心一言的回答
針對邏輯性的測試,三款AI工具都沒(méi)有翻車(chē),給出的答案都是準確的。
不同的是ChatGPT有很清晰的解題邏輯,思維縝密;文心一言只有答案,即使追問(wèn)解題過(guò)程也沒(méi)有更多回答;訊飛星火則介于二者之間,有簡(jiǎn)單的解題邏輯,文字表達也清晰,四種結果一目了然。
整體測評下來(lái),感覺(jué)三款AI工具都各有千秋,但訊飛星火的中文表達、邏輯等更強。
在星火大模型發(fā)布現場(chǎng),更是圍繞訊飛星火認知大模型的七大核心能力,“大膽”語(yǔ)音實(shí)測。
星火不僅對現場(chǎng)隨機提問(wèn)機智回答,甚至在回答“女朋友生氣了該怎么辦”這樣的問(wèn)題時(shí),展現出極高的情商。
科大訊飛董事長(cháng)劉慶峰自豪的表示,當前訊飛星火認知大模型在文本生成、知識問(wèn)答、數學(xué)能力三大能力上已超ChatGPT。他還進(jìn)一步公布大模型年內三次升級時(shí)間點(diǎn),10月底將整體趕超ChatGPT。
二 星火,真的可以燎原
在互聯(lián)網(wǎng)行業(yè),評價(jià)一個(gè)產(chǎn)品好壞的標準是有多少商業(yè)價(jià)值,這在大模型賽道同樣適用。
和ChatGPT面向C端不同,星火認知大模型的定位不僅有C端,更偏向B端。
作為以中文為核心的新一代認知智能大模型,訊飛星火擁有跨領(lǐng)域的知識和語(yǔ)言理解能力,定位是一個(gè)通用的賦能平臺,教育、辦公、醫療等千行百業(yè),都可以基于這個(gè)平臺來(lái)實(shí)現智能化變革,創(chuàng )造商業(yè)價(jià)值。
訊飛星火認知大模型成果發(fā)布會(huì )上,訊飛AI學(xué)習機、訊飛聽(tīng)見(jiàn)、訊飛智能辦公本、訊飛智慧駕艙、訊飛開(kāi)放平臺等5項應用成果也同步發(fā)布。
可以看出,星火認知大模型將催生三種變革:
一是原有產(chǎn)品因AI的加入變得能力更強;二是解鎖了全新場(chǎng)景,催生此前未曾想過(guò)的應用;三是AI的產(chǎn)業(yè)生態(tài)更加繁榮。
首先大模型是讓產(chǎn)品價(jià)值提升。
大模型本身對 C 端硬件的重要價(jià)值就是后端理解能力的提升,每一個(gè)智能終端的人機交互會(huì )更便捷、更自然、更有深度。
發(fā)布會(huì )上,我們看到訊飛錄音筆、辦公本、訊飛聽(tīng)見(jiàn)等在產(chǎn)品效果上的大幅提升。
在會(huì )議紀要方面,以前只是轉寫(xiě)成原汁原味的文字,而運用大模型后,不僅將語(yǔ)音實(shí)時(shí)轉寫(xiě)與墨水屏紙感書(shū)寫(xiě)相結合提升了閱讀的“質(zhì)感”,快速回溯會(huì )議內容,還很“細節控”的去除語(yǔ)音轉寫(xiě)文稿中的口語(yǔ)化詞匯、過(guò)濾冗余詞匯,對文本進(jìn)行潤色,輕松將一篇語(yǔ)音轉寫(xiě)文稿規整成書(shū)面化內容,閱讀效率提升50%。
有了星火大模型,開(kāi)會(huì )也不再是打工人的“負擔”。
第二是產(chǎn)業(yè)融合下的場(chǎng)景價(jià)值提升。
大模型競逐,產(chǎn)業(yè)融合是評判標尺,早在在大模型涌現之前,訊飛就一直在探索AI與產(chǎn)業(yè)的融合,像基于訊飛超腦的智慧城市解決方案、蕪湖市智慧教育平臺都是AI+的典型能力體現。
有人把AI類(lèi)比為數字時(shí)代的“操作系統”,但單純操作系統是沒(méi)法賺錢(qián)的,真正在iOS和安卓上賺到錢(qián)的還是淘寶、美團、抖音這樣的產(chǎn)品以及它們背后廣闊的應用場(chǎng)景。
訊飛星火很早就認識到場(chǎng)景落地的重要,在其他企業(yè)開(kāi)始加速探索各種落地場(chǎng)景之時(shí),率先明確了“1+N認知智能大模型技術(shù)及應用”的戰略布局。其中,“1”是通用的人工智能底座,“N”是在教育、醫療、辦公、人機交互、車(chē)載等領(lǐng)域的行業(yè)縱深應用。
訊飛星火通過(guò)AI底座為各行各業(yè)打造行業(yè)樣板間,最終1和N會(huì )形成飛輪效應,走向商業(yè)化的正循環(huán)。
第三,生態(tài)是大模型玩家制勝的關(guān)鍵一環(huán)。
對于科大訊飛這樣的大模型企業(yè)來(lái)說(shuō),主要的合作伙伴應該會(huì )是AI能力不強的行業(yè)、企業(yè)。
要想讓企業(yè)加入自己的生態(tài)圈,至關(guān)重要,對ChatGPT是這樣,對訊飛星火也是一樣。
“科大訊飛一直認為,人工智能的發(fā)展絕不是單個(gè)企業(yè)和單個(gè)科研機構的事情,而是需要大家合作共贏(yíng)的?!眲c峰說(shuō)。
目前已知的是,星火認識大模型將會(huì )開(kāi)放給訊飛開(kāi)放平臺、羚羊工業(yè)互聯(lián)網(wǎng)平臺等,在行業(yè)內率先實(shí)現真正的大模型開(kāi)源。訊飛的相關(guān)技術(shù)將以 API 和生態(tài)賦能的方式,提供給行業(yè)開(kāi)發(fā)伙伴,在各個(gè)領(lǐng)域成功應用。
發(fā)布會(huì )現場(chǎng)劉慶峰宣布,首批來(lái)自36個(gè)行業(yè)的3000余家企業(yè)開(kāi)發(fā)者將接入星火大模型,聯(lián)合各行業(yè)合作伙伴共建大模型“星火”生態(tài)。與生態(tài)伙伴一起,燎原新一輪產(chǎn)業(yè)變革。
這意味著(zhù)國產(chǎn)大模型邁出走向商用關(guān)鍵一步。
一旦抓住行業(yè)先機,未來(lái)可能會(huì )影響甚至顛覆現有的整個(gè)商業(yè)模式,那么星星之火就真的可以燎原了。
三 誰(shuí)是國產(chǎn)大模型全場(chǎng)的希望?
毫無(wú)疑問(wèn),大模型從開(kāi)發(fā)到落地,需要投入大量的技術(shù)、資金和人力, 他山之石可以攻玉,但為什么一定要做國產(chǎn)大模型?
AI從來(lái)不只是技術(shù)、算力、人才的角逐,更是國家戰略的角力。
“芯片”的前車(chē)之鑒歷歷在目,我們絕不希望未來(lái)還在人工智能領(lǐng)域被掣肘,全世界的大模型不應該也不會(huì )只有chatgpt一種模式。
再者AI產(chǎn)品訓練,必定需要大量?jì)热萃段?,廠(chǎng)商是否合法合規地收集、存儲和處理用戶(hù)數據?是否嚴格遵循相關(guān)法律法規和隱私保護標準?是否確保用戶(hù)數據不被濫用、泄露或侵犯?這些主動(dòng)權只有掌握在自己手里才最安全。
4月份以來(lái),網(wǎng)信辦發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》,科技部發(fā)起成立“國家超算互聯(lián)網(wǎng)聯(lián)合體”,這些都表明了國家的關(guān)切與肯定。
在國家科技競爭之下,中國大模型產(chǎn)業(yè)需要自己的“星火時(shí)刻”。那誰(shuí)會(huì )是大模型行業(yè)全場(chǎng)的希望呢?這取決于以下幾點(diǎn)。
首先是誰(shuí)有更長(cháng)期的數據積累?
在目前宣布進(jìn)軍大模型的約40家企業(yè)、機構中,深耕AI產(chǎn)業(yè)20多年的科大訊飛,在自然語(yǔ)言處理方面的積累最雄厚,人工智能的技術(shù)儲備很深。
在中文文本數據積累方面,訊飛擁有語(yǔ)音及語(yǔ)言信息處理國家工程研究中心多年研究過(guò)程形成的積累,在中文語(yǔ)音市場(chǎng)占有率遙遙領(lǐng)先;訊飛人工智能開(kāi)放平臺作為首批國家新一代人工智能開(kāi)放創(chuàng )新平臺,日使用量超過(guò) 50 億人次,已積累了超過(guò)50TB的行業(yè)語(yǔ)料和每天超10億人次用戶(hù)交互的活躍應用。
當然數據質(zhì)量也很重要。
以醫療領(lǐng)域為例,科大訊飛是全國唯一通過(guò)國家執業(yè)醫師資格考試的人工智能系統,超過(guò)了96.3%的醫學(xué)考生,已累計為基層醫生 提供了超過(guò) 5.8 億次、日均超過(guò) 70 多萬(wàn)人次的人工智能輔診。
很明顯,科大訊飛的數據更多,基礎更扎實(shí)。
第二是誰(shuí)在算力上布局更縱深?
科大訊飛在總部自建有業(yè)界一流的數據中心,目前已建成4城7中心深度學(xué)習計算平臺,為大模型訓練平臺建設奠定了很好的硬件基石。
在工程技術(shù)方面實(shí)現了百億參數大模型推理效率的近千倍加速,為未來(lái)更大更多認知智能大模型技術(shù)經(jīng)濟實(shí)惠規?;瘧锰峁┝丝赡?。
第三是誰(shuí)在算法上更有經(jīng)驗?
目前來(lái)看,科大訊飛在Transformer深度神經(jīng)網(wǎng)絡(luò )算法方面經(jīng)驗豐富,已應用于語(yǔ)音識別、圖文識別、機器翻譯等領(lǐng)域,并達到了國際領(lǐng)先水平。
更重要的是,還要看誰(shuí)的科研投入更多?
訊飛在研發(fā)投入和人才上一直是業(yè)內領(lǐng)先。訊飛研究院核心的研究團隊人數超過(guò)openAI,且其中有兩位是《麻省理工科技評論》“35 歲以下科技創(chuàng )新 35 人”榜單中頂尖的年輕科學(xué)家。
同時(shí)訊飛一向在研發(fā)投入上毫不含糊,僅2022年研發(fā)便花了33.55億元。研發(fā)投入帶來(lái)的核心技術(shù)進(jìn)步是很明顯的。
僅2022年,科大訊飛在人工智能關(guān)鍵核心技術(shù)領(lǐng)域累計摘取16項國際人工智能大賽的冠軍,其中在認知智能領(lǐng)域獲得13項冠軍。
數據、算法、算力的三要素上積累深厚,人才積累和科研投入上不斷加碼,這讓訊飛星火有可能成為大模型行業(yè)全場(chǎng)的希望。
草蛇灰線(xiàn),伏延千里。
大模型賽道,注定有一場(chǎng)避無(wú)可避的戰爭。我們無(wú)法想象世界上只有OpenAI,也無(wú)法想象只有一種大模型,全世界需要ChatGPT這樣的“先行者”,中國更需要訊飛星火這樣的“自己人”。
AI大模型是一項需要長(cháng)期投入的事業(yè),我們現在看到也只是局部,未來(lái),還有更大的世界會(huì )向我們敞開(kāi)大門(mén)。
但無(wú)論如何,只有點(diǎn)燃手上的星星之火,才有機會(huì )可以燎原。