科技互聯(lián)網(wǎng)巨頭扎堆入場(chǎng),ChatGPT成人工智能終極進(jìn)化方向?
2023年開(kāi)年至今,幾乎每一個(gè)網(wǎng)友,都逃不掉狂飆和ChatGPT的“洗禮”,一個(gè)霸榜熱搜一個(gè)多月話(huà)題度絲毫不減,一個(gè)讓全球科技巨頭連夜秀肌肉馬不停歇,就在ChatGPT全球狂飆之際,傳來(lái)若干令人震驚的消息:
據媒體報道,ChatGPT背后竟有一座“血汗工廠(chǎng)”,他們沒(méi)日沒(méi)夜干著(zhù)數據標注的工作,卻拿著(zhù)最低僅9塊錢(qián)的時(shí)薪,堪稱(chēng)復古級工業(yè)壓榨;
另外,讓全球科技巨頭欲罷不能的ChatGPT的運營(yíng)成本也首度被曝光,一次運算耗資高達450萬(wàn)美元,一天的成本高達3億,正如火如荼布局的國內的科技互聯(lián)網(wǎng)大廠(chǎng)們,錢(qián)能燒多久?ChatGPT會(huì )否像元宇宙一樣曇花一現?
ChatGPT全球狂歡:被忽視的“底層血汗”!
近日,美國《時(shí)代周報》的一則報道,讓所有關(guān)注ChatGPT的網(wǎng)友都感到后背一涼,據其稱(chēng)“為了訓練ChatGPT,Open AI雇傭了時(shí)薪不到2美元的尼日尼亞外包員工,讓他們不分晝夜干著(zhù)對龐大的數據庫進(jìn)行手動(dòng)數據標注的工作”
圖:時(shí)代周刊
先簡(jiǎn)單科普一下,何為數據標注,一般來(lái)說(shuō),只有經(jīng)過(guò)標注處理后的結構化數據才能被AI算法模型所訓練使用,所以,ChatGPT的每一次運行,都離不開(kāi)億萬(wàn)字節的被標注的大數據庫,對數據進(jìn)行初級標注的稱(chēng)之為標注工。
數據標注工通過(guò)簡(jiǎn)單的專(zhuān)業(yè)培訓后即可上手,主要工作內容是對圖像、語(yǔ)音、3D點(diǎn)云或文本等內容載體進(jìn)行標注,拿比較好理解的文本標注舉例,一段話(huà),數據標注工需要對其打上語(yǔ)義、構成、語(yǔ)境、目的、情感等數據標簽,從而使AI機器人能更好地理解這些語(yǔ)言。
值得一提的是,數據標注本質(zhì)是勞動(dòng)密集型行業(yè),它的一個(gè)顯性特質(zhì)是工資低微,按行業(yè)慣例,多數數據標注公司都會(huì )選擇開(kāi)在偏遠的鄉鎮以節省房租和運營(yíng)成本,哪怕獲微軟重磅注資、如日中天的OpenAI同樣不例外:
《時(shí)代周刊》報道,Sama公司雇傭了肯尼亞、烏干達和印度的外包員工,來(lái)為OpenAI提供數據標注服務(wù),OpenAI給Sama的項目報酬是每小時(shí)12.5美元,但Sama最后結算給數據標注工的時(shí)薪僅有1.32美元~2美元,相當于直接縮水了60%~90%。
也許有人說(shuō),為何不繞過(guò)中間商直接與OpenAI簽合同?我只能說(shuō)有這種想法的太Na?ve了,是不可能直接給你簽的,外包是他們降低綜合風(fēng)險的最佳方式,而且Sama等外包商就是專(zhuān)門(mén)吃這碗飯的,除了OpenAI還有別的大客戶(hù),這是行業(yè)慣例!
分析到這里,想必你們也就明白為何數據標注工干著(zhù)最苦最累的活,為何卻只能拿著(zhù)極其低微的報酬了,一小時(shí)9塊錢(qián),一天連續干10小時(shí)也才90,還不包吃不包住的,可能最多也就能填飽個(gè)肚子,但為了生存,他們只能選擇接受。
當然,最慘的是,除了拿錢(qián)少,還要承受巨大的心理煎熬,據《時(shí)代周刊》采訪(fǎng)到的四名員工表示,這份工作(數據標注工)給他們留下了持久的心理創(chuàng )傷(比如9小時(shí)完成至多20萬(wàn)個(gè)單詞的標注工)并且他們要求與心理咨詢(xún)師的會(huì )面也被Sama管理層多次拒絕。
ChatGPT的無(wú)限風(fēng)光背后,是全球千萬(wàn)普通數據標注工的無(wú)聲泣淚,毫不夸張地講,這是一場(chǎng)建立在底層血汗基礎之上的高端游戲,如今在眾巨頭與各路資本的助力下,ChatGPT已在全球開(kāi)枝散葉,國內的一眾巨頭們也都摩拳擦掌,生怕錯過(guò)這難得一見(jiàn)的風(fēng)口。
它們是為了講新的商業(yè)故事、還是真正為了人工智能的進(jìn)化?
ChatGPT為何讓巨頭著(zhù)迷?
除了讓蘋(píng)果、微軟和谷歌等一眾巨頭興奮難掩,國產(chǎn)科技互聯(lián)網(wǎng)巨頭也是當仁不讓?zhuān)俣惹澳_官宣“文心一言”,阿里達摩院緊接著(zhù)官宣內測ChatGPT,科大訊飛亦表示將在A(yíng)I學(xué)習機上率先落地ChatGPT……就連國內的數據標注公司海天瑞聲,進(jìn)入兔年以來(lái),股價(jià)都暴漲逾200%,瘋狂之象,前所未見(jiàn)!
來(lái)看一組ChatGPT迄今為止的卓越表現:
谷歌面試官稱(chēng)ChatGPT能通過(guò)年薪18萬(wàn)美元工程師的招聘考試;
《福布斯》報道稱(chēng)全美已有89%的學(xué)生用ChatGPT寫(xiě)作業(yè);
北密歇根大學(xué)稱(chēng)全校最出色的論文,出自ChatGPT之手;
《大西洋月刊》報道稱(chēng)ChatGPT的出現,直接宣告了大學(xué)論文的死亡;
有人用它寫(xiě)《植物大戰僵尸》的游戲代碼,被發(fā)現直接可用,有人告它,零基礎開(kāi)發(fā)出了游戲;
人有用它生成了《老友記》20年后重聚劇本,情節無(wú)比自然流暢;
上面的例子可能還離普通白領(lǐng)比較遠,感知不強烈,那好,再來(lái)一個(gè)爆炸級應用實(shí)例:
用集成了ChatGPT的微軟Edge(任何一臺安裝了WIN10、WIN11的電腦都標配的瀏覽器)打開(kāi)GAP的財報,并問(wèn)邊欄的ChatGPT:“這幾十頁(yè)財報說(shuō)了啥?”
ChatGPT很快給你將要點(diǎn)拎出并總結了一番;
繼續問(wèn)ChatGPT:“跟Lululemon比呢?”
ChatGPT很快給你列了一個(gè)對比表,并且表格里的每一項數據都注明了數字來(lái)源;
你甚至可以想象一下這樣的工作場(chǎng)景,打開(kāi)郵箱,看到一份幾十面的材料,你完全可以讓ChatGPT給你總結要點(diǎn),并且讓ChatGPT給你列出決策項,并且可以針對每個(gè)決策寫(xiě)郵件發(fā)給客戶(hù),客戶(hù)收到你的郵件,也可以呼叫ChatGPT來(lái)信息處理乃至完成回信的操作
……
能分析會(huì )處理還能制表,這已經(jīng)是質(zhì)變了,不說(shuō)完全取代打工人,至少足以完成很多白領(lǐng)的大部分工作了。
據華西證券研報,ChatGPT目前至少能幫人類(lèi)做寫(xiě)代碼、繪畫(huà)、寫(xiě)新聞、寫(xiě)相聲、提供家裝設計和人生規劃建議與信息分類(lèi)等49件事,涉及到多個(gè)行業(yè)和學(xué)習工作的方方面面。
2月13日,知名互聯(lián)網(wǎng)大佬、獵豹移動(dòng)(原金山網(wǎng)絡(luò ))CEO傅盛興奮發(fā)帖稱(chēng):“被ChatGPT給驚到了,因為它居然猜出了我家狗狗叫3萬(wàn)的原因,圖靈測試肯定能通過(guò)了,關(guān)鍵是這才剛開(kāi)始……”
也就是說(shuō),理解常識和理解語(yǔ)義這兩個(gè)對于機器語(yǔ)言最難的點(diǎn),ChatGPT都做到了,人類(lèi)獨有的常識理解被AI機器人掌握,聽(tīng)上去確實(shí)像科幻電影照進(jìn)了現實(shí),但這一切,都只是開(kāi)始;
被ChatGPT震驚的大佬絕不僅傅盛一個(gè),據媒體報道,2020年的一次大會(huì )上,百度創(chuàng )始人李彥宏就準確預判了類(lèi)ChatGPT產(chǎn)品的爆發(fā):
“技術(shù)積累到這兒了,數據的積累也到這兒了,計算能力的積累也到這兒了,正好這三者在這個(gè)時(shí)點(diǎn)具備了爆發(fā)的能力,AI技術(shù)的進(jìn)一步成熟,可以運用于很多領(lǐng)域,大幅提升效率,并改變人們的生活方式”。
微軟創(chuàng )始人比爾蓋茨直言“ChatGPT出現的重大歷史意義,不亞于PC和互聯(lián)網(wǎng)的誕生”!
于是我們看到微軟火線(xiàn)入局OpenAI,成了當下ChatGPT的最大受利者,讓谷歌和蘋(píng)果都開(kāi)始寢食難安,而在大洋彼岸的東方圣土,一場(chǎng)類(lèi)ChatGPT的AI技術(shù)變革正在盛大拉開(kāi)帷幕。
目前,百度布局的ChatGPT產(chǎn)品“文心一言”(英文名“ERNIE Bot”)預計3月份推出,阿里達摩院布局的ChatGPT也在緊張內測中,華為計算產(chǎn)品線(xiàn)相關(guān)負責人亦表示,公司在2020年就開(kāi)始在與ChatGPT相關(guān)的大模型領(lǐng)域有布局,科大訊飛在去年還曾獲得包括OpenBookQA、常識推理挑戰賽QASC等在內的總共12項認知智能領(lǐng)域的權威評測第一名……
這么多巨頭都有在類(lèi)ChatGPT領(lǐng)域縱深布局,足以說(shuō)明,相較之于空泛的元宇宙,更接地氣更顯成果的ChatGPT才是AI賽道最大的風(fēng)口,沒(méi)有之一!
盡管前途一片光明,但也不能忽視過(guò)程中所付出的巨大代價(jià),我們的科技互聯(lián)網(wǎng)巨頭們要推出一個(gè)完成度接近于ChatGPT的產(chǎn)品,首先就要算一筆經(jīng)濟賬:
據《華為爾見(jiàn)聞》報道,按國盛證券的分析模型推測,類(lèi)ChatGPT的大模型訓練一次就要燒掉200萬(wàn)-1200萬(wàn)美元,僅每日的電費消耗就高達4.7萬(wàn)美元;
據《36氪財經(jīng)》報道,ChatGPT一次運算的成本高達450萬(wàn)美元,《財富》曾報道稱(chēng)2022年,OpenAI公司凈虧損高達5.45億美元,如若不是背后大股東微軟源源不斷的輸血支撐,OpenAI的ChatGPT早黃了。
據《深網(wǎng)》透路,小冰CEO李笛曾直言“小冰框架當前所支撐的對話(huà)交互量,一天就達到14個(gè)人類(lèi)一輩子的對話(huà)交互量,若使用ChatGPT的方法,每天成本將高達3億元,一年成本超過(guò)1000億”
……
暫且不說(shuō)“血汗工廠(chǎng)”廉價(jià)雇傭數據標注工的問(wèn)題,先回歸商業(yè)本質(zhì),持續的巨額資金投入亦難平ChatGPT的無(wú)底洞,回報遙遙無(wú)期、沉沒(méi)成本甚至遠高于雇傭人類(lèi),這真的值嗎?
參考資料:
信源綜合每日經(jīng)濟新聞、快科技、鞭牛士、鳳凰網(wǎng)財經(jīng)、36氪財經(jīng)、景聯(lián)文數據標注等,部分圖源網(wǎng)