大模型價(jià)格又砍一刀 這次“屠夫”竟是量化私募?
摘要:①據稱(chēng),其最新大模型性能比肩GPT-4,價(jià)格僅有GPT-4的近百分之一。 ②機構計算,在算力服務(wù)力利用率最高的情況下,DeepSeek每臺服務(wù)器每小時(shí)收益可達35.4美元,毛利率在70%以上。 ③此前該量化私募已手握超萬(wàn)張英偉達GPU,更為了發(fā)展人工智能租下近2000平方米場(chǎng)地。
《科創(chuàng )板日報》5月10日訊?連AI大模型也開(kāi)始“卷”價(jià)格了,這次舉起“砍價(jià)屠刀”的攪局者,沒(méi)有科技巨頭加持,也沒(méi)有互聯(lián)網(wǎng)大廠(chǎng)背景,而是和幻方這家量化私募有著(zhù)千絲萬(wàn)縷關(guān)系。
日前,深度求索開(kāi)源第二代MoE大模型DeepSeek-V2,頂著(zhù)“價(jià)格屠夫”的稱(chēng)號一炮而紅——性能比肩GPT-4、價(jià)格僅有GPT-4的近百分之一。
值得注意的是,DeepSeek出品公司是杭州深度求索人工智能基礎技術(shù)研究有限公司(以下簡(jiǎn)稱(chēng)“杭州深度求索”),此前多家媒體報道顯示,深度求索為幻方旗下組織機構。且幻方量化曾在去年4月發(fā)布公告稱(chēng),將全力投身到人工智能技術(shù)之中,成立新的獨立研究組織“深度求索”。
另?yè)煅鄄閿祿@示,杭州深度求索的背后為幻方量化實(shí)控人梁文鋒,后者在杭州深度求索最終受益的股份比例超八成。
性能方面,DeepSeek-V2擁有2360億參數,其中每個(gè)token210億個(gè)活躍參數。據官網(wǎng)介紹,DeepSeek-V2中文綜合能力(AlignBench)“在眾多開(kāi)源模型中最強”,超過(guò)GPT-4,與GPT-4-Turbo,文心 4.0等閉源模型在評測中處于同一梯隊;英文綜合能力(MT-Bench)與LLaMA3-70B處于同一梯隊,超過(guò)最強MoE開(kāi)源模型Mixtral8x22B。
算力需求方面,分析機構SemiAnalysis指出,DeepSeek-V2訓練參數量達8.1萬(wàn)億個(gè)token,而表現出“難以置信”的訓練效率,計算量?jì)H為Meta Llama 3 70B的1/5,更只有GPT-4 的1/20。
如果說(shuō)上述這些只是AI技術(shù)迭代浪潮中常見(jiàn)的“技術(shù)炫技”,那么價(jià)格則是該模型最引發(fā)關(guān)注的要點(diǎn)。
目前DeepSeek-V2 API定價(jià)為:每百萬(wàn)token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。
SemiAnalysis給出了“便宜得難以置信”的評價(jià)。據該機構計算,在其算力服務(wù)力利用率最高的情況下,DeepSeek每臺服務(wù)器每小時(shí)收益可達35.4美元,毛利率在70%以上。
幻方量化,這家號稱(chēng)量化界“四大天王”之一的私募,管理規模曾一度飆升至千億,但之后幻方產(chǎn)品大幅回撤,管理規模也迅速縮水。去年年末,幻方還遭投資者控訴稱(chēng),“花100萬(wàn)元買(mǎi)了幻方量化的產(chǎn)品兩年多,贖回時(shí)只剩約80萬(wàn)元,還要被計提3萬(wàn)多的業(yè)績(jì)報酬”。
幻方量化去年4月公告成立“深度求索(DeepSeek)”之后,深度求索發(fā)布了第一代大模型,并將免費商用,完全開(kāi)源。
彼時(shí),幻方量化的公告曾在業(yè)內引發(fā)“AI炒股說(shuō)”的議論,但幻方量化董事總經(jīng)理陸政哲表示,“我用中文重申一下:AGI不是用來(lái)炒股的,有大得多的用處和大得多的價(jià)值?!?/p>
在此之前,幻方量化已于2019年投資2億元自主研發(fā)深度學(xué)習訓練平臺“螢火一號”,搭載了1100塊GPU;2021年幻方量化對“螢火二號”投入增加到10億元,且搭載了約1萬(wàn)張英偉達A100顯卡——也是在那一年末,OpenAI的ChatGPT橫空出世,掀起全球AI熱潮和英偉達GPU“搶購潮”。
值得一提的是,為了投入人工智能,幻方還租下“20個(gè)網(wǎng)球場(chǎng)”。去年末有媒體報道稱(chēng),北京深度求索人工智能(以下簡(jiǎn)稱(chēng)“北京深度求索”)正在進(jìn)行裝修招標,辦公室選址于北京海淀區融科中心,裝修工程面積達1950平方米,并獲得了施工許可證。
而天眼查顯示,北京深度求索則由上文提到的杭州深度求索100%控股。