回歸小鎮(zhèn)青年,DeepSeek的草根狂歡
文源 | 源媒匯
作者 | 謝春風(fēng)
編輯 | 蘇淮
DeepSeek幾乎承包了今年春節(jié)期間的大半熱度。
截圖來(lái)源于DeepSeek官網(wǎng)
國(guó)產(chǎn)AI獨(dú)角獸DeepSeek的意外出圈,令其創(chuàng)始人梁文鋒的家鄉(xiāng)——廣東湛江吳川覃巴鎮(zhèn)米歷嶺村吸引了眾多游客前往“打卡”。甚至還有建筑風(fēng)水師拿著羅盤,研究起米歷嶺村的房屋布局和梁文鋒的家宅布局。
一時(shí)間,科技與玄學(xué)巧妙“相融”。
在國(guó)內(nèi)大廠以及國(guó)際巨頭紛紛傾力押注AI大模型的市場(chǎng)背景下,DeepSeek,這家由量化私募公司幻方量化(下稱“幻方”)孵化的大模型公司,團(tuán)隊(duì)核心成員僅百余人,沒有鋪天蓋地的發(fā)布會(huì),卻以“能用、好用、用得起”的口碑悄然滲透市場(chǎng)。
DeepSeek的崛起,不僅曾引發(fā)美國(guó)科技股的大幅下跌,甚至迫使行業(yè)掀起價(jià)格戰(zhàn)。
而梁文鋒本人更因豪捐上億善款、拒絕資本裹挾的姿態(tài),成為中國(guó)AI領(lǐng)域的一股清流。
01
一場(chǎng)“沉默”的技術(shù)革命
與多數(shù)AI公司依賴資本“造勢(shì)”不同,DeepSeek的春節(jié)走紅充滿“草根性”。
主要體現(xiàn)在兩個(gè)方面:
第一,技術(shù)下沉。例如,DeepSeek開源的7B小模型,在英特爾至強(qiáng)CPU上即可運(yùn)行,讓縣城中學(xué)能用老舊機(jī)房開展AI教學(xué),甚至縣城程序員用它調(diào)試代碼。此外,DeepSeek開源的數(shù)學(xué)推理模型,更被中小科技公司接入業(yè)務(wù)系統(tǒng);
第二,極致性比價(jià)。例如,DeepSeek-R1和DeepSeek-V3等模型的API調(diào)用價(jià)格低至0.14元/萬(wàn)token,僅為行業(yè)均價(jià)的1/20。河南某農(nóng)產(chǎn)品電商,借此將智能客服成本壓縮92%。
支撐DeepSeek“極致性價(jià)比”的,是幻方從量化交易中淬煉出的生存哲學(xué)——自研“動(dòng)態(tài)計(jì)算圖”技術(shù),讓同一批GPU可并行訓(xùn)練3個(gè)模型,硬件利用率達(dá)89%,遠(yuǎn)高于行業(yè)平均水平;訓(xùn)練數(shù)據(jù)清洗引入量化風(fēng)控模型,將無(wú)效數(shù)據(jù)標(biāo)記率提升至93%,百億參數(shù)模型訓(xùn)練成本控制在800萬(wàn)元內(nèi)。
不同于大廠執(zhí)著于萬(wàn)億參數(shù)競(jìng)賽,DeepSeek專注提升“單位算力產(chǎn)出效率”。其13B參數(shù)模型在法律文書審核場(chǎng)景擊敗多家千億級(jí)大模型,核心在于對(duì)合同條款、行業(yè)術(shù)語(yǔ)的精準(zhǔn)理解——這源于幻方量化團(tuán)隊(duì)多年處理金融法律文本的經(jīng)驗(yàn)遷移。
此外,梁文鋒堅(jiān)持“用量化交易的錢養(yǎng)AI研發(fā)”。其曾表示,作為出資人之一的幻方,有充足的研發(fā)預(yù)算,另外每年有幾個(gè)億的捐款預(yù)算,之前都是給公益機(jī)構(gòu),如有需要亦可做調(diào)整。同時(shí),還有分析稱,幻方將每年凈利潤(rùn)的90%投入技術(shù)攻堅(jiān),團(tuán)隊(duì)成員甚至自愿將年終獎(jiǎng)轉(zhuǎn)為研發(fā)基金。
這種模式,避開資本對(duì)短期回報(bào)的追逐,但也暗藏風(fēng)險(xiǎn)——2023年A股波動(dòng)導(dǎo)致幻方研發(fā)資金同比減少18%,團(tuán)隊(duì)不得不暫停兩個(gè)長(zhǎng)期項(xiàng)目。
02
第一桶金與“不差錢”的底氣
2016年成立的幻方,最初只是杭州一家低調(diào)的量化私募基金,團(tuán)隊(duì)不足20人,卻憑借AI算法在二級(jí)市場(chǎng)屢創(chuàng)收益神話。
幻方的財(cái)富密碼始于量化交易。梁文鋒團(tuán)隊(duì)早年開發(fā)出一套基于機(jī)器學(xué)習(xí)的高頻交易系統(tǒng),在2015年A股波動(dòng)中逆勢(shì)斬獲300%年化收益,迅速積累數(shù)十億資本。
至2022年,幻方管理規(guī)模突破千億,成為亞洲最大量化私募之一。同年,幻方和員工向慈善機(jī)構(gòu)捐贈(zèng)共計(jì)約3.6億元,其中一名員工以個(gè)人名義捐贈(zèng)1.38億元。該捐贈(zèng)人也被外界鎖定為梁文鋒。
圖片來(lái)源:幻方量化公眾號(hào)
“不差錢”的梁文鋒,甚至多次公開表示:“幻方不需要融資,我們賺的錢足夠養(yǎng)活創(chuàng)新。”
之后,梁文鋒團(tuán)隊(duì)將量化領(lǐng)域的AI技術(shù)積累遷移至大模型賽道,成立DeepSeek,僅用3年時(shí)間便沖至全球大模型競(jìng)技場(chǎng)第二梯隊(duì),與谷歌、Meta同臺(tái)競(jìng)技。
天眼查顯示,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(下稱“深度求索”)成立于2023年,由寧波程恩企業(yè)管理咨詢合伙企業(yè)(有限合伙)和梁文鋒分別持股99%和1%,而前者亦為梁文鋒控股公司。
DeepSeek運(yùn)營(yíng)主體便是深度求索。
相較于OpenAI數(shù)千人的團(tuán)隊(duì)和百億美元投入,DeepSeek核心團(tuán)隊(duì)僅百余人,研發(fā)成本不足行業(yè)巨頭的1/10。其開源模型DeepSeek-Math在GSM8K數(shù)學(xué)推理測(cè)試中超越GPT-4,而API價(jià)格僅為GPT-4的1/50。這種“極致性價(jià)比”直接沖擊市場(chǎng),倒逼阿里、百度等大廠降價(jià)應(yīng)戰(zhàn)。
DeepSeek崛起背后,是近乎“瘋狂”的技術(shù)投入。
曾被小米創(chuàng)始人雷軍以千萬(wàn)年薪招攬的DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一,被譽(yù)為“天才AI少女”的羅福莉,曾直言:“在幻方,技術(shù)理想比商業(yè)回報(bào)更有吸引力!
DeepSeek的崛起,側(cè)面反映出國(guó)產(chǎn)芯片行業(yè)的當(dāng)前困局。
03
中國(guó)需要100個(gè)DeepSeek
“中國(guó)AI芯片的問題不在制程,而在生態(tài)!
“如果我們能讓國(guó)產(chǎn)芯片的算法效率提升30%,就能撕開一道口子!
在近期央視訪談中,梁文鋒如是談到。
為了規(guī)避英偉達(dá)限制,DeepSeek使用華為昇騰910B訓(xùn)練模型,但算子兼容性問題導(dǎo)致訓(xùn)練效率降低40%,團(tuán)隊(duì)不得不用30%工程師人力開發(fā)轉(zhuǎn)換工具。對(duì)此,梁文輝認(rèn)為,這原本該是芯片廠商的工作。
此外,也有業(yè)內(nèi)觀點(diǎn)認(rèn)為,如果中國(guó)AI只能在英偉達(dá)芯片和OpenAI論文基礎(chǔ)上修修補(bǔ)補(bǔ),這不過是另一種形式的代工。
當(dāng)多數(shù)公司焦慮“何時(shí)做出中國(guó)版GPT-4”時(shí),幻方用數(shù)學(xué)思維重新定義競(jìng)爭(zhēng)維度——不做參數(shù)規(guī)模的奴隸,而是深耕“輸入1度電,產(chǎn)出10倍智能”;
當(dāng)行業(yè)沉迷資本故事時(shí),幻方證明,用量化交易的“快錢”支撐硬核科技的“慢研發(fā)”,并非天方夜譚;
當(dāng)全球追逐通用人工智能(AGI)圣杯時(shí),中國(guó)或許更需要1000個(gè)深度改造制造業(yè)、農(nóng)業(yè)、小微企業(yè)的“專用智能”。
春節(jié)假期結(jié)束第一天,DeepSeek社區(qū)出現(xiàn)一條高贊留言:“我們縣城程序員用你的模型接了三個(gè)訂單,養(yǎng)活了一個(gè)五人小團(tuán)隊(duì)!边@或許才是中國(guó)AI最真實(shí)的生命力——不在融資新聞的頭條里,而在無(wú)數(shù)普通人用技術(shù)改善生活的細(xì)節(jié)中。
當(dāng)全球AI陷入千億美金“軍備競(jìng)賽”時(shí),梁文鋒與幻方提供了一種反主流敘事——用數(shù)學(xué)家的極致理性、工程師的務(wù)實(shí)創(chuàng)新,以及近乎偏執(zhí)的成本控制,證明“聰明資本”與“技術(shù)理想主義”可以共存。
這或許正是中國(guó)AI破局的關(guān)鍵密碼:不需要另一個(gè)OpenAI,而是需要100個(gè)DeepSeek。
冷峻又務(wù)實(shí),或?yàn)閲?guó)產(chǎn)AI的未來(lái)。
部分圖片引用網(wǎng)絡(luò) 如有侵權(quán)請(qǐng)告知?jiǎng)h除
原文標(biāo)題 : 回歸小鎮(zhèn)青年,DeepSeek的草根狂歡

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 張勇等人退出阿里合伙人
- 10 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人