2025年4月25日,2025年李善友開年大課暨混沌·AI創(chuàng)新院開學(xué)典禮正式開講。
Day1的主題是"AI的進(jìn)擊",在上午的大課中,教授動情表示:DeepSeek,將是國運(yùn)的AI支點(diǎn)。
以下是李善友教授大課的筆記內(nèi)容。
講者 |李善友
我相信未來的20年,必然是AI在中國的黃金20年。
其實(shí)在大課開始前,我們同事問我:教授你為這堂課,做了多長時(shí)間的準(zhǔn)備?
我想:這個(gè)準(zhǔn)備,如果從長來說可能是十年,往短里說可能是18個(gè)月。
所以:18個(gè)月以來,我一直在思考,今天這個(gè)時(shí)代命題是什么?混沌要呼應(yīng)什么樣的命題?
我要把最大公約數(shù)的那個(gè)命題,像旗幟一樣舉出來,跟所有同學(xué)們?nèi)ズ魬?yīng)。
這個(gè)命題究竟是什么?
我一直在思考。
今天,就是我對這個(gè)思考的一次揭曉,我們的題目叫——
AI的黎明
2015年OpenAI成立,它起初是一家非營利實(shí)驗(yàn)室:早期他們想做一個(gè)開源的、安全的人工智能。
最先發(fā)起這個(gè)倡議的人是馬斯克,他找到了今天OpenAI的CEO奧特曼,一起聯(lián)手從谷歌挖來了Ilya,去做OpenAI的首席科學(xué)家。
因?yàn)轳R斯克看見了一件事情,谷歌把之前最領(lǐng)先的AI實(shí)驗(yàn)室DeepMind給收購了。
馬斯克心中有一個(gè)巨大的隱憂——AI比核武器更具威脅,任由AI發(fā)展下去,最終AI一定反過來控制人類,甚至?xí)缛祟悺?/p>
其實(shí)我認(rèn)為,OpenAI是這一輪AI革命的先驅(qū)。
我覺得全世界的人,都應(yīng)該向AI革命的先驅(qū)OpenAI致敬,因?yàn)樗讶斯ぶ悄軓睦砟詈屠碚摚プ兂赡P汀⒆兂僧a(chǎn)品、變成應(yīng)用。
什么叫建模?混沌看任何事情的時(shí)候,不會說這個(gè)事兒是什么,我們的"第一問"就會問這個(gè)事的"一"是什么?
這句話,等同于在追問這件事情的本質(zhì)是什么?
所以,今天我想提供一種非常簡單的建模方式,用這個(gè)建模方式作為一個(gè)語言體系,我為大家一點(diǎn)一點(diǎn)梳理AI背后的本質(zhì)到底是什么?
這個(gè)模型我稱為XY維度建模法。
我想用X軸和Y軸的二維結(jié)構(gòu),來看OpenAI如何為整個(gè)行業(yè)建模,陪大家探索AI背后的本質(zhì)。
我在這里重申一次:為AI建模,不是OpenAI獨(dú)立完成的,它是幾代人、整個(gè)生態(tài)一次又一次迭代的結(jié)果。
接下來我會講五個(gè)關(guān)鍵節(jié)點(diǎn),結(jié)合XY維度建模法前,從基礎(chǔ)的科研到技術(shù),到產(chǎn)品,到商業(yè)化,來讓你理解OpenAI是如何為AI來建模的。
人工智能有很多流派,簡單來說有兩大流派。
第一個(gè)流派叫符號主義,基于人類的規(guī)則來做人工智能。
就是教人工智能學(xué)習(xí)人類的方式、像人類一樣思考。
另外一派是少數(shù)派,是最不被認(rèn)同的非主流者,叫連接主義。
他們認(rèn)為,憑什么讓人工智能像人一樣去思考呢?
這一派的特點(diǎn)是"不干預(yù)",以翻譯為例,缺點(diǎn)是即使AI翻譯出來了,你也不理解它是如何翻譯出來的。
這兩派競爭了很多年,幾乎沒有人相信第二派。
在第一個(gè)節(jié)點(diǎn),我要致敬的人物是McCulloch和Pitts兩位教授,兩人可以稱為神經(jīng)網(wǎng)絡(luò)之父。
我們今天之所以會有人工智能,是因?yàn)?0年前,這對像父子般的教授聯(lián)手為神經(jīng)元建模。
1943年,兩人用數(shù)學(xué)的方式建立了MP神經(jīng)單元模型。
如果X代表輸入,Y代表輸出,這個(gè)模型會發(fā)生一件非常有意思的事,當(dāng)X在某個(gè)數(shù)字之前的時(shí)候,Y一直等于0。
而當(dāng)X達(dá)到某一個(gè)數(shù)值后,Y突然就變成了1,這就是——
涌現(xiàn)。
而中間層就是人工智能的靈魂,它像黑盒子一樣,在人工智能里面存在著。
另外如果今天有一個(gè)詞你要帶回去,我希望你把涌現(xiàn)帶回去。
涌現(xiàn)是我們今天未解的一個(gè)宇宙之謎,我相信它是AI的秘密,但反過來說,也是我們在AI時(shí)代存活下去的一個(gè)機(jī)制。
第二個(gè)節(jié)點(diǎn),我要致敬的人物是Hinton,被稱為深度學(xué)習(xí)之父,而且在去年拿到了諾貝爾獎(jiǎng)。
如果沒有他對神經(jīng)網(wǎng)絡(luò)路線的探索,后面的一切都不會發(fā)生。
Hinton從小就相信:人工智能應(yīng)該學(xué)習(xí)人類大腦神經(jīng)網(wǎng)絡(luò),能夠自發(fā)產(chǎn)出智能。
當(dāng)他畢業(yè)的時(shí)候,他仍然堅(jiān)持自己的道路,但他的導(dǎo)師不相信,因?yàn)閺睦碚撋蟻砜矗@件事不可行,甚至?xí)蔀樾υ挕?/p>
面對眾多的質(zhì)疑,他輾轉(zhuǎn)去了美國好幾個(gè)學(xué)校做博士后、教授助理、副教授等,但始終難以施展拳腳。
直到后來他到了加拿大,幸運(yùn)的是,最終成功了。
1986年,他提出了反向傳播算法,它可以反向回來校驗(yàn)結(jié)果跟目標(biāo)之間的差距。
今天,反向傳播算法是深度學(xué)習(xí)的核心技術(shù)之一,也是當(dāng)前大模型訓(xùn)練的基礎(chǔ)方法。
斯坦福大學(xué)有一個(gè)華人女教授叫李飛飛,她發(fā)現(xiàn)小孩子可以識別貓和狗,但當(dāng)時(shí)的人工智能無法做到。
于是她做了一個(gè)ImageNet大賽,讓全世界所有的AI來識別貓和狗。
而Hinton還有兩個(gè)學(xué)生非常有名,一個(gè)是Alex,另一個(gè)是Ilya。
三個(gè)人用反向傳播算法做了一個(gè)模型——
AlexNet。
直到2012年,AlexNet模型在大賽當(dāng)中的錯(cuò)誤率是15%,而前一年的冠軍是26%。
這個(gè)結(jié)果震驚了業(yè)界,因?yàn)檫@說明深度學(xué)習(xí)不僅理論上可行,在實(shí)際運(yùn)用時(shí)還能一鳴驚人。
從那一天開始,人工智能領(lǐng)域變天了。
因?yàn)榇蠖鄶?shù)人是看見才會相信,AlexNet的意義非凡。
它證明了:只要算力足夠大,只要數(shù)據(jù)足夠多,神經(jīng)網(wǎng)絡(luò)一定可以超越人類視覺。
這就又到了我提到的:XY維度建模法。
如果AlexNet的X軸是多層神經(jīng)網(wǎng)絡(luò)(特有的叫卷積神經(jīng)網(wǎng)絡(luò)),那么它的Y軸有兩個(gè)要素出來——
一個(gè)是數(shù)據(jù)的規(guī)模,ImageNet大賽有上百萬張圖片供模型去訓(xùn)練。
另一個(gè)則是GPU,Hinton師徒三人第一次把GPU用在人工智能領(lǐng)域,因?yàn)镚PU可以并行運(yùn)算。
而直到兩年以后,黃仁勛才意識到GPU的黃金時(shí)代來了。
第四個(gè)關(guān)鍵節(jié)點(diǎn):2017年,Transformer
2017年6月,8位谷歌的科學(xué)家、工程師發(fā)表了一篇論文叫做《Attention is all You Need》。
這篇論文為今天AI的形態(tài)扎下了根基,就像是在工業(yè)革命里人類發(fā)明內(nèi)燃機(jī)一樣,人類找到了智能革命的內(nèi)燃機(jī)。
這個(gè)內(nèi)燃機(jī)就是論文中提出的Transformer,這是一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)。
這個(gè)力量并不是自然界存在的力量,而是人類發(fā)現(xiàn)的一個(gè)計(jì)算里面的力量存在。
Transformer這篇論文剛發(fā)布的時(shí)候,谷歌還沒有人能挖掘出它更深層次的意義,只把它運(yùn)用在機(jī)器翻譯上。
而Hinton的學(xué)生、OpenAI首席科學(xué)家Ilya,相信Transformer可以用在所有的通用數(shù)據(jù)、通用語言里。
在Transformer的基礎(chǔ)上,Ilya加上了Scaling Law 的維度,讓GPT成為了可能。
而大力包括三部分:第一是算法的規(guī)模,也就是模型參數(shù)的規(guī)模;第二是數(shù)據(jù)量的規(guī)模;第三是GPU卡數(shù)的規(guī)模。
這三個(gè)規(guī)模越大,去做預(yù)訓(xùn)練,就越可以讓智能涌現(xiàn)。
通過不斷地訓(xùn)練,人工智能體的智商不斷提高,它就可以幫人類干活了。
Ilya是全世界第一個(gè)理解這件事情的人。
那么,GPT是什么意思呢?它的全稱是Generative Pre-trained Transformer,也就是生成式預(yù)訓(xùn)練變換模型。
它最重要的的功能是生成連貫的文本內(nèi)容,而不僅僅是分析或分類現(xiàn)有數(shù)據(jù)。
我們來看一組驚人的數(shù)據(jù)——
2018年,GPT-1,1.17億參數(shù),沒跑出什么來。
2019年,GPT-2,15億參數(shù),也就那么回事。
2020年,GPT-3,1750億參數(shù),智能涌現(xiàn)了。
GPT-3涌現(xiàn)出兩個(gè)能力——
第一個(gè)能力,是不需要訓(xùn)練就知道專業(yè)領(lǐng)域的東西了。
第二個(gè)能力,是突然能理解了上下文的推理了。
所以,Ilya可以稱為GPT之父。
既然提到"GPT之父",這里說個(gè)題外話,OpenAI之父該是馬斯克的,但后來馬斯克離開了。
奧特曼加入了OpenAI去做CEO,所以最后是他把公司做出來的。
當(dāng)GPT-3出現(xiàn)之后,OpenAI的開發(fā)人員設(shè)想:能不能把對話的交互界面當(dāng)成產(chǎn)品界面?
于是,就有了我們今天用的產(chǎn)品ChatGPT,它倡導(dǎo)用戶跟它聊天。
2022年11月30日,OpenAI發(fā)布ChatGPT-3.5,五天時(shí)間用戶過百萬,2個(gè)月用戶過億。
它成為史上增長最快的消費(fèi)級應(yīng)用,超過了之前的谷歌。
我們可以用一個(gè)模型來總結(jié)——
OpenAI 將兩個(gè)關(guān)鍵要素重新組合:
一個(gè)是Transformer,一個(gè)是Scaling Law,這兩個(gè)要素在模型維度上的結(jié)合,形成了大語言模型。
這個(gè)大語言模型所推出的技術(shù),就叫做GPT。
如果用混沌理論中的"一"思維模型來看,大家看到的可能是GPT的功能,而它背后的"一"就是大語言模型。
OpenAI的能力不僅限于此。
2023年9月13日,他們發(fā)布了新的推理模型o1。在數(shù)據(jù)競賽中,其準(zhǔn)確率從GPT的13%直接躍升至83%.
o1模型不僅能解數(shù)學(xué)題、邏輯題,還能編寫代碼。
從CatGPT到o1,這種進(jìn)步速度,相當(dāng)于人類思維從系統(tǒng)一(直覺反應(yīng))躍遷到系統(tǒng)二(理性思考),把原需10年的AGI進(jìn)程縮短到兩三年。
而真正的理性不在于給出答案,而在于中間的推理過程:而o1實(shí)現(xiàn)了這個(gè)推理能力。
有人預(yù)測可能需要十年。
如今,業(yè)界對AI的預(yù)測普遍樂觀。
我看到最樂觀的預(yù)測,是認(rèn)為2026年底就能實(shí)現(xiàn)AGI,而最悲觀的預(yù)測也是不超過2029年底。
當(dāng)然,面對OpenAI,我們要站在人類的角度,去審視這一技術(shù)革命的貢獻(xiàn)。
但畢竟我們生活在這片土地上,我們畢竟是中國人,相信各位心中都縈繞著一個(gè)問題——
中國AI,路在何方?
一個(gè)人所遇到的最美好的事,就是與時(shí)代共舞。
第一次工業(yè)革命發(fā)生在好幾百年以前,瓦特改良蒸汽機(jī);
第二次工業(yè)革命出現(xiàn)了電、汽車、石油;
第三次工業(yè)革命的前奏是個(gè)人電腦和互聯(lián)網(wǎng),而它的真正目的是AI。
我們正趕上這個(gè)時(shí)代正在來臨的時(shí)刻,所以我稱它為AI的黎明。
站在人類的角度上,這個(gè)世界正在發(fā)生10倍速的巨變,快到你根本不知道明天會發(fā)生什么。
我們是旁觀者,我們是學(xué)習(xí)者,我們是跟隨者。
大家會無意識地想:讓美國人去做原創(chuàng)吧,我去做應(yīng)用和商業(yè)。
直到2025年1月20號,突然有一個(gè)人出現(xiàn)在新聞聯(lián)播里,他就是梁文鋒。
我相信在那一天之前,全世界全中國99.999999%的人都不知道他是誰。
那一天,梁文鋒不僅參加了總理座談會,同時(shí)帶來了他震驚世界的發(fā)布——
"DeepSeek-R1"。
這是改變中國國運(yùn)的一個(gè)AI支點(diǎn)。
我想用混沌的創(chuàng)新四步法的前三步來分析DeepSeek:
第一步,建模型;
第二步,找單點(diǎn);
第三步,找定位。
最后,我再把它跟OpenAI做一個(gè)對比。
誠懇地說,DeepSeek沒有改變transformer的基礎(chǔ)模型,而是在OpenAI的基礎(chǔ)之上對大語言模型做了工程創(chuàng)新,大大的節(jié)省了成本,提高了效率。
DeepSeek玩的是一個(gè)有限的Scaling law。
首先,它沒有那么多錢。
因?yàn)闆]有融資,用的是自己過去賺的利潤的錢,因此它的資金很有限,不僅跟OpenAI相比非常有限,它跟中國領(lǐng)先的模型相比都是有限的。
其次,GPU受限。
因?yàn)槊绹说目ú弊樱珿PU不是想買就能買,而且想買也只能買次等級別的GPU。
因此DeepSeek必須走低成本、高性能的路徑。
有一個(gè)細(xì)節(jié)讓我深受觸動:梁文鋒每次都會提醒他的工程師,這行代碼能不能再省五毛錢的電費(fèi)。
那么,DeepSeek到底是怎么做的呢?
我重點(diǎn)想講另外兩個(gè)在Transformer上的創(chuàng)新。
我拿圖書館舉例子,假如你是一名超級管理員,你需要記住圖書館所有的書,以及每一本書里面的每一個(gè)字,你想想看這個(gè)注意力機(jī)制需要的運(yùn)算量有多大。
DeepSeek的創(chuàng)新之處在于:給每本書的每一頁建立一個(gè)索引。
要查找內(nèi)容的時(shí)候,先查書的索引,找到書后再查頁的索引,然后把內(nèi)容給用戶。
這是非常精妙的做法。
因?yàn)槿绻凶銐虻馁Y源可以一直找下去,沒有資源的話就創(chuàng)造出了這個(gè)聰明的辦法。
MoE一共有6700億參數(shù),而每次計(jì)算只需要激活37億。
這樣的結(jié)果是V3的模型的訓(xùn)練成本是557萬美元,是同類模型成本的1/10。
對于DeepSeek來說,這就是有限的游戲。
其實(shí)有限游戲?qū)?chuàng)業(yè)者來說是機(jī)會,因?yàn)闊o限的游戲有時(shí)聽到的不是信號,只是噪聲。
公允地說,DeepSeek的性能雖然還沒有達(dá)到o1那么高,但它已經(jīng)屬于一流了。
它的立場是:我知道我跟你大概差不多,然后我開源出去。
這個(gè)氣魄整個(gè)世界沒有,而且成本只有其他競爭者的1/10。
但是真正讓DeepSeek名震天下的,在所有人心里立住的不是V3,而是推理模型R1。
那從V3到R1到底發(fā)生了什么?怎么做到的?
GPT或者V3這樣的大語言模型,需要依賴人類反饋的強(qiáng)化學(xué)習(xí)。
而R1不需要人類反饋,完全靠純強(qiáng)化學(xué)習(xí),也就是"左手打右手",因此,DeepSeek-R1名震天下。
OpenAI其實(shí)也在用"左手打右手"的方法,但他們從未公開算法。
DeepSeek的創(chuàng)新在于用了一種叫GRPO(群體相對策略優(yōu)化)的算法——
先生成十個(gè)模型,淘汰掉一半差的,剩下的繼續(xù)訓(xùn)練、淘汰,重復(fù)64輪后,最終模型就出來了。
OpenAI早期是開放的,連大語言模型的細(xì)節(jié)都會寫論文公開,但到了GPT-4之后,他們就不再公開了,尤其是o1階段,完全保密。
這部分工作DeepSeek沒法直接抄,只能參考。
于是,他們用了一個(gè)全新的純強(qiáng)化學(xué)習(xí)方法,也就是GRPO,訓(xùn)練出一個(gè)叫R1-zero的模型,解題效果特別好。
有意思的是,GRPO其實(shí)不是新技術(shù),業(yè)內(nèi)甚至認(rèn)為它比OpenAI的PPO更落后,但DeepSeek用這個(gè)算法實(shí)現(xiàn)了低成本、高效率的效果。
OpenAI的PPO每一步推理都優(yōu)化,過程精細(xì)但成本高。
DeepSeek沒錢做精細(xì)優(yōu)化,只能根據(jù)最終結(jié)果優(yōu)化,中間的推理過程不管,只優(yōu)化從問題到答案的整體效果。
所以DeepSeek做了一件特別重要的事:
它把所有的推理過程都公開了。你在DeepSeek里問任何問題,它都會把中間的推理過程展示給你。
這種交互方式震驚了全世界——
產(chǎn)品的本質(zhì)就是交互模式。
過去模型只給答案,你無法判斷對錯(cuò);現(xiàn)在它連解題過程都告訴你,這非常厲害。
而OpenAI沒這么做,是有苦衷的。
因?yàn)樗挠?xùn)練反饋花了巨額成本,高達(dá)幾十億甚至上百億。一旦公開,別人可能直接拿這些數(shù)據(jù)蒸餾使用。
原因是中國可以用相對便宜的芯片來構(gòu)建如此強(qiáng)大的推理模型。
推理大模型相當(dāng)于智能時(shí)代的核武器,而目前掌握這種核武器核心能力的只有中美兩國。
而這件事情還是在一個(gè)名不見經(jīng)傳的、就在我們腳下的這片土地上的一家小公司完成的。
它沒有出現(xiàn)在大廠,也沒有出現(xiàn)在"六小虎"之中,而是出現(xiàn)在一個(gè)搞量化投資的人身上。
這件事情堪稱國運(yùn)級別的大事。
按照常理,這件事本不該發(fā)生。
無論從資金、GPU的資源、人才,還是社區(qū)儲備來看,幾乎什么條件都不具備,但它還是成功了。
當(dāng)這件事完成時(shí),意味著中國重新回到了人工智能的牌桌,甚至有可能開始坐莊。
使命
首先,我們探討一個(gè)問題:DeepSeek的終極目標(biāo)是什么?
DeepSeek的終極目標(biāo)難道只是為了跑用戶、直接商業(yè)化賺錢嗎?
我認(rèn)為并非如此。
DeepSeek可能是中國AI公司中唯一一個(gè)真正這樣想的,甚至連OpenAI最初也有這樣的想法,但后來卻忘記了,那就是實(shí)現(xiàn)AGI(通用人工智能)。
AGI意味著在90%的領(lǐng)域中,AI能夠超越90%的人,并且能夠自主行動。
AGI正是讓我們今天感到震驚,甚至恐懼的那個(gè)目標(biāo)。
DeepSeek的終極目標(biāo)并不是商業(yè)化,而是為人類、為全世界實(shí)現(xiàn)AGI。
如果它的目標(biāo)是為全人類實(shí)現(xiàn)通用人工智能,那么DeepSeek的顧客是誰?
我想了很久,答案是:
全人類。
當(dāng)時(shí)我非常感慨,何時(shí)能在中國看到這樣具有宏大世界觀的企業(yè)家?
但梁文鋒和DeepSeek的確是以全人類為目標(biāo),致力于實(shí)現(xiàn)通用人工智能。
如果要讓全人類都能使用這種人工智能,那么顧客的真實(shí)需求是什么呢?如果用一個(gè)詞來概括,那就是:足夠便宜。極致低價(jià)才是王道。
用他們的話來說,就是"人人都能用得起的人工智能"。用一個(gè)時(shí)髦的詞來形容,就是"普惠"。
我們認(rèn)為,AI服務(wù)應(yīng)該是人人都能負(fù)擔(dān)得起且隨時(shí)可用的。這就要求我們探索新的模型架構(gòu)。我們必須在有限的資源下實(shí)現(xiàn)更強(qiáng)的能力普惠,這是需求所在。
如果想為全人類提供人人都能用得起的AI服務(wù),應(yīng)該選擇什么路線呢?
這是一個(gè)基礎(chǔ)的選擇:開源還是閉源?
如果是閉源,僅靠自身服務(wù)所有人,顯然是做不到的。
而如果是開源,我們可以只做基礎(chǔ)及基座模型,讓各個(gè)行業(yè)的人在此基礎(chǔ)上開發(fā)行業(yè)模型或?qū)S心P停儆伤鼈優(yōu)槿祟愄峁┓?wù)。
所以,不要只站在我們習(xí)慣的視角上糾結(jié)開源還是閉源。
要知道,OpenAI從一開始就想要做開源。
而梁文鋒這位"商人中的商人",他從事金融,可以說是離錢最近的人,但他卻在技術(shù)路線上選擇了看似離錢最遠(yuǎn)的,開源。
梁文鋒的選擇是做開源,而且技術(shù)要領(lǐng)先。
這個(gè)想法可能看起來很奇怪。
為什么奇怪呢?
因?yàn)殚L期以來,我們的慣性思維是:美國人擅長原創(chuàng)式創(chuàng)新,處于領(lǐng)先地位;而中國人擅長跟隨式創(chuàng)新,做從1到10的事情。
這種觀念就像思想鋼印一樣,印在了三四代中國人的心中。
比如,一直以來,硅谷負(fù)責(zé)創(chuàng)新,中國人負(fù)責(zé)商業(yè)化。
所以硅谷的人也感到不滿,每次他們創(chuàng)新,賺錢的卻是我們,而我們也因此沾沾自喜。
但我們從未想過,我們也可以做0-1,從未想過這件事與中國有關(guān)。
整個(gè)業(yè)態(tài)幾十年來一直是這樣。
而且,做原創(chuàng)還有一個(gè)難題:全世界排名前50的AI人才幾乎都在美國。
做這些事情需要人才,而排名前50的人才都在美國,我們還有什么希望呢?
這把我們逼到了絕境:我想為全人類提供一個(gè)開源的大模型,而且它要領(lǐng)先全世界,我不是跟隨,那么,該怎么辦呢?
這是在有限條件下的挑戰(zhàn)。
最后,梁文鋒說:"我不融資了,就用自己的錢來做這件事。"他一分錢也沒融到。
他既沒有錢,也沒有這些頂級人才。
他原本也不在這個(gè)領(lǐng)域,但他卻想超越美國,還要開源,那該怎么辦呢?
他選擇了一種獨(dú)特的方式,去觸發(fā)這種原創(chuàng)式的創(chuàng)新。
我相信,這一點(diǎn)是他成功的關(guān)鍵,至少是關(guān)鍵之一。
那個(gè)核心詞匯就是"涌現(xiàn)"。
我還是那句話:如果今天有一個(gè)詞你要帶回去,我希望你把涌現(xiàn)帶回去。
他用涌現(xiàn)式的組織來打造涌現(xiàn)式的AI,這是一個(gè)一體化的組織。
DeepSeek本質(zhì)上是一家AI實(shí)驗(yàn)室,非盈利、不融資、不上市,而是一個(gè)學(xué)院式的實(shí)驗(yàn)室。
我突然發(fā)現(xiàn),做出AI突破性進(jìn)展的,其實(shí)都是AI實(shí)驗(yàn)室:
第一個(gè)是DeepMind,做出了阿爾法狗;
第二個(gè)是OpenAI,早期也是實(shí)驗(yàn)室,做出了GPT;
第三個(gè)就是DeepSeek,也是一個(gè)AI實(shí)驗(yàn)室。
AI實(shí)驗(yàn)室就是純粹為一個(gè)理想而奮斗,先不考慮商業(yè)上的回報(bào)。
另一個(gè)特征是科學(xué)家和工程師放在一起,30%的人是研究員,70%的人是工程師。
工程師和科學(xué)家在一起工作,科學(xué)家有了想法后,工程師立刻就能將其付諸實(shí)踐,反過來驗(yàn)證科學(xué)家的想法。
DeepSeek本身并沒有那么多錢,但這種組織方式卻讓它獲得了極大的優(yōu)勢。
所以,DeepSeek的真實(shí)需求可能是普惠。而它的核心能力,我想可以用五個(gè)關(guān)鍵詞來概括。
第一個(gè)關(guān)鍵詞是"開源"。
如果選擇開源,就必須創(chuàng)新;如果要?jiǎng)?chuàng)新,就必須有人才;而要讓人才發(fā)揮作用,就必須依靠組織,組織的本質(zhì)是一種交互模式。
最后,就是等待涌現(xiàn),等待它的發(fā)生,靜待花開。
梁文鋒為什么選擇開源?
他認(rèn)為,在顛覆性技術(shù)領(lǐng)域,封閉式的護(hù)城河并不持久。
即使像OpenAI這樣的閉源模式,也無法阻止其他公司迎頭趕上。
因此,真正的護(hù)城河是團(tuán)隊(duì)的成長。
第一個(gè)關(guān)鍵詞是"團(tuán)隊(duì)",第二個(gè)關(guān)鍵詞是"團(tuán)隊(duì)的成長"。
團(tuán)隊(duì)成長
如何實(shí)現(xiàn)團(tuán)隊(duì)的成長呢?他強(qiáng)調(diào),要培養(yǎng)創(chuàng)新的文化。
他說,"開源和發(fā)表論文不會帶來重大損失。對技術(shù)人員來說,被同行追隨本身就是一種成就感。開源不僅僅是一種商業(yè)策略,更是一種文化。回饋社區(qū)是一種榮譽(yù),同時(shí)也能吸引更多優(yōu)秀人才。"
此處所說的創(chuàng)新,專指從0到1的原創(chuàng)式創(chuàng)新,是技術(shù)創(chuàng)新,是基礎(chǔ)研究的創(chuàng)新,而不是產(chǎn)品創(chuàng)新、商業(yè)創(chuàng)新或應(yīng)用創(chuàng)新。
記者曾問梁文鋒,為什么DeepSeek只專注于研究,而不像大多數(shù)中國公司那樣同時(shí)布局大模型和應(yīng)用。
梁文鋒的回答代表了一種新的共識。
他說:"過去,人們普遍認(rèn)為美國擅長創(chuàng)新,而中國擅長應(yīng)用和落地。而我們認(rèn)為,隨著經(jīng)濟(jì)的發(fā)展,中國必須從技術(shù)的受益者轉(zhuǎn)變?yōu)榧夹g(shù)的貢獻(xiàn)者,不能總是依賴別人的成果。"
這是一位年輕人的觀點(diǎn),代表著自覺興起的一代新興年輕人,他們由內(nèi)而外地展現(xiàn)出一種自信,與上一代創(chuàng)業(yè)者背著巨大包袱負(fù)重前行的狀態(tài)完全不同。
他們由內(nèi)而外的自信,與上一代創(chuàng)業(yè)者截然不同。
我們常說,只要等上18個(gè)月,即使現(xiàn)在這一級別我夠不上,18個(gè)月后我就能用上今天的硬件和軟件。
同樣,在AI時(shí)代,面對大模型時(shí),我們也相信摩爾定律。
每次OpenAI發(fā)布新成果,我們都說18個(gè)月后我們也能做到。
我們習(xí)慣了拿著盆來接別人過時(shí)的殘?jiān)鼇碛谩?/p>
當(dāng)然,我們在商業(yè)、應(yīng)用和產(chǎn)品上取得了成功,賺到了錢,但這樣的成功對人類、對世界、對自己的生命和靈魂來說,是不夠的。
而且,事實(shí)上,這些技術(shù)的進(jìn)步是西方科技社區(qū)幾代人持續(xù)努力的結(jié)果。
我希望大家能感受到的是,前后五代人孜孜不倦的努力,才有了OpenAI的奇跡。
過去,我們未能長期參與這一過程,反而逐漸忽視了它的真正價(jià)值。
我們會說,如果一個(gè)企業(yè)做基礎(chǔ)研發(fā),那是可笑的。
所以,過去30年,我們更注重利潤而不是創(chuàng)新。但創(chuàng)新不僅僅是商業(yè)驅(qū)動的,它需要好奇心和有野心的創(chuàng)造力。我們被過去的習(xí)慣束縛住了。
我們習(xí)慣了別人做從0到1的創(chuàng)新,我們做從1到10、從10到100的拓展。
這個(gè)習(xí)慣成就了我們,也束縛了我們,讓我們在創(chuàng)新方面似乎總是有一種羞恥感和缺乏勇氣。
但這僅僅是個(gè)開始。
如果要進(jìn)行原創(chuàng)創(chuàng)新,那么創(chuàng)新的核心關(guān)鍵詞之一就是:
人才。
如今,尋找合適的人才并非易事,尤其是那些能夠投身大模型創(chuàng)業(yè)的人才,他們極為稀缺。
有投資人指出,適合大模型創(chuàng)業(yè)的人才可能主要集中在OpenAI、谷歌等科技巨頭的AI實(shí)驗(yàn)室中。
那么,我們會去海外挖掘這些人才嗎?
梁文鋒表示,"雖然全球前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。"
DeepSeek的人才團(tuán)隊(duì)完全由本土人才組成。
DeepSeek目前的成功最大程度歸功于一支由年輕人組成的團(tuán)隊(duì)。他們年輕,技能多于經(jīng)驗(yàn),有應(yīng)屆畢業(yè)生和博士生,甚至在職博士生來組成。
梁文鋒平時(shí)其實(shí)不太見人,他見的大多是前來面試的人。
曾有人在一個(gè)帖子中詢問DeepSeek的工程師:"你為什么不去跳槽?"
工程師回答說:"我們老板親自寫代碼,親自撰寫論文,還親自參與面試。"
創(chuàng)新需要信心,而年輕人往往更具信心。
年輕人初生毛犢不怕虎,年輕人有信心,信心比經(jīng)驗(yàn)重要100倍。
組織的本質(zhì):交互
那么,問題來了:這些初出茅廬的年輕人怎么可能干出一番事業(yè)呢?
所以下一個(gè)關(guān)鍵能力就是:
組織。
組織的本質(zhì)是交互,組織就像一條河流,只要這個(gè)組織形成一個(gè)非常高頻的"河流",普通人在這里也會產(chǎn)生共振,并隨之成長起來。
所以,組織的本質(zhì)是交互模式。
有人問過梁文鋒:"你覺得在這波做大模型的競爭當(dāng)中,創(chuàng)業(yè)公司更適合創(chuàng)新的組織架構(gòu),會不會成為大廠競爭的破局點(diǎn)呢?"
梁文鋒說:"此前大公司的架構(gòu)已經(jīng)不適應(yīng)快速響應(yīng)了,而且他們過去的成功經(jīng)驗(yàn)和慣性反而成為他們今天的束縛。在這波AI新浪潮之下,一定會有一波新公司誕生。"
你看移動互聯(lián)網(wǎng)時(shí)代,有一批年輕人的公司起來了。
所以我堅(jiān)定地相信:未來的AI時(shí)代,又會有一波新的創(chuàng)業(yè)公司出現(xiàn),而不是像過去那些大公司繼續(xù)站在這個(gè)舞臺上。
就像你也知道對于大模型公司來說,算力是它最主要的成本。
但梁文鋒說:"我們的計(jì)算資源對團(tuán)隊(duì)沒有任何限制,但凡有任何人有想法都可以隨時(shí)調(diào)用訓(xùn)練集群,無需批準(zhǔn)。我們辦公室設(shè)計(jì)中有會議室,兩側(cè)的門隨時(shí)可以輕松打開。這種設(shè)計(jì)讓'偶然相遇'成為可能。這讓我想起Transformer的誕生——當(dāng)時(shí)一位路過的研究員無意間聽到討論,幫助將其發(fā)展成了通用架構(gòu)。"
這是一個(gè)涌現(xiàn)型組織。
其實(shí),DeepSeek最重要的基礎(chǔ)架構(gòu)貢獻(xiàn),并非梁文鋒本人想出來的,而是一個(gè)年輕的研究員某一天頓悟出來的。
你也可以說,這是一個(gè)集體涌現(xiàn)出來的至關(guān)重要的想法。
有限的資金、有限的算力、有限的人才,但我只相信一件事——
讓人才和人才去交互。
如果AI通過交互能產(chǎn)生智能,我相信人和人通過交互也會碰撞出天才性的想法,這個(gè)過程就叫——
"涌現(xiàn)"。
再舉一個(gè)例子,有一個(gè)年輕人叫王培懿,他是北大2020級的在讀博士。2023年,他剛讀到博士三年級就加入了DeepSeek。
他提到,去年加入DeepSeek時(shí),自己沒有任何強(qiáng)化學(xué)習(xí)的經(jīng)驗(yàn)。
然而,在進(jìn)行數(shù)學(xué)研究時(shí),他獨(dú)立推導(dǎo)出了一個(gè)統(tǒng)一公式,用于解決各種訓(xùn)練方法。
他說,這感覺就像是一個(gè)頓悟的時(shí)刻,仿佛這個(gè)組織突然被賦予了生命。
這個(gè)統(tǒng)一公式就是SFT(監(jiān)督微調(diào))公式。
強(qiáng)化學(xué)習(xí)的輸出結(jié)果雖然正確,但它的語言表達(dá)方式可能是中文,也可能是英文,就像火星人發(fā)出的信號一樣。
為了將其調(diào)整為人類能夠接受的形式,他采用了監(jiān)督微調(diào)。
監(jiān)督微調(diào)是用人類的語言和表達(dá)習(xí)慣去調(diào)整模型的輸出,使其更符合人類的理解方式。
這種監(jiān)督學(xué)習(xí)是基于人類的反饋和機(jī)器的強(qiáng)化學(xué)習(xí)相結(jié)合的,通常是兩個(gè)完全不相關(guān)的領(lǐng)域。
但這個(gè)年輕人居然用一個(gè)公式將它們?nèi)诤显谝黄稹?/p>
雖然我完全看不懂這個(gè)公式,相信大多數(shù)人也看不懂,但它仍然值得我們致敬。
這個(gè)公式是從R1-Zero回調(diào)到人類可接受的R1的關(guān)鍵一步,而它是由一個(gè)初出茅廬的年輕人完成的,而不是梁文鋒。
DeepSeek-V2的論文有150多個(gè)作者,梁文鋒的名字在中間。他甚至把數(shù)據(jù)標(biāo)注人員的名字也寫進(jìn)了論文。
這不是靠天才,而是一群年輕人共同努力的結(jié)果。
當(dāng)然,你也不要真的以為他們是普通的"生瓜蛋子":這些人智力超群,要么參加過奧數(shù)比賽,要么參加過物理競賽,要么參加過計(jì)算機(jī)競賽。
他們都是年輕的小天才,雖然沒有經(jīng)驗(yàn),也沒有成果,但梁文鋒相信他們在一起可以做到。
我花了一個(gè)多月的時(shí)間去探究他們是怎么做到的,最后發(fā)現(xiàn)其實(shí)沒有什么秘訣,只是相信人才,相信人才之間的交互,創(chuàng)新自然就會涌現(xiàn)出來。
這件事的意義,不僅在于激勵(lì)了中國的大模型發(fā)展,更在于激勵(lì)了中國的芯片公司。
我們或許也有機(jī)會在底層技術(shù)上實(shí)現(xiàn)一些創(chuàng)新。
這些年輕人如此自信、陽光,令人欽佩。
屠龍少年
最后,讓我們回到OpenAI身上。
OpenAI的創(chuàng)辦,其實(shí)是一個(gè)屠龍少年終成惡龍的故事。
谷歌當(dāng)時(shí)收購了DeepMind,這讓馬斯克等人非常警覺,因?yàn)榇蠹叶紦?dān)心AI可能會毀滅人類,誰也不希望AI完全掌握在一個(gè)公司手里,哪怕這個(gè)公司是谷歌。
所以O(shè)penAI的早期目標(biāo),是為了挑戰(zhàn)谷歌的AI霸權(quán)。
正是在這樣的目標(biāo)感召下,意外地誕生了一個(gè)產(chǎn)品叫
ChatGPT。
它已經(jīng)不僅僅是一項(xiàng)技術(shù),而是一個(gè)具有用戶交互的產(chǎn)品。
ChatGPT在5天內(nèi)用戶數(shù)突破百萬,兩個(gè)月內(nèi)用戶數(shù)過億,成為史上增長最快的應(yīng)用之一。
到今天為止,它的市場占有率也在一半以上。
此時(shí)OpenAI與谷歌之間的競爭態(tài)勢會是什么樣的呢?
回到我們熟悉的價(jià)值網(wǎng)絡(luò),錯(cuò)位競爭、低端顛覆,這些都是大家熟悉的策略。
你會發(fā)現(xiàn)有一個(gè)力量在背后起作用,叫"右上角遷移力",往往是邊緣的打敗主流的,這種"邊緣必勝"的感覺。
我們回到這個(gè)案例中來看,也是如此。
谷歌收購了DeepMind,谷歌自己還有一個(gè)偉大的實(shí)驗(yàn)室叫Google Brain。谷歌發(fā)表了那篇震驚世界的Transformer論文,它又有錢又有用戶,人才也在它那里。
按道理說,谷歌擁有無限資源,應(yīng)該在AI領(lǐng)域勝出。
可惜谷歌無比賺錢,所以它的基因是一個(gè)面向消費(fèi)者的互聯(lián)網(wǎng)公司,就像印鈔機(jī)一樣賺錢。
OpenAI早期只是一個(gè)草臺班子,甚至馬斯克退出后,連工資都發(fā)不起了。
結(jié)果,萬萬沒想到,OpenAI這個(gè)草臺班子贏了,這是一個(gè)奇跡。
奇跡背后其實(shí)是有道理的,這個(gè)道理就是我們講過很多遍的——
"創(chuàng)新者的窘境"。
既然Transformer是谷歌人最先提出來的,那么按道理,谷歌應(yīng)該最先把產(chǎn)品做出來。
但是,當(dāng)谷歌的人在內(nèi)部討論要不要把與大模型的交互產(chǎn)品化的時(shí)候,大多數(shù)部門都反對。第一,覺得它太低級了,還有很多幻覺,一本正經(jīng)地胡說八道,怎么能發(fā)布這種玩具性的東西呢?第二,更重要的原因是ChatGPT出來之后,全世界哪一種產(chǎn)品最終會受損?——搜索。
如果推出這個(gè)產(chǎn)品,谷歌的主營業(yè)務(wù)搜索就會被干掉。
原本一個(gè)惡龍壟斷了所有的AI資源,然后一個(gè)少年懷著美好的愿望說——
"我要做這件事,而且我要開源,為了人類安全,保護(hù)全人類的AGI。"
我寧愿這樣相信,讓他贏。
但我們都知道這種故事往往會有下半場,少年自己會不會變成惡龍呢?
奧特曼戰(zhàn)戰(zhàn)兢兢地發(fā)布了ChatGPT。
ChatGPT的奧特曼,原來是硅谷最大的創(chuàng)業(yè)組織YC的創(chuàng)始人。
YC下面每年都有很多硅谷的創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司就是做產(chǎn)品、做應(yīng)用,然后去融資、去上市的模式。
奧特曼本身不是技術(shù)人才,更不是研究人才,他是個(gè)創(chuàng)業(yè)者。
不過,在那之前,奧特曼也是一個(gè)理想主義者,是要做AGI的人。
但突然巨大的成功出來之后,讓奧特曼看到了另一個(gè)世界。
他以為自己接手的是一家AGI實(shí)驗(yàn)室,弄清楚如何打造AI。
誰知道這是一家大型消費(fèi)級互聯(lián)網(wǎng)公司,而且是面向消費(fèi)者的互聯(lián)網(wǎng)公司,因?yàn)镃hatGPT是個(gè)人在使用。
于是他轉(zhuǎn)變了想法,幾乎是徹底的轉(zhuǎn)變,開始從非盈利向盈利轉(zhuǎn)變——
2025年3月,融資400億美元,估值3000億美元。
3000億美元是什么概念?就是超過了字節(jié),僅次于SpaceX,是全世界第二大的未上市公司。累計(jì)融資600億美元以上,也就是接近5000億人民幣。
2024年以后,OpenAI開始全面轉(zhuǎn)向商業(yè)化,一個(gè)AI Lab的靈魂已經(jīng)消失了,奧特曼今天講未來的目標(biāo)已經(jīng)不是AGI,而是五年以后,要有幾款幾十億用戶的產(chǎn)品。
有人發(fā)現(xiàn),OpenAI的官網(wǎng)已經(jīng)將"Open"這個(gè)詞刪除了,這意味著他們不再強(qiáng)調(diào)開源的理念。
因?yàn)槟莻€(gè)曾經(jīng)充滿理想主義的少年,他的初心似乎已經(jīng)不復(fù)存在。
他似乎已經(jīng)變成了另一個(gè)樣子,甚至比谷歌更像谷歌。
最近,奧特曼在一次講話中表現(xiàn)得更加現(xiàn)實(shí)。
他曾說,他原本以為OpenAI對社會的影響會比現(xiàn)在更大,但現(xiàn)在它只是一個(gè)強(qiáng)大的工具,而人們的生活基本上還是照舊。
對此,他表示自己其實(shí)很高興,認(rèn)為自己以前太天真了。
不知道為什么,我看到這段話,非常悲傷。
一個(gè)為人類開啟未來窗口的人,自己卻看不見那個(gè)世界了,他反而退回到那個(gè)世界里。
我不知道各位是否和我一樣,此刻感到一絲悲傷。
一個(gè)幫助整個(gè)人類開啟天幕的人,在天幕剛剛開啟的時(shí)候,不知道他是因恐懼而退縮,還是因利益而退回。
到今天為止,這家公司仍然遙遙領(lǐng)先全世界,但你會發(fā)現(xiàn)它的初心已經(jīng)沒有了。
所以,這家公司的頂級人才一直在往外走。
雖然公司還在,但它的靈魂好像越來越?jīng)]有了。
下一個(gè)少年是誰呢?這個(gè)世界如果是美好的,總會有少年在。
我想也許就是梁文鋒這個(gè)少年。
我想接下來這段梁文鋒與記者的交鋒,便是梁文鋒在這個(gè)時(shí)候出現(xiàn)的意義。
記者問他:"什么叫AI信仰者?"
梁文鋒說:"信仰者就是過去我在這兒,今天我還在這兒。不是因?yàn)榻裉齑竽P突鸨襾淼竭@兒,而是我過去一直在這兒,只是今天它恰巧火爆了。"
他在大學(xué)期間就開始研究人工智能,碩士論文是關(guān)于機(jī)器視覺的。
2010年碩士畢業(yè)后,他沒有找工作,而是成為了一名自由職業(yè)者。
據(jù)說,他在成都一個(gè)簡陋的出租房里待了幾年,他在做什么呢?
他在尋找AI的應(yīng)用場景。
最終,他找到了金融領(lǐng)域。
也就是說,他做金融并不是因?yàn)樗揪蛯鹑诟信d趣,而是金融是他切入AI的第一個(gè)領(lǐng)域。
因此,他用AI來做量化交易,而不是先做了量化交易,再引入AI技術(shù)。他憑借這種方法,從大約8萬元的資金開始,賺到了8億甚至更多。
后來,他成立了公司,叫幻方量化。
所有人都會說,這家公司不像是一家量化公司,更像是一家AI公司。
讓我們看看這些年他到底在做什么——
2015年,他購買了100張GPU卡;
2019年,他搭建了一個(gè)名為"螢火一號"的計(jì)算機(jī)集群,擁有1000張卡,花費(fèi)了兩個(gè)億;
2021年,他又搭建了"螢火二號",擁有1萬張卡,花費(fèi)十個(gè)億;
2022年,美國政府對中國禁運(yùn)高端芯片,但2021年梁文鋒居然買了1萬張卡;
2021年,中國只有五家公司擁有萬張卡,其中完全不知名的就是這家公司。
那么,這個(gè)年輕人花錢去做AI,他是AI信仰者還是AI投機(jī)者呢?
你說今天他好像花了很多錢,他的基金總額也是300億,你說他能賺多少錢?
他確實(shí)是用有限的資金,來做一件偉大的事情,那么他的使命到底是什么呢?
他說:"我們要做通用人工智能,AI人類智能的本質(zhì)可能是語言,語言大模型是通往AI的必經(jīng)之路。"
這是一個(gè)多么有定力的年輕人:目標(biāo)很明確,不做垂類,不做應(yīng)用,只做研究,只做探索。
各位透過紙面看一下,這是一個(gè)非典型的中國創(chuàng)業(yè)者——
因?yàn)閹缀趺恳粋€(gè)中國創(chuàng)業(yè)者都是做垂類,都是做應(yīng)用。阿里如此,騰訊如此,字節(jié)也是如此,六小虎全都是如此。
而他說:"我只做垂直大模型,我不做垂類,不做應(yīng)用。"
無論如何,一個(gè)商業(yè)公司去做無限投入的研究性探索,都有些瘋狂。
梁文鋒說:"如果一定要找一個(gè)商業(yè)性理由,可能找不到,因?yàn)閺纳虡I(yè)角度來講,基礎(chǔ)研究就是投入回報(bào)比較低的。OpenAI早期投入資金的時(shí)候,想的一定不是我要拿回多少回報(bào),而是真的想做這件事。現(xiàn)在比較確定的是,既然我們想做這件事,我們又有這個(gè)能力,在這個(gè)時(shí)間點(diǎn)上,我們就是最合適的人之一。"
這背后有一個(gè)低調(diào)當(dāng)中的力量,叫做當(dāng)仁不讓:從最早的一張卡到2015年的100張,2019年的1000張,2021年的1萬張。
很多人以為這里有一個(gè)商業(yè)邏輯,事實(shí)上他就是好奇心驅(qū)動的,在他商業(yè)最糟糕的那一年,所以,答案很明顯:他做的事情就是為了好奇心。
好奇心是什么?是對AI邊界的探索。
從2012年的AlexNet到2020年OpenAI發(fā)布GPT-3,雖然具體技術(shù)一直在變,但模型、算力和數(shù)據(jù)這三者的組合始終不變。
對于研究員來說,對算力的渴求是永無止境的:在做了小規(guī)模計(jì)算之后,總想做更大規(guī)模的實(shí)驗(yàn)。
換句話說,就是需要更多的算力和更多的卡。
這件事情是基于第一性原理推導(dǎo)出來的,是必須要做的事情。
所以,一個(gè)激動人心的事情或許不能單純用金錢來衡量。
《三體》有一個(gè)隱喻叫"執(zhí)劍人"。
如果三體人要?dú)绲厍颍枰x一個(gè)執(zhí)劍人來代表人類做決策的話,那么在AI時(shí)代或者AGI時(shí)代,要選一個(gè)執(zhí)劍者,你會選誰呢?
我想有人會選奧特曼,因?yàn)樗裉烊匀贿b遙領(lǐng)先;有人會選馬斯克,因?yàn)樗菍θ祟惏参W铌P(guān)切的那個(gè)人。
但我相信,至少在歷史上第一次,可以有一個(gè)中國人出現(xiàn)在為全世界、全人類服務(wù)的候選榜單里了。
最后,我們來對比OpenAI和DeepSeek。
OpenAI從開源變成了閉源,連論文都不發(fā)了,沒人知道其模型的機(jī)理。
它開始變成一個(gè)消費(fèi)互聯(lián)網(wǎng)公司,to C和to B全都做。今天的核心主打產(chǎn)品是ChatGPT。
但與此同時(shí),另一條路線出現(xiàn)了:開源,并且只做通用人工智能,面向開發(fā)者開源,只做基座大模型,讓開發(fā)者在上面自由發(fā)揮,這是一個(gè)全新的選擇。
第一大難題是技術(shù)上太難了;第二大難題是它不賺錢,站在今天的視角看,這條路看起來是不賺錢的。
所以,OpenAI才會從開源轉(zhuǎn)向商業(yè)化。
你會發(fā)現(xiàn),OpenAI空出來的這個(gè)生態(tài)位,被梁文鋒和DeepSeek占據(jù)了。
今天,DeepSeek當(dāng)仁不讓地選擇了那個(gè)少年"曾經(jīng)走過但又離開的位置"。
當(dāng)然,如果我今天問這里會不會發(fā)生生態(tài)位的遷移,我不知道,因?yàn)樽鲞@樣的預(yù)測是很危險(xiǎn)的。
但在我的內(nèi)心深處,我希望這件事情發(fā)生。
OpenAI今天仍然遙遙領(lǐng)先,DeepSeek今天的創(chuàng)新更多是在工程上,而不是技術(shù)基架上的創(chuàng)新。
而且,OpenAI最近融了400億美元,那是一個(gè)幾乎無限的資金池。
再加上ChatGPT出來之后,美國對中國芯片的禁運(yùn)又繼續(xù)加強(qiáng),梁文鋒面前的壓力更大了。
但我內(nèi)心深處總會相信,堅(jiān)持初心的人會贏。
為什么我說DeepSeek會贏?
我想很多人都忽略了一件事情,我相信梁文鋒一定能同意:智能本身就是產(chǎn)品。它何嘗不是智能時(shí)代的水、電、煤氣,誰掌握了它,誰就是最賺錢的那一個(gè)。
我并不僅僅是出于民族情緒,因?yàn)橛锌赡苓@個(gè)模型本身才是那個(gè)產(chǎn)品。著什么急呢?
就像你家小孩是天才,到了少年時(shí)期,你就說讓他趕緊出去唱歌、賣唱賺錢,這不是毀了這個(gè)孩子嗎?
我覺得人類對AI過于殘忍了。
DeepSeek還沒長大呢。
我堅(jiān)信DeepSeek會為中國所有的AI應(yīng)用把底層建好了。未來20年,我相信是AI應(yīng)用的黃金20年。
這里我想再追問一個(gè)問題:為什么是DeepSeek做了這個(gè)原創(chuàng),而不是大廠,不是字節(jié)、不是阿里、不是百度、不是騰訊?
是因?yàn)橛捎谑兄岛凸乐档膲毫Γ髲S和六小虎都不得不迅速產(chǎn)品化和商業(yè)化。
就像騰訊,你說它有錢,但它不可能花上百億美元去做基礎(chǔ)大模型的研究,而不見商業(yè)回報(bào)。
所以,幾十年來我們成于商業(yè),但也困于商業(yè)。
他們不能做,也不敢做,這又是一個(gè)創(chuàng)新者的窘境。
但我認(rèn)為更根本的原因:是兩代中國創(chuàng)業(yè)者都不相信中國企業(yè)有能力做基礎(chǔ)科研。
換句話說,在我們今天自己人在中國兩代創(chuàng)業(yè)者的選項(xiàng)里,從未有過基礎(chǔ)科研的選項(xiàng)。
這個(gè)選項(xiàng),甚至都沒有出現(xiàn)在我們的討論話題里。
大家永遠(yuǎn)活在一個(gè)巨大的思想鋼印里,認(rèn)為美國人做原創(chuàng),我們copy to China。你成于什么,就毀于什么。
這是一個(gè)巨大的思想鋼印,讓我們永遠(yuǎn)在后面追趕。
兩代人的思想鋼印,互聯(lián)網(wǎng)一代、移動互聯(lián)網(wǎng)一代,都在這個(gè)地方。
所以,梁文鋒對中國創(chuàng)業(yè)的意義在于,他打破了新一代創(chuàng)業(yè)者的思想鋼印和集體潛意識。
如果我們相信"轉(zhuǎn)念就能改命",那么從這一刻開始,中國創(chuàng)業(yè)者、中國創(chuàng)新者的命運(yùn)已經(jīng)改變。
這便是為什么我認(rèn)為:DeepSeek,是國運(yùn)的AI支點(diǎn)。
最后,我想平復(fù)一下我的心情,說出最后一句話。
這句話送給我自己,送給各位,送給這個(gè)時(shí)代。
我想這句話是發(fā)自我內(nèi)心的一句話,我以前還沒有講過這句話——
永遠(yuǎn)相信創(chuàng)業(yè)者
永遠(yuǎn)相信創(chuàng)新者
永遠(yuǎn)相信中國
加入混沌·AI創(chuàng)新院,與AI業(yè)務(wù)1號位們并肩作戰(zhàn)~這是一套混沌精心搭建的學(xué)習(xí)和服務(wù)體系,半年時(shí)間讓你真正融入AI時(shí)代的浪潮中!
今晚24點(diǎn)截止報(bào)名
快來搶占AI時(shí)代的黃金席位!