綜合報(bào)道
32min read
九合報(bào)告:不朽的計(jì)算——比特連接世界,詞元生成未來
石頭 2024/06/30
摘要
計(jì)算正從一種輔助性質(zhì)的工具,逐步演進(jìn)為從神經(jīng)網(wǎng)絡(luò)算法開始涌現(xiàn)的一種“類似人類”的工作方式。
計(jì)算,作為一種表達(dá)與理解世界的方式,它引起的顛覆正悄然發(fā)生。2022年,ChatGPT抓住了全世界的想象力,讓人們意識(shí)到AI的重要性和能力上限。在此之前很長(zhǎng)一段時(shí)間里,AI 的相關(guān)研究和應(yīng)用主要集中在解決特定問題和任務(wù)上,而AGI的實(shí)現(xiàn)一直被認(rèn)為是一個(gè)更為復(fù)雜和遙遠(yuǎn)的目標(biāo)。2023年,生成式AI應(yīng)運(yùn)而生, AIGC時(shí)代大幕徐徐開啟。 作為一家早期投資機(jī)構(gòu),九合長(zhǎng)期在一線關(guān)注“計(jì)算演進(jìn)”帶來的結(jié)構(gòu)性變革。我們既保持著與最前沿創(chuàng)業(yè)者的高頻交流,也不曾懈怠以宏觀視角去思考脈絡(luò),推演未來。站在今天,我們觀察到:計(jì)算正從一種輔助性質(zhì)的工具,逐步演進(jìn)為從神經(jīng)網(wǎng)絡(luò)算法開始涌現(xiàn)的一種“類似人類”的工作方式。從工具,類人到未來可能的超越,計(jì)算正涌現(xiàn)出無限的生命力和擴(kuò)展性,其擴(kuò)展的邊界正在迅速蔓延,直至計(jì)算的范疇超出個(gè)體的生命邊界與生命經(jīng)驗(yàn),直至計(jì)算的維度超出單一勞動(dòng)力的知識(shí)密度和知識(shí)體量,直至計(jì)算數(shù)字化一切,不朽的計(jì)算成為現(xiàn)實(shí)。 我們認(rèn)為,AI將成為下一代計(jì)算平臺(tái),智能體本身將不止于提升生產(chǎn)效率,而是有可能作為新興超級(jí)生產(chǎn)力真正參與到經(jīng)濟(jì)生產(chǎn)與社會(huì)生活中,而我們正處于平臺(tái)轉(zhuǎn)變的初期階段,這將深刻影響未來投資與創(chuàng)業(yè)機(jī)會(huì)。一、計(jì)算不朽:對(duì)世界理解與表達(dá)的迭代
在人類歷史的大部分時(shí)間里,我們都有點(diǎn)像LLM,基于經(jīng)驗(yàn),通過匹配我們頭腦中的知識(shí)和思維模型來解決問題。
幾個(gè)世紀(jì)前出現(xiàn)了更系統(tǒng)的形式化,數(shù)學(xué)符號(hào)和“數(shù)學(xué)語(yǔ)言”的發(fā)展為數(shù)學(xué)提供了一種系統(tǒng)的表達(dá)方式,并使代數(shù)、微積分以及最終的現(xiàn)代數(shù)學(xué)科學(xué)成為可能。從數(shù)學(xué)科學(xué)的所有成功中,我們開始相信,一定有公式來預(yù)測(cè)一切,期望總結(jié)出一些規(guī)律,然后通過規(guī)律推理演繹出新的規(guī)律。從工業(yè)革命開始,理性主義更是成為主流,我們一直習(xí)慣于做工程,從“看到齒輪是如何嚙合的”從而“理解”事物是如何工作,逐步提高生產(chǎn)力。
不過,上世紀(jì)30年代,哥德爾和圖靈時(shí)代對(duì)純邏輯系統(tǒng)的能力已經(jīng)有了明確界定,提出了不完備定理,說明純邏輯系統(tǒng)是不完美的,一定會(huì)推導(dǎo)出相互矛盾的結(jié)論。即使是數(shù)學(xué)也無法最終證明一切,我們總會(huì)面臨一些無法證明的事實(shí)存在的情況。
之后,我們步入計(jì)算時(shí)代。過往的歷史中,我們傾向于把計(jì)算視作一種工具(Tool for human),這個(gè)工具以盡可能低的成本,提供了遠(yuǎn)低于人類智慧的輔助功能,帶動(dòng)人類在各個(gè)領(lǐng)域?qū)崿F(xiàn)自己的想法。自1950年代以來,“邏輯驅(qū)動(dòng)”的人工智能曾主宰很長(zhǎng)一段時(shí)間。彼時(shí),人們相信依據(jù)邏輯的程序是簡(jiǎn)單的,他們認(rèn)為人工智能不要急著去“學(xué)習(xí)”——在我們理解了如何表示事物之后,學(xué)習(xí)就很簡(jiǎn)單了。為了抵達(dá)智能,科學(xué)家們?yōu)槊總€(gè)不同問題編寫不同程序,紛紛變成“勞動(dòng)密集型”工種。但人們低估了現(xiàn)實(shí)世界的復(fù)雜度,問題越大,程序越復(fù)雜,越難以細(xì)化推導(dǎo),純粹基于邏輯是不足以應(yīng)對(duì)的,這條路進(jìn)展緩慢。
隨著AI計(jì)算不斷發(fā)展,不同的路徑開始展現(xiàn)。在AI發(fā)展的早期,最開始基于小規(guī)模專家知識(shí)逐步發(fā)展為基于機(jī)器學(xué)習(xí)的推理。1980年,卷積神經(jīng)網(wǎng)絡(luò)的雛形CNN誕生。1998年,現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)LeNet-5誕生,機(jī)器學(xué)習(xí)方法由早期基于淺層機(jī)器學(xué)習(xí)的模型,變?yōu)榱嘶谏疃葘W(xué)習(xí)的模型,為自然語(yǔ)言生成、計(jì)算機(jī)視覺等領(lǐng)域的深入研究奠定了基礎(chǔ)。2013年,自然語(yǔ)言處理模型 Word2Vec誕生,首次提出將單詞轉(zhuǎn)換為向量的“詞向量模型”,以便計(jì)算機(jī)更好地理解和處理文本數(shù)據(jù)。2017年,Google顛覆性地提出了基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu),奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)。由此開始了今天意義上的大語(yǔ)言模型的突破式進(jìn)展。
深度學(xué)習(xí)作為跨學(xué)科產(chǎn)物,擺脫了數(shù)理邏輯的束縛,吸納了生物學(xué)思想,不追求解釋和邏輯,以神經(jīng)網(wǎng)絡(luò)開啟了“暴力美學(xué)”大門——它認(rèn)為智能的本質(zhì)是在神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)連接的強(qiáng)度,不著急去“推理”,在學(xué)習(xí)完成后,推理自然就來了,計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí)、進(jìn)化,讓人工智能變成“數(shù)據(jù)密集型”學(xué)科,最終從應(yīng)用表現(xiàn)中明顯勝出,主導(dǎo)當(dāng)今人工智能的發(fā)展。
“計(jì)算”開始成為一種更新、更強(qiáng)大的方法,我們用數(shù)十億頁(yè)的網(wǎng)頁(yè)來訓(xùn)練LLM,這樣它們就能生成典型的人類所寫的文本,海量數(shù)據(jù)的“計(jì)算”開始逐步展現(xiàn)了不可還原性,我們很難用傳統(tǒng)簡(jiǎn)單的人類敘事,或者說數(shù)學(xué)敘事來解釋或預(yù)測(cè)一個(gè)系統(tǒng)會(huì)做什么。經(jīng)過深度學(xué)習(xí)訓(xùn)練的計(jì)算機(jī),不再被動(dòng)按照指令運(yùn)轉(zhuǎn),而是像自然界的生命由35億年前開始進(jìn)化那樣,自主地從經(jīng)驗(yàn)中學(xué)習(xí),并改寫著這個(gè)世界的角角落落。
人類的生活經(jīng)驗(yàn)通過代際經(jīng)驗(yàn)、基因篩選的機(jī)制跨越時(shí)間傳遞,而模型可以跨越時(shí)間、空間、學(xué)科,用海量的計(jì)算形成智能,帶給我們跨越學(xué)科壁壘、生命尺度、地理阻隔的全新思考。將整個(gè)世界置于不確定性之上,以進(jìn)化涌現(xiàn)來考慮的思維,是計(jì)算 AI時(shí)代最根本的世界觀。
二、超級(jí)模型:累積計(jì)算的高維形態(tài)1.超級(jí)模型:凝結(jié)計(jì)算智慧
模型是能夠沉淀智慧的計(jì)算形態(tài)。模型作為計(jì)算的呈現(xiàn)形式之一,賦予了計(jì)算更強(qiáng)大的生命力和應(yīng)用范圍。在當(dāng)下,每次優(yōu)質(zhì)的計(jì)算輸入和輸出組成了模型的訓(xùn)練集,沉淀下的智慧能力表現(xiàn)為數(shù)億參數(shù)的高維矩陣模型。
來自于計(jì)算的關(guān)鍵元素從量變進(jìn)入到質(zhì)變階段,算力、數(shù)據(jù)、算法都迎來了新的發(fā)展階段,不朽的計(jì)算將帶來模型能力的質(zhì)變:
算力:芯片遵循摩爾定律,正在挑戰(zhàn)當(dāng)前光刻機(jī)的極限,為我們帶來了接近2nm的晶體管密度,這一密度接近人類大腦的神經(jīng)元密度;
算法:迎來了Transformer的架構(gòu)革新,為我們提供了可以容納更多數(shù)據(jù)的智慧框架,因模型架構(gòu)的能力邊界拓展,Scaling Law得以將每次計(jì)算的智力沉淀在模型的高維矩陣當(dāng)中;
數(shù)據(jù):互聯(lián)網(wǎng)經(jīng)過幾十年的發(fā)展,將人類的巨量語(yǔ)料完成了數(shù)字化,正在提供更多可以用于訓(xùn)練的數(shù)據(jù),越來越多的人類生活信息被線上化、數(shù)據(jù)化,給計(jì)算帶來更多學(xué)習(xí)智慧的素材。
未來,凝結(jié)計(jì)算智慧的超級(jí)模型將出現(xiàn),當(dāng)前所有模型都是通往超級(jí)模型的階段性形態(tài),當(dāng)前模型的能力都是未來超級(jí)模型的子集。超級(jí)模型的計(jì)算能力將會(huì)突破當(dāng)前模型的邊界,超級(jí)模型的架構(gòu)將是強(qiáng)大的通用智慧底座,和垂直領(lǐng)域?qū)<夷P偷恼{(diào)用:
就底層模型能力而言,參數(shù)體量更大的模型、多個(gè)專家模型聯(lián)合調(diào)用的使用模式,將會(huì)逐漸提升模型的智慧水平;
就模型的輸入而言,多模態(tài)會(huì)幫助模型理解問題的復(fù)雜性,從而帶來更準(zhǔn)確的回答,更長(zhǎng)的文本輸入將會(huì)讓模型像人一樣深度思考問題的前因后果。
超級(jí)模型的Prompt輸入,將會(huì)擴(kuò)展至對(duì)齊人類的認(rèn)知輸入,乃至超越個(gè)體思考的輸入水平。只有超級(jí)模型的綜合能力超越某個(gè)個(gè)體,模型的智慧水平和能力邊界才會(huì)拓展至超越人類的范疇。
模型的學(xué)習(xí)能力無限接近于人類的學(xué)習(xí)能力,但模型的學(xué)習(xí)速度、信息獲取能力因其硬件設(shè)備的可擴(kuò)展性,而遠(yuǎn)遠(yuǎn)領(lǐng)先于肉身人類。如果沿著模型發(fā)展的想象力繼續(xù)推演,硬件基礎(chǔ)、軟件模型所支撐的“不朽的計(jì)算”,將成為我們通向AGI的一種可能路徑。
2.多模態(tài):模型的完整感官
多模態(tài)能力將是模型的標(biāo)配,這既是人類擁有智慧的方式之一,也是人類處理問題的重要模態(tài)。大語(yǔ)言模型表現(xiàn)出了模型架構(gòu)的智慧能力,這種模型架構(gòu)也正在多模態(tài)領(lǐng)域表現(xiàn)出“智慧涌現(xiàn)”的可能性,Sora正是這樣的一個(gè)范例,模型可能通過視頻學(xué)習(xí)到直接的物理規(guī)律,正如孩子可能通過小車玩具學(xué)習(xí)到慣性規(guī)律。
現(xiàn)實(shí)世界的情境通常涉及超出文本的信息,包括多種模態(tài),特別是視覺方面的信息。因此,LLM驅(qū)動(dòng)的智能體的下一個(gè)進(jìn)化方向是獲得處理和生成多模態(tài)信息的能力,這種能力對(duì)于這些智能體演變成更加強(qiáng)大的AI實(shí)體,鏡像人類水平的智能至關(guān)重要。人工智能既需要處理單一模態(tài)的能力,也需處理多種模態(tài)(如視頻或音樂),甚至可以跨越不同的模態(tài)(如從文本生成圖像)的能力。
Transformer 在各個(gè)領(lǐng)域都表現(xiàn)出了卓越的縮放特性,包括語(yǔ)言建模、計(jì)算機(jī)視覺和圖像生成。OpenAI 的 Sora 就是視覺數(shù)據(jù)的通用模型,OpenAI 首先將視頻壓縮到較低維的潛在空間,然后將表示分解為時(shí)空 patches,從而將視頻轉(zhuǎn)換為 patches。Sora 既是個(gè)擴(kuò)散模型;給定輸入噪聲 patches(以及文本提示等調(diào)節(jié)信息),訓(xùn)練出的模型來預(yù)測(cè)原始的“干凈”patches。Sora 也是一個(gè)擴(kuò)散 Transformer。
DiT(Diffusion Transformer,擴(kuò)散模型)讓我們看到了Transformer架構(gòu)在多模態(tài)領(lǐng)域擴(kuò)展的可能性。沿著這個(gè)思路,不同的模態(tài)(圖片、視頻、音頻、動(dòng)作序列等)都有可能通過Transformer架構(gòu)復(fù)合性地組織出對(duì)應(yīng)的生成式大模型。Transformer在其他領(lǐng)域的延伸,有望帶來多個(gè)模態(tài)內(nèi)的“智慧涌現(xiàn)”,從而讓我們看到更全面的AI智慧形態(tài),OpenAI于5月發(fā)布的GPT- 4o就是這一智慧形態(tài)的初步體現(xiàn)。
3.生成世界:形成世界模型
在《How we learn》中,Stanislas Dehaene將學(xué)習(xí)定義為“學(xué)習(xí)就是形成一個(gè)世界模型”,這意味著智能也需要理解我們周圍環(huán)境并建立一個(gè)內(nèi)部模型來描述它們的能力。正如OpenAI發(fā)布的其訓(xùn)練Sora的動(dòng)機(jī):“我們正在教AI如何理解和模擬物理世界中的運(yùn)動(dòng),目標(biāo)是訓(xùn)練出能夠幫助人們解決需要與現(xiàn)實(shí)世界進(jìn)行交互的問題的模型?!焙翢o疑問,人類的很多智能都與世界建模相關(guān),朝著開發(fā)像人類一樣理解世界的更智能的 AI 模型邁進(jìn),是目前智能發(fā)展的一條主要道路。
人工智能通過學(xué)習(xí)形成世界模型,以期在數(shù)字世界中可控且可重復(fù)地看到在現(xiàn)實(shí)中會(huì)出現(xiàn)的結(jié)果。傳統(tǒng)的仿真方法需要一點(diǎn)點(diǎn)建模,積累大量工程數(shù)據(jù),不斷調(diào)試算法和方程,去逼近真實(shí),且當(dāng)涉及到不同主體的相互關(guān)系的時(shí)候,其復(fù)雜程度在成指數(shù)級(jí)增長(zhǎng)。而以 OpenAI Sora為代表的一系列應(yīng)用嘗試,似乎讓人們看到了自學(xué)習(xí)掌握世界模型的可能,對(duì)于模型的語(yǔ)義理解,對(duì)于相互之間的動(dòng)力學(xué)關(guān)系都有了巨大的進(jìn)展,其生成式能力為我們接近世界模擬器開辟了可能性。
正如劉慈欣在早期的短篇小說《鏡子》中描述的“超弦計(jì)算機(jī)”的故事:如果用鏡象模擬方式為一個(gè)雞蛋建立數(shù)學(xué)模型,將組成雞蛋的每一個(gè)原子的狀態(tài)都輸入模擬的數(shù)據(jù)庫(kù),當(dāng)這個(gè)模型在計(jì)算機(jī)中運(yùn)行時(shí),如果給出的邊界條件合適,內(nèi)存中的那個(gè)虛擬雞蛋就會(huì)孵出與現(xiàn)實(shí)中的那個(gè)雞蛋孵出的小雞一模一樣的小雞來,這就是最理想的世界模擬器。
三、智能體演進(jìn):以進(jìn)化方式1. 人類-人工智能-AGI智能體(1)始于模仿的智能
人類智能的進(jìn)化經(jīng)歷了數(shù)百萬(wàn)年,人工智能的發(fā)展只有60多年。智能是一種現(xiàn)象,甚至是我們可能看到的最復(fù)雜的現(xiàn)象。對(duì)人工智能的探索始于人類的主體性。制造工具將人類與其他物種顯著區(qū)分開來,而人有理解自己的強(qiáng)烈動(dòng)機(jī),探索人工智能,實(shí)現(xiàn) AGI可能是人類在這一能力象限上最后的圣杯。
人工智能最初目標(biāo)是擁有與人腦相同的功能,但我們不會(huì)也沒必要對(duì)大腦進(jìn)行完美復(fù)制。真正的問題在于,要試圖理解這些基本原則是如何從自然界中提煉出來的,從而指導(dǎo)我們構(gòu)建事物。某種意義上,智能的涌現(xiàn)與生物界的進(jìn)化相似,進(jìn)化的聰明難以告訴我們進(jìn)化是怎么做到的,同理智能體的發(fā)展和涌現(xiàn)也未必要等我們完全理解人類智能。在科學(xué)沒有給出原理幫助我們?cè)O(shè)計(jì)系統(tǒng)之前,我們所能做的就是構(gòu)造復(fù)雜系統(tǒng),等待AIGC涌現(xiàn)。從更高意義上說,深度學(xué)習(xí)也可以幫我們更好地理解人類自身,它提供了一個(gè)全然不同的視角,并正解開這個(gè)星球上最為復(fù)雜的奧秘——人類智能的本質(zhì)。
正如特倫斯·謝諾夫斯基在1989 MIT 講座上對(duì)比的,在蒼蠅只有10萬(wàn)個(gè)神經(jīng)元,重量只有1毫克,消耗1毫瓦的能量,但它卻能看、飛、自我定位和覓食,甚至可以通過繁殖來進(jìn)行自我復(fù)制。
而超級(jí)計(jì)算機(jī),需要1億美元的投資和兆瓦級(jí)的能量供應(yīng),以及大量的人力來滿足它對(duì)程序的需求。盡管超級(jí)計(jì)算機(jī)可以與其他計(jì)算機(jī)交流,但它無法看、飛、交配或自我復(fù)制。
(2)何為智能體
人工智能先驅(qū)馬文·明斯基早在 38 年前就提出了智能體(Agent)一詞,介紹了智能體的交互、通信、特性、具身智能等概念。最初的智能體主要是符號(hào)智能體,還提到了記憶的構(gòu)成、推理鏈、智能體之間的交互、世界模型等概念。他在《心智社會(huì)》一書中指出,每個(gè)智能體本身只能做一些簡(jiǎn)單的事情,但是如果智能體形成一個(gè)社會(huì),就會(huì)產(chǎn)生真正的智能。
Legg和 Hutter于 2017年在“Universal Intelligence: A Definition of Machine Intelligence”中提出了智能(intelligence)的定義:認(rèn)為“智能衡量的是一個(gè)代理在各種環(huán)境中實(shí)現(xiàn)目標(biāo)的能力”。同樣,在解決問題的智能(Problem-Solving and Intelligence)中,Hambrick、Burgoyne 和 Altmann 認(rèn)為,解決問題的能力不僅是智能的一個(gè)方面或特征,而且是智能的本質(zhì)。它不僅僅是書本知識(shí)、狹隘的學(xué)術(shù)技能或應(yīng)試技巧。相反,它反映了一種更廣泛、更深層次的理解周圍環(huán)境的能力。一種“抓住”“理解”事物,或者“構(gòu)思”應(yīng)對(duì)方法的能力。
AI智能體(AI Agents),是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。它們擁有自主性和自適應(yīng)性,可以依靠AI賦予的能力完成特定任務(wù),并在此過程中不斷對(duì)自我進(jìn)行完善和改進(jìn)。只有當(dāng)我們能夠創(chuàng)造出一個(gè)可以懷疑自身現(xiàn)實(shí)的系統(tǒng),進(jìn)行自我探索,至少能夠應(yīng)用因果演繹來建立一個(gè)合理的世界模型時(shí),我們才能真正實(shí)現(xiàn) AGI。
AI Agent 架構(gòu)包括以下四個(gè)設(shè)計(jì)模式:
反饋(Reflection):AI模型通過自我反思和迭代改進(jìn)來提高任務(wù)執(zhí)行能力的方法。在這種模式中,模型不僅生成初始解決方案,還會(huì)通過多次反饋和修改,不斷優(yōu)化其輸出。
工具調(diào)用(Tool Use):AI模型通過調(diào)用外部工具或庫(kù)來增強(qiáng)任務(wù)執(zhí)行能力的方法。在這種模式中,模型并不僅僅依賴于自身的知識(shí)和能力,而是利用各種外部資源來完成任務(wù),從而提高效率和準(zhǔn)確性。
規(guī)劃(Planning):通過提前計(jì)劃和組織任務(wù)步驟來提高效率和準(zhǔn)確性的方法。在這種模式中,模型將復(fù)雜任務(wù)分解為多個(gè)步驟,并依次執(zhí)行每個(gè)步驟,以達(dá)到預(yù)期的目標(biāo)。
多智能體協(xié)作(Multiagent Collaboration):通過多個(gè)智能體之間的合作來提高任務(wù)執(zhí)行效率和準(zhǔn)確性的方法。在這種模式中,多個(gè)智能體分擔(dān)任務(wù),并通過相互交流和協(xié)作,共同完成復(fù)雜任務(wù)。
2.大腦:從神經(jīng)網(wǎng)絡(luò)到LLM,作為大腦模型之一的深度學(xué)習(xí)
(1)大腦是已知宇宙中最復(fù)雜的設(shè)備,深度學(xué)習(xí)是仿生產(chǎn)物
小孩從零開始學(xué)習(xí)語(yǔ)言,沒有人給他的大腦編程,但他卻通過觀察和經(jīng)驗(yàn)慢慢自己學(xué)會(huì)了。大自然中的生物使用了一套與編程完全不同的復(fù)雜體系來解決問題,大腦中有很多神經(jīng)元和連接,數(shù)百億的神經(jīng)元之間每時(shí)每刻的連接強(qiáng)度都不同,于是人類也嘗試建立一個(gè)類似的系統(tǒng),運(yùn)用和人腦相似的原理來構(gòu)建人工智能,這就是“神經(jīng)網(wǎng)絡(luò)”,在傳統(tǒng)方法以外的特殊的機(jī)器學(xué)習(xí)。深度學(xué)習(xí)是具有多層的神經(jīng)網(wǎng)絡(luò),作為機(jī)器學(xué)習(xí)的一種,在近期人工智能演進(jìn)中發(fā)揮了重大的作用。
深度學(xué)習(xí)只是大腦皮層的一個(gè)模型。從外部看大腦圖片時(shí),往往只能僅看到一個(gè)表面,但它內(nèi)部是折疊的,有很多褶皺和波紋。大腦皮層下面的一切都非常重要,比如身體調(diào)控、社會(huì)融合、情緒控制、運(yùn)動(dòng)系統(tǒng)、心臟及所有的內(nèi)臟調(diào)節(jié),未來還亟待探索。
(2)大語(yǔ)言模型 LLM——先求其然,不求其所以然
LLMs是一種基于深度學(xué)習(xí)的AI模型,它們能夠從大量的文本數(shù)據(jù)中學(xué)習(xí)和生成自然語(yǔ)言,例如GPT-4、BERT等。LLMs的核心是Transformer神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),它能夠捕捉文本中的長(zhǎng)距離依賴和復(fù)雜的語(yǔ)義關(guān)系。
所羅門諾夫歸納法是大語(yǔ)言模型的理論基礎(chǔ),在所羅門諾夫的框架里,知識(shí)的進(jìn)步就是“遞增學(xué)習(xí)”(incremental learning),所有的學(xué)習(xí)都可被看作是壓縮,是用精簡(jiǎn)的系統(tǒng)概括大量數(shù)據(jù)的過程。大腦就是在給單詞分配特征,并讓特征交互。神經(jīng)網(wǎng)絡(luò)作為一個(gè)通用近似器(universal approximator),可以是實(shí)現(xiàn)所羅門諾夫歸納法的一個(gè)很好的候選機(jī)制。LLM將單詞轉(zhuǎn)換為特征,使這些特征相互作用,并從這些特征交互中預(yù)測(cè)下一個(gè)單詞的特征,這些數(shù)百萬(wàn)個(gè)特征以及它們學(xué)習(xí)的特征之間數(shù)十億次的交互,就是理解,這是大語(yǔ)言模型真正做的事情,它們是在用數(shù)據(jù)擬合一個(gè)模型,實(shí)現(xiàn)“下個(gè)詞元預(yù)測(cè)”(Next Token Prediction)。、
所謂“有用”就是可以用來預(yù)測(cè)。正如何愷明在香港中文大學(xué)講座中提到的,可解釋性確實(shí)是個(gè)很好的屬性,但同時(shí)我們也要意識(shí)到,我們當(dāng)前系統(tǒng)的成功,主要是由經(jīng)驗(yàn)證據(jù)驅(qū)動(dòng)或驗(yàn)證的。
3.身體:具身智能革命
大腦主要負(fù)責(zé)慢思維與推理,是智力的核心所在;而小腦則關(guān)聯(lián)著對(duì)事物的反應(yīng)敏感程度,更多涉及身體的協(xié)調(diào)與運(yùn)動(dòng)的控制。深度學(xué)習(xí)暫時(shí)還沒有涉及小腦,它是個(gè)復(fù)雜的運(yùn)動(dòng)控制器,對(duì)于調(diào)節(jié)進(jìn)出大腦皮層而后進(jìn)入周圍區(qū)域的信息非常重要。目前我們對(duì)模式識(shí)別底層機(jī)制的理解超過了我們對(duì)運(yùn)動(dòng)控制底層機(jī)制的理解。還沒有一個(gè)機(jī)器人有人類身體這樣的靈敏度和靈活性——這是個(gè)十分復(fù)雜的問題,涉及大量自由度。
AI讓人形機(jī)器人擁有新的可能。 “具身智能”概念(Embodied Artificial Intelligence)誕生于1950年。在這一概念下,借助大模型,機(jī)器人感知、決策與交互提升,機(jī)器人賦予大模型現(xiàn)實(shí)的物理載體,具備了更強(qiáng)的自主學(xué)習(xí)能力和環(huán)境適應(yīng)性,以及與真實(shí)世界進(jìn)行交互和學(xué)習(xí)的潛力。
具身智能強(qiáng)調(diào)和追求機(jī)器人泛化及大規(guī)模應(yīng)用。第一,它通過嵌入大模型交互,使機(jī)器人能夠聽懂語(yǔ)言,理解客戶的指示,并讓具身智能體到相應(yīng)的地方進(jìn)行操作。第二是結(jié)構(gòu)化的固定環(huán)境加上感知垂直大模型,能識(shí)別并重建環(huán)節(jié),拓寬機(jī)器人使用的環(huán)境,提高智能化水平。
目前仍有一些問題尚待解決:
(1)如何讓機(jī)器人的大腦更聰明:現(xiàn)階段機(jī)器人在解決復(fù)雜環(huán)境感知、動(dòng)作生成、靈巧操作等問題時(shí)存在局限性。目前,一些主流機(jī)器人大模型(PaLM-E、RT-1、RT-2、RoboCat、Voxposer等)已經(jīng)能夠在本體High level執(zhí)行層面上表現(xiàn)出優(yōu)秀的決策、任務(wù)拆解、任務(wù)規(guī)劃、常識(shí)理解能力,但在數(shù)據(jù)的來源和low level的任務(wù)執(zhí)行規(guī)劃上仍有待提高。
(2)Scaling Laws(尺度定律)能否在機(jī)器人基礎(chǔ)大模型中復(fù)現(xiàn)尚沒有明確證據(jù),驗(yàn)證大語(yǔ)言模型Scaling Laws所需的數(shù)據(jù)體量,在機(jī)器人領(lǐng)域是極高的要求。
(3)具身智能大模型與硬件的融合、配合問題:人形機(jī)器人的整機(jī)結(jié)構(gòu)復(fù)雜,僅零部件就超過5000個(gè),從理解指令到執(zhí)行任務(wù),都是極大的工程量。具身智能的本體離不開感知系統(tǒng)、驅(qū)動(dòng)系統(tǒng)、末端執(zhí)行系統(tǒng)、能源供應(yīng)系統(tǒng)、運(yùn)算系統(tǒng)。一方面,其技術(shù)的本質(zhì)是三維空間中的感知與運(yùn)動(dòng),高性能的核心零部件是實(shí)現(xiàn)感知與運(yùn)動(dòng)的基礎(chǔ);另一方面,控制器、伺服電機(jī)和精密減速器所占成本(目前占成本 60-70%)需要進(jìn)一步降低。好的產(chǎn)品需要平衡技術(shù)和成本,是一個(gè)工程化落地的能力體現(xiàn)。
(4)落地與應(yīng)用:基于具體場(chǎng)景的融合打磨與迭代需要時(shí)間,目前效率與成本仍是問題。具身智能在結(jié)構(gòu)、驅(qū)動(dòng)、動(dòng)力等真實(shí)能力方面,尚未實(shí)現(xiàn)根本性的突破。其中,行為智能成功成本,與“行為數(shù)據(jù)采樣學(xué)習(xí)次數(shù)”乘以“每一次訓(xùn)練成功的成本”得到的結(jié)果相比,其比值仍然遠(yuǎn)遠(yuǎn)小于1。
4.生命:解譯基因的巨量計(jì)算
人類對(duì)自身有限性的恐懼,自古以來都有不朽的愿望。一種是長(zhǎng)生不老,一種是以碳基形式復(fù)刻大腦與行為方式,實(shí)現(xiàn)另一種意義的永生,人類一直不懈在做著超越有限性的嘗試。
所有生命都使用相同的DNA編碼,所有的基因在編碼蛋白質(zhì)時(shí),都使用同一套密碼系統(tǒng)來編碼氨基酸;所有的生命都使用同一套“能量貨幣”,叫作三磷酸腺苷ATP。從人類到變形蟲,從蘑菇到細(xì)菌,只有少數(shù)病毒例外。生命本身被生物學(xué)家看作是一段大自然譜寫的程序代碼,生命的繁殖,發(fā)育和死亡都是被預(yù)先編碼的程序代碼。隨著人類掌握了基因測(cè)序技術(shù)和基因編輯技術(shù),人類開始破解和改寫生命的程序。但是由于人類對(duì)生命程序的破譯還處于初級(jí)階段,不能準(zhǔn)確理解和預(yù)測(cè)不同基因,蛋白的效果是當(dāng)前研發(fā)效率低下最本質(zhì)的原因。
隨著人工智能和生物學(xué)兩個(gè)領(lǐng)域各自取得蓬勃發(fā)展,兩者的交匯也讓產(chǎn)業(yè)充滿興奮和期待——在大規(guī)模的生物學(xué)數(shù)據(jù)面前,機(jī)器學(xué)習(xí)技術(shù)能夠幫助人類破譯生命的程序,發(fā)現(xiàn)疾病的機(jī)制,擁有工程改造生命的能力。
(1)人類基因組計(jì)劃推動(dòng)了基因測(cè)序行業(yè)最先落地
“人類基因組計(jì)劃”帶動(dòng)了基因測(cè)序行業(yè)的快速發(fā)展,直接促成了2005年NGS二代測(cè)序技術(shù)和第三代測(cè)序技術(shù)的發(fā)明,將單人基因組測(cè)序成本下降1萬(wàn)倍,從此人類開始獲取海量的基因組數(shù)據(jù)和基礎(chǔ)醫(yī)學(xué)的大范圍突破。
AI與生命數(shù)據(jù)的結(jié)合除了DNA, 還表現(xiàn)在對(duì)蛋白質(zhì)數(shù)據(jù)的理解。2021年,deepmind首次通過AI深度學(xué)習(xí)訓(xùn)練了蛋白結(jié)構(gòu)預(yù)測(cè)模型 AlphaFold2并打破蛋白結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的精度記錄, 隨后在2023年進(jìn)一步預(yù)測(cè)并開源了地球上100萬(wàn)物種共超2億蛋白質(zhì)結(jié)構(gòu),蛋白質(zhì)作為生命活動(dòng)的基石,其相關(guān)研究對(duì)藥物研發(fā)、疾病攻克、食品工程、農(nóng)業(yè)、工業(yè)等領(lǐng)域都有重要影響,2024 年,升級(jí)版蛋白結(jié)構(gòu)及交互作用預(yù)測(cè)模型——AlphaFold3 問世,繼續(xù)將預(yù)測(cè)范圍擴(kuò)展到蛋白質(zhì)、DNA、RNA以及一系列配體、離子和化學(xué)修飾等更多生物分子結(jié)構(gòu),展示了用統(tǒng)一的深度學(xué)習(xí)架構(gòu),來建模復(fù)雜生命系統(tǒng)組件之間相互作用的可能性,成為“人類了解生物學(xué)動(dòng)態(tài)系統(tǒng)歷史性的第一步”( Demis Hassabis,DeepMind CEO)。
(2)基因編輯工具開啟了可編程藥物時(shí)代
在2013年,科學(xué)家發(fā)明了CRISPR基因編輯技術(shù),就賦予科學(xué)家這種空前精準(zhǔn)的基因編輯能力。被稱為操控基因組的“分子手術(shù)刀”, 也開起了可編程藥物的時(shí)代??删幊趟幬锸侵敢活惿飳W(xué)的基本元件(DNA或RNA)的藥物,相比于過去的依賴篩選的小分子藥物,更加依賴?yán)硇栽O(shè)計(jì)。
展望未來,這或許也預(yù)示著生物醫(yī)藥產(chǎn)業(yè)的新藥發(fā)現(xiàn)模式,將從比拼成功概率的數(shù)字游戲,變成更為精準(zhǔn)的理性設(shè)計(jì)。mRNA疫苗就是一個(gè)典型的例子。
(3)以合成生物學(xué)為代表的生物經(jīng)濟(jì)全面崛起
過去十年間,合成生物學(xué)產(chǎn)業(yè)上游有關(guān)基因測(cè)序、基因編輯和基因合成的使能技術(shù)的突破,推動(dòng)了合成生物學(xué)新一波的產(chǎn)業(yè)浪潮,同時(shí)也積累了大量數(shù)據(jù),為發(fā)展理性設(shè)計(jì)提供了可行性,生成式算法的發(fā)展也讓從頭全新設(shè)計(jì)成為可能,合成生物學(xué)擁抱各類人工智能已經(jīng)成為必然趨勢(shì)。 AI+合成生物代謝工程,就是利用機(jī)器學(xué)習(xí)引導(dǎo)的高通量代謝功能成本更低、耗時(shí)更少,較傳統(tǒng)方法能提高產(chǎn)率,發(fā)現(xiàn)樣本空間中的全局最優(yōu)解,可以大大提高研發(fā)效率。
在生命科學(xué)不同尺度上,一場(chǎng)轟轟烈烈的編解碼工程正在有序展開,例如,在基因組層面的各種基因檢測(cè)服務(wù)和基因療法,在蛋白質(zhì)組學(xué)層面設(shè)計(jì)的各種人造蛋白質(zhì)和抗體,在細(xì)胞層面的各類CAR-T免疫細(xì)胞療法和干細(xì)胞療法。在組織器官層面,器官再生讓人體4S店的構(gòu)想也初見曙光,腦科學(xué)計(jì)劃的發(fā)展也將幫助人類更好的開發(fā)腦機(jī)接口,并且讓腦腦接口成為可能,甚至讓腦腦接口成為可能。未來,高度發(fā)展的生物科技終將消滅疾病,進(jìn)而實(shí)現(xiàn)人類的終極夢(mèng)想:壽命的延長(zhǎng),同時(shí)合成生物技術(shù)將幫助化工產(chǎn)業(yè)實(shí)現(xiàn)綠色低碳升級(jí)。
四、生成未來:模型吃掉世界,智能體成為生產(chǎn)力1.生成式AI帶來生產(chǎn)主體和價(jià)值分配革命
數(shù)十年來,代碼構(gòu)成的軟件生態(tài)極大改變了世界的形態(tài),代碼組成的軟件作為生產(chǎn)力工具,讓人類在各類工作的完成效率大幅提升。但個(gè)體產(chǎn)出的效率上限始終受到人類處理信息的帶寬上限制約,同時(shí)受制于培養(yǎng)一個(gè)相對(duì)成熟工作個(gè)體的成本。這些問題都不是單純的軟件效率工具能夠解決的。
對(duì)比互聯(lián)網(wǎng)時(shí)代,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的構(gòu)建提供了最高效的信息傳播渠道,因此,互聯(lián)網(wǎng)重新定義了所有與信息傳遞和傳播渠道相關(guān)的商業(yè)形態(tài)。在傳統(tǒng)商業(yè)形態(tài)中,加入比特降低信息傳遞的成本,新的商業(yè)模式得以成立,譬如:電商、社交、內(nèi)容消費(fèi)等等。
未來較長(zhǎng)一段時(shí)間內(nèi),以模型為代表的計(jì)算新形態(tài)將提供最高效的有限智力生成成本,因此模型有望重塑所有與人工創(chuàng)作和智力決策的業(yè)態(tài)。在已有的業(yè)務(wù)形式中,加入詞元生成,更多復(fù)雜的勞動(dòng)形式被算力替代。
不同于軟件作為生產(chǎn)力工具的形態(tài),大模型的出現(xiàn)變革性地改變了軟件生態(tài)過往三十余年的商業(yè)價(jià)值屬性。大模型本身具有生產(chǎn)力屬性。模型自身就在處理信息并給出對(duì)應(yīng)的答案,這些工作可以在當(dāng)前替代低階要求的人類工作,直接作為生產(chǎn)力環(huán)節(jié)上的一環(huán)。模型在商業(yè)決策、招聘人選判斷、新藥發(fā)現(xiàn)、美術(shù)作品交付、視頻內(nèi)容生產(chǎn)等多個(gè)流程,直接表現(xiàn)出了替代人工的生產(chǎn)力屬性。在這些垂直領(lǐng)域中,用戶得到的商業(yè)產(chǎn)品價(jià)值中,顛覆性地不再存在人工成本支出,或者說這一支出在迅速收窄。
昂貴的腦力勞動(dòng)產(chǎn)物,正在出現(xiàn)重新定價(jià)的可能性。模型正在成為生產(chǎn)力。電力、算力是模型作為生產(chǎn)力工具的少數(shù)成本,當(dāng)模型的智慧能力表現(xiàn)出更高的問題解決能力,我們將看到諸多商業(yè)形態(tài)因此發(fā)生改變,垂直行業(yè)的智力獲取成本大幅降低。
如果說計(jì)算的第一個(gè)時(shí)代是 PC 時(shí)代,計(jì)算的第二個(gè)時(shí)代是互聯(lián)網(wǎng)時(shí)代,計(jì)算的第三個(gè)時(shí)代就是 AI 時(shí)代。在每一個(gè)時(shí)代中,都有一個(gè)核心的技術(shù)突破和一個(gè)核心的經(jīng)濟(jì)模式。在 PC 時(shí)代,技術(shù)突破是個(gè)人計(jì)算機(jī),經(jīng)濟(jì)模式是軟件許可證。在互聯(lián)網(wǎng)時(shí)代,技術(shù)突破是互聯(lián)網(wǎng),經(jīng)濟(jì)模式是廣告和訂閱。在 AI 時(shí)代,技術(shù)突破是生成式 AI 和 LLM,生成式 AI 作為一種新的經(jīng)濟(jì)模式,它將創(chuàng)造的智力成本幾乎降低到零。同時(shí),生成式 AI 也是開放多元去中心化的,任何人都可以訪問和使用,這意味著任何人都可以用 AI 來創(chuàng)造出高質(zhì)量的內(nèi)容,比如文本、圖像、視頻、音樂等。這將極大地提高人類的創(chuàng)造力和效率。同時(shí),這也將改變內(nèi)容的價(jià)值和分配。因此,生成式 AI 將帶來一場(chǎng)生產(chǎn)主體和價(jià)值分配的革命。
2.生活形態(tài)革新 ——智能即服務(wù)
能源、算力、模型、應(yīng)用是一個(gè)完整的智力產(chǎn)品。我們生活當(dāng)中大部分任務(wù)和勞動(dòng)都可以被這樣的智力產(chǎn)品來度量。這里的應(yīng)用可以是軟件工具,也可以是硬件機(jī)器人。提供優(yōu)質(zhì)數(shù)據(jù)來賺取智力貨幣,在服務(wù)中消耗智力貨幣。
在工作領(lǐng)域,認(rèn)知成本和創(chuàng)作成本將不再與人力成本密切相關(guān),虛擬專家員工,編程、商業(yè)策劃、工程都可以直接鏈接到頂級(jí)的智力資源,永不停歇、收費(fèi)極低、商業(yè)形態(tài)更加豐富。我們將能依賴各種各樣的頂級(jí)專家模型,完成高質(zhì)量的生活、工作決策,降低我們認(rèn)知的成本和決策的錯(cuò)誤率。與此同時(shí),我們也可在自己最擅長(zhǎng)的領(lǐng)域,貢獻(xiàn)出優(yōu)質(zhì)的數(shù)據(jù)集,自己的智慧以數(shù)據(jù)的形式被匯集到專家模型和應(yīng)用的架構(gòu)當(dāng)中。
在生活場(chǎng)景,與機(jī)器人結(jié)合的具身智能產(chǎn)品將出現(xiàn)在諸多高柔性的服務(wù)場(chǎng)景,個(gè)人生活的AI助理會(huì)帶來更全面的數(shù)字化服務(wù)。在未來,人們可能擁有一組個(gè)人AI團(tuán)隊(duì),這些AI在我們的日常生活中扮演各種角色,使用生成模型的產(chǎn)品并不是依賴單一的大模型,而是多模型系統(tǒng)的協(xié)同作用。類似于公司服務(wù)于客戶的方式。對(duì)于復(fù)雜的問題,這些AI團(tuán)隊(duì)可能需要聯(lián)系云端的更大模型來求助。
3.交互界面升級(jí) ——從理解到互動(dòng)調(diào)配
智能的生產(chǎn)力革命可能帶來新的人機(jī)交互方式,過去基于觸屏的交互設(shè)計(jì)可能轉(zhuǎn)變?yōu)榛贏I Agent對(duì)話的操作方式。從傳統(tǒng)流量入口的概念來看,不同的Agent可能成為不同垂直領(lǐng)域解決問題的主要窗口,Agent不應(yīng)當(dāng)只具有傳統(tǒng)應(yīng)用的操作功能,而是有能力在各個(gè)垂直領(lǐng)域重新調(diào)配生產(chǎn)資料和生產(chǎn)力,更深度地耦合供給側(cè)與需求側(cè)。
我們正處于推理能力和交互界面雙重轉(zhuǎn)型的中心,將來的設(shè)備將不再是簡(jiǎn)單的信息記錄工具,而是成為一種能夠全面理解用戶意圖和環(huán)境的智能系統(tǒng)。這種系統(tǒng)不僅要能捕捉到視覺和聽覺信息,還要能夠無縫地整合這些信息,以支持更加自然和高效的用戶交互??臻g計(jì)算將成為繼桌面計(jì)算、移動(dòng)計(jì)算之后的下一代計(jì)算平臺(tái)。從 PC電腦的鼠標(biāo)、鍵盤的操控交互向智能手機(jī)應(yīng)用的觸控交互,到未來集文本、語(yǔ)音和視覺于一體的AI伙伴,能夠?qū)崿F(xiàn)實(shí)時(shí)理解世界并與之互動(dòng)。理想的計(jì)算界面正在不斷演進(jìn),將數(shù)字信息和內(nèi)容無縫地融入到用戶的物理空間中,提供更加沉浸式和交互式的體驗(yàn)。
五、超級(jí)智能尚未到來,當(dāng)下機(jī)會(huì)與路徑1. 大模型≠好產(chǎn)品:從沙灘到用戶,從陽(yáng)光到智能
“能源+算力+模型”是標(biāo)準(zhǔn)化的智力服務(wù)產(chǎn)品,就像“原料+烹飪+配送”是標(biāo)準(zhǔn)化的外賣服務(wù)品。標(biāo)準(zhǔn)化的智能產(chǎn)品,離不開強(qiáng)有力的模型,但并不意味著模型是最終AI世界的全部。
模型智能水平的馬太效應(yīng),決定著未來模型廠商的價(jià)值占比。OpenAI希望看到自己一家獨(dú)大,模型的智能水平遠(yuǎn)超其他競(jìng)爭(zhēng)對(duì)手,因此為了更高的智能程度,各類服務(wù)商只能依托于唯一一家的模型服務(wù)。這種生態(tài)一旦形成,則會(huì)給模型公司帶來高額的利潤(rùn)空間,但這種一家獨(dú)大的智能化程度是否真的存在,且短期內(nèi)難以被其他公司跟進(jìn),在當(dāng)前的模型競(jìng)爭(zhēng)中看到的更多是你追我趕的齊頭并進(jìn)。
如果上述模型的馬太效應(yīng)并不成立,模型廠商的競(jìng)爭(zhēng)格局則可能更接近云服務(wù)廠商的形態(tài)。
從Scaling Law到優(yōu)秀產(chǎn)品的路也在探索中。Open AI相信Scaling Law,在持續(xù)不斷擴(kuò)充模型體量和訓(xùn)練集大小,我們不斷看到更加智慧的模型作為其迭代的新產(chǎn)品。尺度模型在不斷升級(jí)著模型的智能水平,但真正能夠有適合用戶使用的AI產(chǎn)品可能并不完全取決于智能程度。沒有從模型的第一性原理回到產(chǎn)品的第一性原理,可能很難看到互聯(lián)網(wǎng)時(shí)代的大規(guī)模使用產(chǎn)品。OpenAI正在啟動(dòng)ChatGPT的搜索引擎版本,這也可以看作模型能力正在被嘗試裝進(jìn)一個(gè)優(yōu)秀的產(chǎn)品框架。
2.超級(jí)模型基礎(chǔ)設(shè)施:算力,能源
正如Sam Altman所言,如果“智能”足夠便宜,我會(huì)讓AI幫我閱讀每一封郵件并給出建議。但如果“智能”非常昂貴,我們可能只會(huì)用AI來治療癌癥。最好的技術(shù)都是“隱形”的,而只有成本的下降,才能使得“智能”在未來像空氣一樣隨處可得,嵌入到我們工作生活的每個(gè)角落。算力和電力這一組合的供需關(guān)系,將會(huì)構(gòu)成計(jì)算作為一種商品的實(shí)時(shí)價(jià)格依據(jù)。
(1)算力
數(shù)據(jù)與計(jì)算是 AI 的核心資源,它們共同構(gòu)成了 AI 的基礎(chǔ)設(shè)施。模型的成本是 AI 的重要限制,它影響了 AI 的可用性和可持續(xù)性。在數(shù)字化表達(dá)世界模型的過程中,算力是推動(dòng)創(chuàng)新和產(chǎn)生新價(jià)值的關(guān)鍵因素。它能夠處理龐大的數(shù)據(jù)集、開發(fā)復(fù)雜的智能算法,從而孵化出新的商業(yè)模式和經(jīng)濟(jì)增長(zhǎng)點(diǎn)。由于算力的價(jià)值屬性、通用性和稀缺性,算力作為一種新型的生產(chǎn)力,逐漸展現(xiàn)出其貨幣屬性。
按照當(dāng)前的模型參數(shù)體量估計(jì),我們需要更多的算力設(shè)施來保障超級(jí)模型的訓(xùn)練、推理,以確保這種智能作為一種廉價(jià)易得的生產(chǎn)要素,可以被廣泛應(yīng)用在不同行業(yè)當(dāng)中。這種算力設(shè)施既可能沿著當(dāng)前的GPU架構(gòu)演進(jìn),在摩爾定律的約束下達(dá)到極限,也有可能在未來幾年出現(xiàn)新的硬件架構(gòu)方式,為我們降低算力成本而服務(wù)。
(2)能源
能源成本也是制約AI大規(guī)模應(yīng)用的因素之一,ChatGPT當(dāng)前的耗電量相當(dāng)于美國(guó)1.7萬(wàn)個(gè)家庭的總和,而當(dāng)前GPT所服務(wù)的群體、處理的任務(wù)維度還遠(yuǎn)低于超級(jí)模型的極限。廉價(jià)易得的能源仍然是人類邁向更高生產(chǎn)力層次的必要條件,關(guān)于能源革命的故事仍然會(huì)貫穿于智能化升級(jí)的前進(jìn)路線中。
事實(shí)上,中美電力費(fèi)用的差距正在影響中美大模型Token定價(jià)策略。模型推理的優(yōu)化相對(duì)訓(xùn)練更加容易、推理的算力要求不高、電力成本中國(guó)遠(yuǎn)低于美國(guó),這三點(diǎn)推理成本的差異使大模型的價(jià)格競(jìng)爭(zhēng)在中國(guó)市場(chǎng)成為可能,而不是發(fā)生在美國(guó)。如果單個(gè)token的計(jì)算是算力貨幣的基礎(chǔ)形式,這種算力貨幣的定價(jià)顯然仍存在“中美匯差”。
3.當(dāng)下應(yīng)用場(chǎng)景: 平衡模型能力和場(chǎng)景需求
AI 的發(fā)展是一個(gè)驅(qū)動(dòng)力和反饋力之間的循環(huán)過程。驅(qū)動(dòng)力是指 AI 的需求和潛力,它促使我們不斷地提高 AI 的性能和功能。反饋力是指 AI 的效果和價(jià)值,它促使我們不斷地增加 AI 的使用和應(yīng)用。
新的應(yīng)用,不一定要等到人工智能(AGI)的出現(xiàn),現(xiàn)在已經(jīng)能看到人工智能應(yīng)用采用的開端。比如人工智能的基礎(chǔ)模型(如大型語(yǔ)言模型)可以降低創(chuàng)造的邊際成本,從而催生出新的行為和應(yīng)用。
AI 的早期應(yīng)用場(chǎng)景至關(guān)重要,某種程度上決定了 AI 的發(fā)展和創(chuàng)新。AI 的早期應(yīng)用場(chǎng)景通常面臨著一個(gè)重要的問題,就是如何在創(chuàng)造力和正確性之間取舍。創(chuàng)造力是指 AI 能夠生成出新穎和有趣的內(nèi)容,正確性是指 AI 能夠生成出準(zhǔn)確和合理的內(nèi)容。創(chuàng)造力和正確性之間的取舍取決于應(yīng)用場(chǎng)景的目標(biāo)和風(fēng)險(xiǎn)。如果應(yīng)用場(chǎng)景的目標(biāo)是為了娛樂或探索,那么創(chuàng)造力可能更重要。如果應(yīng)用場(chǎng)景的目標(biāo)是為了解決或改善,那么正確性可能更重要。如果應(yīng)用場(chǎng)景的風(fēng)險(xiǎn)是較低或可控的,那么創(chuàng)造力可能更可接受,因?yàn)樗梢蕴峁└嗟膰L試和機(jī)會(huì)。如果應(yīng)用場(chǎng)景的風(fēng)險(xiǎn)是較高或不可控的,那么正確性可能更必要,因?yàn)樗梢蕴峁└嗟谋U虾桶踩?。目前九合重點(diǎn)關(guān)注當(dāng)下能夠利用好生成式AI能力,拓展創(chuàng)造邊界的應(yīng)用場(chǎng)景,如美術(shù),游戲,視頻生成,情感陪伴等領(lǐng)域。
附錄:九合“計(jì)算+”代表被投企業(yè)
一流科技
一流科技創(chuàng)立于2017年1月,始終立足于通用性深度學(xué)習(xí)標(biāo)準(zhǔn)框架的研發(fā)和推廣使用,力爭(zhēng)成為人工智能深度學(xué)習(xí)框架產(chǎn)品的引領(lǐng)者和事實(shí)工業(yè)標(biāo)準(zhǔn)。一流科技研發(fā)的分布式深度學(xué)習(xí)框架 OneFlow,首創(chuàng)了自動(dòng)數(shù)據(jù)模型混合并行、靜態(tài)調(diào)度、去中心化和全鏈路異步流式執(zhí)行四大核心技術(shù),徹底解決了大數(shù)據(jù)、大模型、大計(jì)算所帶來的異構(gòu)集群分布式擴(kuò)展挑戰(zhàn),技術(shù)水平世界領(lǐng)先。九合創(chuàng)投作為第一輪投資人,在2017年投資了一流科技。
彩云科技
彩云科技業(yè)務(wù)涵蓋天氣預(yù)報(bào)、機(jī)器翻譯和智能寫作,持續(xù)致力于發(fā)展具有高階認(rèn)知能力的人工智能,提升人類感知環(huán)境、相互交流和與AI溝通的能力,并將之賦予全球用戶和開發(fā)者。公司基于大規(guī)模語(yǔ)言模型自主研發(fā)了AI創(chuàng)作工具“彩云小夢(mèng)”,AI續(xù)寫的同時(shí)極大程度保留作者的創(chuàng)作空間,在中英文的語(yǔ)言邏輯和內(nèi)容質(zhì)量上都獲得了海內(nèi)外用戶和算法評(píng)估的高度贊譽(yù)。
心影隨形
AI 情感陪伴是一個(gè)公認(rèn)具有想象力的 Killer APP 方向。心影隨形選擇從游戲陪伴和年輕人群切入,推出「逗逗游戲伙伴」。游戲是一個(gè)情緒濃度很高的半封閉情景,用戶情感抒發(fā)和獲得回應(yīng)的需求未被滿足,是 AI 情感陪伴的最佳切口?!付憾河螒蚧锇椤公@得用戶授權(quán)的屏幕內(nèi)容,用語(yǔ)言模型和CV理解內(nèi)容,實(shí)現(xiàn)物理和心靈同頻。
賦之科技
賦之科技團(tuán)隊(duì)成員在機(jī)器人行業(yè)深耕多年,擁有豐富的消費(fèi)級(jí)機(jī)器人產(chǎn)品開發(fā)設(shè)計(jì)和產(chǎn)品化經(jīng)驗(yàn),行業(yè)資源深厚。公司目前約75%為研發(fā)人員,在售的Enabot品牌產(chǎn)品遠(yuǎn)銷海內(nèi)外160多個(gè)國(guó)家和地區(qū),全球用戶超過50萬(wàn),每日服務(wù)萬(wàn)千家庭。公司堅(jiān)持用戶第一,追求極致,以“做有溫度的科技企業(yè),服務(wù)千萬(wàn)家庭”為愿景,致力于通過先進(jìn)的機(jī)器人技術(shù)和產(chǎn)品幫助家庭管理,促進(jìn)家人溝通,提升家庭幸福感。
行者AI
行者AI是國(guó)家高新技術(shù)企業(yè),擁有60余項(xiàng)發(fā)明專利、20余項(xiàng)軟件著作權(quán)和SCI論文。秉承以AI技術(shù)賦能智慧文娛、智慧教育行業(yè)的愿景,憑借核心團(tuán)隊(duì)10年以上研發(fā)實(shí)力和行業(yè)經(jīng)驗(yàn),推出行者AI數(shù)字文娛垂類大模型、AI+美術(shù)、AI+音樂、AI+智能體、AI+安全等產(chǎn)品與解決方案。產(chǎn)品已在文娛、教育、政務(wù)等場(chǎng)景應(yīng)用,典型客戶包括掌趣科技、米哈游、盛大游戲、360游戲、自貢文旅、成都博物館、四川省廣電、上海交大、成都七中、元?dú)馍值取?/p>
CreativeFitting
CreativeFitting(井英科技)位居國(guó)內(nèi)AI視頻模型行業(yè)的前沿,創(chuàng)始人為美國(guó)上市連續(xù)成功創(chuàng)業(yè)者,擁有十余年互聯(lián)網(wǎng)內(nèi)容型產(chǎn)品運(yùn)營(yíng)和增長(zhǎng)的經(jīng)驗(yàn),從0到1成功構(gòu)建并運(yùn)營(yíng)過千萬(wàn)級(jí)內(nèi)容平臺(tái)。CreativeFitting致力于自研AI視頻模型生成高質(zhì)量?jī)?nèi)容,從生成廣告短視頻到AI短劇,生成視頻的質(zhì)量都達(dá)到行業(yè)領(lǐng)先級(jí)效果。2024年1月,公司發(fā)布了全球首款A(yù)I短劇應(yīng)用,用戶觀看視頻時(shí),還可以與劇中人物進(jìn)行聊天互動(dòng),為用戶開啟了全新的想象力領(lǐng)域。
Noetix Robotics
Noetix Robotics 是一家專注于人形機(jī)器人研發(fā)與制造的科技公司,于2023年9月成立于北京。公司核心創(chuàng)始人員來自于清華大學(xué)與中科院等多所知名院校。公司致力于通用人工智能本體、機(jī)器人仿生,以及具身操作系統(tǒng)等多個(gè)方向的研發(fā),實(shí)現(xiàn)高力矩密度、高動(dòng)態(tài)響應(yīng)、高精度力控等特點(diǎn)。目前公司主要專注于下一代智能家庭人形機(jī)器人終端研發(fā)、生產(chǎn)與制造,聚焦于To B、To C端家庭、教育、養(yǎng)老等應(yīng)用場(chǎng)景。
徠福機(jī)器人
徠福機(jī)器人成立于2023年,致力于成為全球領(lǐng)先的智能家庭服務(wù)機(jī)器人、定義未來家庭的智能生活新方式。徠福的技術(shù)聚焦于超強(qiáng)運(yùn)動(dòng)性能的輪足底盤,能夠上下樓梯、步態(tài)展示。首款產(chǎn)品主打3-12歲的兒童陪伴與家庭陪護(hù),型態(tài)為多模態(tài)類人交互機(jī)器人,具備數(shù)字孿生監(jiān)護(hù)、教育娛樂與生命日志等多種功能。
堯唐生物
堯唐生物是國(guó)內(nèi)罕見的同時(shí)擁有工業(yè)級(jí)LNP能力和堿基編輯器原研能力的團(tuán)隊(duì),目前公司首個(gè)體內(nèi)基因編輯藥物管線已經(jīng)完成毒理藥理研究,大動(dòng)物試驗(yàn)結(jié)果已初步顯示了YOLT-201的安全性和有效性,單次給藥的體內(nèi)編輯效率做到了同類最優(yōu),具備best-in-class的潛力。堯唐生物已經(jīng)于近期向國(guó)家藥監(jiān)局遞交了YOLT-201的IND申報(bào)文件,有望開啟中國(guó)首個(gè)基于mRNA-LNP遞送的體內(nèi)基因編輯藥物的注冊(cè)臨床試驗(yàn)。
諾視科技
諾視科技致力于研發(fā)商業(yè)化Micro-LED顯示芯片技術(shù),在微顯示領(lǐng)域?yàn)榭蛻籼峁┳罴呀鉀Q方案,擁有國(guó)內(nèi)首個(gè)深度融合集成電路制造工藝和Micro-LED芯片工藝的團(tuán)隊(duì),公司以VSP技術(shù)突破微顯示領(lǐng)域像素難以小型化的物理限制,打造高性能的微顯示芯片,以IDM模式從產(chǎn)品設(shè)計(jì)、研發(fā)、生產(chǎn)制造,到封裝測(cè)試實(shí)現(xiàn)完全自主可控。該技術(shù)方案不僅在芯片小型化、高亮度、低功耗方面有著極佳的表現(xiàn),而且具有極高的量產(chǎn)可行性,有望成為Micro-LED產(chǎn)業(yè)化的終極方案。
一九象限
一九象限聚焦下一代移動(dòng)計(jì)算平臺(tái)AR芯片及解決方案開發(fā)和交付。產(chǎn)品覆蓋不同檔位的AR/MR應(yīng)用場(chǎng)景,彌補(bǔ)XR領(lǐng)域一體化高集成SoC短缺的空白。團(tuán)隊(duì)全部來自國(guó)內(nèi)頂級(jí)半導(dǎo)體設(shè)計(jì)公司,在行業(yè)持續(xù)近20年積累,具備豐富的從需求到量產(chǎn)全流程的先進(jìn)半導(dǎo)體技術(shù)研發(fā)和量產(chǎn)交付能力。公司聚焦未來產(chǎn)品需求,通過多領(lǐng)域底層核心技術(shù)的自研突破,持續(xù)提升芯片及解決方案競(jìng)爭(zhēng)力,幫助行業(yè)整機(jī)客戶快速提升產(chǎn)品競(jìng)爭(zhēng)力,成就客戶商業(yè)成功。
中科昊芯
中科昊芯是數(shù)字信號(hào)處理器領(lǐng)先企業(yè),作為中國(guó)科學(xué)院科技成果轉(zhuǎn)化企業(yè),公司在全球范圍內(nèi)開創(chuàng)性的使用 RISC-V指令集進(jìn)行數(shù)字信號(hào)處理器 DSP 的設(shè)計(jì)研發(fā),解決了國(guó)內(nèi) DSP市場(chǎng)困擾多年的應(yīng)用生態(tài)和知識(shí)產(chǎn)權(quán)難題。公司率先量產(chǎn)全球首款RISC-V DSP并推出 HX2000系列數(shù)字信號(hào)處理器產(chǎn)品,可廣泛應(yīng)用于工業(yè)控制及電機(jī)驅(qū)動(dòng)、光伏及儲(chǔ)能、新能源汽車、數(shù)字電源、消費(fèi)電子、白色家電等眾多領(lǐng)域,該系列十余款芯片已流片,多款型號(hào)實(shí)現(xiàn)量產(chǎn)并批量供貨數(shù)百萬(wàn)片。
微核芯
微核芯從事RISC-V高性能處理器芯片的研發(fā)和銷售,核心技術(shù)覆蓋高性能處理器芯片的系統(tǒng)架構(gòu)設(shè)計(jì)、物理設(shè)計(jì)、先進(jìn)工藝、基礎(chǔ)軟件等主要領(lǐng)域,是當(dāng)前國(guó)內(nèi)少有的具備服務(wù)器級(jí)高性能RISC-V處理器完整研發(fā)能力的企業(yè),已與多家互聯(lián)網(wǎng)頭部企業(yè)在數(shù)據(jù)中心服務(wù)器領(lǐng)域開展正式的商業(yè)合作。公司創(chuàng)始人是中科院計(jì)算所龍芯團(tuán)隊(duì)的核心創(chuàng)始成員,在高性能處理器領(lǐng)域擁有超過20年研發(fā)、量產(chǎn)和市場(chǎng)推廣經(jīng)驗(yàn)。
芯算科技
芯算科技成立于2023年9月,是國(guó)內(nèi)外光子計(jì)算領(lǐng)軍者,致力于打造下一代更快更強(qiáng)的新型智能計(jì)算基礎(chǔ)設(shè)施。全球首創(chuàng)高維光學(xué)神經(jīng)網(wǎng)絡(luò)架構(gòu),核心技術(shù)絕對(duì)自主可控,以光子計(jì)算為抓手,推進(jìn)光計(jì)算和光通信的有效融合,做全面自主的光芯片。公司的一代產(chǎn)品預(yù)計(jì)于24年Q3發(fā)布,擁有光計(jì)算行業(yè)最強(qiáng)的性能指標(biāo),貫穿全場(chǎng)景AI智能計(jì)算應(yīng)用。
計(jì)算 AGI 生成式AI
發(fā)表評(píng)論
2024-07-01 19:00:31
2024-07-01 19:00:31
2024-07-01 19:00:31