作者 | 張小珺
編輯 | 石? ?丁
出品 | 騰訊新聞《遠(yuǎn)光燈》
就在Robotaxi已經(jīng)快從人們記憶中抹去時,它突然重回大眾視野。
今年7月,百度推出的蘿卜快跑在武漢引發(fā)廣泛關(guān)注,也帶來一些爭議。許多人開始討論Robotaxi是不是迎來拐點?對此,我們和小馬智行聯(lián)合創(chuàng)始人兼CTO樓天城聊聊Robotaxi。
樓天城是清華首屆姚班畢業(yè)生,因在編程競賽的優(yōu)異戰(zhàn)績又被稱作“樓教主”。他畢業(yè)后進(jìn)入Google工作,在這里最早接觸了無人駕駛,而后又加入百度從事無人車研發(fā)。2016年,樓天城與百度前首席架構(gòu)師彭軍,創(chuàng)立無人駕駛公司小馬智行(Pony.AI),他出任聯(lián)合創(chuàng)始人兼CTO。該公司估值達(dá)85億美元,正尋求在納斯達(dá)克或紐交所上市。
樓天城在L4自動駕駛領(lǐng)域從業(yè)10年左右。訪談中,我們探討了關(guān)于Robotaxi的新聞、無人駕駛的簡史、自動駕駛常見的路線之爭。
樓天城說了一些頗為尖銳的觀點:比如,“L2做得越厲害,它離L4越遠(yuǎn),反之亦然”,又比如“當(dāng)自動駕駛超越人類,數(shù)據(jù)就變成干擾項,并不是越多越好”。
這里總結(jié)了樓天城的一些核心觀點:
①?蘿卜快跑出圈是因為無人化;
②?自動駕駛可以分成5級臺階;
③?純視覺是好學(xué)生,激光雷達(dá)是作弊學(xué)生;
④?輔助駕駛做得越厲害,它離L4越遠(yuǎn);
⑤?當(dāng)自動駕駛超越人類,數(shù)據(jù)不是越多越好,而是干擾項;
⑥?現(xiàn)在不是自動駕駛的ChatGPT時刻,無人化鋪開還需三五年;
⑦?我的AI世界觀:“人本質(zhì)也不過就是一個AI而已”。
以下為訪談節(jié)選。(為了方便閱讀,作者進(jìn)行了一些文本優(yōu)化)
自動駕駛有五級臺階
《遠(yuǎn)光燈》:我們先從最近的新聞聊起,蘿卜快跑前段時間在武漢火了,Robotaxi引發(fā)很高關(guān)注度,為什么是這個時間點?
樓天城:因為它無人化了。我們2022年底做到無人化,百度也是這時,技術(shù)成熟已經(jīng)1年多時間。從技術(shù)成熟到公眾感知需要時間準(zhǔn)備。
它(蘿卜快跑)有一定規(guī)模,且集中在一個城市,公眾感受度比以前高一些。99%是因為無人,這個是前提——哪怕有10萬輛車,每輛車配安全員,絕對達(dá)不到今天的熱度。
《遠(yuǎn)光燈》:其他人也會把熱度歸結(jié)為其他一些要素,如更多車隊、更大試用范圍。
樓天城:這些是那1%,這1%是最近才有,但最根本是無人化。
《遠(yuǎn)光燈》:為什么火的是武漢,是偶然還是必然?誰會是下一個武漢?
樓天城:可能有關(guān)系,但一定時間內(nèi)絕對不會是唯一。一線城市都有可能。
《遠(yuǎn)光燈》:能不能梳理一下自動駕駛發(fā)展歷史,它是如何誕生并一步步發(fā)展到今天的?
樓天城:自動駕駛這個技術(shù)有30年。2009年是一個檻,一幫人意識到可以做到全無人——在那之前大家講的都是輔助功能。我不直接在其中,但后來加入這個團(tuán)隊(Waymo)。
L2、L4定義是從那時開始的。(L2是部分自動駕駛,駕駛員必須時刻監(jiān)控駕駛環(huán)境,并準(zhǔn)備隨時接管控制權(quán);L4是高度自動駕駛,車輛可以在大多數(shù)環(huán)境和條件下完全自動駕駛,無需駕駛員干預(yù)。)
我用時間讓你感官更強(qiáng)——它能自動1小時、10小時、100小時、1000小時、10000小時不用你管。每一步都至少要一年甚至是兩三年慢慢走過來。這是L4純無人駕駛。輔助駕駛有另一條線。
谷歌2012年做到1小時,我們2017年底做到1小時,慢慢向前從1到10000小時,每一步有對mindset的演進(jìn)。認(rèn)知很重要。
《遠(yuǎn)光燈》:每一步技術(shù)突破的關(guān)鍵是什么?
樓天城:讓車輛能夠有一些基礎(chǔ)功能,有一些基礎(chǔ)時間能力,基本1小時接管一次。今天做到這一步的也不多。輔助駕駛你不敢輕易說能做到1小時。這涉及對車輛改裝,包括傳感器等整個集成。
1到10是我們說的一些模型,就是機(jī)器學(xué)習(xí),不一定是大語言模型,就是各種模型——是1到10的主要動力點。
10到100開始真正涉及收集大規(guī)模數(shù)據(jù),很復(fù)雜的模型,以及端到端。并且你肯定要有一定的車隊,你要收集足夠的數(shù)據(jù)。從10到100,需要原生數(shù)據(jù),不能依賴其他行業(yè)數(shù)據(jù)。完整數(shù)據(jù)收集和模擬訓(xùn)練體系,是這個階段的關(guān)鍵,這個走兩年不過分。
從100到1000的關(guān)鍵是指標(biāo)體系。比如上個月我們做到200,這個月有新版本,我想知道是做180還是220了?我不能靠猜。我不能靠坐1小時做決定,因為1小時太短。我能不能測1萬小時?首先測1萬小時要測很久;其次,測1萬小時無法保證,比如上個月下雨下多了,這個月下雨下少了,你怎么知道數(shù)據(jù)強(qiáng)還是弱。比如最近修路多,或者就是運(yùn)氣不好,周五晚上交通事故特別多,上個月不小心多了一個周五晚上——有各種噪聲影響判斷。
如何把這些噪聲濾掉,真正判斷你做得好不好?這是100到1000最關(guān)鍵的。很多家卡在了這。
1到10或者10到100,經(jīng)常說一個詞叫“資源”——我有很多錢、數(shù)據(jù)、機(jī)器,我可以訓(xùn)練模型,這都沒問題。但如果你沒有“尺子”,你都不知道是變好還是變差,這是“超越資源”的能力。如果做不好,再多資源也做不到。不至于南轅北轍,但會原地打轉(zhuǎn)。
再說AlphaGO的故事,人下不過AlphaGO,我為什么知道?他們可以對弈,我看誰勝率高。開車的好壞千人千面,兩個好的司機(jī)開得不一樣。究竟開好還是開差?評價極難。
甚至我訓(xùn)練了一個大規(guī)模的模型來做這件事——評價這個模型的好壞可比模型本身難多了。
《遠(yuǎn)光燈》:這個模型你們專業(yè)術(shù)語叫什么?
樓天城:我們內(nèi)部叫Context-based metric system(旨在根據(jù)不同的場景分別評估系統(tǒng)的能力),我主要精力都花在這邊。
這是公司突破極限很重要的事。很多人講的都是我們數(shù)據(jù)多少,我們數(shù)據(jù)多大,但忘記了好壞之分——當(dāng)你不能判斷好壞,就沒辦法前進(jìn)了。
《遠(yuǎn)光燈》:最近蘿卜快跑,我在武漢的朋友說,它開得太慢了,這讓一個人類司機(jī)感覺不安全——好像是一個貨車在前面,你需要也開得很慢,否則撞上怎么辦?
樓天城:這個評價不好量化,得用模型模擬。安全有安全感的問題——你開車把人嚇得要死,那也是不安全。慢得要死不安全,這是高階的,這個理解很厲害。有時候有錯覺,感覺開得慢會安全一點,并不是這樣。開車開得慢會讓人犯昏,讓別的司機(jī)不知道你要干什么,讓別人confused(迷惑)很危險。
從1000到10000,其實就是這個。現(xiàn)在我回頭看,好像挺顯然。站在當(dāng)初1000小時不明白這個道理。從1000到10000小時,你可能出的安全風(fēng)險不完全由你個人,可能由其他司機(jī)。你不撞別人,別人還會撞你。整體安全才是真正安全很重要的一部分,這是1000之后。
人一般都能做到1000,那時已經(jīng)超越人的水平了。
為什么難呢?我坐我們的車,某天我突然發(fā)現(xiàn),這個車怎么這么開?這時我不敢懷疑它錯了,因為我懷疑是我不如它,它可能想了我沒有想到的東西——它開得比我好,我不能僅僅靠我評價,因為我根本不如它,我只能告訴它什么是好的。
從1000到10000根本是,有這樣一套演進(jìn)系統(tǒng),能幫它怎么去演進(jìn)——你不能教他了?,F(xiàn)在帶娃我覺得沒問題,還可以教;很多年后就不一定,他比我厲害,我只能告訴他怎樣讓他自己學(xué),給他創(chuàng)造環(huán)境,給他找更好的老師,告訴他什么是好的,但究竟怎么學(xué),那是他的本事。
你千萬不能把你開車數(shù)據(jù)全部灌給它,因為你的數(shù)據(jù)就這個水平,你把差的數(shù)據(jù)灌給它,它更學(xué)不會了。首先,你要找到非常好的數(shù)據(jù)。
以及,如何降低其他車的風(fēng)險,是1000到10000最關(guān)鍵的。跟你剛講的有點像,別人車發(fā)生困難,是因為我開車給他造成困難,讓別人發(fā)生事故。那么我能不能不要給別人造成困難,讓別人開車都覺得比較容易?
《遠(yuǎn)光燈》:現(xiàn)在是千到萬的過程當(dāng)中?
樓天城:現(xiàn)在已經(jīng)到10000小時了。10000小時是10倍于人類司機(jī)水平。
《遠(yuǎn)光燈》:你說的1小時、100小時、1000小時到10000個小時,專業(yè)術(shù)語怎么說?
樓天城:我們一般用開多少里程會出現(xiàn)一次你不希望發(fā)生的事情,比如出現(xiàn)接管或者一次事故。最早源于美國,美國是英里,就是Miles per Intervention、Miles per Perfectly evasion之類,我們叫MP-X。
《遠(yuǎn)光燈》:2016年創(chuàng)業(yè)到現(xiàn)在,哪一步對你們是一次質(zhì)的飛躍?
樓天城:每一步都很難。我們在10小時停留了不少時間,擔(dān)心是不是走不下去了。10小時肯定不夠,如果長時間沒進(jìn)展,團(tuán)隊可能迷茫,那時壓力很大。
這個突破是信心累積非常重要的一點,當(dāng)時伴隨而來的是豐田投資。
L2越厲害,就離L4越遠(yuǎn)
《遠(yuǎn)光燈》:我在學(xué)習(xí)自動駕駛時發(fā)現(xiàn),這個行業(yè)有很多路線之爭。第一個是使用純視覺還是激光雷達(dá)?
樓天城:目標(biāo)不同是最大差別。目標(biāo)不同,最合適的路線就不同。
做全無人,我就不會走某些路線。比如說我不會走全視覺路線。
我很喜歡禾賽的說法,好學(xué)生,你可以很努力、優(yōu)秀,但你很難比過作弊的學(xué)生。激光雷達(dá)是一個作弊的東西——比如,從我們這到屏幕的距離,激光雷達(dá)一測就知道,不需要數(shù)據(jù),不需要參數(shù),不需要學(xué)什么,直接看答案就行了。做到全無人,需要“一個作弊的學(xué)生”來做。
《遠(yuǎn)光燈》:為什么特斯拉要用純視覺的路線?
樓天城:因為現(xiàn)在它不需要全無人。
純視覺成本更低;更重要的是,車輛顏值會受很大影響。成本在四五年前是影響因素,但今天成本差異沒那么明顯了,對車輛外觀確實有影響。
《遠(yuǎn)光燈》:第二個路線之爭是,車路協(xié)同還是單車智能?
樓天城:這兩個是互相加成,他們的矛盾從第一天就非常少。這兩個之間各有各自重要的東西,都能做到,沒必要A取代B。
但如果萬一沒有車路協(xié)同,它是調(diào)度不夠好,但不至于完全不能上路——這是為什么我們先做單車智能的原因。它有priority(優(yōu)先級)。
車路協(xié)同現(xiàn)在提供的數(shù)據(jù),當(dāng)下很難幫助單車智能。反過來,單車智能在幫車路協(xié)同。你可以認(rèn)為自動駕駛也是一個設(shè)備,現(xiàn)在這個智能設(shè)備各方面性能比車路協(xié)同好。
《遠(yuǎn)光燈》:第三個路線之爭是,漸進(jìn)式自動駕駛還是跨越式自動駕駛?你們是跨越式。
樓天城:你說L2和L4,從數(shù)字上我好像占了便宜,因為我取了比較大的數(shù)。不應(yīng)該占嘴上這個便宜。大家是不同的兩個目標(biāo)——That’s it。
一個是足球、一個是籃球。一個頂尖足球運(yùn)動員更難成為頂尖籃球運(yùn)動員,因為很多做得太極致了。足球運(yùn)動員非常優(yōu)秀,彎腰能力強(qiáng),人都有點駝背,籃球運(yùn)動員一定不能這樣。當(dāng)他很極致,做另一件事反而很難。
《遠(yuǎn)光燈》:何小鵬最近去美國試駕特斯拉FSD和Waymo,得出的結(jié)論是特斯拉FSD明年一定會追上Waymo,雖然Waymo現(xiàn)階段體驗更絲滑,但特斯拉有更多數(shù)據(jù),范圍更廣,面積更大,成本更低。你同意這種觀點嗎?
樓天城:一個學(xué)文科,一個學(xué)理科,誰考得高,得看出什么題。
他們的目標(biāo)差別很大。我比較輔助駕駛和L4,因為本身FSD和L4不是一個同類比較。輔助駕駛,它成本和覆蓋區(qū)域很重要,跟人類交互很重要。它一個助手,要做的是,幫你的時候一定做得都對,幫不了的時候就告訴你,你要自己來。而剛剛說的全是L4沒有的。
L4首先成本很重要,但沒那么重要。在此基礎(chǔ)上,所有事情都要自己handle,不能交給別人。別人可能在睡覺,你叫不醒,所有事情都要自己處理。哪怕稍微慢一點(我們現(xiàn)在速度上是比別的車快),安全性100%一定要保證。如果你了解模型訓(xùn)練的東西,這是兩個非常極端的規(guī)劃。
你可以理解成,家庭醫(yī)生和??漆t(yī)生的區(qū)別。一個醫(yī)生各種病都要知道一些,但治療需要找??漆t(yī)生。專科醫(yī)生是我不知道很多病,但我知道的病一定是要對的。
《遠(yuǎn)光燈》:所以,F(xiàn)SD做得再厲害也不能直接過渡到L4。
樓天城:L2做得越厲害,它離L4越遠(yuǎn)。
反之也是如此。一個越好的L4公司,它離L2越遠(yuǎn)。
《遠(yuǎn)光燈》:L2和L4技術(shù)上的本質(zhì)差異是什么?
樓天城:L4需要10000小時不出事故是最少的。說不好聽的,10小時出一次事故,誰敢用你的車?
L2的技術(shù)也在不斷前進(jìn),但這個數(shù)字是越來越低。三個月之前我可能做到10小時,這個月只有8小時。這不是問題,因為用戶從沒要求過我,我只要大于1就可以。但從10到8,成本降低了,用戶只需要付更少的錢就可以,這是用戶更喜歡的。你本來要從10小時做到10000小時,但你花了三個月降到8小時。
你是一個更好的L2產(chǎn)品,但是距離L4更遠(yuǎn)了。
馬斯克拍過一個視頻,40分鐘接管一次,他都沒覺得這有問題,我也沒覺得有問題。
當(dāng)自動駕駛超越人類,數(shù)據(jù)是干擾項
《遠(yuǎn)光燈》:你現(xiàn)在最關(guān)注的北極星指標(biāo)是什么?
樓天城:按重要程度依次是安全、舒適度和效率。
《遠(yuǎn)光燈》:關(guān)于我們剛剛討論的怎么讓人類司機(jī)或路人減少恐懼,Robotaxi公司需要做什么?
樓天城:做所有人該做的事,讓他覺得你是一輛正常的車。這個技術(shù)非常復(fù)雜,但通俗說,是讓大家覺得是人在開車,你沒有任何特別之處。
千萬不要surprise別人——變道該堅決就堅決,該不變就不變,不要猶豫。人一般不猶豫,人覺得稍微有點擠,我就擠進(jìn)去了——所有行為就像一個老司機(jī)的正常行為一樣。
很多人開法不一樣,我們叫“千人千面”。大家覺得數(shù)據(jù)多肯定好,但到這里就不是了。因為一旦千人千面,數(shù)據(jù)越多越不好、越多越雜。
《遠(yuǎn)光燈》:這跟FSD的觀點相反,他們覺得數(shù)據(jù)越多越好。
樓天城:他們?nèi)绻龅?000小時,也會這么理解,但它現(xiàn)在連1都不到。
當(dāng)你開始超越人類,數(shù)據(jù)不是越多越好。人就是1000小時,當(dāng)你開始超越人類,數(shù)據(jù)是你的干擾項。
到1000小時之后就要考慮數(shù)據(jù)的缺點。人在不同情況下開車行為不同,會把機(jī)器學(xué)習(xí)搞暈,它不知道跟誰學(xué)。它也沒有辦法取平均,因為行為沒有平均值。假設(shè)說你有所有數(shù)據(jù),你現(xiàn)在要超越這個平均的時候,數(shù)據(jù)越多越難超越。
《遠(yuǎn)光燈》:如果數(shù)據(jù)不是越多越好,多少數(shù)據(jù)是合理數(shù)據(jù)?
樓天城:這個涉及到內(nèi)部的一些點。到了1000小時之后,百輛車就夠。
《遠(yuǎn)光燈》:這聽起來很容易,數(shù)據(jù)量變大很難,數(shù)據(jù)量變小很容易。
樓天城:變小不是說我就扔一些數(shù)據(jù),而是我需要對數(shù)據(jù)做更多處理,剩下我要的。很難。
《遠(yuǎn)光燈》:你怎么知道多少數(shù)據(jù)是合理數(shù)據(jù)?
樓天城:這是根據(jù)要達(dá)到的目標(biāo)所訓(xùn)練的模型大小反推需要的數(shù)據(jù)量。數(shù)據(jù)越多,讓你越難收斂。
之前馬斯克提到,平路空白路上的數(shù)據(jù)是沒用的。因為大語言模型迭代,它的梯度會很快下降為0,沒辦法收斂,這是技術(shù)原因。但本質(zhì)是當(dāng)你超越,你會發(fā)現(xiàn)這些數(shù)據(jù)會出現(xiàn)反面效果。當(dāng)你從1000走到10000,數(shù)據(jù)達(dá)到一定數(shù)字,幫你做一些事是可以的,再多就是負(fù)面向,會把你拉回來。
我今天已經(jīng)達(dá)到6000小時,還沒有達(dá)到10000,我把那1000的數(shù)據(jù)加進(jìn)去之后,會從6000被拉回來,變成4000小時。
《遠(yuǎn)光燈》:L2既然有這么多數(shù)據(jù),為什么現(xiàn)在才到1,為什么這么慢?
樓天城:我經(jīng)常這樣舉例,我們公司給到員工每個人1臺電腦,但每個人的表現(xiàn)天差地別。公司有人做得好,有人做得不好,不是說你給好的人發(fā)了10臺電腦,差的人只發(fā)了1臺電腦,大家的電腦都是1臺,有很大不同。有很多超越硬件之外的東西。
《遠(yuǎn)光燈》:何小鵬有一個觀點,他認(rèn)為在大AI應(yīng)用里,軟硬要合體,你同意嗎?
樓天城:如果說最終追求性能極致,軟硬一體是有幫助的,這個我認(rèn)可。但世界上不是所有東西都要追求性能極致。
現(xiàn)在不是自動駕駛的ChatGPT時刻
《遠(yuǎn)光燈》:你一畢業(yè)就加入了谷歌,你在谷歌最大的收獲是什么?
樓天城:最大的收獲就是接觸了自動駕駛。因為當(dāng)時只有谷歌有自動駕駛。
《遠(yuǎn)光燈》:谷歌的組織文化有沒有給你一些啟發(fā)?
樓天城:谷歌很強(qiáng)調(diào)團(tuán)隊合作,他教你很多辦法,怎么能更好的合作。大家一起工作,代碼應(yīng)該如何管理,數(shù)據(jù)應(yīng)該如何管理,用什么樣的方式去一起寫代碼,大家能寫得很好,不出問題。
做事需要大家一起做,而不是靠一兩個超級明星。
《遠(yuǎn)光燈》:你2016年為什么跟彭軍一起創(chuàng)業(yè)?
樓天城:我當(dāng)時在百度。大家在理念、認(rèn)知、做這件事的決心上有非常大認(rèn)可。
現(xiàn)在蘿卜快跑關(guān)注度更多在無人上。2016年到2019年、2020年,大家都相信能做到純無人??墒侵蟮娜辏咔槟菐啄?,大家有點懷疑能不能做到。根本上還是大家對這件事的認(rèn)知。大家愿意出來是因為想花幾年做一件影響人類的事。
《遠(yuǎn)光燈》:你們創(chuàng)業(yè)了8年,無人駕駛落地比你預(yù)期的早還是晚?
樓天城:有早有晚。首先是政策,過去幾年,尤其是中國,政策是頂著技術(shù)往前走,感謝政策制定方。還有一個快是成本,激光雷達(dá)早年8萬美金一個,那時匯率和現(xiàn)在差不多,50萬+人民幣,而今天好的是小幾千人民幣。價格的下降比想象快很多,這對商業(yè)化有很大幫助。
無人化比我想象中慢了一點。當(dāng)然不是說所有都是因為疫情,但有關(guān)系。
《遠(yuǎn)光燈》:特斯拉FSD很厲害,華為、小鵬等國內(nèi)車企的智駕水平也在提升,他們跟你們是什么關(guān)系?最后市場格局能給我描述一下?
樓天城:L4的伙伴有技術(shù)公司、車廠以及運(yùn)營的平臺方,有可能一家公司做其中多個,但從格局角度來說是這樣的,做多個不表示格局不是如此。這是L4的狀態(tài)。他們也可以成為其中的車廠。如果說哪一天突然冒出來一家公司,他既能做車也可以做好的技術(shù),這有可能發(fā)生。
《遠(yuǎn)光燈》:如果說L4實現(xiàn)了,街上是不是就不需要這么多特斯拉了?
樓天城:不是這樣。很多人還是要開車。今天我們做的更多是出行服務(wù),為城市提供基礎(chǔ)運(yùn)力,并不是說要剝奪人開車。
《遠(yuǎn)光燈》:有人說這是自動駕駛的ChatGPT moment,你認(rèn)同嗎?
樓天城:L4肯定沒到,我們要把它做到。
《遠(yuǎn)光燈》:你覺得Robotaxi什么時候能讓我們看到非常大規(guī)模的在多個城市運(yùn)行?
樓天城:三五年。L2和L4的差別,有一個成本問題。你說很大規(guī)模,成本怎么也得說比如說10萬這個量級前后?,F(xiàn)在大概是十幾萬。
但下降不是說買便宜東西,它需要標(biāo)準(zhǔn)化生產(chǎn)、做產(chǎn)線。去年我們和豐田成立合資公司專門做量產(chǎn),把我們的方案標(biāo)準(zhǔn)化、量產(chǎn)化、產(chǎn)線化需要更長時間。
《遠(yuǎn)光燈》:你覺得以L4為目標(biāo)的無人駕駛公司,在全球范圍內(nèi)能活幾家?
樓天城:我的觀點是一只手。
達(dá)到10000小時的技術(shù)門檻很高,不是隨便可以做到;但也絕對不可能是1。它的擴(kuò)張和互聯(lián)網(wǎng)不一樣,互聯(lián)網(wǎng)是0成本擴(kuò)張,這需要鋪車。就連車廠,也沒有說只有一家。到最后有不同的體驗,有不同的要求。
《遠(yuǎn)光燈》:融了這么多錢,用了這么多年,你對今天的結(jié)果滿意嗎?
樓天城:滿意。前年年底之后我都滿意——無人化是幾代做技術(shù)的人的終極夢想。
《遠(yuǎn)光燈》:Pony.AI你期待它成功的樣子是什么,最差的預(yù)期是什么?
樓天城:三年和五年(實現(xiàn)全無人)。我估計最好是三年,最差是五年。
《遠(yuǎn)光燈》:Pony.AI在通往無人化的路上有沒有倒下的可能性?
樓天城:不會因為我能想到的原因倒下。
《遠(yuǎn)光燈》:是什么讓你堅持做無人駕駛這么多年?
樓天城:不光我,是公司所有創(chuàng)始團(tuán)隊。這也是我導(dǎo)師姚期智先生帶給我的,我是第一屆姚班學(xué)生。
一個人放棄初心,一般人會認(rèn)為他遇到了很多困難沒辦法堅持,但人放棄初心的根本原因是不切實際的誘惑,不是因為艱苦。很多人可以在很艱苦的條件下堅持前行,但無法在誘惑面前保持好的心態(tài)。
我們當(dāng)時出來,不是為了一個體面的生活,我們其實都有,不需要這么做。我們就是要為了把這件事做成,因此我不太會受很多誘惑。和我們同期出來,沒有堅持下來的,沒有是因為艱苦或者因為沒錢了,而都是因為沒經(jīng)受住誘惑。
《遠(yuǎn)光燈》:姚先生是一個什么樣的人?
樓天城:我沒有資格評價他。
他是一個對教學(xué)看得很重的人。他上課的時候?qū)ξ覀兊暮芏喾答伿呛苷J(rèn)真的。甚至我們問他回答不了的問題,他也會說我來想辦法回答你——他會真的來找你來回答你的問題。
這種“大家”可能會忘了,但是他不會,他對教學(xué)和對學(xué)生的學(xué)習(xí)很看重。
人本質(zhì)也不過就是一個AI而已
《遠(yuǎn)光燈》:怎么看李飛飛提出的空間智能?
樓天城:這個涉及到世界觀的東西了,我不予置評。
《遠(yuǎn)光燈》:你說說你的AI世界觀。
樓天城:人有時候會高估自己的智能。我覺得我們生活在一個非真實環(huán)境。我不相信我們的世界是不真實這件事,所以我花了一些精力去找一些我們世界是真實的證據(jù),但是我越找越發(fā)現(xiàn)——我們的世界不真實,我們在一個模擬器里,模擬器安排了我們的今天見面。
這個根本是說,你可以探尋模擬器的一些參數(shù),比如光速就是模擬器很重要的參數(shù),現(xiàn)在做的很多AI工作已經(jīng)開始一定程度探尋到一些參數(shù),但是我們跟那些東西不一定有本質(zhì)區(qū)別。
《遠(yuǎn)光燈》:這會帶來你對AI有什么樣的見解?
樓天城:AI超過人不是AI的頂峰。
再說的更夸張一些,我們經(jīng)常會問AI會不會超過人?但你問這個問題的時候是不是對自己太高看了?你憑什么人可以判斷AI能不能超過人?
《遠(yuǎn)光燈》:大家覺得AI是人創(chuàng)造的。
樓天城:我們創(chuàng)造的車,車跑的速度比我們跑的速度快多了。我們創(chuàng)造的AI可以超過人。但更可能的見地是,人的智力可能不足以判斷AI能不能超過人。
我也不夸大AI的能力,AI本身是一個擬合回歸過程,AI并沒有創(chuàng)造新的邏輯。今天所謂的AI,還遠(yuǎn)沒有到通用人工智能的地步,今天的ChatGPT,今天的大語言模型所有的東西,都是在模仿人,僅此而已——只是一個超大參數(shù)擬合的過程。
但是我并不否認(rèn),這種做法非常好,也能達(dá)到非常好的效果,也能超過人——因為人本質(zhì)也不過就是一個AI而已。
《遠(yuǎn)光燈》:人和機(jī)器人會共用一個大腦嗎?
樓天城:這就是要回答什么是大腦這個話題。也許大腦只是高階智能的一段程序,什么叫記憶,記憶是對之前某些印象的encoder(編碼器)。這方面是可以做到,但這個東西靠人來做不容易。
今天AI的技術(shù)在有些方面得到了很多進(jìn)步,比如ChatGPT,但很多方面并沒有達(dá)到特別高的水平,比如說能耗。我中午吃了飯到現(xiàn)在為止都不覺得餓,干了這么多事,但是同樣的事給機(jī)器人,它早就歇菜了。人的能耗比非??膳隆?/P>
還有人這個系統(tǒng)的穩(wěn)定性也極其可怕,你今天讓我造一個心臟是造不出來的,它可以一生跳這么次都不壞,我做不出來這樣的東西。所以人可以造出來的東西和人自己相比還有很大的差距,也包括腦子。但只是處理特定問題的時候,AI能達(dá)到人的水平。
《遠(yuǎn)光燈》:所以會共用一個大腦嗎?
樓天城:完全可以,腦機(jī)科技可以做到這一點,這個理論上并沒有任何問題。
因為你問的是能不能,但是我并不是說好做,它其實很難做,但是他能。
競賽中有一個技巧是:Hold cold card
《遠(yuǎn)光燈》:你會怎么看待楊植麟?你們都會被評價為清華的學(xué)神、技術(shù)的天才,我很好奇一個天才怎么看待另外一個天才?
樓天城:雖然大家都屬于AI方向,但當(dāng)下沒有立刻合作的點。如果說合作,我還是會珍惜這個機(jī)會。同樣經(jīng)歷過這些的人,才會理解合作的不易、對方的支持和真正的閃光點。
只有拿過冠軍的人,才知道冠軍和亞軍的差別。
《遠(yuǎn)光燈》:描述一下差別。
樓天城:你看奧運(yùn)會獎牌,第一名和第二名可不止是差這一名。世界第二高峰,很多人不知道是什么峰,但世界第一高峰全天下都知道。
然而他付出的努力也是巨大的,當(dāng)你沒有接近,可能你并不知道你要付出多少努力。但是你真正走過的人,我相信他一定能理解。
《遠(yuǎn)光燈》:被稱作技術(shù)天才會是一種負(fù)累嗎?
樓天城:如果說這個都能成為一種burden,可能也達(dá)不到這種高度。因為之前就可以稱為burden。眼界要放得更高一些,顯然上面還有更廣闊的空間。
《遠(yuǎn)光燈》:為什么你參加比賽的ID叫ACRush,怎么取的?
樓天城:當(dāng)時是速度為王的時代,Rush就是一種最快的跑步動作。
《遠(yuǎn)光燈》:你連續(xù)11年蟬聯(lián)TopCoder得冠軍,你為什么要參加11屆,驅(qū)動力是什么?
樓天城:是因為第12屆我沒有拿到冠軍。杜瑜晧后來超過我了,雖然我三年之后超了回來,但是后面就不重要了。本質(zhì)上我沒有做到12屆。
《遠(yuǎn)光燈》:你最近一年參加是什么時候?
樓天城:就是幾周前。我去年拿了亞軍,但沒有拿到冠軍,我一般叫亞軍是“最大的失敗者”,首先他是一個失敗者,但他又是亞軍,所以是最大的失敗者。
競賽是一個我能堅持20年的事情,自動駕駛也是如此。
《遠(yuǎn)光燈》:你就沒有哪一年覺得今年要不就不去了,以后就不去了?
樓天城:用一個競賽圈的行話說,能不能和想不想是兩碼事。如果不能了,說不想的話,那就是找借口。
它是選拔,不是報名,你要進(jìn)前幾才能去。如果你前幾年都沒有進(jìn)前幾那就是不能的,但不能和不想是兩碼事。做L4也有能不能、想不想。
《遠(yuǎn)光燈》:競賽有技巧嗎?
樓天城:技巧無處不在。競賽中經(jīng)常有一點是,別人會知道你做的現(xiàn)狀,因為大家是一個racing過程,而不是最后才知道結(jié)果,過程當(dāng)中就大概知道。
這個過程當(dāng)中有一個“hold cold card”,我有一些東西我知道怎么做,但我就是不讓你知道,我通過一些辦法,讓你覺得我也不知道,讓你放棄真正拼搏的想法,把你淹沒在里面。
現(xiàn)在他能做到80分,我已經(jīng)可以做到90分,萬一我讓他知道我做到90分了,就會激發(fā)他的潛能,他會拼命做得很高,會完全跳出這個點去想東西。你把你的分?jǐn)?shù)控制在80左右,讓他覺得自己不錯,只要注意一些細(xì)節(jié)就可以了。最后你再亮劍亮出90,這就沒有時間想這個事了。
經(jīng)常在比賽在最后一刻會有完全不同的結(jié)果,大家都hold在那一個點,但是總有人不hold,很多人把分?jǐn)?shù)調(diào)整成最不hold的人的最高的地方,讓別人覺得我好像差不多了。
《遠(yuǎn)光燈》:今天在和L2那條技術(shù)線賽跑的時候,你會hold嗎?
樓天城:這個不一樣。公司發(fā)展需要一定的publicity,競賽是不關(guān)注中間情況的,中間你哪怕領(lǐng)先一路,最后被超過還是被超過了,這是競賽的特點。公司不是這樣的,我不要同學(xué)們也需要,他們不要他們家人也需要,我需要交朋友,我需要有合作伙伴,中間的結(jié)果是很重要的。
《遠(yuǎn)光燈》:這種招用多了別人不就知道了嗎?
樓天城:我經(jīng)常這么干,別人也都知道。但他或許有僥幸心理。
《遠(yuǎn)光燈》:我記得你還有過比賽倒數(shù)的時候。
樓天城:我比賽倒數(shù)次數(shù)可能是世界第一,有四次倒數(shù),很難會有來者了——因為很多人都進(jìn)不了四次決賽。決賽一般只是8-10人,能進(jìn)決賽四次不容易。我有幸墊底過4次。
《遠(yuǎn)光燈》:你倒數(shù)的話,回家會沮喪嗎?
樓天城:難過肯定是會難過,因為我很看重這件事,但事后過了也就過了,需要繼續(xù)往前看。
《遠(yuǎn)光燈》:失落多久?
樓天城:一趟飛機(jī)。
《遠(yuǎn)光燈》:你參加過這么多比賽,競賽給你帶來的樂趣是什么?
樓天城:理解冠軍和亞軍的差別算嗎?認(rèn)識很多同樣的人,有不斷學(xué)習(xí)的一種態(tài)度。
最根本的是,到真正塔尖的時刻,那樣一種極致,是我一直很留戀的感覺。
往期內(nèi)容
發(fā)表評論
2024-08-15 12:30:08
2024-08-15 12:30:08
2024-08-15 12:30:08
2024-08-15 12:30:08
2024-08-15 12:30:08