圖片來源:視覺中國
特約作者 | 周子豪
編輯 | 王偉凱
編者按:
自從OpenAI打開了生成式AI的潘多拉魔盒,大模型依然是2024年最炙手可熱的風口,硅谷作為技術(shù)發(fā)源地,人才蜂擁。任何優(yōu)秀的組織,一定都是找到了一種方法和對應(yīng)的工具,去最大程度地激發(fā)每一個個體的創(chuàng)造力。但更重要的,是抓住那些稍縱即逝的天才靈感?!禔I光年》通過走訪一些AI公司員工,記錄當下中外大模型公司的變化:掌握未來的人才在哪里?是為第二篇。
從森尼韋爾到舊金山市中心,驅(qū)車近40英里,斯坦福大學的碩士生趙鳴將將會參加一場AI創(chuàng)投的活動。這是六月一個周末的傍晚,趙鳴的活動軌跡。
硅谷本地一家美元基金的合伙人舉辦了這場活動。與會者有數(shù)十家AI初創(chuàng)公司的創(chuàng)始人,還有近50位代表不同資本的投資人?;顒又?,創(chuàng)業(yè)者們上臺向投資者兜售自己的想法,AI工程師們則在臺下觀望“行情”。
“這樣的場景每周都在硅谷上演?!壁w鳴向《AI光年》作者表示??颗笥褷烤€,他得到了一張入場券。趙鳴在斯坦福大學主修計算機,現(xiàn)在決心踏入AI行業(yè)。
他期待在這場活動中認識更多的科技從業(yè)者,以獲取行業(yè)的前沿訊息。但是,令他驚訝的是,四百多位參與者中有一半是華人面孔。
觥籌交錯之間,這些人的身份逐漸明朗:有專程從北京飛來尋求投資機會的風險投資人;也有在谷歌、微軟等工作多年的中國籍軟件工程師;還有一些在美國頂尖學府研究AI的中國學生。
他們都是中國人在硅谷的縮影。美國麥克羅波洛智庫的一份報告(2022)顯示,當時在美國工作的頂尖人工智能研究人員中,來自中國的研究人員占38%,美國人占其中37%。而在2019年,這兩個數(shù)字還是27%和31%。
一直以來,華人都是硅谷科技圈的“中堅力量”。如今,在新的AI浪潮下,硅谷的中國年輕人又在經(jīng)歷什么樣的起伏呢?
大公司卷模型,初創(chuàng)公司拼B端
“硅谷做AI的技術(shù)員,很多是中國人?!鼻靥煜蜃髡弑硎尽?/span>
他是硅谷一家知名科技公司的機器學習工程師(MLE)。2019年從美國一所TOP30高校的計算機專業(yè)碩士畢業(yè)后,開始在硅谷從事AI相關(guān)的算法研究工作。在他的團隊里,中國籍工程師占比近40%,“其他人主要來自印度,還有一些是羅馬尼亞等國的東歐人。”
根據(jù)硅谷指標的報告,硅谷地區(qū)的人口主要由亞洲人和白人組成,而在亞洲人群中,華人數(shù)量占比最高。2022年,華人占亞洲人口的31%,成為硅谷最主要的亞裔群體之一。此前,秦天的許多中國朋友還是軟件工程師。
但2022年年初,OpenAI發(fā)布GPT3和DALL-E 2的最新版本后,打破了這個局面,很多人開始向AI方面轉(zhuǎn)型。
以秦天為例,早些時候,他所在的業(yè)務(wù)線還是開發(fā)一款有AI功能的移動相機應(yīng)用。到2022年6月,公司突然宣布戰(zhàn)略調(diào)整,砍掉已有近五年歷史的產(chǎn)品線,轉(zhuǎn)向大模型領(lǐng)域。
事實上,這種調(diào)整在2022年并不罕見。那一年,硅谷的多家科技巨頭如Meta、Adobe和Google都進行了重大業(yè)務(wù)調(diào)整,紛紛開發(fā)了AI大模型領(lǐng)域,追隨OpenAI的步伐。這一轉(zhuǎn)變也促使大量軟件工程師流向人工智能業(yè)務(wù)板塊,其中不乏中國人的身影。
畢業(yè)于卡內(nèi)基梅隆大學的張宇,目前在谷歌母公司旗下的自動駕駛公司Waymo工作,負責車載AI系統(tǒng)的研發(fā)。張宇介紹,ChatGPT-4出現(xiàn)后,Waymo經(jīng)歷了一期離職潮,部分中國同事也選擇了離開?!半x職比例不定,有些組可能每周流失一個人。”張宇說。
這些同事大多轉(zhuǎn)投從事大語言模型研發(fā)的科技公司,或者重回谷歌,負責其他產(chǎn)品的AI研發(fā)工作。張宇感嘆:“在硅谷,GPT儼然成了比自動駕駛更火的領(lǐng)域。”
加入這股AI浪潮的不僅有在硅谷打拼多年的“老工程師”們,還有從中國來趕潮的“新人”。
25歲的詩琦是其中的一份子。今年五月,他從國內(nèi)飛往舊金山,決定加入一家專注AI的初創(chuàng)公司。詩琦不敢確定有多少人和他一樣在今年從中國來到了這里,但他相信:“人才和資金總是會流入最先進生產(chǎn)力的地方?!?/span>
來硅谷的決定,并非詩琦一時沖動。在這之前,他是一名軟件工程師,2021年本科畢業(yè)后,便在國內(nèi)一家互聯(lián)網(wǎng)大廠工作。起初,初入職場的施琦還希望在業(yè)務(wù)線上盡可能“施展身手”。但后來,他越發(fā)感到實際工作與期待的背離。
2022年前后,詩琦所在的產(chǎn)品線陷入增長的停滯:無論做再多的產(chǎn)品體驗優(yōu)化,用戶量不再有突破式的增長?!按媪繒r代好像真的來了”,詩琦感覺提早進入了“養(yǎng)老狀態(tài)”,每天維護一下系統(tǒng),再根據(jù)需求做些代碼修改,就結(jié)束了。
朝十晚六,到點下班,不再996的日子,讓詩琦感到危機四伏。雖然“清閑”了,但這也意味著“有沒有你都是一樣了”。
這樣的狀況促使他萌生了兼職打工的想法。一次偶然的機會,詩琦通過了一家位于美國密歇根州的AI初創(chuàng)公司的面試,開始為其遠程工作。2022年春天,該公司的老板突然給詩琦發(fā)來一條訊息,說公司拿到一個新模型,是OpenAI最新推出的InstructGPT,邀請他一起內(nèi)測。
“這和我之前見到的AI是完全不一樣的。”詩琦感嘆道。盡管GPT-3早在2020年就已面世,但InstructGPT 使用了從人類反饋中進行的強化學習(RLHF),能生成更符合人類偏好和意圖的響應(yīng)。詩琦冥冥中有一股直覺:“它可能會帶來不一樣的東西?!?/span>
從那之后,詩琦所在的公司就開始大規(guī)模接入這一語言模型,以研發(fā)新產(chǎn)品。這也讓詩琦感到了國內(nèi)與美國在AI推廣上的差距:當時,詩琦身邊的軟件工程師鮮有人接觸過GPT,辦公室里也沒有人談?wù)撚嘘P(guān)transformer的論文。但在美國,OpenAI已然成為各大科技公司熱議的話題。
詩琦回憶,國內(nèi)最早一批關(guān)注GPT的工程師都愛逛GitHub(開源社區(qū))。那個時候,一些內(nèi)地工程師開始接入GPT的API,做些套殼的應(yīng)用。但直到2022年底GPT-3.5發(fā)布后,國內(nèi)的大模型才開始受到資本的追捧。2023年,也被媒體稱之為進入了“百模大戰(zhàn)”。
2023年末,詩琦選擇辭職,憑借此前遠程工作的經(jīng)驗,他獲得了現(xiàn)在這家公司的邀請?!叭ス韫龋ルx新生產(chǎn)力最近的地方。”他說。
“去硅谷,去離新生產(chǎn)力最近的地方?!?/strong>
自公司all?in?AI以來,秦天感受到工作壓力變大了。
在2022年夏天前,工作的氛圍還較為輕松,按秦天的理解,“這得益于上一個信息時代留下來的競爭壁壘”。負責后端開發(fā)的他,每天到點下班,新產(chǎn)品的發(fā)布壓力也不大,“老的互聯(lián)網(wǎng)產(chǎn)品維持營收,新產(chǎn)品做2-3年再發(fā)布很正?!?。
如今,硅谷各大科技公司都不敢在AI競爭中有一絲怠慢。業(yè)務(wù)線的調(diào)整使秦天的日常生活開始變得緊湊,晚上11點下班已成為常態(tài),周末加班也變得不可避免。
OpenAI在AIGC上的進展太快,給了硅谷其他公司許多壓力。 2024年2月,在OpenAI發(fā)布Sora后,秦天就職公司的股價受到了猛烈沖擊。短短一個春天,跌幅超30%。而在上一年,資本市場還對其公司的戰(zhàn)略調(diào)整充滿信心,一段時間內(nèi),股價甚至漲幅超60%。
面對OpenAI等大廠的競爭,秦天的公司加快了產(chǎn)品更新的步伐,將發(fā)布周期縮短至至少半年一次,以確保公司在這場技術(shù)革新的浪潮中保持競爭力,避免被拍在灘涂上。
“產(chǎn)品要加速迭代,與此同時,更多的前沿論文也要研究?!鼻靥煺f,一場新技術(shù)的軍備競賽正在硅谷上演。秦天主要負責多模態(tài)大模型(MLLMs)的開發(fā)工作,簡單來說,就是讓模型可以同時接受語言、視頻、音頻等數(shù)據(jù)的輸入,從而更全面地理解和生成內(nèi)容。
多模態(tài)領(lǐng)域是一座有待AI工程師開拓的新礦山。一篇五月發(fā)表的行業(yè)論文顯示,減少資源消耗,同時擴大其適用性并最小化性能下降,是當下MLLMs的主要研發(fā)目標。
日前,中國智源聯(lián)合國內(nèi)多所高校提出的多任務(wù)長視頻理解評測基準--MLVU,對20個最新流行的多模態(tài)大模型評測發(fā)現(xiàn),排名第一的GPT-4的單選正確率不足65%,現(xiàn)有模型在長視頻理解上仍然面臨巨大挑戰(zhàn)。
“我們需要不斷地關(guān)注是否有新技術(shù)的出現(xiàn),來應(yīng)對這一全新領(lǐng)域。”秦天說。如當Open?AI運用的DIT(Diffusion Transformer)算法架構(gòu)生成出更好的視頻時,秦天和他的同事們就會立即跟蹤,從而判斷產(chǎn)品迭代的方向。
大公司在大模型賽道上激流勇進,硅谷密集的初創(chuàng)公司也在扎起自己的AI營地。
據(jù)詩琦的觀察,許多硅谷的初創(chuàng)公司卷B端產(chǎn)品線,這或與這些公司老板們過去的大廠背景有關(guān)?!八麄兛梢岳霉ぷ髦蟹e累的人脈,更快速地打通商業(yè)渠道。”詩琦說。
如今,詩琦和他的團隊正在研發(fā)一款面向企業(yè)的端對端的開發(fā)者工具,通過AI提升程序員的工作效率。去年9月,微軟也曾推出過類似的應(yīng)用“copilot”,他們期望實現(xiàn)這樣的場景:開發(fā)者寫代碼時可以詢問這些編程助手,從而更高效地完成工作。
“為技術(shù)提效,是不少在美初創(chuàng)公司競爭的方向?!痹婄硎?,而端到端意味著創(chuàng)建一個自動化的工作流。整個過程完全由AI實現(xiàn),客戶只需關(guān)注最終生成的結(jié)果是否符合預(yù)期?!跋胍獜澋莱嚕覀兙鸵嗟厮伎寂c這些大公司進行差異化競爭?!痹婄f。
但一些技術(shù)難題依然擺在硅谷的工程師們面前。在詩琦看來,提高產(chǎn)品的準確率是他們急需突破的技術(shù)點,不同的用戶場景有不同的準確率標準。
就以用戶情感陪伴為核心的C 端產(chǎn)品而言,擁有70%的準確率或許已經(jīng)足夠。但對于企業(yè)級的需求來說,80%才是他們追逐的目標。這也迫使他們?nèi)ふ腋珳实闹R庫數(shù)據(jù),用于模型的訓練。
為了競爭,燒錢是避免不了的。對詩琦的公司而言,每服務(wù)一家公司,即使是一個小體量的項目,每個月的推理花費就有數(shù)千美元。“這樣的單項目成本,放到發(fā)展中國家,頂?shù)蒙弦粋€全職算法工程師的月薪”。
面臨高昂的成本,詩琦坦誠地表示公司尚未實現(xiàn)盈利,但近期已有多家規(guī)??捎^的公司與他們簽訂了服務(wù)合同,他們期望在一年后可以實現(xiàn)盈利?!爸辽俑顿M是一個積極的信號。”詩琦說。
裁員、創(chuàng)業(yè)、回國,硅谷的三重奏
根據(jù)硅谷指數(shù)的統(tǒng)計,從2019年到2023年,硅谷和舊金山地區(qū)誕生了近3000家初創(chuàng)公司,達歷史新高。在這其中,能看見不少華人CEO的名字。目前,4家華人創(chuàng)立的AI公司——Scale AI,Cognition AI,Imbue,和Cresta 已躋身獨角獸行列,總估值超過180億美元。
在硅谷,從來不缺創(chuàng)業(yè)暴富的神話,但在殘酷的競爭下,創(chuàng)業(yè)也意味著風險。在秦天的朋友圈中,離開大廠去創(chuàng)業(yè)的中國籍工程師仍是少數(shù),更多的人還是選擇觀望。
與此同時,盡管AI在資本市場上引發(fā)了新一輪熱潮,但在過去兩年里,硅谷卻經(jīng)歷了持續(xù)的裁員潮。
在硅谷工作的Aria向《AI光年》作者透露,身邊的許多中國同事受到了這股裁員潮的影響。據(jù)她介紹,被裁的工程師主要從事基礎(chǔ)代碼編寫或debug等調(diào)試工作。顯然,這是容易被AI取代的工種。
根據(jù)就業(yè)追蹤機構(gòu)Layoffs.fyi估計,自2022年初以來,已有超過400,000個科技工作崗位被裁減。另一個數(shù)據(jù)是,2022年到2023年間,美國科技公司的全球裁員總數(shù)超過了50萬。這是自2008年金融危機以來,科技行業(yè)規(guī)模最大的一批裁員。
秦天也明顯感到,2024年硅谷的就業(yè)機會比2019年時少很多。
去年底,美國通貨膨脹率折合成年率一度低于3%,與2023年初的6%相比,幾乎攔腰斬。硅谷就業(yè)分析公司CGC解釋稱,通貨膨脹率回落之后,科技公司難再有漲價的空間,無法通過漲價來提升業(yè)績,裁員控制支出就成為最直接的選擇。
“一位被谷歌裁員的中國工程師曾來我們公司面試?!痹婄颉禔I光年》作者表示,但他的公司最后沒有聘用他。據(jù)秦天介紹,在硅谷,一名工作3年左右的AI算法研究工程師的平均年薪在45萬美元左右,對很多初創(chuàng)公司來說,這是一筆不小的開支。
“裁員潮讓很多有創(chuàng)業(yè)夢的中國人不敢行動。”秦天說。
另一方面,簽證的嚴苛規(guī)定,也讓他們?nèi)鄙佟斑x擇自由”。根據(jù)美國的移民法規(guī),在沒有綠卡之前,持有OPT實習簽證或H-1B工作簽證的失業(yè)者,必須要在60天或90天內(nèi)找到新的工作,否則就將面臨被遣返回國的風險。
若創(chuàng)業(yè)失敗,失業(yè)可能會使他們無法繼續(xù)留在硅谷。Aria認為,如今不是AI創(chuàng)業(yè)的好時機,和許多中國AI公司面臨的處境一樣,在硅谷,“如何讓AI產(chǎn)品實現(xiàn)好的商業(yè)化落地,依舊是個問題”。
大洋彼岸的中國,對AI的狂熱似乎才剛剛達到高潮。前不久,世界人工智能大會剛剛在上海落幕。身在異鄉(xiāng),受限于工作精力,秦天較少關(guān)注國內(nèi)AI產(chǎn)業(yè)發(fā)展的新動態(tài),但他認為,國內(nèi)學者在AI的算法研究上已經(jīng)十分領(lǐng)先了。
在全球最大的開源大模型社區(qū)Hugging Face公布的世界開源模型排行榜上,多款來自中國的開源模型一度占據(jù)前列。
但短時間內(nèi),秦天沒有歸國發(fā)展的打算,他認為算力對于大模型的訓練至關(guān)重要,而缺少先進算力始終是中國AI公司要解決的問題。
2022年8月,英偉達收到美國通知,要求其停止向中國出口A100和H100芯片。
今年7月17日,據(jù)彭博社報道,拜登政府正在考慮是否出臺一項加強規(guī)定,該規(guī)定允許對使用任何美國制造技術(shù)的外國產(chǎn)品進行控制。它將針對日本的東京電子(Tokyo Electron)和阿斯麥(ASML)等公司的在華業(yè)務(wù),這兩家公司生產(chǎn)的芯片制造機械對該行業(yè)至關(guān)重要。
地緣政治的因素,讓不少在硅谷的AI技術(shù)人才對歸國后的就業(yè)發(fā)展,多了一團疑云。
“即使崗位競爭激烈,也不能放棄去硅谷?!彼固垢4髮W的碩士生趙鳴向作者感嘆,不少在美的AI碩士生把留美作為第一選擇。為此,很多學生都會在“l(fā)uma”等活動平臺上蹲守最新的行業(yè)交流活動。在他看來,通過社交找工作,是當下在硅谷最現(xiàn)實的捷徑。
今年五月,亞布力論壇上,金沙江創(chuàng)業(yè)投資董事總經(jīng)理、合伙人丁健曾表示,以前硅谷AI研究生70%以上能回國,現(xiàn)在幾乎沒有。
“即使無法確保獲得綠卡,但有一段硅谷工作的經(jīng)歷,一定不是壞事情?!壁w鳴說。
(趙鳴 秦天 張宇 詩琦 均為化名)
?
發(fā)表評論
2024-07-24 10:06:12
2024-07-24 10:06:12
2024-07-24 10:06:12
2024-07-24 10:06:12