【導(dǎo)讀】 實探“AI的盛宴”!華為開發(fā)者大會帶來什么啟示?
中國基金報記者 馮堯
為期3天(6月21日至23日)的 “華為開發(fā)者大會2024”,給業(yè)界帶來了不少驚喜:被稱為“純血鴻蒙”的鴻蒙NEXT面世、“夸父”人形機(jī)器人亮相、盤古大模型5.0發(fā)布……
其中,鴻蒙NEXT恐怕是迄今為止最“聰明”的鴻蒙系統(tǒng),其最為重要的三大特點之一,便是 原生智能能力。華為提出了“鴻蒙原生智能”概念,背后仰仗著大模型的支撐。
“夸父”的橫空出世,展示了識別物品、問答互動、擊掌、遞水等能力,這同樣離不開 盤古具身智能大模型的加持。盤古具身智能大模型提升了機(jī)器人的智能及泛化能力。
而盤古大模型則在一年內(nèi)從3.0版本進(jìn)化為5.0版本,帶來了全系列、多模態(tài)的變化。其參數(shù)覆蓋面從十億級到萬億級,而多模態(tài)能力令盤古大模型能夠更精準(zhǔn)地理解世界。
所有的蛻變都離不開人工智能。記者在此次一線實探中,深切感受到人工智能帶來的科技“溫度”。毫不夸張地說,此次華為開發(fā)者大會實際上更像是一場“AI的盛宴”。AI讓一切變得更“聰明”,一切都離不開它。
但在參加此次華為開發(fā)者大會的業(yè)內(nèi)人士看來,無論AI未來如何進(jìn)化,其最終歸宿將是跨入產(chǎn)業(yè)。“盡管國內(nèi)算力受限、也沒有算法優(yōu)勢,但國內(nèi)擁有全球最全的工業(yè)門類,行業(yè)數(shù)據(jù)最全、場景最多,行業(yè)大模型大有可為”,業(yè)內(nèi)人士如是表述。
“小藝”為何變聰明了?
在華為開發(fā)者大會的鴻蒙展示區(qū)域內(nèi),工作人員向記者展示了鴻蒙NEXT的原生智能能力,即用各類圖片對“小藝”進(jìn)行“投喂”。
例如,在識別人們并不熟悉的旅游景點建筑時,“小藝”在識別后會明確給出景點的詳細(xì)資料,同時會附上相應(yīng)的旅游攻略,供用戶參考。
再如,當(dāng)“小藝”識別人物照片時,甚至可以知悉人物著裝的品牌,包括衣物、背包、鞋類等,同時“小藝”可以幫助用戶識別衣物等物品所對應(yīng)的商店、網(wǎng)店,更便于用戶購物。
而當(dāng)用戶搜尋文檔時,“小藝”甚至可以根據(jù)要求,提取其中重要內(nèi)容并生成PPT,供用戶使用。也就是說,只需將文字、圖片、文檔“投喂”給小藝,其即可便捷高效處理文字、識別圖像、分析文檔。
這依賴于鴻蒙NEXT與AI的融合升級,華為也提出了“鴻蒙原生智能”概念。
實際上,就在不久前的蘋果全球開發(fā)者大會上,蘋果就發(fā)布了其自研的Apple Intelligence(蘋果智能),并宣布其Siri語音助手將接入GPT-4o,構(gòu)成iOS+AI的智能體體系。
而華為也將操作系統(tǒng)層的鴻蒙和模型層的盤古聯(lián)合起來,共同構(gòu)建系統(tǒng)級原生智能,這在國內(nèi)尚屬首次。
盤古上身 “夸父”出道
另一邊,在華為云的展示區(qū)中,人工智能的氛圍更為濃厚。其中, 人形機(jī)器人“夸父”身邊聚集了眾多參會者。
在6月21日的發(fā)布會上,“夸父”現(xiàn)場演示了復(fù)雜任務(wù)執(zhí)行,包括與華為常務(wù)董事、華為云CEO張平安擊掌,分辨位于它面前的與華為有關(guān)的物品,并在得知主持人口渴時,將面前桌上的水遞給了主持人。
而在展示區(qū)內(nèi),“夸父”與參會者近距離接觸。在展示現(xiàn)場區(qū)內(nèi),這款機(jī)器人通過理解工作人員的食物喜好,來搭配食材,并烹飪美食,同時展示了行動能力。
實際上,“夸父”并非新產(chǎn)物,其為樂聚公司推出的人形機(jī)器人。而樂聚是一家老牌人形機(jī)器人公司,創(chuàng)立于2016年3月,總部位于深圳。
資料顯示,“夸父”發(fā)布于2023年12月,重約45kg,全身26個自由度,行走速度最高可達(dá)4.6km/h,可快速連續(xù)跳躍,跳躍高度超20cm。其搭載自研一體化關(guān)節(jié)和深度攝像頭,可實現(xiàn)全方位視覺感知。
真正令“夸父”實現(xiàn)進(jìn)化的是人工智能。據(jù)工作人員介紹,盤古具身智能大模型令“夸父”的智能及泛化能力得以提升。
該模型具備多模態(tài)(文本、圖像、視頻)能力,使機(jī)器人能夠模擬人類常識進(jìn)行邏輯推理,能夠讓機(jī)器人完成10步以上的復(fù)雜任務(wù)規(guī)劃,并且在任務(wù)執(zhí)行中實現(xiàn)多場景泛化和多任務(wù)處理。同時,盤古大模型還能生成機(jī)器人需要的訓(xùn)練視頻,讓機(jī)器人更快地學(xué)習(xí)各種復(fù)雜場景。
張平安展望了一個未來場景:AI機(jī)器人將幫助人們處理日常家務(wù),如洗衣、做飯和掃地,從而讓人們有更多時間投身于閱讀、創(chuàng)作等更有意義的活動。
其實,人形機(jī)器人與大模型的結(jié)合是大勢所趨。今年年初,英偉達(dá)展示了多模態(tài)人形機(jī)器人通用基礎(chǔ)模型GR00T,其可作為機(jī)器人的大腦,驅(qū)動機(jī)器人理解自然語言,通過觀察人類行為來快速學(xué)習(xí)協(xié)調(diào)、靈活性和其他技能。
而OpenAI與人形機(jī)器人獨角獸公司Figure合作推出的Figure 01機(jī)器人,依托OpenAI的大模型,能僅利用獨立神經(jīng)網(wǎng)絡(luò),接收人類指令,并執(zhí)行向人類傳遞蘋果、整理垃圾、放置餐具的動作。馬斯克近期也在特斯拉2024年股東大會上表示,特斯拉的人形機(jī)器人將采用大語言模型。
“大模型+人形機(jī)器人”蔚然成風(fēng)。
盤古大模型的進(jìn)化
其實不難看出, 無論是鴻蒙NEXT系統(tǒng)還是人形機(jī)器人“夸父”,令其更為“聰明”的底座均為盤古大模型。而盤古大模型此次也迎來歷史性的進(jìn)化:從一年前的3.0版本,升級成為5.0版本。
盤古大模型5.0在全系列、多模態(tài)、強思維三個方面實現(xiàn)全新升級。
其中在全系列方面,其覆蓋了十億級到萬億級參數(shù),從手機(jī)到企業(yè)云實現(xiàn)全覆蓋。而多模態(tài)方面的升級,令盤古大模型5.0支持10K超圖像識別,能夠更好更精準(zhǔn)地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。
例如,當(dāng)被問到“《清明上河圖》中趙太丞家有多少人”,盤古大模型5.0可以在占全圖1/200的畫面中,識別出細(xì)小畫面和漢字,并得出“4個人 ”這一正確答案。
但實際上,相較于盤古大模型“炫技”而言,更具有現(xiàn)實意義的是,盤古大模型已經(jīng)開始扎根于各行各業(yè)。
在華為云的展示區(qū)內(nèi),更多的舞臺留給了盤古大模型在各大專業(yè)化產(chǎn)業(yè)領(lǐng)域的融合,例如工業(yè)制造、生物醫(yī)藥、氣象服務(wù)等。
而且,華為云在此次大會上一口氣發(fā)布了六個專業(yè)模型: 盤古鋼鐵大模型、盤古高鐵大模型、盤古具身智能大模型、盤古工業(yè)設(shè)計大模型、盤古安全大模型及盤古媒體大模型。
工作人員告訴記者,例如在高鐵行業(yè),基于盤古高鐵大模型,華為云為高鐵檢測裝上了“盤古眼 ”,幫巡檢工人減少了龐大工作量?!耙涣袆榆嚨?.2萬個故障檢測項點,本來需要4人花費2小時進(jìn)行檢查,而用盤古大模型,自動識別準(zhǔn)確率可達(dá)99%?!?/p>
模型本身只是一張“白紙”
“當(dāng)前,國內(nèi)的大模型充滿挑戰(zhàn),例如算力受限、沒有算法優(yōu)勢等。”一位與會的業(yè)內(nèi)人士對記者表示。
實際上,從GPT-3的1750億參數(shù)規(guī)模,到GPT-4非官方估計1.8萬億參數(shù),GPT-5參數(shù)量或?qū)⑼黄?0萬億,OpenAI、Google等均沿著這條路徑一路前行。
“如果參數(shù)無限向上,大模型最終是否能夠通往通用人工智能,目前沒有人能夠得到確切答案。” 他表示,從當(dāng)前現(xiàn)實情況來看,一個通用的大模型,盡管可能擁有千億級別的參數(shù),幾乎可以回答任何問題,但是在專業(yè)領(lǐng)域的表現(xiàn)可能只是普通甚至難以勝任。
再加上隨著模型規(guī)模不斷增大帶來的模型幻覺、居高不下的訓(xùn)練成本以及算力資源的稀缺等挑戰(zhàn),都成為擺在業(yè)內(nèi)的現(xiàn)實問題。
“不止國內(nèi)需要面對算力資源的稀缺問題,全球都會面對這一問題。所以,把有限的算力用好,汲取硬件資源提供的每一分能力,成為業(yè)內(nèi)首要考慮的問題,這也是突破算力瓶頸的必然之路?!币晃蝗A為云人士表示。
“模型本身只是一張‘白紙’,上面畫出什么樣的一幅‘畫’,由數(shù)據(jù)決定,需要高質(zhì)量數(shù)據(jù)?!彼缡潜硎觯皣鴥?nèi)擁有全球最全的工業(yè)門類,行業(yè)數(shù)據(jù)最全、場景最多?!?/p>
在多位受訪人士看來,大模型的發(fā)展將趨向通用化與專用化并行,企業(yè)對于大模型的需求不僅僅是實現(xiàn)通識,更需要其成為特定領(lǐng)域的“最強大腦”。面向行業(yè)解決特定問題的專屬大模型,將加速企業(yè)數(shù)據(jù)價值的釋放、提高數(shù)據(jù)和知識的利用率。
根據(jù)IDC相關(guān)調(diào)研顯示,目前有60%的企業(yè)使用大模型的公開版本,但兩年后會迅速降至17%,更多的企業(yè)會將AI應(yīng)用建立在私有、專屬模型基礎(chǔ)上。
“行業(yè)市場需要更豐富的、更多種類的行業(yè)大模型應(yīng)用到具體場景里去產(chǎn)生價值,而不只是一個大模型無限泛化能力去解決所有問題?!鄙鲜鋈A為云人士表示,“大模型只有融入企業(yè)運營、緊貼應(yīng)用場景,才能真正發(fā)揮帶動產(chǎn)業(yè)升級的作用?!?/p>
編輯:小茉
審核:許聞
版權(quán)聲明
《中國基金報》對本平臺所刊載的原創(chuàng)內(nèi)容享有著作權(quán),未經(jīng)授權(quán)禁止轉(zhuǎn)載,否則將追究法律責(zé)任。
授權(quán)轉(zhuǎn)載合作聯(lián)系人:于先生(電話:0755-82468670)
發(fā)表評論