智東西(公眾號(hào):zhidxcom)
作者 | 香草 云鵬
編輯 | 心緣
打麻將、拆快遞、紐扣穿針,還能做30KG重物提拉!
沉寂一年,稚暉君帶著他的二代機(jī)器人全家桶重磅回歸,秀出的各種新技能令人眼前一亮。
智東西8月18日?qǐng)?bào)道,今日,“野生鋼鐵俠”稚暉君一連亮出5款智元人形機(jī)器人,全程整活兒,前有機(jī)器人開(kāi)瓶蓋、倒可樂(lè)、搬重物,后有機(jī)器人上場(chǎng)主持、穿針、搓麻將、推銷賣車,最后還有老父親稚暉君陪伴“夾子手機(jī)器娃”蹣跚學(xué)步的感人成長(zhǎng)Vlog,并甩出“0元購(gòu)”終極大招。
智元不僅首次定義具身智能的五級(jí)技術(shù)演進(jìn)路線圖,而且公布了最新商業(yè)化進(jìn)展:團(tuán)隊(duì)面向量產(chǎn)做了大量的正向設(shè)計(jì)分析、系統(tǒng)方案重構(gòu)、核心部件自研;遠(yuǎn)征系列產(chǎn)品規(guī)模量產(chǎn)正在進(jìn)行,接收到來(lái)自制造業(yè)、交互服務(wù)行業(yè)等不同客戶的大量訂單,整個(gè)團(tuán)隊(duì)都在加班加點(diǎn)準(zhǔn)備批量交付。
稚暉君還秀了一波大格局,化身“賽博源神”,從數(shù)據(jù)集、設(shè)計(jì)圖紙、軟件框架、中間件源碼到運(yùn)控算法,通通開(kāi)源,要讓人人可造人形機(jī)器人。
智元機(jī)器人此次發(fā)布了“遠(yuǎn)征”與“靈犀”兩個(gè)系列,共5款商用機(jī)器人新品,包括遠(yuǎn)征A2、遠(yuǎn)征A2-W、遠(yuǎn)征A2-Max、靈犀X1以及靈犀X1-W。
發(fā)布會(huì)一開(kāi)場(chǎng),稚暉君直接和遠(yuǎn)征A2機(jī)器人家族的幾位成員演了一出“人機(jī)小品”。
遠(yuǎn)征A2系列秀出不少新技能,比如遠(yuǎn)征A2-W機(jī)器人用開(kāi)瓶器開(kāi)可樂(lè)瓶、操作榨汁機(jī)做出一杯“葡汽可樂(lè)”、精準(zhǔn)將榨汁機(jī)中的飲料倒入杯中。
“大力士”遠(yuǎn)征A2-Max則原地抱起80多斤的重物。整體來(lái)看,機(jī)器人的肢體動(dòng)作流暢靈巧,相比去年8月首次出場(chǎng)時(shí),顯然嫻熟了許多,但動(dòng)作屬實(shí)有點(diǎn)太過(guò)緩慢,光是做飲料就花了整整3分鐘。
演完小品后,稚暉君轉(zhuǎn)身走入發(fā)布會(huì)現(xiàn)場(chǎng),一臺(tái)遠(yuǎn)征A2機(jī)器人直接登臺(tái)當(dāng)主持人,介紹了遠(yuǎn)征A2系列機(jī)器人家族。
遠(yuǎn)征A2系列包括遠(yuǎn)征A2、遠(yuǎn)征A2-W和遠(yuǎn)征A2-Max三款機(jī)器人,分別針對(duì)交互服務(wù)、柔性制造和重載特種場(chǎng)景,內(nèi)嵌大語(yǔ)言模型,可實(shí)現(xiàn)超擬人音色語(yǔ)音對(duì)話,各種技能都可以持續(xù)學(xué)習(xí)。
▲遠(yuǎn)征A2語(yǔ)音交互現(xiàn)場(chǎng)演示
作為今天發(fā)布會(huì)的“One More Thing”,稚暉君亮出自家的首款模塊化機(jī)器人靈犀X1,它個(gè)頭不大,可以看作是“青春版”機(jī)器人,在成本方面有大幅優(yōu)化。
稚暉君帶領(lǐng)不到10人的團(tuán)隊(duì),在不到3個(gè)月的時(shí)間里,就把靈犀X1從概念做成了整機(jī)。靈犀X1從組裝完成到今天,還不到兩周的時(shí)間,因此是“還沒(méi)滿月就出來(lái)干活了”。
值得一提的是,靈犀X1有個(gè)“機(jī)機(jī)模式”,手機(jī)可以直接放到機(jī)器人里,做機(jī)器人的“大腦”,這個(gè)“腦洞”確實(shí)夠大。
靈犀X1的屏幕可以定制畫面,比如顯示稚暉君自己的臉,頗有一種機(jī)器人帶上了Vision Pro的既視感。
為了避免“價(jià)格戰(zhàn)”,稚暉君直接給靈犀X1定價(jià)為“0元”,全面開(kāi)源。
在應(yīng)用場(chǎng)景方面,遠(yuǎn)征A2可以在4S店內(nèi)作銷售導(dǎo)購(gòu),多語(yǔ)言交流,了解用戶需求,例如聽(tīng)到顧客想喝水就去拿水,路上可以自動(dòng)避障;在工廠里,遠(yuǎn)征A2基本可以完成質(zhì)檢上料、貨架擺放貨物等工作。
一、全身40+主動(dòng)自由度,靈巧手19自由度,四大子域核心系統(tǒng)
人形機(jī)器人遠(yuǎn)征A2全身采用外骨骼設(shè)計(jì),身高體重都與成年人類相仿,可續(xù)航超2小時(shí),行走速度每秒1米。
在外形方面,遠(yuǎn)征A2比上一代遠(yuǎn)征A1更像人了,腦袋更圓、四肢比例更協(xié)調(diào),腿部形態(tài)從A1的反屈膝設(shè)計(jì)變?yōu)榱苏ァ?/P>
遠(yuǎn)征A2-W由一個(gè)人形上半身和背后的機(jī)械身體組成,主要用于工業(yè)制造領(lǐng)域,其主動(dòng)自由度22個(gè),續(xù)航超過(guò)5小時(shí),每秒可行走1.5米以上。雙臂寫作、多模態(tài)感知、持久作業(yè)等是遠(yuǎn)征A2-W針對(duì)制造場(chǎng)景進(jìn)行的針對(duì)性優(yōu)化。
遠(yuǎn)征A2-Max最大的特點(diǎn)就是力大無(wú)窮,其主動(dòng)自由度達(dá)到53個(gè),雙臂可稱重80斤以上。
遠(yuǎn)征A2系列產(chǎn)品的工業(yè)設(shè)計(jì)采用了家族化ID語(yǔ)言,有助于實(shí)現(xiàn)量產(chǎn)以及獨(dú)特的視覺(jué)識(shí)別特征。
在核心零部件上,遠(yuǎn)征A2系列借鑒新能源汽車的系統(tǒng),將機(jī)器人的核心系統(tǒng)劃分為動(dòng)力域、感知域、通信域、控制域四個(gè)子域。
在動(dòng)力域方面,遠(yuǎn)征A2的關(guān)節(jié)模組在上一代的基礎(chǔ)上面向量產(chǎn)做了大量的優(yōu)化和測(cè)試,其中部分關(guān)節(jié)電機(jī)的峰值扭矩可以達(dá)到512 Nm。
視觸覺(jué)靈巧手也全面升級(jí),擁有19個(gè)自由度,其中12個(gè)為主動(dòng)關(guān)節(jié)。
基于靈活的手部關(guān)節(jié)和視覺(jué)、觸覺(jué)感知,靈巧手現(xiàn)在可以輕松擰螺絲、拆快遞。
通用的物品抓取更是不在話下,還能雙手配合倒水。
紐扣穿針這樣的精細(xì)活,靈巧手也能輕松實(shí)現(xiàn)。
遠(yuǎn)征A2擁有7自由度雙臂,單臂自由度達(dá)到3+2+2+N,臂展60厘米。雙臂內(nèi)置六維力傳感器,可以配合實(shí)現(xiàn)更復(fù)雜的操作。
感知域方面,遠(yuǎn)征A2增加了激光雷達(dá)、全景相機(jī)等傳感器,可實(shí)現(xiàn)全域安全、局部避障。基于自研的系統(tǒng)算法,機(jī)器人對(duì)環(huán)境的理解也大幅提升。
通信域方面,智元團(tuán)隊(duì)自研了一套輕量化、高性能的智能機(jī)器人通信框架AimRT,可以完全不依賴第三方中間件。
值得一提的是,這一框架將在下個(gè)月底全面開(kāi)源。
控制域方面,遠(yuǎn)征A2在去年Model base的基礎(chǔ)上增加了數(shù)據(jù)驅(qū)動(dòng)的Learning base,使用兩種方式共同驅(qū)動(dòng)機(jī)器人的行為優(yōu)化,行走起來(lái)更穩(wěn)定自然。
在運(yùn)動(dòng)算法層面,智元構(gòu)建了一套由自然語(yǔ)言指令集驅(qū)動(dòng),可以適配不同機(jī)器人硬件的AgentOS。
基于機(jī)器人本體,AgentOS定義了技能庫(kù),通過(guò)多模態(tài)大模型去定義機(jī)器人的狀態(tài),再由任務(wù)執(zhí)行器來(lái)驅(qū)動(dòng)各種原子技能去進(jìn)行任務(wù)操作,然后再進(jìn)行反饋來(lái)獲取這信號(hào)。
AgentOS目前還在預(yù)研初期,不過(guò)從開(kāi)頭的自制飲料等演示來(lái)看,它已經(jīng)實(shí)現(xiàn)了比較好的任務(wù)編排效果。
遠(yuǎn)征A2的整體框架參考強(qiáng)化學(xué)習(xí)來(lái)構(gòu)建,整個(gè)機(jī)器人是一個(gè)軟硬件非常復(fù)雜的系統(tǒng),既涉及到內(nèi)部各個(gè)硬件模塊的協(xié)同和部署,也需要軟件跟算法做高效的配合
智元構(gòu)建了開(kāi)放軟硬件平臺(tái)AIMA,將遠(yuǎn)征A2的復(fù)雜系統(tǒng)的二次開(kāi)發(fā)能力,開(kāi)放給外部更多的開(kāi)發(fā)者,共同去構(gòu)建整個(gè)生態(tài)。
二、交互服務(wù)、柔性制造領(lǐng)域落地,自研數(shù)據(jù)采集全流程開(kāi)源
稚暉君首次公布了智元機(jī)器人的具身智能技術(shù)演進(jìn)路線圖,從G1到G5分別對(duì)應(yīng)基礎(chǔ)自動(dòng)化、通用原子技能、端到端操作技能、端到端操作大模型以及最終的AGI,類似自動(dòng)駕駛領(lǐng)域的L1、L2、L3分級(jí)。
去年一年,智元機(jī)器人在G2、G3階段并行研發(fā),其中基于G2的原子能力已經(jīng)實(shí)現(xiàn)實(shí)際場(chǎng)景的落地應(yīng)用。
例如在交互服務(wù)場(chǎng)景中,遠(yuǎn)征A2可以針對(duì)客戶進(jìn)行精準(zhǔn)營(yíng)銷。在汽車4S店內(nèi),它可以作為導(dǎo)購(gòu)為客戶提供服務(wù)。基于記憶能力,遠(yuǎn)征A2能夠知道顧客上次看中的是哪款車,并主動(dòng)推薦體驗(yàn)。
基于多模態(tài)大模型,遠(yuǎn)征A2能對(duì)不同意圖指令精準(zhǔn)識(shí)別。比如當(dāng)小朋友說(shuō)口渴了,遠(yuǎn)征A2會(huì)主動(dòng)詢問(wèn)需要什么飲品,并取回來(lái)交給她。
在行進(jìn)的路上,遠(yuǎn)征A2還能智能避障,躲開(kāi)碰到的人或物品。
基于語(yǔ)言動(dòng)作大模型,遠(yuǎn)征A2可以端到端生成自然動(dòng)作,比如說(shuō)“1萬(wàn)現(xiàn)金優(yōu)惠”時(shí),它非常自然地比了個(gè)1的手勢(shì)。
雖然從人形機(jī)器人演進(jìn)的角度來(lái)看,遠(yuǎn)征A2已經(jīng)實(shí)現(xiàn)了很大的進(jìn)步,但僅憑其現(xiàn)在慢吞吞的說(shuō)話和做事效率,離替代人類銷售還差得遠(yuǎn)。
在柔性制造場(chǎng)景中,遠(yuǎn)征A2-W可以基于多模態(tài)感知、雙臂協(xié)作、原子模塊化等能力,實(shí)現(xiàn)工件投料、上下料、質(zhì)檢、搬運(yùn)等,還能在不同工序間自動(dòng)轉(zhuǎn)場(chǎng)。
智元具身智能數(shù)據(jù)系統(tǒng)AIDEA是稚暉君放出的另一個(gè)關(guān)鍵大招,包括仿真平臺(tái)、機(jī)器學(xué)習(xí)平臺(tái)、功能部署平臺(tái)、數(shù)據(jù)平臺(tái),可以說(shuō)是智元機(jī)器人從實(shí)驗(yàn)室到工廠再到量產(chǎn)商用的關(guān)鍵基礎(chǔ)。
具身領(lǐng)域有一個(gè)很大的痛點(diǎn),就是真實(shí)場(chǎng)景數(shù)據(jù)稀缺。它不像大語(yǔ)言模型有海量的互聯(lián)網(wǎng)免費(fèi)數(shù)據(jù),也不像自動(dòng)駕駛每天有上百萬(wàn)汽車在路上采集到的真實(shí)數(shù)據(jù)。
為了解決這一痛點(diǎn),智元自研了具身智能數(shù)據(jù)系統(tǒng)AIDEA,形成了一套全流程穩(wěn)定可靠的數(shù)據(jù)采集方案。
AIDEA將在今年Q4全面開(kāi)源百萬(wàn)條真機(jī)、千萬(wàn)條仿真數(shù)據(jù)集,此外,今年下半年智元將會(huì)落地百臺(tái)以上機(jī)器人專門用于數(shù)據(jù)采集。
三、首個(gè)模塊化機(jī)器人靈犀X1亮相,團(tuán)隊(duì)不到10人,2個(gè)月從概念到整機(jī)
在發(fā)布會(huì)臨近尾聲的時(shí)候,稚暉君還帶來(lái)了一個(gè)One more thing:智元機(jī)器人首個(gè)模塊化機(jī)器人靈犀X1,就藏在發(fā)布會(huì)開(kāi)頭遠(yuǎn)征A2-Max舉起的箱子里。
靈犀X1由智元X-Lab打造,這是智元于6月新成立的一個(gè)實(shí)驗(yàn)室,也叫“稚暉君實(shí)驗(yàn)室”,專門做一些前沿技術(shù)創(chuàng)新類研究。這臺(tái)靈犀X1,是由不到10個(gè)人,在兩個(gè)多月的時(shí)間內(nèi)從無(wú)到有自研得到的。
靈犀X1身高133厘米,體重不到66斤,十分小巧。其手臂使用串并聯(lián)混合結(jié)構(gòu),整臂重量只有2kg,這使得它可以支持更靈活的運(yùn)動(dòng)、更高效的控制。
靈犀X1還創(chuàng)新推出“機(jī)機(jī)模式”,也就是機(jī)器人+手機(jī),把手機(jī)放到機(jī)器人的“頭”里來(lái)做大腦,讓手機(jī)本身的麥克風(fēng)、揚(yáng)聲器、屏幕等硬件,以及網(wǎng)絡(luò)、AI算力等軟件能力,為機(jī)器人帶來(lái)新的突破。
通過(guò)在遠(yuǎn)征系列上積累的各種研發(fā)經(jīng)驗(yàn),靈犀X1上也自研了兩款全新的關(guān)節(jié),其全身30多個(gè)自由度,均由這兩款關(guān)節(jié)提供支持,做到了極致的標(biāo)準(zhǔn)化。
靈犀X1也推出了用于數(shù)據(jù)采集的機(jī)器人靈犀X1-W,相比遠(yuǎn)征A2-W成本更低。
就像稚暉君本人一樣,智元機(jī)器人可謂是將開(kāi)源貫徹到底。靈犀X1的本體設(shè)計(jì)圖紙、軟件框架、中間件源碼,以及基礎(chǔ)運(yùn)控算法都將全面開(kāi)源。
四、沉寂一年,華為天才少年“悶聲干大事”
自智元機(jī)器人首款人形機(jī)器人遠(yuǎn)征A1發(fā)布,剛好過(guò)去一整年的時(shí)間。如果說(shuō)遠(yuǎn)征A1是從零到一的突破,那么這次發(fā)布的遠(yuǎn)征A2,則是在從1到100的AGI之路上,邁出的重要一步。
智元機(jī)器人成立于去年2月,致力于研發(fā)具身智能機(jī)器人產(chǎn)品及應(yīng)用生態(tài)。帶著創(chuàng)始人之一稚暉君的光環(huán),智元機(jī)器人從誕生之初就備受科技圈關(guān)注。
稚暉君本名彭志輝,本碩均畢業(yè)于電子科技大學(xué),畢業(yè)后曾在OPPO研究院AI實(shí)驗(yàn)室擔(dān)任算法工程師,隨后在2020年加入“華為天才少年計(jì)劃”,從事昇騰AI芯片和AI算法相關(guān)研究工作。
那一年的華為天才少年,總共有6名。
▲稚暉君華為天才少年簽約紀(jì)念
稚暉君的另一個(gè)身份,是科技圈知名up主,因在B站發(fā)布的一系列硬核科技產(chǎn)品視頻而聞名。
視頻中的他軟硬件“通吃”,從寫代碼、畫電路圖,到建模、裝配全部DIY,獨(dú)立制作了給葡萄縫針的鋼鐵俠機(jī)械臂、“能夠自己行走”不摔跤的自行車、模塊化機(jī)械鍵盤等有趣的項(xiàng)目。
▲稚暉軍B站主頁(yè)
2022年12月,稚暉君宣布已從華為離職創(chuàng)業(yè),次年2月就正式成立了智元機(jī)器人(上海智元新創(chuàng)技術(shù)有限公司),作為聯(lián)合創(chuàng)始人之一擔(dān)任CTO和首席架構(gòu)師。
智元機(jī)器人也備受資本青睞,目前已完成A3輪融資,投資方包括比亞迪、BV百度風(fēng)投、紅杉中國(guó)、高瓴創(chuàng)投等知名企業(yè)或機(jī)構(gòu),估值也早在去年就超過(guò)10億美元,晉升獨(dú)角獸。
結(jié)語(yǔ):人形機(jī)器人明星獨(dú)角獸重磅“回歸”
就在上周,美國(guó)人形機(jī)器人創(chuàng)企Figure剛剛發(fā)布第二代機(jī)器人Figure 02,要做“地表最強(qiáng)人形機(jī)器人”。Figure 02第四代手部擁有16個(gè)自由度,比特斯拉的擎天柱二代多了5個(gè),而遠(yuǎn)征A2則更勝一籌達(dá)到19個(gè)。
在自媒體時(shí)代,稚暉君就時(shí)常“悶聲干大事”,半年做一個(gè)項(xiàng)目驚艷全場(chǎng)。在過(guò)去一年中,智元機(jī)器人一直比較低調(diào),此次時(shí)隔一年再辦發(fā)布會(huì),稚暉君果然沒(méi)讓大家失望,不僅甩出超強(qiáng)遠(yuǎn)征A2全家桶,還帶來(lái)了靈犀X1這一驚喜新品。光是現(xiàn)場(chǎng)演示,就已經(jīng)打敗了一大半同類產(chǎn)品。
在生態(tài)方面,智元看起來(lái)是要走和稚暉君本人同樣的開(kāi)源路線,讓更多開(kāi)發(fā)者參與進(jìn)來(lái),共同為遠(yuǎn)征A2、靈犀X1的迭代添磚加瓦。
發(fā)表評(píng)論
2024-08-19 10:30:12
2024-08-19 10:30:12
2024-08-19 10:30:12
2024-08-19 10:30:12
2024-08-19 10:30:12