“能給我一些吃的嗎?”工作人員向Figure 02問(wèn)道。
“當(dāng)然?!保?Figure 02將蘋(píng)果遞給了工作人員)
“你能解釋一下剛剛的行為嗎?”工作人員繼續(xù)提問(wèn)。
“我給了你蘋(píng)果,因?yàn)樘O(píng)果是桌面上唯一可以食用的?!盕igure 02邊回答邊收拾桌面上的垃圾。
如此智能又貼心,這就是今天“硅谷新貴”Figure AI公司發(fā)布的新一代人形機(jī)器人Figure 02。
畫(huà)面中展示的就是Figure 02引以為傲的語(yǔ)音到語(yǔ)音推理功能。
全面升級(jí)的Figure 02搭載了麥克風(fēng)和揚(yáng)聲器,借助OpenAI的力量,實(shí)現(xiàn)了語(yǔ)音對(duì)話(huà)和推理。
在創(chuàng)始人Brett Adcock發(fā)布的技術(shù)文章中,介紹了Figure 02是如何將ChatGPT變成一個(gè)機(jī)器人的過(guò)程:
用戶(hù)輸入語(yǔ)音,F(xiàn)igure 02將語(yǔ)音轉(zhuǎn)化為文本信息,同時(shí)新增的6個(gè)RGB攝像頭讓機(jī)器人擁有超人視覺(jué),能夠接收?qǐng)D像信息。兩種信息交予ChatGPT處理。
AI處理后的信息以語(yǔ)音的形式反饋給用戶(hù),并且指導(dǎo)機(jī)器人作出響應(yīng)行動(dòng)。
Figure 02語(yǔ)音到語(yǔ)音的推理過(guò)程
光能反饋還不行,具體執(zhí)行的時(shí)候,還需要與視覺(jué)模型配合。否則就會(huì)出現(xiàn)機(jī)器人炒菜把鍋里的菜全灑在地上的翻車(chē)場(chǎng)面。Figure 02沒(méi)少在這上面下功夫。
Adcock介紹,Figure 02內(nèi)設(shè)視覺(jué)語(yǔ)言模型(VLM),搭配6個(gè)攝像頭工作,機(jī)器人能夠進(jìn)行語(yǔ)義基礎(chǔ)和快速常識(shí)性的視覺(jué)推理。
這個(gè)功能在與寶馬的合作中,體現(xiàn)得淋漓盡致。
在今年1月,F(xiàn)igure AI宣布和BMW Manufacturing Co., LLC 簽署商業(yè)協(xié)議,在汽車(chē)中部署通用機(jī)器人參與制造流程。在Figure 02的宣傳片中,也花了不少篇幅展現(xiàn)Figure 02在寶馬工廠中如何利用視覺(jué)語(yǔ)言模型進(jìn)行配件組裝類(lèi)的精細(xì)工作。
并且,與上一代相比,AI推理能力提高了3倍。在宣傳片中,F(xiàn)igure 02看到?jīng)]有安好的配件還會(huì)再補(bǔ)上一下。
Figure 02宣傳片截圖
除了這些,大家最關(guān)心的莫過(guò)于機(jī)器人「手」的改進(jìn)。
我們的雙手可以輕易地從數(shù)字1比到數(shù)字10。但如此簡(jiǎn)單的手勢(shì)對(duì)于機(jī)器人來(lái)說(shuō),難于登天。在放出預(yù)告片時(shí),大家的注意力就被第四代手吸引了。
這次Figure 02的第四代手配備了16個(gè)自由度。
「16」這個(gè)數(shù)字的意思是5根手指,每根手指上有3個(gè)關(guān)節(jié),一共15個(gè)關(guān)節(jié),再加上1個(gè)手腕關(guān)節(jié),一共16個(gè)關(guān)節(jié)都是可以自由活動(dòng)的。這個(gè)技術(shù)距離人類(lèi)22個(gè)自由度的手部又近了一大步。
并且,F(xiàn)igure 02的手部還配備了與人類(lèi)相當(dāng)?shù)牧α浚梢猿兄?5公斤,更加適用于實(shí)用場(chǎng)景。有網(wǎng)友放出01和02之間的對(duì)比,有了自由度的提升,手部的動(dòng)作看上去精細(xì)不少。
手部特寫(xiě)(左側(cè)為Figure 01,右側(cè)Figure 02)
還有一些其它的更新,例如電池的容量比上一代提升了50%,現(xiàn)在Figure 02每天能完成20小時(shí)的工作。
布線(xiàn)也重新設(shè)計(jì)了,用于電源和計(jì)算的集成布線(xiàn)現(xiàn)在使用的是隱秘式電線(xiàn),具有更緊密的包裝和更高的可靠性。
重新設(shè)計(jì)了機(jī)體的外骨骼結(jié)構(gòu),平衡了結(jié)構(gòu)的剛度和防止碰撞載荷。當(dāng)然,這些改變也使Figure 02的重量達(dá)到70公斤,比01重了10公斤。
“地表最強(qiáng)”機(jī)器人?
Figure 02剛發(fā)布3小時(shí),就吸引來(lái)了50萬(wàn)網(wǎng)友的圍觀。
許多網(wǎng)友表示驚嘆:“不敢想象未來(lái)20年會(huì)發(fā)生什么!”“2024年絕對(duì)的機(jī)器人年!”
英偉達(dá)高級(jí)科學(xué)家、具身智能負(fù)責(zé)人Jim Fan也第一時(shí)間送上稱(chēng)贊,表示:“第四代手的自由度的改進(jìn)絕對(duì)是一個(gè)正確的選擇”。
和Jim Fan一樣,不少網(wǎng)友驚嘆于手部動(dòng)作的絲滑。
其實(shí),第四代手的誕生是來(lái)源于創(chuàng)始人Adcock的堅(jiān)持。
“我們選擇做人形機(jī)器人是因?yàn)槟壳暗氖澜缡菄@人類(lèi)活動(dòng)建造的,所有的一切標(biāo)準(zhǔn)都適配人類(lèi)的生理?xiàng)l件?!盇dcock曾在訪(fǎng)談中解釋為何自己堅(jiān)持要做好人形的機(jī)器人。
只有一切向「人」靠攏,才能更好地服務(wù)人,幫人省去不必要的勞動(dòng)。
他和大多數(shù)網(wǎng)友的思路一樣——“AI的作用不是寫(xiě)詩(shī)、畫(huà)畫(huà),而是替我去刷碗、洗衣服,讓我有時(shí)間去寫(xiě)詩(shī)、畫(huà)畫(huà)”。
從決定好AI的思路到如今成為行業(yè)佼佼者, Adcock只用了2年。
這家AI公司是在2022年才創(chuàng)立的。如此迅猛的發(fā)展是依賴(lài)于Adcock的遠(yuǎn)見(jiàn)。
在替Figure AI集得近7億資金之前,他還創(chuàng)辦過(guò)軟件公司和飛行器公司,前者的出售為Adcock贏來(lái)了“第一桶金”。后者也已經(jīng)成功上市。
AI時(shí)代到來(lái),Adcock像許多人一樣,決定“All in AI”。但不同的是,有前兩次成功的創(chuàng)業(yè)經(jīng)驗(yàn),創(chuàng)辦Figure AI的過(guò)程順利地像開(kāi)了金手指。
作為當(dāng)之無(wú)愧的“硅谷新貴”,F(xiàn)igure AI的背后是貝索斯(亞馬遜創(chuàng)始人)、OpenAI、英偉達(dá)等巨頭們的聯(lián)合投資,當(dāng)前Figure AI的估值也高達(dá)26億美元(人民幣約186億元)。
Figure AI也不負(fù)眾望,旗下產(chǎn)品Figure01是世界上第一個(gè)具有商業(yè)可行性的自主人形機(jī)器人。
歷時(shí)18個(gè)月后,F(xiàn)igure 02于今天正式發(fā)布。官方稱(chēng)之為“世界最先進(jìn)的AI硬件”。
不過(guò),有鮮花的地方,也一定會(huì)有質(zhì)疑。
有網(wǎng)友發(fā)出競(jìng)爭(zhēng)對(duì)手特斯拉的Optimus演示視頻,表示這些改進(jìn)的東西,特斯拉7個(gè)月前就在做了,F(xiàn)igure 02是如何成了“最先進(jìn)的”?
“宿敵”O(jiān)ptimus
其實(shí),作為科技界兩個(gè)最受關(guān)注的具身智能項(xiàng)目,F(xiàn)igure AI與特斯拉Optimus的爭(zhēng)議一直貫穿始終。
早在一年前,F(xiàn)igure01發(fā)布預(yù)告時(shí),就有網(wǎng)友開(kāi)玩笑說(shuō):“特斯拉的機(jī)器人叫擎天柱(Optimus),那你的應(yīng)該叫威震天。”
在這次Figure 02發(fā)布時(shí),也有網(wǎng)友看熱鬧地表示:“已經(jīng)迫不及待想看Figure 02大戰(zhàn)Optimus Gen 2啦!”
并且,在Adcock自己的團(tuán)隊(duì)里就有不少特斯拉出來(lái)的員工。
Adcock沒(méi)有專(zhuān)門(mén)去回復(fù)那條質(zhì)疑的評(píng)論,他似乎也從來(lái)不在乎和Optimus的競(jìng)爭(zhēng)。
雖然Optimus背后有特斯拉這顆“大樹(shù)”,既有廣泛的數(shù)據(jù)供給訓(xùn)練,又有豐厚的研究資金,但Figure AI本身也算得上是“不愁衣食”。
不僅手握大把資金,在商業(yè)化合作上,F(xiàn)igure AI也是“未來(lái)可期”。和寶馬的合作目前處于第一階段,F(xiàn)igure機(jī)器人將會(huì)應(yīng)用在汽車(chē)生產(chǎn)的初始階段。第一階段完成后,寶馬還會(huì)與其進(jìn)行深度合作,共同探索人工智能、機(jī)器人控制、制造虛擬化和機(jī)器人集成等先進(jìn)技術(shù)主題。
Optimus目前也已經(jīng)在特斯拉工廠落地使用。兩位具身智能的領(lǐng)先玩家都在自己的道路上狂奔。
至于誰(shuí)才是“世界最先進(jìn)的AI硬件”,這個(gè)問(wèn)題不必糾結(jié)。名稱(chēng)不會(huì)消失,但會(huì)轉(zhuǎn)移。在快速發(fā)展的AI行業(yè)中,下一位技術(shù)的領(lǐng)先者或許已經(jīng)在等待登場(chǎng)了。
發(fā)表評(píng)論