近日,北卡羅來納州立大學與北卡羅來納大學教堂山分校的蘇浩教授團隊在國際頂級學術期刊 Nature 上發(fā)表了一篇關于機器人和人工智能算法相結合服務人類的突破性研究論文,標題為“Experiment-free Exoskeleton Assistance via Learning in Simulation”。
該論文展示了一種在計算機仿真環(huán)境中通過強化學習來讓機器人學習控制策略的新方法。通過這種“計算機仿真中的機器學習”(learning-in-simulation),研究展示了這種方法可以讓機器人具備智能性,特別是能適合各種人的泛化能力,不僅可以自主適應走路、跑步、爬樓梯等多種動作,還能幫助在行走中節(jié)省大量的人體能量。
這項研究標志著外骨骼技術的重大突破,使機器人更加智能和實用,有望極大地提高老年人,行動障礙人士和殘疾人的生活質量。
創(chuàng)新人工智能“仿真中學習”框架,實現(xiàn)外骨骼的智能性和通用性
外骨骼是一種穿戴式機器人,通過提供外部動力來輔助人體運動,增強力量和穩(wěn)定性。它可以改善人類的運動,恢復殘疾人的行動能力,顯著提高人們的健康和生活質量。
該論文的通訊作者、北卡羅納州立大學&北卡羅納大學教堂山分校教授蘇浩表示:“我們的理念是科學技術要以人為本,為人服務,解決現(xiàn)實中的問題?,F(xiàn)有的外骨骼控制算法通常需要長達幾個小時的人體實驗和調參,這一過程耗時耗力,這阻礙了外骨骼的廣泛應用。這一創(chuàng)新的人工智能框架突破了仿真與現(xiàn)實之間的鴻溝。通過純計算機仿真,也就是數(shù)字孿生的方法,這種基于模型和數(shù)據(jù)驅動的強化學習算法,使外骨骼為步行、跑步、爬樓梯多種動作提供有效助力,減少人體能量消耗,相當于減少 11.9 公斤體重。”
為了探索這個技術的可行性,該論文的第一作者羅淑貞博士(曾是蘇浩教授博士后,現(xiàn)為安柏瑞德大學助理教授)進行了長達 4 年的研究,她介紹說:“我們首先通過創(chuàng)建高保真的肌肉骨骼模型,并設計三個深度神經網絡的閉環(huán)仿真訓練方法。此方法集成了人類模型(包括運動模仿網絡和肌肉協(xié)調網絡)以及外骨骼控制器(神經網絡的控制策略),實現(xiàn)通過交換狀態(tài)信息來精準模擬人機互動過程。通過這種“計算機仿真中的機器學習”(learning-in-simulation)的方法,訓練后的控制器可實時生成適應不同運動模式的助力,無需任何人體實驗或調試。”
蘇浩教授團隊將仿真學習得到的控制器在三種活動(步行、跑步和爬樓梯)上進行了實驗,每種活動均包含 8 位健康受試者。實驗結果顯示,該控制器產生的助力曲線能夠根據(jù)不同的活動類型自主進行調整,無需進行任何人工干預。例如,隨著行進速度的逐漸加快,控制器產生的助力大小也會隨之增加,并且曲線形狀也會發(fā)生變化以適應不同活動的助力需求。實現(xiàn)這一能力的關鍵在于控制器完全依賴于戴在受試者大腿上的慣性測量單元傳感器提供的大腿運動學信息作為輸入,并且控制器通過上百萬輪的仿真訓練掌握了通過輸入的運動學信號直接輸出合適的助力的能力。“我們的控制器能夠端到端地生成合適的助力,現(xiàn)有方法大多都需要很多額外的中間步驟,而這會帶來繁瑣的人工調節(jié)參數(shù)的過程,并且也會對控制器的泛化能力產生影響”,蘇浩教授表示。同時,由于不同受試者的行動方式各有差異,即使是針對同一個速度的活動,控制器也會給不同受試者產生略有不同的助力曲線。“我們工作的一大亮點是控制器產生的助力在不同人身上是不一樣的,它會自主調節(jié),而不是給一個固定形狀的助力?!?/span>
進一步的實驗結果顯示,使用該控制器后,在行走時將受試者的平均新陳代謝速率降低了 24.3%,在跑步時降低了 13.1%,在爬樓梯時降低了 15.4%。這些降幅超過了以往研究中任何一款使用便攜式下肢外骨骼所取得能量降幅,以上結果表明通過仿真學習得到的外骨骼控制器確實對人的不同活動提供了極大的幫助。
圖|通過仿真學習對外骨骼助力進行免實驗優(yōu)化
該研究的核心在于利用仿真學習來彌合電腦仿真與現(xiàn)實應用之間的鴻溝。研究團隊通過數(shù)百萬輪的仿真訓練,使控制器能夠在不同的活動中生成有效的助力。這種方法不僅提高了開發(fā)效率,還減少了對昂貴且耗時的人體實驗的依賴,為外骨骼的快速開發(fā)與廣泛應用提供了可行路徑。
張賽男博士(曾是蘇教授博士生,現(xiàn)為其博士后,作者之一)表示:“這是一種具身智能的研究,我們的算法是基于我們自己研發(fā)的外骨骼,是最輕的動力型可穿戴機器人。該研究的一大亮點在于外骨骼設備能夠實現(xiàn)多動作的連續(xù)支持。在實驗中,佩戴外骨骼設備的受試者可以無縫銜接多種動作。例如,用戶從慢走逐漸加速到跑步,然后再迅速轉變?yōu)榕罉翘荩麄€過程外骨骼設備都能夠提供穩(wěn)定而有效的輔助。通過由強化學習得到的控制策略,外骨骼能夠實時調整助力大小和時機,確保每一個動作都得到合適的助力?!边@種支持對連續(xù)動作提供助力的能力顯著提高了外骨骼設備的實用性和用戶體驗,展示了外骨骼技術在多樣化運動中的潛力。
這項研究成果在外骨骼技術的發(fā)展過程中具有重要的里程碑意義。外骨骼設備不僅可以顯著提高普通人的運動表現(xiàn),也能幫助殘疾人恢復行動能力。羅淑貞博士、蘇浩教授及新澤西理工學院周先連教授和全美最大的康復研究中心之一 Kessler Foundation 岳光輝教授合作,研究利用仿真學習來控制康復機器人。周先連教授表示:“我認為仿真學習在康復機器人控制上具有非常好的應用前景。需要進行運動康復的患者病情各異,因而需要不同的輔助需求。我們的仿真學習技術具有很好的自適應性,同時也有可能進一步實現(xiàn)定制化的輔助控制。” 研究團隊相信,通過進一步優(yōu)化和推廣這一仿真學習框架,可穿戴機器人未來將在醫(yī)療、工業(yè)和日常生活中發(fā)揮更加廣泛的作用。
該研究的作者包括蘇浩、羅淑貞、姜夢涵、張賽男、朱君璽、于雙悅、Israel Dominguez、王天、周先連教授,密歇根大學 Elliott Rouse 教授、加州大學洛杉磯分校 Bolei Zhou 教授、韓國科學技術高等研究院 Hyunwoo Yuk 博士。
相關論文信息:https://doi.org/10.1038/s41586-024-07382-4
蘇浩教授實驗室正在招聘 mechatronics、electronics、control 和 reinforcement learning 方向的博士生和博士后,歡迎email聯(lián)系[email protected]申請。
蘇浩教授實驗室主頁:https://haosu-robotics.github.io/
發(fā)表評論
2024-06-18 01:04:17
2024-06-18 01:04:17
2024-06-18 01:04:17
2024-06-18 01:04:17
2024-06-18 01:04:17