文圖掃描如何實現(xiàn)“所得”超越“所見”,解決陰影、臟污、印刷和手寫文字混雜所帶來的困擾?人形雙足機(jī)器人在人工智能大會上將帶來哪些驚喜?
2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)將于7月4日在滬開幕。日前,澎湃新聞(www.thepaper.cn)記者提前對相關(guān)亮點展品進(jìn)行了探訪。
一鍵去除干擾因素,讓掃描“所得超所見”
數(shù)字化時代,掃描工具正變得越來越智能和個性化。無論工作中還是在旅途里,人們經(jīng)常會使用手機(jī)掃描褶皺、臟污的文件。
手機(jī)掃描效果的優(yōu)劣,與文檔本身的清晰度、拍攝環(huán)境與硬件等因素密切相關(guān),也受到諸如手部遮擋、陰影、拍攝角度引起的畸變等因素的影響。在實際中,文檔本身存在的透字、頁面模糊、清晰度不足等“不可抗力”也會影響掃描的效果,比如塵封已久的資料、褶皺的文檔、熱敏紙上逐漸褪色的文字,即使用戶反復(fù)調(diào)整拍攝角度和濾鏡,也無法獲得清晰的掃描效果。
本屆世界人工智能大會上,合合信息將展示掃描全能王最新升級的智能高清濾鏡2.0版本功能,該功能可智能研判圖像問題,一鍵去除十余種干擾因素,顯著提升文檔畫面清晰度。
一張礦物寶石分類圖,拍攝掃描后寶石名稱可以橫平豎直的文檔順序顯示。澎湃新聞記者 俞凱 圖
據(jù)掃描全能王事業(yè)部產(chǎn)品總監(jiān)許昌華介紹,掃描全能王智能高清濾鏡2.0版本升級了圖像增強(qiáng)能力和圖像清晰度,實現(xiàn)了多方向文字提取,用戶只需點擊拍攝按鈕,便可自動生成一張如原稿般清晰平整的圖片。
比如拍攝掃描一張礦物寶石分類圖,圖上呈圓形放射狀排列的寶石名稱可以輕而易舉地以橫平豎直的文檔順序顯示在手機(jī)屏幕上,方便閱讀、修改和存儲;拍攝一張存在透字和手指“闖鏡”的筆記或者作業(yè)時,智能濾鏡可以很聰明地只保留本頁上的文字內(nèi)容,智能去除透字和手指影像。如果一張名校的考卷已經(jīng)被人做了答題和紅筆批改,借助生成式AI技術(shù),拍攝掃描后可以馬上得到一張高清晰度的空白考卷,不用再費力費時地重新謄抄,達(dá)到事半功倍的效果。
已經(jīng)被人做了答題和紅筆批改的考卷,拍攝掃描后可以得到一張高清晰度的空白考卷。澎湃新聞記者 俞凱 圖
這款人形機(jī)器人可以烤面包片、熨燙衣服
具身智能有哪些應(yīng)用場景和前沿成果?在本屆世界人工智能大會上,特斯拉、達(dá)闥將首發(fā)首展最新一代人形機(jī)器人。
據(jù)介紹,達(dá)闥機(jī)器人研制的最新人形雙足機(jī)器人XR4(又名“七仙女”小紫)將在本次大會首秀。這款身高165厘米、體重75公斤、采用碳纖維復(fù)合材料打造的全尺寸雙足機(jī)器人,采用自研智能柔性執(zhí)行器SCA和獨創(chuàng)的串并聯(lián)混合結(jié)構(gòu),融通信、計算、傳感于一體,最大峰值輸出力矩800NM。這款手眼足協(xié)同具身智能人形機(jī)器人采用直腿擬人行走步態(tài),行走速度0.5米/秒。
人形雙足機(jī)器人XR4“七仙女”小紫。受訪者供圖
值得一提的是,“七仙女”小紫擁有超過60個智能柔性關(guān)節(jié),手臂可承載10公斤重物,通過模仿學(xué)習(xí)和基于數(shù)字孿生的強(qiáng)化學(xué)習(xí),展現(xiàn)出卓越的穩(wěn)定性。借助14組力觸感知單元,小紫擁有感知、認(rèn)知、推理、決策能力,手部尺寸操作靈活,可以輕松拿起雞蛋和纖薄的撲克牌,也可以雙手協(xié)作完成烤面包片和裝盤、熨燙衣服等精細(xì)活,并且能通過自認(rèn)語言的方式聽懂人類的指令并完成具體任務(wù),在工業(yè)制造、家庭養(yǎng)老和商業(yè)服務(wù)等多個領(lǐng)域大有可為。
達(dá)闥方面透露,小紫機(jī)器人將會在本次世界人工智能大會上與觀眾見面互動,并進(jìn)行限量預(yù)售。
小紫機(jī)器人手部尺寸操作靈活,可以輕松拿起雞蛋和纖薄的撲克牌。受訪者供圖
小紫機(jī)器人也可以雙手協(xié)作完成烤面包片和裝盤、熨燙衣服等精細(xì)活?。受訪者供圖
達(dá)闥的另一款人形機(jī)器人Cloud Ginger也將在本次大會首次展示其在機(jī)場廁所清潔方面的新應(yīng)用。憑借圖像識別和深度學(xué)習(xí)技術(shù),這款機(jī)器人能夠精準(zhǔn)識別污漬、自主規(guī)劃清潔路徑,實現(xiàn)高效細(xì)致清潔。
本次大會上,特斯拉首發(fā)的人形機(jī)器人擎天柱二代(Optimus)采用視覺感知方案和神經(jīng)網(wǎng)絡(luò)技術(shù),以完成路徑規(guī)劃、物體識別等核心功能,相較一代擁有更大自由度,甚至可以用它來完成煮雞蛋等精細(xì)活。
屆時,參觀者還將能看到傅利葉展出的商業(yè)化量產(chǎn)GR-1人形機(jī)器人、星動紀(jì)元針對制造業(yè)及服務(wù)業(yè)等商用場景推出的全尺寸人形機(jī)器人XBot-L、自重僅48kg的鈦虎輕量化人形機(jī)器人T170A,以及能廣泛適用于科研教育、醫(yī)療物流、特種場景、家庭服務(wù)等行業(yè)領(lǐng)域的樂聚KUAVO開源鴻蒙人形機(jī)器人。
發(fā)表評論