當(dāng)?shù)貢r(shí)間24日,特斯拉機(jī)器人官方賬號(hào)Tesla Optimus更新了“具身智能首秀”。
在介紹中,特斯拉稱,人形機(jī)器人Optimus(擎天柱)已可以自主對物品分類,其神經(jīng)網(wǎng)絡(luò)訓(xùn)練是“完全端到端的”——即可實(shí)現(xiàn)視頻信號(hào)輸入,控制信號(hào)輸出。
在視頻中,特斯拉機(jī)器人展示了視覺自標(biāo)定、顏色分揀任務(wù)、單腳保持平衡等能力,在感知、大腦、運(yùn)動(dòng)與控制方面具備多項(xiàng)亮點(diǎn):
在感知方面,通過視覺感知及關(guān)節(jié)位置編碼器,Optimus便可自動(dòng)校準(zhǔn)四肢,并精準(zhǔn)定位四肢的空間位置。
在大腦方面,憑借純視覺技術(shù)及完全本地部署的神經(jīng)網(wǎng)絡(luò),其可以迅速適應(yīng)環(huán)境并完成多項(xiàng)任務(wù)。
其將藍(lán)色與綠色積木分別分揀到對應(yīng)顏色的托盤之中,即便在抓取積木過程中,有人在一旁將積木打亂,Optimus也可以立即調(diào)整并適應(yīng)新環(huán)境,繼續(xù)分揀積木。與此同時(shí),其還可以將翻倒的積木擺正,并執(zhí)行“打亂分類好的積木”等新任務(wù)。
在運(yùn)動(dòng)控制能力方面,Optimus可以精準(zhǔn)抓取物品,在做出動(dòng)作時(shí),該機(jī)器人的四肢、軀干、手指動(dòng)作都極為靈活,且與人類接近。此外,Optimus還做出多個(gè)單腿支撐的運(yùn)動(dòng)拉伸動(dòng)作,并能在拉伸的同時(shí)保持軀干平衡。
值得注意的是,特斯拉端到端模型輸入端為視頻信號(hào),即圖像及音頻信號(hào)的混合輸入,但此次展示顯示,其識(shí)別部分神經(jīng)網(wǎng)絡(luò)算法僅使用視覺信息。
中信證券認(rèn)為,特斯拉V12自動(dòng)駕駛的算法體系同時(shí)應(yīng)用于人形機(jī)器人及汽車是可行的,且有利于加速提升識(shí)別算法的泛化能力。隨著特斯拉展示了機(jī)器人端到端技術(shù)路線可能性,該方案與其FSD的運(yùn)行模式類似,F(xiàn)SD以及Dojo的成功經(jīng)驗(yàn)有望加速機(jī)器人迭代速度,由單一任務(wù)向多任務(wù)拓展。
分環(huán)節(jié)來看,(1)在輸入端,分析師指出,本次特斯拉展現(xiàn)的圖像識(shí)別,2D及3D相機(jī)都可實(shí)現(xiàn),選配核心為成本控制因素,國內(nèi)視覺鏡頭及相機(jī)等核心零部件廠商已具備此類產(chǎn)品生產(chǎn)能力,產(chǎn)品配套方案及產(chǎn)品性價(jià)比值得關(guān)注。