具身智能機(jī)器人概念股周五表現(xiàn)強(qiáng)勢(shì),為智能機(jī)器人提供精密減速器的龍頭企業(yè)豐立智能連續(xù)兩個(gè)交易日收盤錄得20cm漲停。
消息面上,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在ITF World 2023半導(dǎo)體大會(huì)上發(fā)表演講,下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能。同日,在特斯拉5月股東大會(huì)上,CEO馬斯克表示,人形機(jī)器人會(huì)是今后特斯拉主要的長(zhǎng)期價(jià)值來源。其推測(cè),人形機(jī)器人Optimus需求將達(dá)100億臺(tái),遠(yuǎn)遠(yuǎn)超過汽車需求,可能是百億美元級(jí)別的。從最終用途來看,特斯拉人形機(jī)器人和具身智能機(jī)器人幾乎可以劃等號(hào)。
值得一提的是,政策端也已開始著眼于具身人工智能?!侗本┦写龠M(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見稿)》日前發(fā)布,提出推動(dòng)具身智能系統(tǒng)研究及應(yīng)用,突破機(jī)器人在開放環(huán)境、泛化場(chǎng)景、連續(xù)任務(wù)等復(fù)雜條件下的感知、認(rèn)知、決策技術(shù)。
太平洋證券崔文娟等人5月14日研報(bào)認(rèn)為,雖然當(dāng)前人形機(jī)器人的智能AI系統(tǒng)還不夠成熟,但當(dāng)前ChatGPT的出現(xiàn)已展現(xiàn)了生成式AI具備較強(qiáng)理解和生成對(duì)話能力,結(jié)合OpenAI投資人形機(jī)器人賽道,以及特斯拉等巨頭的入局,看好未來人形機(jī)器人更快商業(yè)化落地。
國盛證券宋嘉吉等人在5月19日研報(bào)中表示,具身智能憑借物理反饋、物理輸出的特性,將是繼AIGC之后的又一個(gè)現(xiàn)象級(jí)AI應(yīng)用。
據(jù)了解,具身智能指的是智能體通過與環(huán)境產(chǎn)生交互后,通過自身的學(xué)習(xí),產(chǎn)生對(duì)于客觀世界的理解和改造能力。一個(gè)具身智能機(jī)器人需要,首先聽懂人類語言,之后分解任務(wù)、規(guī)劃子任務(wù),移動(dòng)中識(shí)別物體,與環(huán)境交互,最終完成相應(yīng)任務(wù)。
浙商證券王華君等人5月18日研報(bào)介紹,具身智能是多個(gè)學(xué)科交叉互助的產(chǎn)物,表現(xiàn)為:機(jī)器人學(xué)為具身智能供機(jī)械身體和基本運(yùn)動(dòng)控制;深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)是具身智能中主要工具;強(qiáng)化學(xué)習(xí)是具身智能機(jī)器人的主要學(xué)習(xí)手段之一;機(jī)器視覺給具身智能提供了處理視覺信號(hào)的能力;計(jì)算機(jī)圖形學(xué)開發(fā)的物理仿真環(huán)境為具身智能提供了真實(shí)物理世界的替代;自然語言給具身智能帶來了與人類交流、從自然文本中學(xué)習(xí)的可能;認(rèn)知科學(xué)進(jìn)一步幫助具身智能體理解人類、構(gòu)建認(rèn)知和價(jià)值。
市場(chǎng)規(guī)模來看,王華君等人表示,人形機(jī)器人市場(chǎng)空間巨大,中性預(yù)計(jì)2021-2030年全球市場(chǎng)規(guī)模CAGR約71%。
產(chǎn)業(yè)鏈方面,平安證券認(rèn)為“零部件先行”,上游核心零部件環(huán)節(jié)是人形機(jī)器人產(chǎn)業(yè)落地的重要保障,有望率先受益于人形機(jī)器人行業(yè)發(fā)展。目前來看,機(jī)械行業(yè)中,伺服系統(tǒng)和減速器環(huán)節(jié)受益于人形機(jī)器人賽道的確定性較強(qiáng)。
事實(shí)上,按照“具身AI”的定義,美國的科技巨頭早已開始布局。例如特斯拉推出的人形機(jī)器人Optimus、波士頓動(dòng)力的Atlas和Spot就具備接近具身智能的能力,它們可以通過機(jī)器人的身軀來模擬人類或動(dòng)物的行為和動(dòng)作,更加逼真地與人類進(jìn)行互動(dòng)。算法側(cè),特斯拉的Dojo AI超級(jí)計(jì)算機(jī)項(xiàng)目用于加速訓(xùn)練和推理具身智能模型。
值得一提的是,進(jìn)入AIGC時(shí)代,GPT等大模型的出現(xiàn)助力提升人形機(jī)器人感知能力,加速產(chǎn)業(yè)化。黃仁勛于會(huì)議上同步介紹了英偉達(dá)的多模態(tài)具身智能系統(tǒng)Nvidia VIMA,其能在視覺文本提示的指導(dǎo)下,執(zhí)行復(fù)雜任務(wù)、獲取概念、理解邊界、甚至模擬物理學(xué)。
此外,谷歌、微軟帶頭,均試圖以大模型為機(jī)器人注入靈魂。微軟團(tuán)隊(duì)在最近的一項(xiàng)研究中探索如何將OpenA研發(fā)的ChatGPT擴(kuò)展到機(jī)器人領(lǐng)域,從而讓人類用語言直觀控制如機(jī)械臂、無人機(jī)、家庭輔助機(jī)器人等多個(gè)平臺(tái)。研究人員展示了多個(gè)ChatGPT解決機(jī)器人難題的示例,以及在操作、空中和導(dǎo)航領(lǐng)域的復(fù)雜機(jī)器人部署。
谷歌聯(lián)合柏林工業(yè)大學(xué)團(tuán)隊(duì)3月8日發(fā)布PaLM-E,其是一種多模態(tài)具身視覺語言模型,也是史上最大的“通才”AI模型,其不僅可以理解圖像,還能理解、生成語言,可執(zhí)行各種復(fù)雜的機(jī)器人指令而無需重新訓(xùn)練,且表現(xiàn)出很好的遷移能力。
崔文娟等人表示,具身智能迎來PALM-E時(shí)代,有望提升機(jī)器人智能化水平。鑒于PaLM-E所表現(xiàn)出來的應(yīng)用前景,未來相關(guān)技術(shù)有望在諸如工業(yè)機(jī)器人、家庭自動(dòng)化等更多場(chǎng)景落地。
上市公司方面,崔文娟等人推薦減速器中大力德等;工業(yè)機(jī)器人拓斯達(dá)等;服務(wù)機(jī)器人科沃斯、石頭科技、九號(hào)公司等。
據(jù)財(cái)聯(lián)社不完全統(tǒng)計(jì),涉及具身智能機(jī)器人的A股上市公司包括億嘉和、埃斯頓、機(jī)器人、新時(shí)達(dá)、匯川技術(shù)、凌云光、綠的諧波、雙環(huán)傳動(dòng)、天準(zhǔn)科技和豐立智能等,具體情況如下:
值得注意的是,清華大學(xué)國強(qiáng)教授、智能產(chǎn)業(yè)研究院首席研究員聶再清表示,由于具身AI在與人類互動(dòng)和操作的過程中需要收集大量的來自現(xiàn)實(shí)世界中的數(shù)據(jù),用于模型訓(xùn)練和改進(jìn),因此從保護(hù)數(shù)據(jù)隱私安全的角度來看,無疑是提出了更大的挑戰(zhàn)。