界面新聞?dòng)浾?| 周姝祺
具身智能行業(yè)可能是當(dāng)下最熱門的投資賽道。據(jù)界面新聞統(tǒng)計(jì),從7月7日至7月9日,三天時(shí)間里共有六家具身智能初創(chuàng)公司披露完成了新一輪融資。截至7月10日,2025年具身智能融資事件超過120起,涉及資金規(guī)模約173億元,均已超過2024年全年數(shù)據(jù)。
曾在今年3月創(chuàng)下中國具身智能行業(yè)天使輪最大融資額紀(jì)錄的它石智航,再度拿下一筆1.22億美元的天使+輪投資。這家企業(yè)核心成員來自華為和百度,創(chuàng)始人陳亦倫過去被視為華為智能輔助駕駛研發(fā)團(tuán)隊(duì)的靈魂人物。
星動(dòng)紀(jì)元、深庭紀(jì)智能科技、云深處科技、小雨制造和星海圖等五家具身機(jī)器人初創(chuàng)企業(yè)也均完成不同規(guī)模的融資。參與此輪布局的,不乏美團(tuán)、滴滴、百度、IDG資本、均山資本、亦莊國投、國新基金等各類知名投資機(jī)構(gòu)。
擁有高瓴創(chuàng)投、紅杉中國和上汽創(chuàng)投等多家資方加持的智元機(jī)器人,還有望成為在科創(chuàng)板上市的首家具身智能企業(yè)。上市公司上緯新材公告稱,智元機(jī)器人將至少收購其63.62%的股份,與其管理團(tuán)隊(duì)共同控股。不過,智元機(jī)器人隨后否認(rèn)了此舉意在借殼上市。
具身智能的通俗理解是,機(jī)器人能夠在物理世界自主地感知環(huán)境,做出決策并執(zhí)行動(dòng)作。人形機(jī)器人是行業(yè)典型代表之一,也是各家企業(yè)追逐的研發(fā)方向。宇樹科技人形機(jī)器人在今年央視蛇年春晚表演的舞蹈,將這一概念從實(shí)驗(yàn)室走向了大眾視野。
風(fēng)險(xiǎn)投資人被人形機(jī)器人極具想象力的未來打動(dòng),他們將其視同于10年前自動(dòng)駕駛的風(fēng)口,正處于技術(shù)躍遷的關(guān)鍵節(jié)點(diǎn),是人工智能與物理世界結(jié)合的終極形態(tài)載體。瑞銀證券發(fā)布報(bào)告稱,2035年全球人形機(jī)器人數(shù)量將超過200萬臺(tái),到2050年超過3億臺(tái),潛在市場(chǎng)空間高達(dá)1.4至1.7萬億美元。
有志于搶占未來人機(jī)交互核心入口的汽車公司同樣不愿錯(cuò)過這一賽道。人形機(jī)器人與智能電動(dòng)汽車技術(shù)同源,做決策的“大腦”可復(fù)用智能輔助駕駛系統(tǒng)的大模型能力。與此同時(shí),汽車制造與機(jī)器人生產(chǎn)的供應(yīng)鏈重疊度較高,汽車公司能夠降低人形機(jī)器人成本和加速規(guī)模量產(chǎn)。
界面新聞注意到,比亞迪、長(zhǎng)安、廣汽、奇瑞、小鵬、蔚來、理想以及小米等超過10家汽車公司已涉足具身智能領(lǐng)域。今年上海車展上,部分企業(yè)還開始用人形機(jī)器人當(dāng)車模,吸引消費(fèi)者看車和強(qiáng)化品牌科技智能形象。
一位要求匿名的汽車企業(yè)高管向界面新聞透露,2026至2028年將是人形機(jī)器人產(chǎn)業(yè)變革速度最快的三年,且2026年的發(fā)展進(jìn)度或與2014年中國新能源汽車行業(yè)元年的水平相當(dāng)。并且,人形機(jī)器人在相同發(fā)展階段的進(jìn)步速度還可能快于新能源汽車行業(yè)。
但他同時(shí)指出,大多數(shù)從業(yè)者低估了人形機(jī)器人的復(fù)雜性和量產(chǎn)難度。它屬于軟硬件強(qiáng)耦合系統(tǒng),一個(gè)軟件功能的變動(dòng)將牽扯到看似或與其無關(guān)的硬件大調(diào)整?,F(xiàn)在售賣的人形機(jī)器人多只提供情緒價(jià)值,而真正具備人工智能能力的人形機(jī)器人最快還要一年的時(shí)間才會(huì)出現(xiàn)。
“人形機(jī)器人跳過了集成研發(fā)(供應(yīng)商拼裝)和全棧研發(fā)(單項(xiàng)功能自研)兩大階段,直接進(jìn)入全域研發(fā)的階段,要求企業(yè)具備軟硬件協(xié)同能力。”這位參與機(jī)器人研發(fā)生產(chǎn)的高管說,只做生成式大模型的初創(chuàng)公司,或者不具備人工智能開發(fā)能力的汽車制造商,可能都很難成功。
瑞銀證券用“電動(dòng)汽車時(shí)刻”定義為電動(dòng)汽車技術(shù)瓶頸得到解決,且銷量在5年內(nèi)從100萬臺(tái)增長(zhǎng)至1000萬臺(tái)的時(shí)刻。由于軟硬件技術(shù)、制造成本、商業(yè)應(yīng)用場(chǎng)景以及法律監(jiān)管等多重障礙,該投資銀行認(rèn)為,人形機(jī)器人的“電動(dòng)汽車時(shí)刻”可能要到2030年之后才會(huì)出現(xiàn)。
“人形機(jī)器人最大的技術(shù)制約瓶頸是智能化的‘大腦’?!比疸y證券中國機(jī)械行業(yè)分析師王斐麗接受界面新聞等媒體采訪表示,“目前沒有看到成熟的用于大腦訓(xùn)練的人工智能通用大模型,另外訓(xùn)練模型的數(shù)據(jù)集也較為受限?!?/p>
參照自動(dòng)駕駛等級(jí)分類標(biāo)準(zhǔn)(L0-L5),瑞銀證券報(bào)告指出,當(dāng)前人形機(jī)器人的智能化水平還停留在L0-L1的初級(jí)階段,執(zhí)行大多數(shù)任務(wù)依賴人工操作或預(yù)編程。
特斯拉是人形機(jī)器人領(lǐng)域進(jìn)展最受矚目的公司之一,其自研的人形機(jī)器人Optimus在去年10月“We Robot”發(fā)布會(huì)上,展示了倒酒,回答問題和石頭剪刀布等復(fù)雜交互能力。但后被證實(shí),這些動(dòng)作多由工程師遠(yuǎn)程幕后控制完成。
一位人形機(jī)器人研發(fā)工程師向界面新聞指出,比如“讓機(jī)器人到廚房取個(gè)勺子”這句簡(jiǎn)單指令,就能難倒大部分公司。它要人形機(jī)器人聽到這句話,成功判斷意圖,知道廚房位置,準(zhǔn)確找到勺子,穩(wěn)定行走,抬手并抓住勺子,涉及多模態(tài)感知融合、空間建圖與導(dǎo)航、全身運(yùn)動(dòng)控制等多技術(shù)模塊。
不過,隨著VLM(視覺語言模型)、VLA(視覺語言動(dòng)作模型)等端到端大模型技術(shù)的演進(jìn),人形機(jī)器人得以將感知、決策、執(zhí)行集成至統(tǒng)一框架,開始朝著L2階段發(fā)展,即能在標(biāo)準(zhǔn)場(chǎng)景中部分自主地完成單個(gè)任務(wù)。
人形機(jī)器人初創(chuàng)公司千尋智能的首席科學(xué)家高陽認(rèn)為,VLA模型先從視覺和語言中抽取信息,再將兩者融合,最后與動(dòng)作模塊進(jìn)行進(jìn)一步整合。這樣的設(shè)計(jì)有兩個(gè)顯著優(yōu)勢(shì):一是信息以數(shù)學(xué)語言的形式傳遞,更加高效和精確;二是具備良好的預(yù)訓(xùn)練能力,便于大規(guī)模數(shù)據(jù)學(xué)習(xí)與遷移。
目前VLA模型還處在極早期的技術(shù)驗(yàn)證階段,尚未有企業(yè)能讓機(jī)器人具備足夠的泛化性完成大量通用任務(wù),并且還做到足夠穩(wěn)定。一位自動(dòng)駕駛研發(fā)人員向界面新聞指出,VLA模型上限高,下限也很低,它需要大量高質(zhì)量的數(shù)據(jù)訓(xùn)練才能發(fā)揮模型效用。
界面新聞了解到,具身智能行業(yè)的數(shù)據(jù)來源主要包括真機(jī)數(shù)據(jù)、仿真數(shù)據(jù)以及互聯(lián)網(wǎng)數(shù)據(jù)。其中,真機(jī)數(shù)據(jù)是通過遙控或輔助機(jī)器人進(jìn)行任務(wù)操作而采集到的數(shù)據(jù),也被稱為“遙操”數(shù)據(jù),采集成本高,但訓(xùn)練價(jià)值大;而仿真數(shù)據(jù)依賴算法生成,規(guī)模大卻容易出現(xiàn)幻覺。
上述汽車企業(yè)高管告訴界面新聞,參考智能輔助駕駛系統(tǒng)工程落地的實(shí)踐經(jīng)驗(yàn),現(xiàn)階段其人形機(jī)器人的訓(xùn)練數(shù)據(jù)主要依靠真機(jī)數(shù)據(jù),小部分采用仿真數(shù)據(jù)。在他看來,真機(jī)數(shù)據(jù)最大價(jià)值是將物理世界發(fā)生頻率極低但產(chǎn)生較大影響的長(zhǎng)尾場(chǎng)景集合起來訓(xùn)練,能極大提升模型的安全性和技術(shù)能力。
王斐麗則向界面新聞等媒體表示,自動(dòng)駕駛領(lǐng)域發(fā)展時(shí)間早,搜集數(shù)據(jù)時(shí)間長(zhǎng),其訓(xùn)練數(shù)據(jù)規(guī)模可能已經(jīng)出現(xiàn)冗余,但人形機(jī)器人訓(xùn)練數(shù)據(jù)集的廣度、寬度都非常有限,“所有可利用的數(shù)據(jù)都很重要,沒有主次之分?!?/p>
人形機(jī)器人不光大腦要好,身體也要足夠靈活,這其中最重要的零部件是執(zhí)行器。它相當(dāng)于人形機(jī)器人的“肌肉”,直接決定了機(jī)器人能不能運(yùn)動(dòng),怎么運(yùn)動(dòng),持續(xù)時(shí)間多久以及運(yùn)動(dòng)多么類人。
執(zhí)行器的組成包括電機(jī)(驅(qū)動(dòng)裝置)、減速器(傳動(dòng)裝置)、編碼器(傳感裝置)、控制板和控制軟件(控制裝置)等。在接收到“大腦”傳遞的動(dòng)作指令后,執(zhí)行器里的電機(jī)開始運(yùn)轉(zhuǎn),經(jīng)減速器把速度放慢,增大扭矩,以此帶動(dòng)軸承開始運(yùn)動(dòng)。編碼器和力矩傳感器分別監(jiān)測(cè)動(dòng)了多少度和用了多大力氣,將運(yùn)動(dòng)反饋轉(zhuǎn)變?yōu)殡娦盘?hào)再傳遞至大腦,進(jìn)行隨時(shí)調(diào)整。
早期人形機(jī)器人公司使用響應(yīng)快、易調(diào)試的旋轉(zhuǎn)式執(zhí)行器方案,能快速實(shí)現(xiàn)簡(jiǎn)單行走。但是,該方案功耗高,也沒有辦法讓機(jī)器人負(fù)重干活,直到特斯拉Optimus推出行星滾柱絲杠方案,提高了推力和能效,才帶動(dòng)行業(yè)向混合式執(zhí)行器發(fā)展演變。
人形機(jī)器人初創(chuàng)公司開普勒已經(jīng)切換為行星滾柱絲杠方案,然而過程并不容易。 CEO胡德波提到,國內(nèi)供應(yīng)鏈沒有行星滾柱絲杠的制造基礎(chǔ),工業(yè)級(jí)部件難以直接用于人形機(jī)器人;并且,將行星滾柱絲杠、電機(jī)、編碼器、傳感器等復(fù)雜機(jī)電系統(tǒng)集成,做出穩(wěn)定可靠的解決方案,也是全新嘗試。
想要機(jī)器人穩(wěn)定執(zhí)行更加精細(xì)化的動(dòng)作,還需要一雙精準(zhǔn)的靈巧手和穩(wěn)健的仿生腳,這依靠先進(jìn)的傳感器技術(shù)研發(fā),即使是特斯拉,也還沒有得出滿意的設(shè)計(jì)方案。
從商業(yè)化落地角度看,人形機(jī)器人則面臨高企的制造成本與尚未明確的客戶群體兩大挑戰(zhàn)。以特斯拉最新一代Optimus為例,科技媒體晚點(diǎn)報(bào)道稱,其造價(jià)約為6萬美元,實(shí)際成本可能要更高。
依據(jù)瑞銀證券估算,人形機(jī)器人執(zhí)行器中的絲杠和力矩傳感器是兩個(gè)最大的成本項(xiàng)目,分別占總物料成本的14%和27%;其次是減速器和電機(jī),均占總物料成本的8%。半導(dǎo)體芯片由于產(chǎn)業(yè)較為成熟,僅約占1%至2%,但也需要約1400美元。
一位業(yè)內(nèi)人士向界面新聞指出,當(dāng)前人形機(jī)器人的供應(yīng)鏈還不完備,部分零部件還需要企業(yè)自主研發(fā)生產(chǎn)。前期量產(chǎn)規(guī)模的不足,導(dǎo)致單位成本高企,無法產(chǎn)生經(jīng)濟(jì)效益,同時(shí)品質(zhì)還不夠穩(wěn)定?!昂芏喙救诵螜C(jī)器人都是靠手搓,而不是工業(yè)化流水線量產(chǎn)。”
部分機(jī)構(gòu)投資人對(duì)人形機(jī)器人的商業(yè)前景已經(jīng)失去耐心。金沙江創(chuàng)投即已從星海圖和松延動(dòng)力兩家具身智能公司退出,其管理合伙人朱嘯虎認(rèn)為,人形機(jī)器人當(dāng)前最主要的市場(chǎng)需求是做研究以及前臺(tái)展示,并不能夠?yàn)榭蛻魟?chuàng)造可持續(xù)的價(jià)值。
“現(xiàn)在人形機(jī)器人就會(huì)翻跟頭,但商業(yè)化在哪里?我問這幾個(gè)CEO,感覺他們都是自己想象出來的客戶,誰會(huì)花十幾萬買一個(gè)機(jī)器人去干這些活?”
一位具身智能初創(chuàng)公司的員工向界面新聞表示對(duì)朱嘯虎觀點(diǎn)的認(rèn)同?!拔覀兊娜诵螜C(jī)器人連翻跟頭都還不會(huì),也沒找到清晰的應(yīng)用場(chǎng)景,甚至現(xiàn)階段行業(yè)對(duì)是否開發(fā)人形也都有爭(zhēng)議?!?/p>
瑞銀證券認(rèn)為,人形機(jī)器人或?qū)⒙氏葟挠虚L(zhǎng)期自動(dòng)化經(jīng)驗(yàn)且盈利能力相對(duì)較高的制造業(yè)開始,包括汽車、電氣設(shè)備、電信設(shè)備、食品飲料以及化工和纖維行業(yè),隨后憑借人形機(jī)器人均價(jià)下降和規(guī)模效應(yīng),逐步進(jìn)入到服務(wù)業(yè),最終進(jìn)入家庭。
今年已有多家人形機(jī)器人公司拿下汽車廠訂單。優(yōu)必選與東風(fēng)柳汽、一汽大眾、比亞迪等十余家企業(yè)達(dá)成合作,獲得了車廠超500臺(tái)訂單;樂聚機(jī)器人向北汽越野車交付了第100臺(tái)全尺寸人形機(jī)器人;智元機(jī)器人、智平方、傅里葉等公司同樣和汽車廠達(dá)成合作。
“在汽車組裝的物體搬運(yùn)場(chǎng)景,尤其是“最后10米”任務(wù),是人形機(jī)器人的切入口?!蓖蹯雏惛嬖V界面新聞,“一方面該工作場(chǎng)景里還沒有實(shí)現(xiàn)完全自動(dòng)化,需要依賴勞動(dòng)力;另一方面,這個(gè)場(chǎng)景比較簡(jiǎn)單,對(duì)工廠效率影響較小,符合人形機(jī)器人目前的功能邊界?!?/p>
在相當(dāng)長(zhǎng)一段時(shí)間里,人形機(jī)器人或都仍將處于高商業(yè)估值區(qū)間,為眾多初創(chuàng)企業(yè)帶來熱錢和技術(shù)突破的機(jī)遇。但當(dāng)潮水退去,唯有率先向消費(fèi)者提供可負(fù)擔(dān)的產(chǎn)品,并持續(xù)創(chuàng)造不可替代價(jià)值的玩家,才能經(jīng)受住商業(yè)檢驗(yàn),成長(zhǎng)為人形機(jī)器人資本泡沫里,真正跑出來的大公司。