為了不吃愛(ài)情的苦,年輕人選擇花錢(qián)買(mǎi)機器人
人類(lèi)對于人形機器人的想象一直在變。
1984年,科幻迷卡梅隆把自己的一個(gè)夢(mèng)境搬進(jìn)電影,開(kāi)創(chuàng )了《終結者》時(shí)代,施瓦辛格扮演的人形機器人鋼筋鐵骨,飛天遁地。
2009年,卡梅隆再次圓夢(mèng),在《阿凡達》中塑造了“腦機接口”的新機器人,將人類(lèi)智力注入遙控的生物身體中,下身癱瘓的前海軍戰士通過(guò)頭戴式設備,操控人造的混血機器人阿凡達。
他指出了人與機器人,在未來(lái)世界共存的另一種可能性。
時(shí)間來(lái)到2021年,特斯拉首次亮相了人形機器人“擎天柱”Optimus,2022年,雷軍在個(gè)人年度演講中拋出王炸“全尺寸仿生人形機器人CyberOne”,它具有聰明的“大腦”、發(fā)達的“小腦”、強健的“四肢”。
事實(shí)上,人型機器人除了擁有類(lèi)人的外形外觀(guān)、感覺(jué)系統、智能思維方式以外,還具備控制系統和決策能力,最終表現“行為類(lèi)人”。
在應用場(chǎng)景上,除了個(gè)人/家庭機器人(輔助吸塵、地板清潔、草坪修剪、游泳池清潔、窗戶(hù)清潔、家庭安全等)、娛樂(lè )休閑機器人(用于滿(mǎn)足情感需求、教育、陪伴等),還包括商業(yè)機器人,其應用場(chǎng)景主要包括醫療、物流、農業(yè)和其他(包括國防、公共關(guān)系等)。
簡(jiǎn)單來(lái)說(shuō),主要分為商用場(chǎng)景和個(gè)人/家庭應用場(chǎng)景兩大類(lèi)。
以其中的服務(wù)型機器人為例。
根據中國電子學(xué)會(huì )的調研,其全球市場(chǎng)規模到 2022 年底預計就將達 159.9 億美元。而在我國,由于人口老齡化趨勢的不斷發(fā)展,服務(wù)型全尺寸人型機器人在醫療和公共衛生領(lǐng)域的需求,也將持續保持旺盛的上升勢頭。
在使用場(chǎng)景足夠廣泛的背景下,人型機器人似乎已經(jīng)成為了當下資本企圖涉足的領(lǐng)域。但需要注意的是,從核心技術(shù)來(lái)看,人型機器人的“攻城略地”才剛剛開(kāi)始。
一、人型機器人成熟了嗎?
在智能領(lǐng)域,人型機器人被譽(yù)為AI的終極形態(tài)。
在早前的8月份,2022世界機器人博覽會(huì )在北京亦創(chuàng )國際會(huì )展中心舉辦,共有130余家企業(yè)帶來(lái)的500余件展品,有30余款全球首發(fā)新品在現場(chǎng)集中發(fā)布。
而這場(chǎng)博覽會(huì )主要是以應用需求端為導向,采用“機器人+應用場(chǎng)景”的展覽模式,策劃了“機器人+醫療”、“機器人+物流”、“機器人+商用”、“機器人+農業(yè)”、“機器人+建筑”、“機器人+制造”、“機器人+礦山”等專(zhuān)區,匯聚各類(lèi)場(chǎng)景下的前沿機器人產(chǎn)品。
往更具體的方向來(lái)說(shuō),人型機器人分為以高精度、穩定性為核心要素的工業(yè)機器人、以人機交互為核心的協(xié)作機器人、替代復雜重復性工作的服務(wù)機器人。
就拿Atias、Digit、Walker、Optimus四款機器人分析。
其中,Atlas采用的是液壓驅動(dòng)的控制方法,追求運動(dòng)能力上的極致,主要作為科研平臺,長(cháng)期則期望在軍事領(lǐng)域發(fā)揮作用。與Atlas不同的是,Digit以電機驅動(dòng),并將重心上移,增加機器人負重,致力于物流“最后一公里”的配送應用。
而Walker同樣是電機驅動(dòng),并結合力控,讓機器人在B端與C端的環(huán)境中均能與人安全交互。就連即將發(fā)布的Tesla Bot也將走電機驅動(dòng)的技術(shù)路線(xiàn),擁有由Dojo超級計算機進(jìn)行神經(jīng)網(wǎng)絡(luò )自動(dòng)訓練的“大腦”及人類(lèi)級別的四肢,將在2023-2025年被首先用于造車(chē)場(chǎng)景。
值得注意的是,當下各大企業(yè)研發(fā)的人型機器人,整體更偏向于“工業(yè)化”方向。從某種角度來(lái)看,勞動(dòng)力短缺的重工業(yè)領(lǐng)域,在需求量、價(jià)格等方面往往接受度更高。
但需要說(shuō)明的是,人型機器人最后能否成功被不同領(lǐng)域所接受,智能化程度以及運動(dòng)控制技術(shù)的發(fā)展具有關(guān)鍵的作用。
目前的人型機器人,在諸如生產(chǎn)機械臂裝配方面,幾乎都在使用著(zhù)傳統的位置控制。
比較典型的就是:機器人沿著(zhù)事先規劃好的軌跡在封閉、確認的空間中運動(dòng)?;蛘咴谀承r(shí)候,機器人得到從視覺(jué)系統的反饋,這樣就能使得位置控制的機器人具備一定適應外界可變環(huán)境的能力。然而通過(guò)實(shí)際規劃軌跡運動(dòng)的機器人仍然占大部分。
從長(cháng)遠的角度來(lái)看,未來(lái)的機器人運動(dòng)控制領(lǐng)域,必須引入力控,純位置控制是沒(méi)有前途的。
舉個(gè)例子,在重工業(yè)領(lǐng)域機器臂純位置控制是很難精確化的,最明顯的是在汽車(chē)外形不規則拋光、物品使用力度等制造場(chǎng)景上。
另一方面,人型機器人最終仍然需要往與人交互的層面上發(fā)展。也就是說(shuō),需要確保人型機器人在與人類(lèi)做物理交互的安全,不能僅依靠純位置控制。
不過(guò),目前國內的人型機器人大多數還處于初級階段,從功能上來(lái)看近似于一個(gè)會(huì )走路的智能音箱,象征意義比實(shí)用性大。同時(shí),運動(dòng)控制的價(jià)格占比也較高。
根據未來(lái)智庫數據顯示,在整個(gè)機器核心零部件生產(chǎn)成本方面,人形機器人中運動(dòng)控制占比接近50%,其中減速器占比22%,伺服系統占比16%,控制器占比11%。
在運動(dòng)控制技術(shù)之外,人型機器人對環(huán)境感知系統的要求同樣也極高。
目前市場(chǎng)上的機器人自由度在20-60個(gè)左右,靈活度相對而言并不算低。但人型機器人的自由度再高,沒(méi)有結合環(huán)境感知技術(shù),是很難做到在與人交互時(shí)足夠的“擬人性”。
在環(huán)境感知技術(shù)層面上,無(wú)論是定位側重于情感識別與交互的小米CyberOne,或是偏向于工業(yè)化的特斯拉Optimus,仍然有待突破。
二、到底需要怎樣的機器人?
從掃地機器人一路發(fā)展到如今的人型機器人,在同樣能夠做一定家務(wù)的前提下,人們更需要一個(gè)多元化的人型機器人,具備陪伴、聊天、導盲、看護、娛樂(lè )、教育等能力已經(jīng)成為了用戶(hù)對人型機器人的最終想象。
然而,現在的人型機器人領(lǐng)域遠不能夠達成用戶(hù)的需求。
原因在于,最終能夠起到?jīng)Q定機器人人機交互能力的,主要在于A(yíng)I算法及軟件平臺能力。
目前,除了運動(dòng)控制模塊受益于自動(dòng)駕駛、工業(yè)機器人等領(lǐng)域的成熟應用外,環(huán)境感知也同樣得益于此,于是相關(guān)硬件商用化進(jìn)程較快。
而在人機交互模塊,由于算法、算力的限制,在實(shí)際消費場(chǎng)景中,實(shí)現高效的人機智能交互還存在不小的難度。
小米CyberOne就是最好的例子。
雖然在機器視覺(jué)技術(shù)上,小米CyberOne搭載自研Mi-Sense深度視覺(jué)模組,結合AI交互算法,但小米CyberOne也僅僅是擁有簡(jiǎn)單的空間感知能力,例如人物身份識別、手勢識別、表情識別。
即便是擁有極致運動(dòng)控制性能的波士頓動(dòng)力人形機器人Atlas,在聊天、逛街等方面,也仍然無(wú)法做得到。
另外更值得注意的是,在機器人領(lǐng)域進(jìn)程中相對優(yōu)越的Atlas,在發(fā)展過(guò)程中也仍然經(jīng)歷了多次轉手,首先是被谷歌收購,到2017年又被轉手賣(mài)給日本軟銀,最后被韓國現代收入旗下。
一家美國軍方背景的公司最后硬是變成了全球跨國公司,歸根結底,還是人形機器人短期沒(méi)法商業(yè)化。
從這個(gè)層面講,現實(shí)與理想的差距是肉眼可見(jiàn)的,人形機器人和元宇宙一樣都還是“無(wú)源之水,無(wú)本之木”。
當然,僅是依靠片面的說(shuō)詞并不能證明什么,或許從人型機器人在環(huán)境感應系統的發(fā)展看會(huì )更直觀(guān)一些。
環(huán)境感知系統包括視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)。
因為要模仿人,所以感知系統,是人形機器人的一個(gè)增量環(huán)節,包含著(zhù)各類(lèi)傳感器分支,對應的如攝像頭、激光雷達、溫度傳感器、氣味傳感器、聽(tīng)覺(jué)傳感器等等。
其中,傳感器是服務(wù)機器人的重要部件。服務(wù)機器人的應用場(chǎng)景相對非標準化,要求對環(huán)境的感知能力,傳感器是其重要的部件之一。
雖然現階段傳感器的成熟度和豐富度已經(jīng)很高了,但由于傳感器所輸出的信號也在一定程度上影響著(zhù)視覺(jué)感知的識別結果。
直白一點(diǎn)說(shuō),在傳感器成熟度以外,能否實(shí)現精密操作執行將決定人形機器人應用前景。
這也就意味著(zhù),為了實(shí)現精密執行操作,機器人視覺(jué)感知技術(shù)在原來(lái)主要滿(mǎn)足避障、目標識別、路徑規劃等功能的基礎上,機器視覺(jué)模塊還要配合運動(dòng)系統實(shí)現高精度估計和機械手的伺服控制。
原因很簡(jiǎn)單,想要知道末端執行器相對于物體的三維位置,需要測量每個(gè)joint的角度利用正向運動(dòng)學(xué)來(lái)計算,在一般的應用場(chǎng)景中,這個(gè)三維的位置被認為是己知的。
由此帶來(lái)的問(wèn)題就是,機器人本身需要十分精確,這時(shí)就需要精確的傳感器將joint angle測量值反饋給控制器,我們需要很精確的正向運動(dòng)學(xué)模型,來(lái)根據傳感器提供的角度得出此時(shí)末端執行器的位置,末端執行器的目標也需要被精確的放置在已知的三維位置上,以上任何一個(gè)環(huán)節出問(wèn)題,都會(huì )導致誤差的出現。
為了得到精確的三維位置,未來(lái)多模態(tài)視覺(jué)感知或許有可能會(huì )成為滿(mǎn)足機器人視覺(jué)感知的不同需求。
但需要在任何狀態(tài)下都能夠獲取正確的正向運動(dòng)模型,機器人就需要通過(guò)巨大的樣本量來(lái)進(jìn)行深度學(xué)習,還要有海量的算力支持。
這不僅短時(shí)間內無(wú)法實(shí)現,也很難從價(jià)格上讓大量用戶(hù)所接受,產(chǎn)商盈利。
三、用戶(hù)和廠(chǎng)商之間沒(méi)有正比
根據方舟投資預計,到2025年,每臺工業(yè)機器人的成本將低于11,000美元,遠低于波士頓咨詢(xún)集團(BCG)的24,000美元左右的預期。
而該機構的分析基礎是摩爾定律更具準確性的萊特定律。即,生產(chǎn)單位數量每增加一倍,成本就會(huì )以固定百分比下降。
換個(gè)說(shuō)法也就意味著(zhù)在沒(méi)有徹底量產(chǎn)前,產(chǎn)品最終在性?xún)r(jià)比上很難形成競爭力。
即便假設隨著(zhù)人型機器人技術(shù)的不斷提升攤薄成本,2025年的價(jià)格或許如方舟投資所預料一般。但如果僅僅是以當下分析,不到10萬(wàn)元的人型機器人,還有一定的難度。
根據小米推出的CyberOne來(lái)看,研發(fā)涉及包含仿生感知認知技術(shù)、生機電融合技術(shù)、人工智能技術(shù)、大數據云計算技術(shù)、視覺(jué)導航技術(shù)等各領(lǐng)域的尖端技術(shù),成本每臺大概六七十萬(wàn)元,跟波士頓動(dòng)力一樣,成本造價(jià)高。
另一方面,雖然2020年風(fēng)險投資公司向機器人公司投入了63億美元中,但不少資金和關(guān)注都投擲在單任務(wù)機器人上,這些機器人是專(zhuān)門(mén)任務(wù)而設計的。
而單一任務(wù)機器人也可能效率低下,短時(shí)間內迫使企業(yè)不得不面臨著(zhù)提高效率和節省成本的巨大壓力,而且經(jīng)濟的未來(lái)又陷入了供應鏈挑戰和供需失衡等不確定性中,這些單一機器人構成的障礙,可能會(huì )多于其解決的問(wèn)題。
誠然,這也就說(shuō)明,一組可以做很多事情并靈活適應需求和工作流程的機器人,往往比單一用途機器人更有前途。
此外,相對于中小企業(yè)來(lái)說(shuō),機器人的成本仍然較高,中小企業(yè)規?;褂萌匀惠^為困難。
可以做一個(gè)簡(jiǎn)單的預測,人型機器人第一批投入使用更多會(huì )偏向于無(wú)聊、單一的工業(yè)。
因為以目前智能家居讓人處于被動(dòng)服務(wù)狀態(tài)來(lái)看,能夠完成感知用戶(hù)的狀態(tài),識別用戶(hù)的意圖,學(xué)習用戶(hù)的習慣,通過(guò)IOT技術(shù)獲取環(huán)境以及設備的信息,提供主動(dòng)服務(wù)的機器人時(shí)代還遠未到來(lái)。