爱看影院,天美传媒97a∨,天堂av,国产精品免费大片

這些大專生,教出人形機器人
2025-03-28 22:30

這些大專生,教出人形機器人

本文來自微信公眾號:鹽財經,作者:朱秋雨、賴丁萌,編輯:向由,題圖來源:視覺中國

文章摘要
中國機器人行業興起“數據采集員”新崗位,大專學歷者通過穿戴動捕設備模擬人類動作,為訓練人形機器人提供真實數據。行業依賴高質量數據解決上肢操作、泛化能力等技術瓶頸,企業推動數據開源共建生態,但數據采集高成本與通用性難題仍待突破。

## 亮點

? ??新興職業崛起:大專生擔任機器人“教練”,通過重復動作生成訓練數據,推動具身智能發展。

? ??數據成行業“石油”:真實動作數據成技術突破關鍵,采集成本高且標注精度要求嚴苛。

? ??上肢訓練難題:機器人上肢操作比下肢平衡更難,需人類手把手教學提升精細動作能力。

? ??產業生態共建:企業開源數據集推動行業協作,解決數據短缺與算法優化瓶頸。

? ??技術路徑爭議:依賴強化學習還是真實數據尚未定論,通用性目標仍存不確定性。

? ??人力密集型模式:數據采集依賴重復人工操作,成本高昂但被視為“智能進化”必經之路。

中國人形機器人賽道最近“好消息”不斷。


前有深圳的眾擎機器人完成全球首例前空翻,后有杭州宇樹科技機器人實現720度回旋踢。3月11日,前華為天才少年“智暉君”創立的智元機器人,發布了人形機器人靈犀X2。在視頻里,機器人不僅可以像人一樣走路、跑步,還能玩滑板車、騎自行車。


人們正通向“機器人養老”的美好愿景,而現在,一個新工種隨著具身機器人的火爆而出現。在Boss直聘、實習僧等求職APP上,一些公司正招聘學歷要求大專以上,名叫“機器人數據采集員”的崗位。


在Boss直聘等求職APP上,一些公司正招聘“機器人數據采集員”的崗位


這份工作的主要內容包括:負責機器人數據采集工作、控制機器人正確移動、保護機器人處于安全狀態,等等。


除此以外,很多崗位還列出了對人的外形的要求,有的是,“不戴眼鏡,沒有高度近視”;有的要求“男生身高170-175,體重65公斤以內;女生160-168,體重55公斤內”;還有的公司要求,“不能有小肚子,身體協調性較好,細心、靈活、有控制力”。


這些崗位成功引起了眾人的注意。人們不禁好奇:機器人的數據采集員,會是一份什么樣的工作?這個問題的答案,關系到了人形機器人的技術路徑和當下的阻礙。更本質的問題是,機器人實現智能的背后,會像AI倚賴數據標注一樣,“有多少人工就有多少智能”嗎?


重復性新工作


薪資100元~240元/天,在社交媒體上,關于機器人數據采集員的兼職、全職工作正在火熱招聘中。


上海的“90后”張謙看到了這樣的趨勢,近半年來一直在給“數據采集崗”投遞簡歷。事實上,她在一家經濟貿易公司有全職工作,但在AI浪潮下,她愈發感到危機降臨,想轉行到一個代表未來的行業。


具身機器人賽道就是她瞄準的方向,而數據采集員就是其中最簡單的跳板。“門檻低,這是我投數據采集員最主要的原因。畢竟AI等未來產業,許多崗位都是招工程師,對代碼或硬件知識有一定要求。”她對鹽財經說。


她同時感到這類工作是有趣的?!坝行祿杉ぷ鲿M真實作業環境。數據采集員穿動捕服,戴VR眼鏡第一視角模擬機器人完成任務。感覺很像游戲。”只是,投遞了多份簡歷后,她仍未收到一份有效回復,轉行之夢離她仍有些遙遠。


而正如張謙所感受的,機器人數據采集崗的工作內容,與游戲3D動畫有相似之處。多位業內人士告訴鹽財經,訓練機器人時,他們都運用了與游戲3D相似的動作捕捉技術。


所謂的動作捕捉,即通過人類穿戴各種設備,測量、跟蹤、記錄人的運動軌跡,再經過計算機處理,得到三維空間坐標的數據。當數據被計算機識別后,人體3D技術可以應用在動畫制作、步態分析,生物力學、人機工程等各個領域。


事實上,業內人士都清楚,這波數據采集員的招聘熱,最早是由全球頂尖機器人公司帶動的。2024年8月,特斯拉率先為旗下Optimus人形機器人招募數據采集操作員(Data Collection Operator)。據介紹,其工作內容為穿戴動作捕捉服和 VR 頭盔,每天沿著測試路線行走7小時以上,身上同時攜帶最多30磅(13.61千克)的重物。


與此同時,該崗位還要求采集員身高在170~180厘米之間,因為該職位需要穿上特制動捕服,身材要與機器人相似。采集員需要穿戴設備,在工作過程中站立、坐下、行走、彎腰、伸展、蹲伏和扭轉身體。


特斯拉還給這群數據采集員提供了有競爭力的薪酬:每小時25~48 美元(約人民幣 180~342元),以及股權刺激。


相似的大型招聘同時在上海開啟。2024年6月,智元機器人在上海建立了一座面積3000平方米的數采工廠。公開視頻顯示,在這個工廠里,人需要通過在胸前佩戴VR設備等進行數據采集,比如,人佩戴設備教機器人疊衣服。


智元機器人具身產品線總裁姚卯青對媒體介紹,數采廠模擬了家庭、零售、服務業、餐飲、工廠的五個場景,未來將源源不斷為機器人學習提供數據養料。去年數采工廠僅投入使用兩個多月,就采集了超百萬量級真機數據集。


“不久后我們將擁有超千萬條數據。”姚卯青笑著對媒體介紹道。


從大廠的爭相布局和落地來看,真實數據正成為機器人行業的一道門檻。唯一的問題是,機器人數據采集員門檻究竟高嗎?


鹽財經記者以求職者身份,試圖聯系多個招聘機器人數據采集員的科技公司。來自深圳某科技公司的招聘經理張女士表示,數據采集員多數是臨時性的崗位,“我們有較大數據需求才會招人”。


“我們一般招的是大專生,或者外包的臨時工,做的是短期一兩個月的工作?!?/p>


據她介紹,機器人數據采集工作技術難度不算高,每天,采集員需要穿上一套設備,重復性地做某類任務。比如,為了訓練機器人學習拿礦泉水,采集員需要在桌子前反復完成拿礦泉水的動作,“如果數據需求大的話,可能一個星期都要重復做這一個動作”。


“當然,這個工作崗位也是有一定門檻的。”張女士說。


“倒不是技術專業背景的門檻,我們想要比較聽話、(身體)靈活的人。


人類老師的重要性


數據采集員的招聘一定程度上反映了機器人行業的變化。國內動作捕捉廠商、NOKOV度量動捕負責人告訴鹽財經,近兩年,隨著人形機器人為代表的具身智能在國內火熱,機器人產業對動作捕捉的設備需求也隨之大增。


為什么是近兩年的需求增長?該負責人介紹,這是因為人形機器人要求精度更高的人體運動數據。相比于電腦模擬的理想仿真環境而言,由人采集回來的真實數據,可以兼容更多的隨機性和意外。


舉個例子,他說,機器人在遇見凹凸不平的地面時,因為機械機構的原因,很容易摔倒。但是,如果是人在面對一些崎嶇地面或者突發狀況時,人體本身可以自適應,很快能自己調節過來。


機器人資深從業者、北京某高校學者孔博士也告訴鹽財經,機器人行業對真實數據的需求,是隨著這兩年AI大模型技術的發展而興。一個典型標桿是特斯拉人型機器人的Optimus,采用端到端的技術,試圖通過給機器人喂大量的數據,從而訓練出具有通用能力的機器人。


此外,Transformer架構、VLA(Vision-Language-Action)的發展和應用,讓機器人行業對數據的要求又增加了,如今,業界亟需精度高、質量佳的數據。


當下,來自業界一個共識是,“人類老師”對機器人的能力增長必不可少。上海通用機器人公司傅利葉生態拓展負責人周斌告訴鹽財經,人類采集的數據可以反映真實世界的復雜性。比如在訓練機器人時,周斌說,他們會首先運用仿真數據進行預訓練和初調;接著,再使用人類采集的高質量數據,進行多次精調,“這樣可以確保部署到真實物理世界的性能和效果”。


這一過程,智元具身研究中心常務主任廣輝也曾打過一個形象的比方。他以學習乒乓球為例,一般我們要通過圖文、看別人打球或看比賽等方式,先了解基礎或理論,再去訓練場通過發球機或者和別人打球簡單模擬?!叭绻懈咭螅€要找教練一對一手把手教學?!?/p>


總的來說,人類老師就是機器人的“一對一教練”。一對一教學的最終目的,是為了讓機器人更像人類。


不可或缺的“上肢”力量


除了確保與真實世界相符,機器人的“一對一教練”還有一個更重要的功能。孔博告訴鹽財經,目前機器人行業一個最大的難點是上肢力量。


相比于人類教學,當前行業內還有一個更主流的方向,叫強化學習。這是一種在仿真環境下通過試錯(Trial and Error),讓機器人學習做出最優決策的方式。


他舉例:“通俗的理解,強化學習就像喂一個小狗,這個小狗它做對了,我就獎勵它,他做錯了,我就懲罰他。強化學習本質就是一個獎勵函數。”


這一獎勵最佳路徑的方式,如今被發現能較好地訓練機器人走路、跑動等運動自平衡能力??撞⑵湫稳轂闄C器人的“下肢力量”,他稱,業內主流的宇樹科技等公司,都是運用強化學習訓練的。


“但現在人形機器人最讓人期待的使用上肢,去干具體的事,”孔博告訴鹽財經,“它不應僅僅是個玩具,它要成為一個生產力,去工廠干活,去商店買東西,最終進入家庭,成為機器人保姆。這里的關鍵是在上肢?!?/p>


不過,與公眾的期待仍有差距的是,孔博說,在實踐中,訓練機器人的上肢比下肢要難得多。而且,上肢訓練在仿真環境下,通過強化學習訓練得到的效果較差。


因此,多數機器人公司需要通過動作捕捉、遙操作等方式,讓機器人觀察人類演示后,遷移到自己本體上(尤其是上肢動作)去執行任務。這在機器人行業內,叫做模仿學習。


國內專注于機械臂和機器人本體的廣東某機器人技術總監告訴鹽財經,機器人獲取“上肢”力量之所以難,其實是難在機器人的“控制”端。


相比于移動、平衡小腦等類似于人類小腦的功能,機器人“大腦”控制端需要面對各類復雜的物理場景。這很難通過獎勵函數,在仿真環境中大規模訓練就可以得到好的效果。


他舉例,即使是簡單地使用機械臂,實施抓取動作,也面臨著復雜的狀況。“理想的仿真環境都是存在系統誤差的。(例如)在真實世界里,機械臂在運動過程中,會因為重力因素存在抖動狀況。這些誤差怎么去模擬出來,這是一個難題?!?/p>


因此,在操作端,該技術總監表示,還是人類在真實場景下進行數據采集,手把手教學的效果最好?!罢鎸嵉臄祿亲钪庇^的,雖然在目前的成本是最高的,但是在訓練大模型時候,效果是最好的,也更容易進行參數調優?!彼f。


與此同時,他強調,人工采集數據,不僅是簡單的采集,還包括上游的環境搭建、下游對數據的清洗和審核,這些步驟都需要大量的人力。


從這個角度而言,機器人行業也屬于“有多少人工,就有多少智能”的勞動密集型工作。


數據爭霸


從招聘APP的熱門崗位可以看出來,機器人行業正在經歷與AI一樣的數據“危機”——在AI行業里,數據被稱為石油。OpenAI公司聯合創始人兼前首席科學家伊利亞·蘇茨克維爾2024年曾公開警告,“AI的訓練數據如同化石燃料一樣面臨著耗盡的危機”。


傅利葉負責人周斌對鹽財經表示,“真實場景下的機器人動作數據在行業內一直是個瓶頸,因為它的采集成本非常高,很多數據的標注精度也不夠。高質量數據的缺失,是制約機器人發展的一個主要卡點?!?/p>


相較于自動駕駛而言,周斌介紹,機器人行業對數據的需求和要求也高得多。“就像特斯拉的自動駕駛技術,需要有海量的數據才能訓練出來。但汽車需要控制的變量其實并不多,無非是加速、減速,轉向。”


相比之下,周斌說,人型機器人至少有三四十個自由度的數據輸出,“它背后的數據集的需求非常巨大”。


與此同時,在AI大模型的浪潮下,如今機器人行業迎來了全新的目標——追求通用性??撞└嬖V鹽財經,機器人行業一直以來很難突破的地方是,機器人只能完成特定場景下的特定任務。


“過去的技術一直只適用于固定的結構化場景,它的位置姿態都是固定的?!笨撞┙榻B,“比如,一個立方體在桌子上,機器人可以去抓取。但是如果讓它去拿一個水果,或者擇菜,他就搞不了?!?/p>


大模型和具身智能火了后,上述多家機器人公司負責人都對鹽財經提到,他們追求的是讓機器人具有泛化性,意思就是,機器人可以同時完成多種任務,適用于多種場景。這就需要機器人擁有認知物理世界的“智慧”大腦。


而形成智能的關鍵,首先依賴大量高質量的數據,對機器人的AI算法進行訓練。


不過,多位業內人士也承認,目前在機器人的數據上,仍存在許多不確定的因素。比如,當前各家機器人公司的形態、技術路徑都不一樣,導致了采集的數據形態不一,很難實現通用。


此外,真實世界因為存在過多的變量,例如光照因素、物理因素等等影響,需要采集的數據量也變得無窮大。而對于采集大量數據后,機器人能否擁有預想中的泛化性和通用性,目前還是未知數。


“目前來說大家都傾向于相信(具身智能)這個方向可以,但是究竟能不能行,目前還是有待觀察。”孔博士總結。相比于AI,多重學科交叉的機器人還處在產業爆發的初期,前方仍有很多不確定性。


而當下,處在爆發期的機器人行業,也逐漸形成共識:各企業共同打造開放共建的生態,推動機器人數據共享。3月12日,智元機器人攜手上海人工智能實驗室、國家地方共建人形機器人創新中心等機構,發布全球百萬真機數據集開源項目 AgiBot World。3月17日,傅里葉也正式開源全尺寸人形機器人數據集Fourier ActionNet。


“如何解決數據(緊缺)的問題,我們認為首先需要一個更加開放共建行業的生態?!敝鼙罂偨Y道,“這不是說是一家公司能夠實現的,應該由企業、研究機構共同努力,參與數據的貢獻與算法的優化?!?/p>


可以肯定的是,真實的人類動作數據正在被機器人企業所珍視,成為未來一大段時間的“石油”。眾多機器人企業也將依靠著一名名“大專生”,一遍遍完成最簡單的人類行為,等待機器人行業的ChatGPT時刻降臨。


(應受訪對象要求,文中張謙、孔博為化名)

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系hezuo@huxiu.com
如對本稿件有異議或投訴,請聯系tougao@huxiu.com
正在改變與想要改變世界的人,都在 虎嗅APP
主站蜘蛛池模板: 大足县| 竹溪县| 京山县| 德庆县| 许昌县| 含山县| 宁蒗| 墨玉县| 乌兰县| 定日县| 万盛区| 正定县| 从江县| 莫力| 邳州市| 福建省| 合江县| 金堂县| 剑河县| 宜昌市| 门源| 怀柔区| 额尔古纳市| 读书| 安平县| 胶南市| 大连市| 如东县| 石楼县| 交口县| 奉节县| 青田县| 综艺| 晋宁县| 泰兴市| 宁都县| 河曲县| 阿克苏市| 四川省| 定南县| 永泰县|