在近年来,在关节材料和电机技术的进步下,人形机器人的运动能力越来越强,在机器人“小脑”,也就是平衡、运动算法上取得了突破,让人形机器人能够实现接近于人类的动作流畅度,甚至能完成一般人无法完成的杂技动作。
而在机器人硬件基础逐步提高的前提下,也就成为了机器人“大脑”开发的基石,真正让人形机器人走向“具身智能”。最近有消息称,特斯拉正在利用一支数据采集团队,来训练Optimus机器人像人类一样自主行动。那么具体是如何做的?
延续纯视觉路线,百人团队采集训练数据
根据报道,特斯拉数据采集团队在鼎盛时期拥有超过100名员工,在8小时的轮班中,数据采集员需要根据任务指派文件和操作手册,重复数百次包括奔跑、蹲下、舞蹈、拿杯子、擦桌子、拉窗帘等动作,以确保数据采集工作正确完成。
值得一提的是,特斯拉在此前是使用动作捕捉服或是远程手动控制机器人来采集数据。而今年6月,特斯拉开始改用纯摄像头采集数据,这与其自动驾驶的技术路线相同。团队成员被告知,不采用动作捕抓服后,数据采集的工作效率会更高。除了环境周围的摄像头外,数据采集员工需要穿戴头盔和背包,搭载5台摄像头记录全程的动作。
特斯拉数据采集团队的前员工表示,目前远程操控功能主要被用于接待投资者参观时使用。“投资者们希望看到这些机器人实际运行起来,演示时我们会使用动作捕抓手动控制这些机
器人,这样整个操作过程看起来才会更加流畅自然”。
与自动驾驶类似,人形机器人实际上也需要海量的数据训练,数据是泛化能力的核心。但问题在于,相比自动驾驶能够通过路测和仿真来采集数据,目前针对人类动作记录的数据获取要麻烦得多。人形机器人的路线规划可以与发展多年的自动驾驶类似,但动作、触觉等仍需要大量真实数据,因为不同材料、不同形状的物体需要机器人灵巧手对其施加不同的力,以及不同的抓取方式。
目前机器人主要的数据采集方式有几大类,包括真实场景采集、仿真环境、多模态融合采集、人机协作与自主生成等。
真实场景采集是通过在实际环境中部署机器人,直接收集传感器数据。例如上海智元数据采集中心构建了家居、工业、商超等五大类真实场景,利用 100 余台机器人每日采集超万条数据。这类数据能提供最真实的环境反馈,解决仿真数据与现实的 “域差距” 问题,但成本较高。为提升效率,智元采用模仿学习与强化学习结合的路径:前者通过人类示范总结规律(如机械臂分拣动作),后者通过奖励机制让机器人在试错中优化策略。
仿真环境是利用物理引擎构建虚拟世界,生成包含传感器信号(视觉、力觉等)的训练数据,批量生成低成本数据。这种数据采集技术,依赖精确的物理建模(如关节刚度、摩擦系数)和渲染引擎;需要支持大规模参数随机化以增强数据多样性;最终输出为可直接用于模型训练的原始传感器数据或标注数据集。
多模态融合采集则是整合多种传感器数据以提升环境感知精度,其中也有几种技术路线。
数据级融合:直接对齐原始信号,如将 LiDAR 点云与摄像头图像投影到同一坐标系;
特征级融合:在神经网络中层融合视觉特征与 IMU 运动数据,例如 MVX-Net 通过注意力机制混合图像纹理与点云几何信息;
决策级融合:独立运行单模态模型后整合结果,如百度 Apollo 结合摄像头 YOLO 模型与 LiDAR 检测进行障碍物判断。
人机协作与自主生成则分别是两种数据采集方式,首先人机协作是类似于使用动捕装置生成动作轨迹,将人的动作映射到机器人上;自主生成则是机器人根据模型不确定性自主选择高价值数据点,减少对人类标注的依赖。
但总体来看,多模态融合采集是当前主流的数据采集方案。
当前机器人仍离不开远程操控
另一家最近在网上爆火的挪威人形机器人公司1X Technologies,他们宣布了旗下NEO人形机器人将会在2026年出货,并开始预售,售价仅2万美元,甚至公司还提供了6个月499美元的租赁计划。
而NEO机器人的定位是家庭服务机器人,在宣传片中NEO能够自动完成打扫、开门、整理衣服、将衣物放入洗衣机、将餐具放入洗碗机并启动、拿饮料等工作。许多人看完后已经开始想象未来所有家务交给机器人的场景。
然而最近WJS的记者在体验以及采访了1X CEO Bernt Børnich之后,却发现实际情况要远远落后于人们预期。目前,NEO的所有动作,都由戴着VR眼镜和操作手柄的工作人员在远程控制。另一方面,机器人的行走速度缓慢、动作同样较为拖沓,工作效率低下。而更重要的是,利用VR控制机器人的工作人员,将会获得用户房间内的视频信息,这对用户个人隐私造成很大的威胁。
当然1X表示预计到2026年,Neo将自主执行大多数家务,通过人工指导的过程来让机器人收集真实世界数据,并进行学习。但也有可能跟很多超前的科技产品一样,2026年只是一个目标,实际的量产落地时间还是未知数。
小结:
综合来看,当前人形机器人的发展正处在硬件基础发展迅速,与数据采集、AI训练起步的关键交汇期。关节材料、电机技术的突破与平衡算法的升级,为机器人赋予了接近人类的动作潜力;而行业内多样化的数据采集模式,共同构成了机器人向“具身智能”迈进的核心支撑。未来人形机器人真正要走进家庭,还需要面临大量的现实问题,包括安全、隐私、自主决策等,从演示级产品到实用产品,可能还要等待很长的时间。
文章来自:电子发烧友
![]()
