
马年春晚舞台上,机器人轮番上台,完成了一场国产人形机器人的国民级亮相,也引发大量追问:机器人何时走进日常生活?今年初启动试运营的广东省首个异构具身智能机器人训练场──位于惠州市的惠阳异构具身智能训练场,或许可以解答一二。
推门而入,几十台形态各异的机器人正在给超市货架摆放商品,在快递站分拣包裹,制作咖啡……来自优必选、星尘智能、智元等全国各地机器人企业的机器人正在接受不同场景的“职业培训”,过程中产生的海量行为数据,正是让机器人学会自主应对真实世界的关键秘笈。\大公报记者 李紫妍
与实验室里简单、有限的场景不同,一旦走入真实世界,机器人将面对无穷无尽的复杂状况。要“智能地”应对一切,还需更多来自物理世界的真实行为数据。具身智能训练场通过搭建真实物理场景与仿真平台,供机器人“学习”人类行为,采集有效训练数据,推动具身智能数据标准化,破解高质量训练数据短缺这一发展瓶颈。
训练场景采自真实工厂环境
“机器人一定要有更强的‘泛化’能力,要能举一反三,达到一定程度后才会出现‘涌现’的能力,遇到没见过的东西也能自主应对。”惠阳异构具身智能训练场运营方刻行时空创始人兼CEO黄阳明介绍,目前训练场共划分16类大场景,涵盖康养家庭、酒店客房、工业流水线分拣、生物医药物料分类等,场景维持高频迭代,平均每两周更新一次。上月末,训练场正式产出的首批“数字资产”已陆续交付。
训练场中的场景均采自当地企业、工厂的真实环境。机器人在训练师操控下,一遍遍重复人类的精准动作,学习应对不同规格、材质、形状物体时的发力方式与运动轨迹等信息,并生成相应数据。数据经过标注、清洗等技术处理后,留下有价值的高质量数据。基于对这些数据的学习,机器人逐渐形成自己的“手感”,越发灵活地应对现实场景。“必须有足够多的数据去教会它,这个过程和我7个月大的小孩学习拿东西很像。”黄阳明说。
目前,优必选、星尘智能、智元、穹彻智能、浙江人形等国内头部机器人企业的约180台机器人已在此“入学”,包括双足机器人、轮式人形机器人、固定式机械臂等不同构型,预计一年可采集500万条多模态数据,并将持续引入更多本体厂商。黄阳明介绍,除场景多元丰富外,不同机器人产生的异构数据同样是增加数据多样性、提高泛化能力的重要维度。
国家“十五五”规划纲要重点布局具身智能等未来产业,构建全链条培育体系,提出强化算力算法数据高效供给,促进模型算法迭代创新,鼓励具身智能技术创新,探索通用人工智能发展路径。
“这类数据需求是全球化的”
“这类数据的需求是全球化的,中国如果能率先掌握高质量的数据标准,就拥有了话语权。”黄阳明说,中国的竞争优势在于制造业基础,大量的场景和技术工人有助于数据生产,快速填补空白。
自去年起,内地具身智能训练场的建设热潮全面爆发,北京、广州、上海、天津、绵阳等多个城市已陆续建成专业训练场。中国人工智能学会副理事长、清华大学教授孙富春对此表示,建设训练场能推动具身智能数据标准化,将仿真数据与真实数据结合,破解高质量训练数据缺乏的难题。
同时孙富春指出,当前具身智能训练场面临两方面挑战:一是对具身智能人形机器人的定义与内涵仍存在诸多不一致;二是现有数据采集途径容易造成重复采集,采集的数据难以使用和共享。
黄阳明指出,作为惠阳异构具身智能训练场的运营方,刻行时空主要解决异构机器人接入标准不统一、场景数据价值挖掘不足,以及不同模型厂商数据需求匹配与共享效率不高等问题。他认为,未来具身智能产业竞争很大程度上将体现为高质量数据能力的竞争,能够持续生产、组织和流通数据的平台,将成为产业发展的重要基础设施,在这一点上,粤港澳大湾区正走在前列。