通过仿人化的方式来打造通用机器人
当你吃到口感松软的鳕鱼排时,可能不会想到其背后隐藏的机器人力量。
以往,为了实现鳕鱼排松软的口感,需要加工线的工人将鳕鱼和面包糠堆在一起,再按照一定的力度按压成型。为了确保食品安全,工人们还需穿着防护服在低温环境下辛勤工作。如今,4 位斯坦福博士研发的通用机器人正在改造这一产品线。经盲测,机器人出品的鳕鱼排口感更佳,且产出效率更高,也更稳定。
王世全是这家通用机器人公司的核心创始成员之一。在浙江大学读本科时,他就选择了机器人方向,在他看来这是一个交叉学科,更有可能迸发出创新的火花。从浙江大学毕业后,王世全进入斯坦福大学攻读博士学位,期间加入斯坦福大学仿生与灵巧操作实验室,积累了 10 年以上机器人研发经验。
2016 年,王世全和多位斯坦福校友创办了非夕科技,沿着仿人化技术创新路径,专注于研发、生产集工业级力控、计算机视觉和人工智能技术于一体的自适应机器人,为不同行业的客户提供通用机器人解决方案和服务,经预估已探明的应用市场规模已达千亿元。
过去 8 年,非夕科技累计完成 4 轮融资,投资方包括金沙江创投、高榕资本、真格基金、顺为资本、魔量资本、云峰基金、招商局资本等多家知名机构,也得到美团、珠江集团、新希望集团等产业方的持续支持,并多次获得老股东复投。公开资料显示,非夕科技 2022 年 B+ 轮投后估值达 10 亿美元,跻身独角兽行列。
在商业化落地方面,非夕科技的自适应机器人已经进入精密装配、螺丝拧紧、曲面涂覆、柔性打磨、柔性包装、手术操作、按摩理疗、实验室自动化、肉类切割、食品加工等生产工序及产线,覆盖汽车、3C、家电、快消、医疗、生物医药、农业及食品等多个领域。
01 差异
创业之初,王世全就选择了与市面上机器人完全差异化的路线,即通过仿人化的方式来打造通用机器人。
它跟其他现有机器人的显著区别是,现有的机器人大多采用位置控制方式结合额外的视觉或力觉传感器和大量非标设备,最终集成到一个智能化的方案,但在王世全看来,这样的技术框架制约了机器人的柔性通用程度和应用范围。
在这样的技术框架下,机器人大多还是服务于某些特定场景,或从事某些结构化的工作,各大产业中依然存在大量只能用人工才能完成的任务,挑战着企业的产品质量一致性、服务质量和综合成本,尤其在精密器件插拔组装、复杂曲面打磨抛光等精密行业,以及分拣包装、食品加工等重人工且工作环境恶劣的场景。
" 以人作为参考,人在做事情时,最核心的概念不是精确的轨迹记忆,而是通过力觉手感去触碰和实时调整动作。所以我们所创造的通用机器人,需要有人类所具备的灵巧肢体构造,以手感调整为主、视觉引导为辅的方式去完成任务,且可以通过肌肉记忆,不断领悟和精进自身技能。" 王世全告诉《中国企业家》。
通用机器人发展至今已经五六十年了,但是渗透率依然很低,王世全认为,力觉为中心的仿人化路径可能是一个很好的突破口。
此外,不同于目前很多机器人公司聚焦于视觉领域的探索,王世全认为,具身智能是面向真实世界的交互,要想让机器人真正像人一样去做很多事情,除了视觉,力觉控制更加重要。
" 它是通过手或者拿着的工具,持续地跟环境去作用,就像婴儿出生之后跟整个环境的互动学习,他不可能只靠眼睛看,他还要体验,他要双手甚至整个身体跟现实环境去做探索,把自己的感知和行动的闭环投射到一个具象的世界上。" 王世全解释道。
其实,即便到现在,全球层面上真正去实践以力控为主理论路线的依然非常少,处于一个非共识的状态,但王世全坚定地认为力控是一个非常必要的通向人形机器人的环节,最终真正做到像人一样,甚至超越人的能力。
02 积累
摩根士丹利在 2022 年底发布的一份报告显示,目前全球机器人渗透率为 0.9%,机器人占劳动力市场比例约为 1%。
王世全亲历了机器人近 15 年的进化过程。在他看来,无论工业机器人还是协作机器人,发展历程都很长了,价格也都卷到很低了,但渗透率依然很低。他认为这其中最关键因素是,目前市面上大多数机器人并没有尽可能像人一样去使用工具和适应这个现实世界,而是让现实世界通过一定的改造方式去适应机器人。
这也是他立志研发通用机器人的初心。" 通用机器人之所以叫通用,肯定是说它的产品本身就已经能够适应各种各样的行业,而不需要额外增加很多辅助设备、现场改造和人力调校的成本。"
2019 年 4 月,在德国汉诺威工业展上,非夕科技发布了自适应机器人技术,并展示了旗下首个自适应机械臂 Rizon(拂晓)。经历 5 年的迭代和优化,王世全表示,非夕科技的机器人已经能够适应产线环境。
比如,对于一些带有振动的输送线,类似人类擦晃动的桌子,非夕科技自适应机器人已经不需要有人把这个桌子或来料按紧,也不需要高精度的视觉传感器,完全以直接控制的接触力为核心,辅以低成本的视觉判断,就能适应环境保质保效地完成工作。
在斯坦福大学仿生与灵巧操作实验室时,王世全就曾主导和参与完成过攀岩、水下及家用人形机器人等项目;非夕科技联合创始人叶熙阳、钟书耘同样是斯坦福大学机器人实验室博士和博士后,两人均有 15 年以上机器人软硬件研发经验;非夕科技首席 AI 科学家卢策吾则是斯坦福大学 AI 实验室博士后,也是上海交通大学 AI 实验室教授、长江学者。
在斯坦福的多个实验室里,王世全和核心创始团队完成了在机器人力控本体和 AI 大脑方面的技术储备,而这些都是通用机器人本身最核心的部分。
经历 8 年多的积累,非夕机器人在技术、产品、商业的飞轮正在飞速运转。2021 年,非夕科技研发的机器人本体基本成熟;2022 年年底,非夕机器人核心能力越过此前团队探明的应用价值临界点,开始收获规模化复制订单;2023 年年底,受益于产品通用性的成熟,非夕机器人破圈,开启了跨行业的加速开拓。
王世全回忆时感慨:" 走这条路确实很长很难,需要足够耐心,但也很有成就感。" 而这个过程中,他们最乐意看到的时刻之一,就是客户认知态度的转变。
刚开始接触时,大多数客户会抛出 " 凭什么以前不能解决现在就能解决了 " 的质疑,直到王世全带领团队真的攻克且证明给他们看,客户们才会完全重新思考之前的判断,甚至给非夕科技团队开放越来越多的场景。
03 聚焦
大多数机器人创业者,会先选择在某一个领域做深做透之后再进行拓展,尝试做更多应用,但王世全从一开始就聚焦在通用机器人的通用性上。
王世全表示,通用机器人的聚焦与做某一个行业细分解决方案的聚焦并不一样,它更多是从行业倒推去理解不同场景应用背后的工艺,提炼工艺本身背后手法的共性,聚焦共性需求。
成立之初,非夕科技团队发现在制造业板块,组装和表面处理这两块其实各自存在非常共性的手法,基于此可以辐射到成千上万的行业细分点。因此,虽然目前非夕科技看起来有非常多元化的应用场景和行业覆盖,但背后可以浓缩成由同款非夕机器人所能完成的多个不同的 " 元操作 ",例如压、插、滚、抹、拧、敲等等手法。这些 " 元操作 " 只需要通过不同工艺参数的设置,或搭载基于工艺理解和视觉判断的 AI 算法,就能在多种产线和应用场景下实现不同的任务目的。
王世全带领团队在打造产品的历程中,一方面,以力控为主、视觉识别为辅的方式把机器人本体做成熟,从传感器到驱动单元到整机控制全栈式地突破各种能力的极限,最终以人作为参照系把产品优化;另一方面,王世全再去寻找人工密集、工艺长时间无法被优化迭代、客户希望自动化但仍未有成熟解决方案的场景。
通用性就决定了独特的产品化路径。王世全表示,如果定点去爆破一个应用点,成为一个小池塘的大鱼,然后再快速去其他地方,对团队来讲有两个天然的挑战点:
第一,制造业对于每一个创新应用的导入,一般需要经历一个非常长的流程周期去引导客户尝试和验证。这是由行业属性、创新程度和业务模式决定的,无法靠增大投入或者靠堆人力加速;
第二,大环境和各行业企业的情况又一直在变化,如果用一样的策略去堆在一个应用点上,风险非常大。
在过去 8 年的研发过程中,因为采取完全差异化的研发路径,王世全发现很多环节市面上零部件的性能都不够,所以从力矩传感器、关节控制器、一体化关节,到整个手臂的规划算法,再到操作系统等等,所有环节都需要团队自研。
但也正因为这样,过往踏过的每一步都成为非夕科技深深的技术壁垒。从显性和隐性的工艺专利,到算法的壁垒再到整个商业模式,王世全带领团队完全是自己生产自己迭代,自己去开拓应用,最终再反馈迭代,并不断优化形成飞轮效应。
04 未来
2023 年开年,非夕科技发布了全球第一款自适应并联机器人和新一代通用力控型夹爪,除此之外值得关注的是其发布的穹知 AI 系统。
就像英伟达基于其 GPU 等硬件产品打造的 CUDA 计算平台,非夕科技发布的穹知 AI 系统同样是基于产品的独特性而布局的基础设施,其目的是赋能通用机器人的生态,让更多人能在这个平台上去创造有价值的事情。
如今,非夕科技的一套机器人本体 + 软件的元操作及 AI 所构成的解决方案,售价从十来万元到三四十万元不等,其在进入不同行业龙头企业后,正在形成一定的标杆效应,王世全称非夕科技在商业化上每年有 3 倍左右的增长。
关于未来的商业增量空间,王世全表示:" 其实非夕科技现在覆盖到的行业已经很广阔了,未来更多业务量的增长,除了播撒更多种子,更多将来自于怎么样真正让埋在每一个行业细分里的种子和破土的小苗,变成参天大树。"
回顾这段创业旅程,王世全表示,刚开始的几年像是技术探索的享受期,大家有着明确的大方向,抱着 " 干就是了 " 的心态,潜心研发技术。等到 2019 年底,团队研发的机器人产品正式对外发布,有了第一批种子。
但紧接着就是一段黑暗期,因为是采用全新的产品路线和技术架构,没有过往的坐标系作参考,王世全和团队甚至不知道产品的核心性能要做到多好才能在应用工艺上满足需求,只能不断摸索和突破着各项能力的边界。
与此同时,王世全等管理团队一方面要把握公司运营和融资节奏,在公司团队高速扩张期兼顾好组织管理;另一方面还要管理好客户预期,让对方耐心地相信团队,度过漫长的应用迭代期直至最终验证成功。
等到产品成熟度突破真实工业落地的临界点,翻山越岭,有些核心能力相较发布时甚至有了数百倍的提升。随着第一个成功案例出现,曙光终于乍现,技术、产品、商业化的飞轮不断加速,公司也开始按照预期的方式去增长。
这是王世全第一次主导创业,他终于变得得心应手,团队和业务也开始冲刺加速。
在他看来,通用机器人最理想的状态将有三大特征:第一,它可以像人一样保质保量地完成各类工作,甚至超越人,这一点是最核心的,但其实也是最难的;第二,它学习各个不同行业里老师傅经验的速度越来越快,成本越来越低;第三,拥有不同技能的机器人在跟人交互时的便捷和智能程度越来越高。
这些,在非夕科技未来的 10 年里,将有更多的突破到来。
来源:中国企业家杂志