美国再迎来基于 AI 大模型技术的人形机器人新公司。
7 月 13 日,总部位于匹兹堡的人形机器人初创公司 Skild AI 宣布,公司完成了总额 3 亿美元(约合人民币 21.75 亿元)A 轮融资,投后估值高达 15 亿美元。这笔融资主要用于技术研发、产品打磨、团队搭建以及商业化的部署。
值得一题的是,参与 Skild AI 的投资人阵容也非常强大,涵盖科技界、顶尖风投甚至学术机构,贝索斯、红杉资本和孙正义的软银都出现在领投名单中。具体来说,包括 Coatue、CRV、Felicis Ventures、General Catalyst、Menlo Ventures、SV Angel、卡内基梅隆大学、红杉资本(Sequoia)、美国光速创投、贝索斯探险和日本软银集团等。
实际上,Skild AI 的两位创始人均来自卡内基梅隆大学,在自监督和自适应机器人领域有超过 25 年的经验,团队也来自谷歌、Meta、特斯拉、英伟达、亚马逊、卡内基梅隆大学和斯坦福大学等科技巨头及院校,其利用比其竞争对手大 1000 倍的数据集训练模型,实现一种通用的智能系统,可以接入不同机器人,让他们立刻获得一些基本能力,如爬坡、跨过障碍、识别和捡起物品。
红杉资本合伙人 Stephanie Zhan 直言,无论是在物流、车厂试点的人形机器人,还是四足机器狗,都要有脑子。过去," 脑子 " 要定制,但现在有了大模型和 Skild AI,世界机器人已经有了通用化和泛化实力。
AI 时代的 " 新 iPhone 时刻 " 正在进入人形机器人世界。
为实现物理世界的 AGI,两位美国大学教授构建大规模数据集
Skild AI 成立于 2023 年 5 月,由两位前美国卡内基梅隆大学教授 Abhinav Gupta 和 Deepak Pathak 创立,他们也曾是 Meta 的 AI 研究人员,公司长期目标是开发扎根于物理世界的通用人工智能 (AGI),以打造一个通用、灵活、智能的人形机器人产品。
人才方面,Skild AI 团队主要来自 Meta、特斯拉、英伟达、亚马逊、谷歌以及卡内基梅隆大学、斯坦福大学、加州大学伯克利分校和 UIUC 等名校。
技术层面,Skild AI 正在构建一个共享的通用大脑,为机器人提供一种基础模型,作为 " 通用大脑 "。而 Skild Brain 是一个可扩展的机器人基础模型,具备使用性和灵活性的能力,能够使机器人在不同硬件、场景、任务之间自适应。
这个 " 通用大脑 " 可以与包括人形机器人在内的任何类型机器人进行集成,以通用 AI 技术使机器人执行动作,从而在不同场景中处理各种任务,可以在家庭和工业环境中灵巧地操纵物体,可以在任何物理环境中导航。如攀爬陡峭的斜坡、绕过前进道路上的障碍物以及识别和拾取物品。
这种独家技术,一个是 Deepak Pathak 读博时开发的一种向机器人灌输 " 人工好奇心 " 的方法。当机器人对自己行为的结果感到不确定时,它就会变得更 " 好奇 ",愿意探索更多场景,带回更多数据,增加学习的广度和深度。Pathak 还设计了一种方法,可以将人类给 GPT 等大模型下的命令(如打开一罐牛奶),转化为实际动作。
除了这些与物理世界交互和操作的真实数据,团队还结合从模拟环境中收集的数据,提供大量、特别是在频繁重复场景中的资料和反馈。另外,在 2022 年,两位创始人还通过各种机器学习和不同源数据中学习等手段,整合到一个连贯系统中,大大提高了模型的学习效率和适应能力。
值得一提的是,爬楼梯是一个复杂的平衡问题,通常需要针对特定环境编程和训练,但 Skild AI 的模型能让机器人迅速学习和适应新环境,完成任务。而且,基于 Skild AI 技术的机器人展现出一种 " 涌现能力 ",可以自学习实现更多动作捕捉。
" 我们的模型表明,它可以适用于不同的机器人、场景和任务。"Pathak 表示。
模型泛化能力和涌现能力,离不开所谓 " 规模空前 "、文本、图像和视频组成的庞大数据集。因此,这种独特能力背后,Skill AI 的核心在于其模型训练所使用的海量数据。
Skill AI 团队透露,相比竞争对手,其数据点至少多出 1000 倍,这一优势使得 Skill AI 的模型能够更好地理解和适应复杂多变的物理世界。
据悉,Skill AI 的通用机器人技术有望为医疗、建筑、仓储和制造业等行业提供解决方案,从而让机器人能够与人类一起执行新任务,或部分环境下代替人类工作,可以有效缓解劳动力短缺和提升工作效率。
据 maginative 报道,Pathak 认为,目前美国面临着日益严重的劳动力短缺问题,预计到 2030 年将有 210 万个制造业岗位空缺。Skild.ai 的技术可以帮助实现危险或劳动密集型任务的自动化生产。
作为此次投资人,光速创投合伙人 Raviraj Jain 表示,Skill AI 能够通过将基础模型的核心原则应用于现实世界,推动机器人技术的进步,推动人形机器人的发展。这也显示了他对 Skill AI 技术创新能力、产品能力、和市场前瞻性的高度认可,也是对人形机器人未来发展的认可。
千亿新市场来袭,人形机器人行业正迎来 OpenAI 式颠覆
人形机器人市场正迎来快速增长。
根据 Markets and Markets 数据显示,全球人形机器人市场规模预计将由 2023 年的 18 亿美元,提升至 2028 年的 138 亿美元,年复合增速约 50.2%。高盛则预测,到 2035 年,全球人形机器人市场规模或将达到 1540 亿美元。
另据国内公开研报显示,预计到 2026 年,中国人形机器人产业规模将超过 200 亿元。
Stephanie Zhan 指出,"GPT-3 时刻即将降临机器人世界。它将引发一场巨大的转变,将类似于我们在数字智能领域所见的进步带入物理世界。"
随着全球人口老龄化加剧、劳动力成本和需求不断上升,以及基于 AI 大模型技术的不断进步,包括人形机器人在内的智能设备迎来新的市场机会,有望显著提升制造业的生产效率和竞争力。
值得一提的是,大模型通过其强大的推理能力和上下文理解能力,提升人形机器人功能的可见性和现实具象性。通过融合视觉、语音、文本等多模态信息,增强了人形机器人的感知和决策能力,从而使人形机器人能够更好地理解和感知现实世界,提升其智能化水平。
不过,当前 AI 机器人市场也存在三个核心问题。
一是以 Skild AI 为例的机器人产品正面临着市场激烈竞争。其中,特斯拉擎天柱正在快速进化,马斯克透露年底会迎来重大更新;OpenAI 最近恢复了其机器人团队,为机器人公司提供基础模型;英伟达也开始发力机器人技术;此外亿万富翁 CEO Brett Adcock 掌舵的人形机器人公司 Figure AI 和 OpenAI 衍生公司 Covariant 正在为机器人构建 ChatGPT,并已筹集了超过 2 亿美元。
二是盈利难。整体来看,人形机器人造价高,成本动辄几十万元,消费者和企业望而却步。智元机器人负责人曾对钛媒体 App 表示,人形机器人成本要控制在 20 万元人民币以下才能大规模生产。但是目前,特斯拉的擎天柱仅材料费用就需要 4 万美元(约合 29 万元);而国内的人形机器人成本更高,比如小米铁大(Cyber One),每台成本达 60-70 万元,因此,目前人形机器人尚无法实现大规模量产,更多是在 To B 制造端进行小规模应用。
三是人形机器人的技术还不成熟,无法在精细工作上完全替代人类,距离量产仍远。无论是 " 幻觉 " 问题,还是机器人摔倒,都让人们对于机器人技术保持质疑态度。
而 Skild AI 设想了一个类似 OpenAI 的未来:通过微调,就可以在 Skild 基础模型上构建不同的用例和产品。
这正是他们颠覆机器人行业的方式。最终,他们希望抵达机器人 AGI,人们可以在物理世界中,与之互动。
今年 2 月,高盛将 2035 年全球机器人市场的规模预期上调至 380 亿美元,预计出货量将增长 4 倍,达到 140 万台。
特斯拉 CEO 马斯克在 2022 年特斯拉人工智能日(AI Day)表示:" 人形机器人需求量有望达到 100 亿台— 200 亿台,人类对人形机器人的需求甚至会远远超过汽车。"
如今,资本市场已率先升温。2024 年至今,国内的人形机器人行业投融资事件激增至超过 22 起,融资金额超过 70 亿元,同比增长 300% 以上。
其中,美国美国人形机器人初创公司 Figure AI 凭借 6.75 亿美元(折合人民币约 49 亿元),成为 2024 年上半年全球最大一笔的融资。由此可以看出,人形机器人市场正在加速发展。
而在国内,宇树科技则凭借近 10 亿元人民币融资,引领国内人形机器人赛道融资。
总的来说,人形机器人具有解决劳动力短缺、提高工作效率和生活质量方面的潜力。新技术的推动为人形机器人带来广泛的应用前景,这些机器人在未来有望成为家庭、医疗、教育、工业制造等多个领域的重要助手。同时,不少投资人认为,通过租赁、销售、服务等多种商业模式,人形机器人企业有望为社会提供更多价值。
来源:钛媒体