不久前,3D 大模型公司影眸科技完成了数千万美元 A 轮融资。这一轮融资由美团龙珠、字节跳动领投,老股东红杉中国种子基金、奇绩创坛连续跟投,光源资本担任独家财务顾问。
据影眸科技创始人吴迪介绍,本轮融资将主要用于影眸科技在 3D 大模型的前沿探索,并加速以 3D 生成大模型 Rodin 为核心的 Hyper3D 系列产品在全球市场的商业化落地。
2024 年,资本及市场对 AI 的关注迅速从技术前沿进展转向商业化收益。据了解,影眸科技推出的大模型 Rodin 自上线仅 45 天,年度经常性收入(ARR)就已突破 100 万美元,成为当前 AI 创业公司中少有的商业化成功案例。
图:Rodin 界面;图片来源:企业供图
Rodin 的快速增长折射出 3D 生成市场的巨大潜力,尤其是随着元宇宙、虚拟现实、具身智能等新兴应用场景的迅猛发展,3D 内容的需求量正迎来爆发。
综合相关行业数据,游戏和娱乐、影视和动画、建筑与房地产(AEC)、制造业与产品设计、电商务与虚拟展示的 3D 建模外包市场 TAM 总规模高达 149-335 亿美元。
然而,传统的基于几何建模的手工创作 3D 模型不仅耗时费力,还有着较高的技术门槛,极大地限制了 3D 内容生产的效率和规模。在此背景下,生成式 AI 工具被视作是提高 3D 生成效率,降低 3D 内容创作门槛的关键。
但问题在于,尽管 AIGC 的热潮已席卷全球,目前,我们熟悉的大部分主流 AIGC 工具依然集中在图像和视频等 2D 内容的生成上,属于 3D 生成的 "ChatGPT" 时刻尚未真正到来。
这背后的原因是,受限于技术,3D 大模型的生成质量瓶颈尚未得到真正突破。
相较于图像、视频等形式,生产级的 3D 内容需要满足更为复杂和更严格的标准。除了生成速度、质量,还要兼顾 3D 网格的结构和拓扑质量、UV 图结构以及纹理清晰度等。
吴迪坦言,虽然 3D 生成的质量已经被抬升到一个新的高度,目前的 3D 生成在材质可用性、拓扑结构、UV 展开等方面还不能满足实际应用的需求。这些技术方面的短板,已经成为 3D 生成行业前沿待攻克的重点问题。
这一背景下,全球范围内,3D 生成技术的迭代正加速推进。去年,影眸团队与上海科技大学合作提出的 " 可控 3D 原生 DiT 生成框架 CLAY" 和 "3D 服装生成框架 DressCode",显著提升了 3D 生成的质量,被认为是新一代 3D 生成的基础框架。
与此同时,海内外已经集中爆发了一批 AI 生成 3D 产品。
在海外,Meta 推出文生 3D 模型 Meta 3D Gen,可 1 秒生成 3D 素材;谷歌发布基础世界模型 Genie2,根据一张图片生成可供人类或 AI 智能体控制动作、可玩的 3D 环境;英伟达发布 Edify 3D,支持从文本提示或图像直接生成 4K 级别的 3D 实体与场景。
在国内,除了影眸科技上线了 AI 3D 模型生成产品 Rodin,腾讯也发布了 3D 生成开源模型 Hunyuan3D-1.0,可同时支持文字、图像转 3D 资产,最快 10 秒完成端到端生成。
可以说,全球 3D 大模型选手们都在暗中较量、默默发力,从 a16z 押注的 Yellow、Kaedim、BackFlip,到李飞飞的 World Labs,AI 3D 生成的技术迭代正在加速逼近质变的临界点。
不过,从市场层面看,3D 生成现阶段所辐射的用户群体仍集中于游戏、视频制作、电商、工业设计等 B 端领域,C 端市场的渗透率相对较低。
吴迪在和 36 氪的对谈中对这一现象分析称,与视频、图像以及音乐不同,3D 资产现阶段还无法轻松地通过社交媒体进行分享和传播。
尤其是在当前以二维为主的设备环境下,普通用户对 3D 资产的需求尚未成熟,消费场景也较为有限,这一现状很大程度上影响了 3D 生成技术在 C 端市场的普及与推广。
" 但随着 3D 打印、AR 和 VR 等消费级产品的不断发展和普及,3D 生成有望在 C 端市场迎来爆发式增长。" 在吴迪看来,随着技术的成熟,3D 生成一定可以运用在越来越多的领域,甚至像文字、图像和视频一样成为普通用户日常创作和分享的一部分。
图:影眸团队在 SIGGRAPH Real-time Live! 环节展示 Rodin 3D 生成;图源:企业供图
正是基于对商业化的洞察,影眸在研发阶段便以落地为目标,比如公司专注的 " 生产就绪(Production-Ready)" 标准。
这个标准指的是生成的 3D 模型可以直接适配后期制作管线,进入实际生产流程,从而将用户的兴趣转化为真正的生产力工具,并产生实际商业价值。
" 在更加遥远的未来,当元宇宙、机器人成为生活中的一部分时,3D 生成必然会迎来真正的爆发。" 吴迪表示。
近期 36 氪和影眸科技创始人吴迪进行了对谈,以下为采访精编:
36 氪:作为一家由高校孵化的企业,影眸的商业化进展很多都基于学术研发,可以简单介绍一下吗?
吴迪:影眸孵化于上海科技大学,2016 年起就在三维建模领域进行研发。2024 年,我们有两篇和 3D 生成大模型相关的文章获得 SIGGRAPH 最佳论文荣誉提名,两次入选 SIGGRAPH Real-time Live!,是该项目 50 年来首次入选的中国大陆团队。
36 氪:Rodin 为什么能做到上线仅 45 天就达到了 100w 美金 ARR?
吴迪:主要得益于对市场的精准定位以及产品力。在研发和产品开发的过程中,我们始终把 "Production- Ready" 作为研发的核心指标,我们要做的就是可直接使用的技术的研发。而且,在研发的过程中,我们对比了所有技术路线,没有选择当时更被广泛关注的 "2D 升维 " 的技术路径,而是选择了当时并不被看好的 "3D 原生 " 路线,即从该模型的训练、监督、生成都在三维中进行。这虽然让我们的产品比同行晚了半年发布,但也让我们产品的生成效果在当时的行业内实现了代差级的领先。
36 氪:在技术路径上,影眸并没有跟随大多数人去采用 2D 升维的技术路线,而是选择 3D 原生,这背后的考量是什么?
吴迪:2D 升 3D 的路径是当时行业内被普遍认同,也是用的最多的,因为从多视角的二维图像来得到三维信息最符合大家直觉,同时大家普遍觉得三维资产不够,需要用二维资产补足,但我们在最开始接触目标客户的时候,我们就发现他们其实不只是需要能生成 3D 模型,更重要的是这个 3D 模型的可用性要足够好。
我们当时结合自己在图形学领域数年的研究经验,认识到当三维数据被压缩到二维时,无论有多少视角,都无法完整表达物体三维结构中的每个细节,这会导致 2D 升 3D 的路径很难达到客户的使用标准,同时 3D 原生能保留更多信息,生成质量的上限会更高。
如果当时选择了 2D 升维这条路的话,我们可能很快就能推出产品,但最后还是没这样做,Rodin Gen-1 比别人晚发半年左右。
36 氪:但其实很多企业都会担心自己的产品发布落后于同行,在做这个选择的时候不会有顾虑吗?
吴迪:这确实是一个 " 敢为天下后 " 的决定,但在当时我们几乎没有犹豫,因为我们坚定认为只有 3D 原生的技术路径才能达到更接近商用的标准,我们在内部把他称为 "Production- Ready",这也是影眸研发和开发产品的核心标准。要达到 "Production- Ready",除了建出模型,还在 3D 表达、拓扑、UV 展开、材质等方面有更多要求。Rodin Gen-1 虽然比其他产品发出的更晚,但它是最早跨过 " 可用性 " 那条标准线的 3D 大模型产品。当然即使我们现在这一代模型已经提升了质量上限,它与真正可以接入到流程还有距离。
36 氪:这种差距具体表现在哪里?
吴迪:由于在一些场景,比如游戏中要使用一个模型,他会有很严格的要求,比如在刚说到的拓扑结构、UV 展开还有一些绝对的细节量上,即使我们已经做的非常不错,但仍旧会有距离。客户在使用的过程中还是需要经过修改甚至是重新制作。
36 氪:公司的收入分布是怎样的?
吴迪:我们有 70% 的收入来自海外,在美国、欧洲、日韩都有业务布局,其中欧美的份额占比较大,占大约 50% 以上。比如有一个来自德国的用户,调用我们的 API 做了一个非常有吸引力的产品,这个产品甚至本身就超过了 50 万美元的 ARR。
36 氪:影眸的核心客户群体有哪些?
吴迪:目前还是集中在游戏、视频制作、电商这些泛娱乐、新消费场景。但 3D 生成也正在不断地拓展使用边界,像 3D 打印、具身智能、工业设计都是我们未来目标的的核心用户群。
36 氪:有没有具体的案例可以讲一下?
吴迪:以我们与拓竹的合作为例,我们之间合作实际上是拓竹基于我们的技术开发出产品,然后将产品开放给客户。在拓竹官方的 printmo 项目中,用户仅需上传一张图片,AI 就能把它转换成宠物小精灵的风格,然后由我们的技术完成 3D 生成,再由用户的 3D 打印机打印为实体。这也是我们在 3D 打印领域的第一次尝试。
36 氪:这些客户的需求对于影眸在技术上的迭代有哪些影响?
吴迪:影眸的所有技术层面的迭代几乎都是基于客户需求的。比如说游戏、视频制作等领域需要的模型都是拓扑规整且合理、UV 利用率高的模型,我们接下来的技术研发就会朝着这个目标前进。但当我们横跨到工业设计等领域,需求就完全不同。所以从最长期的角度考虑,我们希望能够找到一种一统天下的 3D 表达方式,可适配不同场景,对各种需求下的三维模型都能做到很好的转换和适配。
2024 年底,我们最新上线了 Rodin Gen-1.5 版本的模型,这次升级通过新一代 3D 原生表达,全面解决了行业内长期存在的薄面与边缘锐度问题,让生成的模型有更加锐利和平直的边缘。这个需求在游戏,尤其是产品设计领域中尤为重要。这次升级也让我们的产品领先幅度再次扩大。
36 氪:影眸如何看待 3D 生成的未来发展?
吴迪:在未来 3D 生成还有很大的可供挖掘的空间。要实现在 AR/VR/ 虚拟世界中的个人创作,就要解放用户的 3D 内容创作能力。作为构建在三维空间中的世界,未来机器对世界的理解也必然基于三维。3D 生成会实现空间智能的最重要组成部分。
来源:36氪