缩放定律的放缓带来的技术路径演变
在 2024 年的 NeurIPS 会议上,Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点,尤其集中于 Scaling Law 的观点:「现有的预训练方法将会结束」,这不仅是一次技术的自然演进,也可能标志着对当前「大力出奇迹」方法的根本性质疑。
Ilya 讨论了预训练模型的局限性,预见 AI 系统需要发展出更加接近人类思考方式的推理能力。他强调,为了突破当前的局限并继续提升 AI 的能力,必须寻找新的训练方法。这意味着,基于语言单一模态的大模型能力已经逼近上限。基于现有的开源路线分析,商业社会想要寻求 AGI,必须将目光转向多种模态和推理过程。
商业领域对人工智能公司的偏好开始出现范式转换
知名数据分析机构 CB Insights 发布的「2024 年第三季度全球人工智能投融资报告」显示,该季度全球人工智能交易数量环比激增 24%,但融资实际上环比下降了 29%,主要归因于单笔融资金额超过 10 亿美元的「巨额交易」数量环比下降了 77%。报告指出,这反映了当前市场对中小规模、高潜力初创企业的偏好转变,投资者更加关注具有创新技术和可扩展商业模式的企业。
作为专业的人工智能媒体与产业服务平台,机器之心于 2017 年发布了 AI 榜单「Synced Machine Intelligence Awards」,在随后的时间里,伴随 AI 的跨越式发展,机器之心的年度评选也逐渐成为了产业风向标之一,其中,机器之心 2024 年度评选中的「大模型最具潜力创业企业 TOP 10」,旨在表彰技术创新能力强、团队领先、已经推出大模型或拥有完整大模型研发能力的创业企业。
其中名列「大模型最具潜力创业企业」榜单首位的贝式计算,其产品 OpenBayes 可能是是中国最受欢迎的 GPU 计算系统之一,拥有超过 17 万注册科研人员和过百个集群私有部署客户。
2024 年第三季度,紧跟多模态大模型升级趋势,OpenBayes贝式计算基于集群构架、编译器、模型结构等领域的多项创新与技术,推出了多模态模型贝式小算,结合了先进的视觉理解和语言生成技术,能够同时处理和分析多种形式的数据,包括静态图片和动态视频。
模型性能方面,得益于OpenBayes贝式计算近年来在编译器技术领域的积累,贝式小算可天然运行在 Nvidia、ARM 以及多种国产芯片上,同时拥有较高的计算精度和计算效率。该模型在MME-Realworld 等评测中取得了优异的成绩,是前列排名中为数不多的初创企业之一。
*MME-RealWorld 是迄今为止已知最大的完全人工标注基准,拥有超 1.3 万平均像素为 2,000 × 1,500 的高分辨率图像,收集了更多关于中国的真实场景图片,评测任务相较传统基准难度更大。
以此为基础,OpenBayes贝式计算赋能企业客户,已经为十余个私有部署用户提供了高效可靠的大模型服务,该多模态模型成功落地于卫星遥感、医疗影像、法律财务、文件表格互译等生产场景。
举例而言,在中国科学院某研究所,OpenBayes贝式计算为该院所级高性能计算集群的百余名学者与工程师用户提供了完备的 AI+HPC 计算体验。工科研究者可以通过同一套计算系统无缝连接各类 HPC 应用与 AI 计算框架,通过统一的数据流转流程,使得工科领域相关计算结果可以无缝连接 AI 的最佳实践,进而加速了 AI 在诸多工科领域的研究效率。
值得一提的是,就在 2024 年 11 月 28 日,OpenBayes贝式计算还入选了 36氪评选的「WISE2024 商业之王年度最具商业潜力企业」。如今再度获评机器之心「大模型最具潜力创业企业 TOP 10」,可以说是对公司发展空间的高度认可。
从人工智能技术落地的角度来看,OpenBayes贝式计算拥有 17 万注册科研人员和过百个集群私有部署客户,是公司创新技术与解决方案落地应用的最佳渠道,其中包括清华大学、北京大学、北京邮电大学、天津大学、上海交通大学、中国科学院等头部科研院所,以及招商局集团、南方电网、辽港集团、粤能能源等重点头部公司。OpenBayes贝式计算的商业化潜力已经初步获得验证,是否能够如期兑现,仍然需要时间来证明。