市场传闻 DeepSeek 考虑以估值 100 亿美元进行新一轮融资,阿里有计划投资 10 亿美元认购 DeepSeek 股权,目前双方团队正在沟通具体执行细节,阿里云将作为第一推理算力选择。
受消息影响,阿里美股(NYSE: BABA)大涨 6% 以上。
截至发稿前,阿里、DeepSeek 双方均未对传闻做出回应,而两家企业都位于杭州。
钛媒体 AGI 从消息人士处进一步了解到,其实 DeepSeek 公司估值目前只在数十亿美金左右。消息最初是在投资圈和量化群里进行传播,有多家投资机构人士对此非常感兴趣。
据腾讯科技,金沙江创投主管合伙人朱啸虎早前表示,一旦 DeepSeek 开放融资,他肯定会投资。" 我肯定会投啊!我肯定会投!这个价格已经不太重要了,关键是参与在这里面。真的见证人类 AGI 产生,见证人类 AI 意识产生,这些东西都很有意义。"
朱啸虎强调,他认为 DeepSeek 还是应该开放融资的,因为再往前走是需要烧钱的,当前主要资源需求还是算力卡。
据悉,DeepSeek(深度求索,全称杭州深度求索人工智能基础技术研究有限公司)成立于 2023 年,总部位于杭州,由中资对冲基金幻方量化创立,DeepSeek 创始人、CEO 为梁文锋。
2023 年 10 月 28 日,DeepSeek 发表深度求索的第一个大模型 DeepSeek-Coder,11 月 29 日发布 DeepSeek-LLM。到 2024 年 12 月 13 日,DeepSeek 发布用于高级多模态理解的专家混合视觉语言模型—— DeepSeek-VL2。同月 26 日,DeepSeek 发布并开源了 DeepSeek-V3,引发关注。
DeepSeek 表示,该大模型的训练系基于 2048 块英伟达 GPU 集群上运行 55 天完成,训练耗资 557.6 万美元,而 DeepSeek-V3 的评测成绩超越 LLaMA 3.1-405B(Meta 自研大模型)等开源模型,能与 GPT-4o 等闭源模型相抗衡。
2025 年 1 月 20 日, DeepSeek 发布并开源了推理模型 DeepSeek-R1 模型,成本低于预期,但该模型在数学、代码、自然语言推理等任务上,性能与 OpenAI o1 正式版相当。到今年 1 月 27 日,DeepSeek 智能助手在美区苹果 App Store 下载榜上超越 ChatGPT,并登顶 App Store 免费应用榜榜首。
据报道,DeepSeek 的员工规模不到 140 人。梁文锋曾表示,留住年轻人才的方法主要是 " 高薪 " 和 " 算力管够 " 两条路。
" 我们看到的是中国 AI 不可能永远处在跟随的位置。我们经常说中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。" 梁文锋称。
来源:钛媒体