文章来源:深网

2024年上半年,已经决定投资欧洲人工智能Mistral AI的宋春雨,回国第一时间便要求团队在国内寻找商业模式和Mistral AI相似的创业公司。

Mistral AI成立于2023年4月,由三位前谷歌DeepMind和Meta的科学家联合创立。早期他们推出的开源模型Mistral 7B曾凭借超低的调用成本及比肩GPT-3.5的性能,迅速成为OpenAI最有力的竞争对手。

宋春雨是联想创投集团高级合伙人和首席投资官,是AI领域的投资老兵,投资项目覆盖AI1.0至AI2.0时代不少明星项目——旷视科技、第四范式、寒武纪、阶跃星辰、智谱AI等。但在基础大模型最火的2023年,宋春雨没有投任何一个基础大模型公司,反而是投资了开源社区、上层应用及一些算力芯片公司。

“当时在海内外,GPT-4都非常火。但因为调用GPT-4成本高,这种模式不长久,我们要找的是能把大模型像水、电、煤一样接入社会基础设施的公司。”宋春雨说。

宋春雨在海外投资了Mistral AI,而在国内发现了同样开源且采用MoE架构的Deepseek。

“我去年2月就和梁文锋在交流,但他们不融资。梁文锋对商业化不感兴趣,他专注打磨基础模型,确保每一代模型都保持领先。”宋春雨说。

今年,宋春雨在AI领域的投资方向已经开始向智能体、AI原生应用以及具身智能等方向迁移,关注大模型如何重构物理世界。

以下是宋春雨对于基础大模型技术迭代、Deepseek不融资、中美AI差距、AI原生应用、具身智能、自动驾驶等看法,在不改变原意的基础上有所删减:

梁文锋拒绝融资背后的逻辑

问:你决定投资Mistral AI主要是因为这家公司是开源的吗?

宋春雨:开源的魅力在于将最先进的成果公开,使大家能够快速学习并在其基础上进行创新。这使得当前各大模型的学习和进化速度比以往快了几倍。例如,OpenAI在去年12月6日发布o1正式版,Deepseek-R1在今年年初达到与o1相似的性能水平。此后,行业内几乎每个月都会出现试图对标o1和R1的新模型。

开源也促进了算法、架构等技术的迅速传播与应用。比如,Deepseek取得成功之后,Meta在其Llama 4中也采用了MoE架构。Mistral之所以在2023年底迅速走红,是因为其开源的MoE大模型Mistral 8x7B性能达到了GPT-3.5的水平。

我们于去年年初投资了Mistral。我回到国内后,就要求我们的投资团队在国内寻找能够和Mistral对标的、并采用MoE架构的开源模型。去年2月份我们就和梁文锋有深度交流,但他们不融资。

问:不缺钱?
宋春雨:我个人觉得梁文锋是坚信AGI的人。第一,他是技术极客背景出身,他给自己的使命就是要去摸AGI的上限,或者说人类能达到硅基智能的上限是什么?他对商业化不感兴趣,这一轮Deepseek浪潮中,在用户体验方面,最大的赢家是腾讯的元宝,梁文锋所有的卡都用来做下一代的模型了。

梁文锋和DeepSeek公司主体(杭州深度求索人工智能基础技术研究有限公司)本身也不差钱,这点很重要,他们可以养的起团队。现在很多投资机构和大厂都要给DeepSeek融资,但梁文锋不接,因为他有实现AGI的使命感。从这一点来看,DeepSeek某种程度上回归了OpenAI最初作为非营利组织的初心与愿景。

所以开源的DeepSeek代表代际模型的最高水平,部署成本仅是闭源模式的几十分之一。马斯克下的xAI训练出对标o1和R1水平的模型,大约用了20万张卡,但梁文锋团队用的少了一个量级。

问:DeepSeek对创投行业也是分水岭?
宋春雨:是的。从去年开始,我们一直在找拐点。在DeepSeek出来之前,中国创业者用GPT-4更多,但因为调用GPT-4成本高,这种模式不长久,我们要找的是能把大模型像水、电、煤一样接入社会的基础设施。

就像4G通信技术的普及曾催生移动互联网原生应用,比如滴滴、拼多多、大众点评、美团、小红书等。我们相信,AI时代也会诞生AI原生的Super APP。在DeepSeek出来之前,受基础模型性能与成本的双重制约,当时大家觉得这个Super APP很难出现。

问:为什么?
宋春雨:用户对基础模型还没有培养起高度的使用粘性。比如在DeepSeek推出之前,豆包拥有1亿到1.5亿用户,但DeepSeek上线后,大量用户开始迁移。这也正是我特别佩服梁文锋的地方——他专注打磨基础模型,确保每一代模型都保持领先,只要模型足够好,客户自然会来。

问:你怎么评价梁文锋?
宋春雨:他是我心中最完美的AGI创业者,初心纯粹,笃定AGI方向。

    

    © 2025 加国生活网life416