2026年4月的某个周末,北京首都机场T3航站楼出现了罕见的一幕:
数十位投资机构的合伙人、董事总经理,不约而同地订下了同一时段的航班。他们的目的地各异——杭州、深圳、或者只是“待定”——但目标一致:见到梁文锋。
这位DeepSeek创始人,曾经让三拨中间人带话都拒绝见面的“技术极客”,终于“松口”了。
据外媒The Information报道,DeepSeek正在寻求首次外部融资,目标估值不低于100亿美元,计划募资至少3亿美元。如果交易落地,这将是中国AI大模型领域2025年最受瞩目的融资事件之一。
图源:网络
时间倒回一年多前。
五源资本创始合伙人刘芹通过三拨关系约见梁文锋,均被婉拒。对方的理由大致相同:觉得他们缺乏创新精神,“道不同不相为谋”。
元禾璞华管理合伙人陈大同稍幸运一些。
因投资领域涉及芯片,与DeepSeek有业务交集,才得以和团队有过交流,“算是获得了一点接触机会”。
最尴尬的当属百度风投。
其北京办公室与DeepSeek同楼办公,却因“幻方量化的大模型业务未拆分独立融资”这一技术原因,与其他VC一样错失投资机会。CEO高雪后来专门澄清此事,语气里的遗憾藏不住。
图源:三言Pro
“给你们投了这么多钱,为什么没有给我们投出梁文锋?”
2025年春节后,这句质问在各地政府引导基金的LP会议上反复出现。
拿着政府钱的VC们,不得不一轮轮解释:不是我们不努力,是梁文锋真的不开放融资。
“好在所有机构都没投进去,要不然真的很难向上交代。”一位华南机构合伙人当时如此自嘲。
DeepSeek的“高冷”有其底气。
母公司幻方量化是国内量化私募巨头,管理规模峰值曾达千亿级别。
2025年幻方收益均值高达56.55%,根据估算可获得数亿美元收入。
相比之下,DeepSeek V3的单纯训练成本预算仅为约558万美元(不包括前期投入)。
图源:网络
梁文锋曾明确表示,研究经费来源于幻方的研发预算,“不必急于通过融资输血”。
更深层的考量是控制权。
梁文锋是典型的“技术极客”,对公司掌控欲极强。
他担心外部投资者会干预决策,特别是强迫DeepSeek过早商业化。他曾放话:“我们不做应用,我们只做研究和探索。”
看似固若金汤的堡垒,2025年开始出现裂缝。
首先是人才流失。
V3架构的关键贡献者罗福莉去了小米,核心研究员郭达雅被字节跳动挖走,多模态骨干阮翀转投元戎启行。
图源:网络
据晚点报道,郭达雅在字节的薪资潜在收益有近亿元,需满足一定条件才能拿全。不过,“近亿元”薪资传闻已被字节跳动副总裁李亮公开辟谣,但郭达雅加入字节、薪酬显著高于DeepSeek应该属实。
“不是不认同梁文锋的技术理想,是外面给的条件实在太有诱惑力。”
一位接近DeepSeek的人士透露,“DeepSeek从未融资,没有市场化估值锚点,员工手里的期权就是一张无法兑现的白条。”
其次是算力成本。
DeepSeek一直以“省钱、高效”著称,R1模型以极低训练成本震撼全球。
但下一代旗舰模型V4参数规模飙升至万亿级别,单次训练成本动辄数亿美金。
更关键的是技术路线的战略转向。
据多家行业媒体爆料,V4将深度适配华为昇腾芯片,大幅降低对英伟达CUDA生态的依赖。
图源:网络
从CUDA迁移到CANN架构,意味着核心代码重写、架构重构——这不仅是技术攻坚,更是资金上的“碎钞机”。
“2026年全球算力价格由于需求暴增而上涨,”一位AI基础设施投资人分析,“即便幻方赚钱能力极强,面对需要储备数万片国产顶级芯片的背景,单靠自有资金已经捉襟见肘。”
梁文锋开口要至少3亿美元,买的不是生存,是通往终局的入场券。
第一笔账:人才。
融资确立100亿美元+估值,员工期权瞬间有了清晰变现预期。
这是与OpenAI、字节跳动争夺顶尖华人AI科学家的筹码。
第二笔账:算力。
为V4的临门一脚储备弹药,确保在摆脱英伟达的豪赌中不至于断粮。
英伟达最新一代Blackwell芯片受到出口管制影响,获取存在限制。
国产替代已是必选项。
第三笔账:生态。
深度适配华为昇腾,若V4能在国产芯片上跑出有竞争力的性能,DeepSeek将成为国内少数实现从底层算力到模型层全栈国产适配的通用大模型之一。
图源:网络
这也是英伟达创始人黄仁勋近期公开表达关注的核心原因。
他在采访中直言,主流开源大模型在国产算力生态上规模化落地,“对美国来说将是一个糟糕的结果”——美国芯片在AI领域的护城河将被打开缺口。
消息传出后,投资圈的反应堪称"疯狂"。
“这个周末,投资人已经订好机票,务必要在这一次,见到梁文锋!”一位接近交易的人士描述,“以前是他不见人,现在是怕见不到他。”
但并非所有人都能上桌。
知情人士称,部分美国投资机构在是否参与上态度谨慎。
美国国会曾对DeepSeek提出过相关质疑,虽然目前该公司未被纳入任何美国贸易限制名单,但地缘政治风险始终悬在头顶。
估值也是博弈焦点。
100亿美元对应的是2025年初R1模型爆红后的窗口期溢价,但DeepSeek尚未推出新一代模型,V4因工程问题已多次推迟。有投资人私下表示:“估值不便宜,但错过这一轮,可能再也没有机会。” 也有投资人表示,100亿美元估值不贵,也可能是让一些特定基金能投得起,但口风上是不低于100亿美元,根据情况可以提高估值。
梁文锋“低头”了,但DeepSeek的“干净”时代是否结束?
或许,这只是理想主义的2.0版本。
拒绝资本是一种姿态,驾驭资本才是真正的能力。
3亿美元、不到3%的股权稀释,换来的是饱和式投入的算力弹药、市场化定价的人才激励、以及国产替代的战略纵深。
从适配华为昇腾那一刻起,DeepSeek的牌桌上就不只是大模型,而是整个中国AI算力的自主未来。
图源:网络
梁文锋正在为这场更大的战役,秣兵厉马。
而那些周末挤在机场的投资人们,争的不过是一张观战台的门票。