网站首页 > 市场观察 > 行业动态
DeepSeek要融资了!
发布时间:2026-04-26

26560198-euaInt.jpg?auth_key=1777219199-

据外媒The Information报道,国产大模型公司DeepSeek正在寻求首次外部融资!


这家公司过去一直坚持“不拿外部投资”,但现在打算打破这一惯例——计划以不低于100亿美元的估值,至少融资3亿美元。


原因很简单:AI大模型研发极其烧钱,即使是DeepSeek,也需要充实自己的“弹药库”,为接下来的竞赛储备资金。


01


|启动首次外部融资

曾经的DeepSeek,是个“不差钱也不融资”的硬核玩家。它隶属于国内对冲基金巨头幻方量化,在2025年推出DeepSeek R1大模型后,一鸣惊人,连硅谷和华尔街都为之震动。


尽管当时多家顶级风投和科技巨头主动上门想投资,DeepSeek全都一一拒绝。创始人梁文锋一直是个技术理想主义者,希望公司能保持独立,不受资本干扰,专注做真正想做的AI。


但如今情况变了——距离R1发布已经一年半,行业都在飞速前进,而DeepSeek的新模型V4却迟迟未上线。


与此同时,全球AI竞争白热化:美国的OpenAI、谷歌、Meta,中国的百度、阿里、字节、智谱……这些巨头靠着雄厚资金疯狂投入算力、人才和产品迭代,不断抢占高地。


面对压力,梁文锋终于松口:启动首次外部融资。如果成功,DeepSeek将能:买更多算力(训练大模型最烧钱的部分)开出更高薪水,留住顶尖AI人才。不过,作为一家中国AI初创公司,一些美国投资人可能会犹豫,担心地缘政治风险。


02


|V4 不只是“升级”,而是一次全面飞跃

根据多家媒体报道,DeepSeek 的新一代大模型 V4 虽然多次跳票(原定2026年2月发布),但很可能就在4月底正式上线。


1. 更大、更聪明,但不更贵

参数总量达到1万亿,采用 MoE(混合专家)架构。每次推理只激活约 370亿参数,所以运行成本和上一代V3差不多。延续了 DeepSeek 一贯的“高效优先”理念:性能强,但不瞎烧钱。

2. 能记住超长内容——上下文长达100万字

引入新架构 Engram(记忆系统),可以快速精准地从百万字中找回关键信息。内部测试显示:在100万token长度下,信息召回率高达97%(V3在12.8万token时远不如这个水平)。


3. 首次支持多模态:文字、图片、视频都能处理

过去 DeepSeek 只做纯文本模型,而 V4 是第一个原生支持图像和视频生成的版本。这一步让它终于跟上了 GPT-4、Claude 等国际主流模型的步伐。


4. 代码能力大幅升级,专治复杂Bug

V4 从立项起就以“最强代码模型”为目标。内部测试成绩亮眼:SWE-bench(真实世界编程任务)得分超80%、HumanEval(算法题)达90%。它甚至能理解整个代码仓库,自动修复复杂Bug,在长上下文代码推理上有望超越GPT和Claude。


两个版本,适配不同需求

完整版:超万亿参数,专为高难度推理和代码任务设计,适配华为昇腾芯片。轻量版(V4 Lite):约2000亿参数,用于日常对话和API服务,可在其他国产芯片上运行。


有趣的是,3月9日,V4 Lite 曾短暂上线又撤下;4月初,开发者又在API中发现测试版——推理速度提升30%,128K上下文召回率从45%飙升到94%。


V4 将继续开源,模型权重按 Apache 2.0 协议开放。DeepSeek 最近还在内蒙古乌兰察布招聘服务器运维和交付经理——这是公司首次招驻场算力基建人员,说明 V4 已走出实验室,进入大规模部署倒计时。


综合多方消息,DeepSeek V4 很可能在2026年4月底正式发布。如果如期上线,它将成为中国大模型阵营中首个兼具超长上下文、多模态、顶尖代码能力和高效推理的旗舰产品。


03


|脱离英伟达生态?

V4推迟发布,问题不在模型本身,而在“换心脏”——DeepSeek 正在把整个技术底座从英伟达芯片,全面迁移到华为昇腾芯片。


过去,DeepSeek 所有模型都跑在英伟达 GPU 上,依赖的是 CUDA 这套成熟的生态。但 V4 不一样:它要完全适配华为的 CANN 软件架构。


这意味着工程师们得重写大量底层代码,相当于把一辆跑车的发动机从进口换成国产,还要保证性能不降。


这不仅是技术挑战,更是一次战略选择:DeepSeek 没有提前给英伟达或 AMD 提供 V4 用于优化;反而把早期测试权限独家给了国产芯片厂商。


如果 V4 最终能在华为芯片上跑出媲美甚至接近英伟达的性能,它将成为全球第一个不依赖英伟达的顶尖大模型。


这件事连英伟达 CEO 黄仁勋(“老黄”)都坐不住了。他在最近采访中直接说:“DeepSeek 基于华为平台的新模型,对美国来说将是一个糟糕的结果。”


为什么?


因为一旦最前沿的 AI 模型在中国芯片上跑得更好、更便宜、更高效,那英伟达长期以来的技术护城河就可能被打破。

那3亿美元,到底图什么?


DeepSeek 一直以“省钱高效”著称,但如今光靠母公司幻方量化“输血”也不够了。根据斯坦福大学《2026 AI指数报告》,截至2026年3月,中美顶级AI模型的性能差距只剩2.7个百分点。


越接近,每提升一点点,成本就越高。对比来看:OpenAI 刚融了 400亿美元,估值高达 3000亿美元;DeepSeek 要融的 3亿美元,看似不多,但目标明确——不是为了多烧钱,而是为了彻底摆脱对英伟达的依赖。


04


竞泰观点|关注三条链路

一年半前,DeepSeek R1让世界看到:中国团队不用天量资金,也能做出惊艳模型。一年半后,DeepSeek V4想证明更难的事:不用英伟达,也能跑出世界级AI。


1. AI模型层:DeepSeek若成功,将重塑全球格局

若V4在昇腾上性能接近GPT-5/Claude 4,国产AI生态将获得关键支点;开源策略有望吸引全球开发者,形成“中国版Hugging Face”。


 2. 算力基础设施:华为昇腾产业链受益

华为昇腾:核心受益者,验证其支撑前沿大模型的能力;国产算力服务商:如寒武纪、海光、壁仞等,若生态打开,机会可期;数据中心与液冷:乌兰察布等地的算力基建需求将激增。


3. AI应用层:代码与多模态是突破口

V4强在代码生成与长上下文理解,利好AI编程工具、智能客服、科研辅助等场景;多模态能力补全后,教育、内容创作、工业设计等领域或迎新应用。


风险提示:地缘政治限制、技术落地不及预期、人才流失。


统一服务热线:
18117862238
邮箱地址:zhangruxia@jt-capital.com.cn
公司地址:成都市高新区泰合·国际金融中心18层

Copyright © 2021 jt-capital.com.cn All Rights Reserved 

版权所有: 竞泰资本 粤ICP备2022003949号-1  

快速链接

Copyright © 2021 jt-capital.com.cn All Rights Reserved 

版权所有: 竞泰资本 粤ICP备2022003949号-1