DeepSeek要融资了！

EN / 中文

网站首页 > 市场观察 > 行业动态

DeepSeek要融资了！

发布时间：2026-04-26

26560198-euaInt.jpg?auth_key=1777219199-

据外媒The Information报道，国产大模型公司DeepSeek正在寻求首次外部融资！

这家公司过去一直坚持“不拿外部投资”，但现在打算打破这一惯例——计划以不低于100亿美元的估值，至少融资3亿美元。

原因很简单：AI大模型研发极其烧钱，即使是DeepSeek，也需要充实自己的“弹药库”，为接下来的竞赛储备资金。

｜启动首次外部融资

曾经的DeepSeek，是个“不差钱也不融资”的硬核玩家。它隶属于国内对冲基金巨头幻方量化，在2025年推出DeepSeek R1大模型后，一鸣惊人，连硅谷和华尔街都为之震动。

尽管当时多家顶级风投和科技巨头主动上门想投资，DeepSeek全都一一拒绝。创始人梁文锋一直是个技术理想主义者，希望公司能保持独立，不受资本干扰，专注做真正想做的AI。

但如今情况变了——距离R1发布已经一年半，行业都在飞速前进，而DeepSeek的新模型V4却迟迟未上线。

与此同时，全球AI竞争白热化：美国的OpenAI、谷歌、Meta，中国的百度、阿里、字节、智谱……这些巨头靠着雄厚资金疯狂投入算力、人才和产品迭代，不断抢占高地。

面对压力，梁文锋终于松口：启动首次外部融资。如果成功，DeepSeek将能：买更多算力（训练大模型最烧钱的部分）开出更高薪水，留住顶尖AI人才。不过，作为一家中国AI初创公司，一些美国投资人可能会犹豫，担心地缘政治风险。

｜V4 不只是“升级”，而是一次全面飞跃

根据多家媒体报道，DeepSeek 的新一代大模型 V4 虽然多次跳票（原定2026年2月发布），但很可能就在4月底正式上线。

1. 更大、更聪明，但不更贵

参数总量达到1万亿，采用 MoE（混合专家）架构。每次推理只激活约 370亿参数，所以运行成本和上一代V3差不多。延续了 DeepSeek 一贯的“高效优先”理念：性能强，但不瞎烧钱。

2. 能记住超长内容——上下文长达100万字

引入新架构 Engram（记忆系统），可以快速精准地从百万字中找回关键信息。内部测试显示：在100万token长度下，信息召回率高达97%（V3在12.8万token时远不如这个水平）。

3. 首次支持多模态：文字、图片、视频都能处理

过去 DeepSeek 只做纯文本模型，而 V4 是第一个原生支持图像和视频生成的版本。这一步让它终于跟上了 GPT-4、Claude 等国际主流模型的步伐。

4. 代码能力大幅升级，专治复杂Bug

V4 从立项起就以“最强代码模型”为目标。内部测试成绩亮眼：SWE-bench（真实世界编程任务）得分超80%、HumanEval（算法题）达90%。它甚至能理解整个代码仓库，自动修复复杂Bug，在长上下文代码推理上有望超越GPT和Claude。

两个版本，适配不同需求

完整版：超万亿参数，专为高难度推理和代码任务设计，适配华为昇腾芯片。轻量版（V4 Lite）：约2000亿参数，用于日常对话和API服务，可在其他国产芯片上运行。

有趣的是，3月9日，V4 Lite 曾短暂上线又撤下；4月初，开发者又在API中发现测试版——推理速度提升30%，128K上下文召回率从45%飙升到94%。

V4 将继续开源，模型权重按 Apache 2.0 协议开放。DeepSeek 最近还在内蒙古乌兰察布招聘服务器运维和交付经理——这是公司首次招驻场算力基建人员，说明 V4 已走出实验室，进入大规模部署倒计时。

综合多方消息，DeepSeek V4 很可能在2026年4月底正式发布。如果如期上线，它将成为中国大模型阵营中首个兼具超长上下文、多模态、顶尖代码能力和高效推理的旗舰产品。

｜脱离英伟达生态？

V4推迟发布，问题不在模型本身，而在“换心脏”——DeepSeek 正在把整个技术底座从英伟达芯片，全面迁移到华为昇腾芯片。

过去，DeepSeek 所有模型都跑在英伟达 GPU 上，依赖的是 CUDA 这套成熟的生态。但 V4 不一样：它要完全适配华为的 CANN 软件架构。

这意味着工程师们得重写大量底层代码，相当于把一辆跑车的发动机从进口换成国产，还要保证性能不降。

这不仅是技术挑战，更是一次战略选择：DeepSeek 没有提前给英伟达或 AMD 提供 V4 用于优化；反而把早期测试权限独家给了国产芯片厂商。

如果 V4 最终能在华为芯片上跑出媲美甚至接近英伟达的性能，它将成为全球第一个不依赖英伟达的顶尖大模型。

这件事连英伟达 CEO 黄仁勋（“老黄”）都坐不住了。他在最近采访中直接说：“DeepSeek 基于华为平台的新模型，对美国来说将是一个糟糕的结果。”

为什么？

因为一旦最前沿的 AI 模型在中国芯片上跑得更好、更便宜、更高效，那英伟达长期以来的技术护城河就可能被打破。

那3亿美元，到底图什么？

DeepSeek 一直以“省钱高效”著称，但如今光靠母公司幻方量化“输血”也不够了。根据斯坦福大学《2026 AI指数报告》，截至2026年3月，中美顶级AI模型的性能差距只剩2.7个百分点。

越接近，每提升一点点，成本就越高。对比来看：OpenAI 刚融了 400亿美元，估值高达 3000亿美元；DeepSeek 要融的 3亿美元，看似不多，但目标明确——不是为了多烧钱，而是为了彻底摆脱对英伟达的依赖。

竞泰观点｜关注三条链路

一年半前，DeepSeek R1让世界看到：中国团队不用天量资金，也能做出惊艳模型。一年半后，DeepSeek V4想证明更难的事：不用英伟达，也能跑出世界级AI。

1. AI模型层：DeepSeek若成功，将重塑全球格局

若V4在昇腾上性能接近GPT-5/Claude 4，国产AI生态将获得关键支点；开源策略有望吸引全球开发者，形成“中国版Hugging Face”。

2. 算力基础设施：华为昇腾产业链受益

华为昇腾：核心受益者，验证其支撑前沿大模型的能力；国产算力服务商：如寒武纪、海光、壁仞等，若生态打开，机会可期；数据中心与液冷：乌兰察布等地的算力基建需求将激增。

3. AI应用层：代码与多模态是突破口

V4强在代码生成与长上下文理解，利好AI编程工具、智能客服、科研辅助等场景；多模态能力补全后，教育、内容创作、工业设计等领域或迎新应用。

风险提示：地缘政治限制、技术落地不及预期、人才流失。

上一条：Anthropic正全面抢走OpenAI的风头！

下一条：宁德时代为何要花300亿成立新投资平台？

返回列表

统一服务热线：

18117862238

邮箱地址：zhangruxia@jt-capital.com.cn
公司地址：成都市高新区泰合·国际金融中心18层

快速链接

微信咨询
电话咨询

18117862238
返回顶部