1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。而其竞技场得分达到1357分,略超OpenAI o1的1352分。这是继DeepSeek-V3在剔除OpenAI o1等闭源模型排名开源模型类第一后,DeepSeek-R1向全球最强AI大模型的再一次进击。
|DeepSeek震惊硅谷
最近,AI界可是被一家来自中国的初创公司 —— 深度求索(DeepSeek),搅得 “天翻地覆”!短短一个月,深度求索就接连发布了DeepSeek-V3 和DeepSeek-R1两款大模型,关键是,它们不仅成本低,性能还能和OpenAI 一较高下,这可把硅谷惊到了,连Meta 的工程师们都吓得连夜 “加班”,试图复制 DeepSeek的成功。
Scale AI 的创始人Alexander Wang 在1 月24 日接受采访时,毫不吝啬对DeepSeek的夸赞,直言在他们的测试中,DeepSeek表现最佳,和美国顶尖模型水平相当。之前,Alexander Wang 就评价DeepSeek-V3 是中国科技界送给美国的 “苦涩教训”,还感慨道:“当美国在休息时,中国(科技界)可是在埋头苦干,以更低的成本、更快的速度和更强的实力迎头赶上。”
中国AI 的这波 “神操作”,也成功吸引了国外各大媒体的目光,纷纷报道,他们觉得中国大模型的新突破,就像给硅谷敲响了警钟。
更让人惊讶的是,在5000 亿美元的 “星际之门” 计划公布之时,DeepSeek没用尖端芯片,就以超低的成本打造出了突破性的AI 模型,这不禁让人产生疑问:在AI行业,砸下数千亿美元的巨额资本,真的是最有效的发展方式吗?
|DeepSeek-R1:聊天机器人竞技场的新星
在最新的聊天机器人竞技场综合榜单中,DeepSeek-R1以出色的表现脱颖而出,与顶尖推理模型o1并列第三。然而,更令人瞩目的是,在一些特定领域,DeepSeek-R1展现出了绝对的优势。
当涉及到高难度提示词、代码编写以及数学问题等技术性极强的挑战时,DeepSeek-R1一马当先,荣登榜首。这表明在处理复杂任务和专业领域的问题上,DeepSeek-R1具备无可比拟的能力。
不仅如此,在风格控制方面,DeepSeek-R1与o1并驾齐驱,共同占据第一的位置。这意味着该模型不仅能够准确理解用户的指令,还能根据用户的需求生成符合特定风格的内容。无论是正式报告还是轻松对话,DeepSeek-R1都能游刃有余地应对。
在结合了高难度提示词与风格控制的测试中,DeepSeek-R1再次与o1并列第一,进一步证明了它在执行复杂任务和精细化内容控制方面的强大实力。这种能力使得DeepSeek-R1不仅能解决难题,还能以用户期望的方式呈现结果。
Artificial-Analysis对DeepSeek-R1进行了初始基准测试,结果显示其在AI分析质量指数中获得了第二高的评分。更为吸引人的是,DeepSeek-R1的价格仅为o1的约三十分之一,为用户提供了一个极具性价比的选择。
|DeepSeek以低成本挑战巨头
斯坦福大学和Epoch AI的研究人员去年年中发布的一项研究表明,到2027年,训练最大型AI模型的成本可能超过10亿美元。Gartner预测,到2028年,Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将达到惊人的5000亿美元。然而,在这个资本密集型领域中,一家名为DeepSeek的公司却走出了截然不同的道路。
Noah's Arc资本管理公司指出,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。与其他公司动辄数十亿甚至上百亿美元的投资不同,DeepSeek的训练成本相对低廉。这种高性价比的解决方案让业界重新思考,“大力出奇迹”的巨额投入是否真的是最有效的方法?
美股知名大V“THE SHORT BEAR”在1月24日通过X平台(前Twitter)发文称:“DeepSeek给AI巨头们带来了痛苦时刻,投资者必须对此敲响警钟。”他进一步解释道:“如果击败OpenAI只需要5500万美元,那么AI行业的商业化进程可能会比许多人预想的要快得多。”
他还提到:“根据红杉资本的数据,美国的AI公司每年需要产生大约6000亿美元的收入来支付其AI硬件费用。现在看来,这种高额投入正变得越来越无利可图。”
著名财经记者Holger Zschaepitz也在1月25日表示,DeepSeek以极低的价格建立了一个突破性的AI模型,并且没有依赖尖端芯片。这引发了对整个行业数千亿美元资本支出效用的质疑。有投资者认为,美股中的芯片股股价也可能因此面临挑战。
投资者Geiger Capital表示:“DeepSeek不仅与OpenAI一样出色,甚至更胜一筹,而其成本仅为后者的3%。与此同时,美国公司却投入了数千亿美元。那么……纳斯达克会怎样呢?”值得注意的是,自从DeepSeek-V3发布以来,英伟达的股价已经下跌了2%。而在DeepSeek-R1引发海外广泛讨论后的1月24日,英伟达的股价更是大跌了3.12%。
|技术实力与商业化挑战并存
在业内人士眼中,DeepSeek相较于国内其他大模型创业公司显得尤为幸运。它不仅没有融资的压力,也无需向投资人证明其价值,更不必在技术迭代和产品应用优化之间疲于奔命。这种自由让DeepSeek能够专注于技术创新,而不被短期的商业目标所束缚。
然而,作为一家商业公司,DeepSeek迟早会面临与其他模型公司同样的压力和挑战。尽管目前它似乎游刃有余,但未来的商业化道路依然充满了不确定性。
对于国内的AI模型行业而言,DeepSeek这样具备真正技术实力的公司的加入无疑是一件好事。它不仅提升了行业的整体技术水平,也为其他公司树立了榜样。正如某业内资深人士所说:“有像DeepSeek这样的公司存在,整个行业都会因此受益。”