
今年春节档,国产大模型迎来一波密集更新:智谱发布了新一代旗舰模型 GLM-5;Minimax 推出 Minimax 2.5;DeepSeek 已在网页和App端升级,上下文长度从128K猛增到100万Token——相当于能一次性读完一整部长篇小说;阿里通义千问的 Qwen 3.5 和 字节跳动的豆包大模型 2.0 也预计将在春节期间亮相。
这些新模型普遍聚焦两大能力:编程 和 智能体(即能自主思考、执行任务的AI代理)。
随着智能体处理的任务越来越复杂,单次运行消耗的算力(Token)急剧上升。如果成本降不下来,未来AI的大规模普及可能会被“烧钱”拖住脚步。技术跑得快,但能不能用得起,才是落地的关键。
|智能体时代加速到来
就在春节前夕,国产大模型迎来重磅升级:MiniMax 推出 M2.5:专为“AI智能体”而生。
这是全球首个为智能体(Agent)场景原生设计的生产级模型,编程和智能体能力直追国际顶尖水平,对标 Anthropic 的 Claude Opus 4.6。特别擅长 Excel 高阶处理、深度调研、PPT 制作等办公场景,表现已达行业领先(SOTA),虽然激活参数仅 100亿(10B),但效率极高:显存占用低、推理速度快,支持 每秒100次请求(100 TPS)的超高吞吐量,远超同类国际模型。
智谱发布 GLM-5:参数翻倍,性能跃升。
参数规模从上一代 3550亿 扩展到 7440亿,激活参数也从 32B 提升至 40B,在前后端开发、长任务处理等编程场景中,性能平均提升超20%。真实编程体验已接近 Claude Opus 4.5,受此利好,智谱港股股价4天内从203港元飙至443港元,几乎翻倍,市值逼近 MiniMax。
|智能体,成了国产大模型竞争的新“主战场”
国产大模型的竞争,已经不再拼谁参数更大,而是进入新阶段——比的是技术特色、场景落地能力,以及成本和效率。
今年春节前后,各大厂商的动作都围绕这个核心展开:腾讯元宝、阿里千问通过红包营销吸引用户,强化生态布局;字节跳动推出 Seedance 2.0,DeepSeek 升级 V4 模型,MiniMax 上线 Agent 平台。
这些更新有一个共同点:越来越聚焦“智能体”(Agent)能力。
什么是智能体?
简单说,就是能让AI不只聊天回答问题,还能主动思考、调用工具、执行任务的系统。比如自动订票、写代码、做调研、生成PPT等。
通用大模型在专业、复杂的业务场景中往往“力不从心”。而智能体通过整合专业知识、调用外部工具、编排工作流程,能真正深入金融、医疗、制造等垂直领域,提供自动化、高价值的解决方案。
这也反映了市场心态的变化:大家不再为“AI能聊多好”买单,而是更关心——它能不能在真实工作中帮我干活、提效、省钱?
|AI规模化落地仍要过成本关
尽管国产AI发展迅猛,但要真正大规模落地,仍面临几大现实挑战:
1. 生态“碎片化”,缺乏统一标准
从芯片、开发框架到大模型和应用,国内AI产业链各环节“各自为战”,接口不兼容、工具不互通,增加了开发和部署的复杂度,亟需更统一的生态体系。
2. 成本太高,企业算不清“回报账”
虽然调用API越来越便宜,但很多企业出于安全或合规考虑,仍希望把AI模型私有化部署在本地;这意味着要一次性投入大量资金买服务器、建机房,还要长期养运维团队;如果不能清晰证明AI能带来可量化的业务收益(比如降本、增收),企业很难下决心投入。
更麻烦的是:随着智能体任务越来越复杂——比如自动完成一份市场报告,需要查数据、写分析、做图表——
单次任务消耗的算力(Token)暴增,成本居高不下。
如果降不下来,AI智能体就只能用在“高价值、低频”场景,难以普及到日常业务中。
3. 可靠性不足,“幻觉”仍是硬伤
在金融、医疗、制造等对准确性要求极高的行业,AI一旦“胡说八道”(即产生“幻觉”),后果可能很严重;
当前模型在执行多步骤复杂任务时,错误容易一步步累积,最终导致整个流程失败;没有足够可靠性,企业就不敢让AI真正“上岗干活”。
4. 治理与信任机制还没跟上
当AI从“辅助建议”走向“自主执行”,新问题来了:
权限怎么管?AI能操作哪些系统?出了问题谁负责?是开发者、企业,还是AI自己?操作过程能不能被审计追溯?
只有把这些治理问题解决清楚,企业才敢真正把关键任务交给AI。
5. 数据安全与隐私仍是敏感门槛
尤其在政务、金融、医疗等领域:企业担心数据上传到公有云会“出域”泄露;模型训练数据是否合规、有没有偏见,也让人担忧;智能体在与用户交互过程中,如何保护隐私,仍是技术+制度的双重难题。
竞太观点|拥抱“能落地”的AI,警惕“纯参数”泡沫
对A股/港股科技股:
优先布局具备垂直场景智能体能力的公司:如金融、医疗、政务、制造等领域的AI解决方案商;关注国产算力+模型协同生态:华为昇腾、寒武纪、科大讯飞、智谱AI(港股)等;谨慎对待纯大模型概念股——若无真实客户、无成本控制、无治理框架,难逃“PPT AI”质疑。
对一级市场/创业者:
切入高价值、低容错场景需谨慎(如医疗诊断、工业控制);更适合从办公提效、客服自动化、营销生成等中低风险领域切入;核心能力不是“模型多大”,而是“任务闭环+成本可控+可解释”。
对企业用户:
可试点SaaS化智能体服务(如MiniMax、阿里云百炼平台),避免重资产投入;重点评估:错误率、审计能力、数据不出域三大底线。





