2018年以来,预训练语言模型(PLM)及其“预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,该范式先利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标注数据进行有监督学习微调模型参数,实现下游任务的适配。在AI的1.0时代,存在模型碎片化明显、AI泛化能力不足等问题。
“预训练+微调”大模型能显著降低AI工程化门槛,预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,细分场景的应用厂商能够基于大模型通过零样本、小样本学习即可获得显著的效果,使得人工智能有望构建成统一的智能底座,AI+赋能各行各业。
本轮的生成式AI有望从简单的内容生成,逐步达到具有预测、决策、探索等更高的认知智能。
|人工智能的发展历程
|大模型快速爆发,重新定义人工智能产业
2018年以来,预训练语言模型(PLM)及其“预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,该范式先利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标注数据进行有监督学习微调模型参数,实现下游任务的适配。
规模越大的模型不仅在已知任务上有着更好的表现,同时展现出完成更复杂的未知任务的强大泛化能力。
|人工智能产业链
AI产业链主要包括基础层、技术层、应用层三大层。
|人工智能产业分类
AI模型大致可以分为决策式AI和生成式AI两种。决策式AI指学习数据中的条件概率分布,根据已有数据进行分析、判断、预测,主要应用模型有用于推荐系统和风控系统的辅助决策、用于自动驾驶和机器人的决策智能体。
生成式AI指学习数据中的联合概率分布,并非简单分析已有数据而是学习归纳已有数据后进行演技创造,基于历史进行模仿式、缝合式创作,生成了全新的内容,也能解决判别问题。
人工智能在经历前期技术积累和迭代后,逐渐突破传统分析型AI领域,迎来生成式AI的爆发期。从2012年至今,生成式AI急速发展,其源头就是DNN算法的升级,实现了语音和图像识别等功能。
|生成式人工智能应用领域
生成式人工智能的重大意义就在于能够为当前人力和AI 技术无法突破的难题提供可行的解决方案,从而颠覆了整个商业规则和运营模式。以下案例均为生成式AI 工具在前期发展阶段已经可以赋能的应用场景。
|全球市场规模预测
据彭博研究数据预测,全球生成式AI 市场 2023年收入规模约 670亿美元,到 2032年该规模将接近13,040亿美元,占总信息技术支出比例预计十年内从现阶段的小于1%增至10~12%。
从投资角度看,IDC预计 2023 年全球AIGC 投资规模为160 亿美元,2027年将达到约 1430亿美元,且其投资额占AI 整体支出比例将增至28%(2023年 9%)。
未来,AIGC应用将日渐普及,IDC最新报告显示,到2027年,全球约45%的企业将采用生成式人工智能工具进行产品和服务的开发和运营。
|中国市场规模预测
中国将引领亚太区AIGC 投资,实现相关技术产业规模的爆发式增长。IDC最新预测数据显示,中国将继续成为亚太地区人工智能市场发展的主要增量,相关投资在亚太地区AI 总支出占比中超50%,约占全球AI 技术投资总规模的9%。作为向自动化和通用生产力迈进的关键技术,国内生成式AI 技术投资占比预计将在2027 年达到33.0%(2022年4.6%),投资规模超130亿美元,五年复合增长率为86.2%。
艾瑞咨询数据显示,目前中国仍处于大模型生态培育期,2023年 AIGC产业规模约为143 亿元,基本完成大模型最底层算力和应用平台等新型基础设施的搭建。预计于2028 年前后完成重点领域、关键场景的技术价值兑现,实现7,202 亿元的市场规模。
预计2030 年中国AIGC 产业规模有望突破万亿元,达到11,441 亿元,年复合增长率为115%。