一年一度的国内“AI春晚”—— 智源大会又一次拉开了序幕。
2024年6月14日,AI行业盛会“2024北京智源大会”在中关村展示中心开幕。零一万物李开复与清华大学智能产业研究院的院长张亚勤炉边对话,百川智能CEO 王小川、智谱AI CEO 张鹏、月之暗面CEO 杨植麟、面壁智能CEO李大海等关键人物就目前AI界最关键的问题开启了一场大型探讨会。
|国产大模型迭代加速
在最近的访谈与会议中,智源研究院院长王仲远阐述了过去一年中国大模型技术的迅猛发展。他指出,国内大模型领域经历了从奋力追赶GPT 3.5到现今平均水平已超越GPT 3.5并紧追GPT4的显著进步,尤其在中文应用场景下展现出了超越国际先进水平的能力。
尽管如此,鉴于GPT4的持续演进,如GPT4o的发布带来的性能飞跃,国产大模型的迭代与优化仍然面临着紧迫的挑战。
智源研究院在大模型技术的探索上取得了多项创新成果,包括与电信人工智能研究院合作推出的Tele-FLM-1T,作为首个低碳万亿语言模型,以及为解决大模型幻觉问题研发的BGE系列模型和下一代多模态模型Emu3的问世。王仲远同时强调,尽管国产大模型已达到可用性标准,但要达到高度优化仍有很长的路要走,特别是在算力整合、核心算法和系统工程等关键技术难题上。
关于大模型发展的加速器,规模法则(Scaling Law)成为行业热议焦点。李开复等业界领袖认为,AI 2.0时代背景下,规模法则对于推动大模型智慧增长至关重要,且其潜力远未饱和。
不过,也有如杨植麟、张鹏、王小川和李大海等行业专家指出,虽然认同规模扩增的重要性,但单纯依赖数据和算力的增加并非通往通用人工智能(AGI)的唯一路径,还需在学习范式、模型训练方法及系统性创新上寻求突破。
这些观点共同勾勒出大模型领域既充满机遇又面临挑战的复杂图景。
|从C端潜能到AI安全的全面审视
在访谈中,王仲远对大模型的未来应用持乐观态度,预计未来两三年将迎来B端应用的广泛普及,并承认C端市场虽期待爆款,但需耐心等待模型成熟至既经济高效又能直击用户需求的阶段。他强调,迈向AGI时代的技术路径或将跨越单一语言模型限制,融合多模态理解与决策能力,最终导向具身智能及科学领域的深度应用。
OpenAI Sora团队负责人Aditya Ramesh则在与学术界互动时表达了对语言模态重要性的认可,同时也预见了将语言信息与视觉信号融合的潜力,预示着模型对语言的依赖或将减弱。
针对当前视频生成模型的热潮,Aditya强调了安全性与社会影响的关注,透露Sora团队正聚焦于增强模型的可控性和减少随机性以响应合作伙伴需求。
会议中,AI安全作为核心议题备受关注,杨植麟博士重申其对未来的重要性,尤其是在模型能力随Scaling Law呈指数级增长的背景下,防范用户恶意利用及预先构建模型行为规范成为维护AI安全的双轨策略。
这表明,在追求技术进步的同时,行业亦需前瞻布局,确保AI技术的健康发展与社会正面影响。
|开源的力量与正向循环
李大海强调开源生态的多维度价值,指出其不仅汇聚了原创工作的推动力,还吸纳了广泛的需求输入与反馈循环,形成了一个良性共生的环境。
他认为,积极参与开源贡献能为公司带来正面收益,促进技术与业务的双赢局面。
王小川则从开源的市场需求、影响力构建及竞争力保持等角度分析,认为开源行动不仅能增强企业的行业影响力,而且在快速迭代的模型生态系统中,分享并不会削弱企业的竞争优势。
相反,这种开放的姿态增强了公司的市场声誉,符合行业发展趋势。他赞赏当前众多企业加入开源行列,共同推动中国AI生态快速追赶国际水平,并呼吁持续共建,共享繁荣的开源生态。