3月4日晚,Anthropic,一家获得谷歌和亚马逊投资的初创公司,宣布发布其最新的通用大语言模型Claude3。Claude 3 Opus标志着模型能力的实质性飞跃,实现了在全方位能力上对GPT-4的超越,尽管优势微弱,但其成就不容小觑,使其成为全球唯一能与GPT-4匹敌的模型。
|Claude 3 Opu最强版本模型
Anthropic重磅发布了其第三代人工智能(AI)模型 ——Claude 3 系列模型,包括Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。其中,Claude 3 Opu 为 Claude 3 系列模型的最强版本,具有接近人类的理解能力,可以灵巧地处理开放式提示和复杂的任务,根据官方给到的资料,其性能全面超过了GPT-4。
值得一提的是,Claude 3 系列模型具有与其他领先模型同等的复杂视觉功能,可以处理各种视觉格式,包括照片、图表、图形和技术图表。
Anthropic在其官方 X上表示,Claude 3 系列模型“在推理、数学、编码、多语言理解和视觉方面树立了新的行业基准”。据介绍,Claude 3 Opus 和 Claude 3 Sonnet 现已可以通过API 直接访问。目前,API也已全面开放,开发人员可立即开始使用这些模型。
另外,Claude 3 Sonnet 还可以供部分地区的用户在网站(http://claude.ai)上免费体验,而Claude 3 Opus 的使用权限,则只开放给了Claude Pro 用户。Anthropic团队还表示,Claude 3 系列模型解决了之前模型经常出现“不必要的拒绝”的问题。
评测结果显示,Claude 3 Opus 在 AI系统的大多数常用评估基准上都优于同类产品,包括本科生水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出了接近人类水平的理解力和流畅性,“引领着通用智能的前沿”。
所有Claude 3模型在分析和预测、细微内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的能力都得到了提高。
|Claude 3主打安全
Claude 3大模型不同于GPT-4与Gemini,Anthropic希望打造安全的人工智能系统,并能让人们能可靠地部署,通过在数据对齐方面的努力,追求从人类的反馈中进行强化学习,以培养出一个有益无害的助手。
Anthropic认为人工智能是一门系统科学。为此他们开发了标度定律(scaling laws)。这是受到在统计物理学中标度普遍性的启发。Anthropic发现Transformer语言模型中性能与训练时间、上下文长度、数据集大小、模型大小和计算预算等因素之间存在精确的幂律关系。通过使用足够小的批次大小时所需的计算量预测,并且这对于理解语言模型的性能和优化计算资源分配具有重要意义。
安全性的研究则更为重要。技术的迭代让人们每次都会看到比以往性能更好、更大的模型和网络。这些更大的网络也带来了新的安全挑战。Anthropic更加关注大型模型的安全问题,以便找到使其更可靠的方法,并提高整个领域的安全部署结果。Anthropic当前的重点是原型系统,将这些安全技术与分析文本和代码的工具相结合。因此,在Claude 2 有时会过度拒绝,Claude 3 对提示的理解更加细致。
Anthropic高度重视项目合作,并致力于自上而下和自下而上的研究规划相结合。Anthropic非常重视让每个人——研究人员、工程师、社会影响专家和政策分析师——都参与到确定这一方向中来。希望与其他实验室和研究人员合作,因为我们相信,表征这些系统的最佳研究将来自广泛的研究人员群体。
为了让模型有益无害,Anthropic利用一种方法,通过收集人类偏好数据并应用偏好建模(Preference Modeling,PMing)和从人类反馈中强化学习(Reinforcement Learning from Human Feedback,RLHF)的技术来训练出一种相对有助且无害的自然语言助理。
|以高性能作为标杆吸引融资
市场策略方面,Anthropic坚持发展通用大模型的路线,并将高性能模型作为其吸引融资的主要标杆,同时通过推出中小型模型来覆盖更广泛的市场。Claude3的发布不仅是Anthropic的一项重要宣传策略,旨在吸引更多资金支持其规模扩大,同时也通过高定价策略展现了对自身模型性能的强大自信。
以百万token计价,Claude3的使用费用包括输入和输出的双向计费,其中大型版本Opus的收费为输入15美元、输出75美元,是目前市场上定价最高的模型。与GPT-4相比,Opus的输出费用是后者的2.5倍,这在一定程度上象征性地展示了Anthropic在市场上所拥有的领先地位。相比之下,中型版本Sonnet的定价更具竞争力,输入和输出费用分别为3美元和15美元,性价比极高。
在性能上,Sonnet与GPT-4不相上下,但其定价仅为GPT-4的一半,使其成为市场争夺的有力工具。至于小型版本Haiku,则以极具吸引力的价格0.25美元/输入和1.25美元/输出进入市场,其性能超过GPT-3.5但价格更低,明确针对初级市场和边缘AI市场进行布局,意在抢占这一细分市场的先机。通过这样的层次化定价和产品策略,Anthropic旨在吸引不同需求层级的用户,从而在竞争激烈的AI市场中占据有利地位。
竞泰观点|持续看好AI算力层面
Anthropic发布其最新的通用大语言模型Claude3,实现了在全方位能力上对GPT-4的超越。投资层面来看,Claude3对于视频多模态的重视亦强调今年多模态将会是发展的重心。具体而言应用层面,随着底层模型算法能力提升,应用端场景有望实现0到1的突破,软件、互联网有望率先受益。
除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,仍然持续看好AI算力层面,尤其是得益于商业端成熟而带来的更多的AI推理侧算力的机会。