近日,ChatGPT最大竞争对手发布了Claude 2!升级后的模型,在编码、数学和推理方面的性能都有所提高。
同时,官网提到了Claude 2 的取得的两个成绩,一个是在律师资格证考试,多项选择题中取得了76.5% 的成绩,在GRE 考试中,比90% 申请研究生院的学生取得的成绩要高。
据网友评价:在一些指标上已经超过了GPT-4,目前100K token的上下文窗口,是目前模型中最大的,且拥有更快的处理速度。
|Anthropic有多牛?
在生成式人工智能(AI)军备竞赛中,Anthropic是最值得关注的10家初创公司之一,也是OpenAI最强劲竞争者之一。
在第二轮融资中筹集7.5亿美元几个月后,这家初创公司周二(7月11日)推出了新版人工智能聊天机器人:Claude 2,Anthropic目前估值为41亿美元。
这也是Anthropic首次向普通消费者开放其聊天机器人技术,在过去的两个月里,该公司的人工智能模型已经被Slack、Notion和Quora等企业测试过,而Anthropic已经积累了超过35万人的预约名单,要求开放Claude的API接口和消费者服务。
在OpenAI创业的过程中,有大量人才选择离职,其中由OpenAI前研究副总裁Dario Amodei等人在2021年创建的Anthropic公司最受关注,该公司还得到了谷歌、Salesforce和Zoom等公司的投资。
此前,Anthropic研发的人工智能聊天机器人Claude,不仅在各项大型语言模型排行榜中名列前茅,甚至有些竞赛成绩胜过了迄今最强的GPT 4大模型。
与OpenAI明显商业化的趋势不同,Anthropic强调其旨在构建“可靠、可解释和可操纵的人工智能系统”,但这也限制了Anthropic的模型开发速度。
Anthropic的创始人之一Daniela Amodei最新表示:“我们一直把重点放在商业化方面,让Claude尽可能地安全,我们也真的认为这是目前为止我们开发的最安全的Claude版本,所以我们非常高兴能把它送到更广泛的企业和个人消费者手中。”
|Claude凭什么?
Claude是Anthropic公司开发的一系列大型语言模型。这些模型使用了Transformer架构,并通过无监督学习、人类反馈强化学习(RLHF)进行训练。Claude模型可以理解和生成人类语言,用于各种任务,如回答问题、写作、编辑和编程。
相较之前的版本,Claude 2在代码、数学、推理方面都有了史诗级提升。不仅如此,它还能做出更长的回答——支持高达100K token的上下文。而且最重要的是,现在我们可以用中文和Claude 2对话了,而且完全免费!
最高支持10万tokens的输入和4000个tokens的输出。尽管很早之前Anthropic就生成Claude最高支持10万tokens的输入,但是一直没有发布。今天的Claude2宣布正式支持10万tokens的输入,并且可以一次性输出4000个tokens,大约3000多个单词。
这应该是目前最高的上下文限制了(超过GPT-4的32K)。编码能力提升很大,Claude 2在Codex HumanEval的Python代码测试中,Claude 2的得分从56.0%提升到了71.2%。在GSM8k(大型小学数学问题集)上,Claude 2的得分从85.2%提升到了88.0%。
Anthropic官方给大家秀了一段Claude的代码能力。你可以让Claude生成代码,帮助我们把一幅静态的地图变成一幅可互动的地图。
更高的安全性能。此前据说,Anthropic的创始人们就是和OpenAI在大模型的安全性上理念不一致,才集体出走,创立了Anthropic。
Claude 2也一直在不停迭代,安全性和无害性大大提高,产生冒犯性或危险性的输出的可能性大大降低。
内部的红队评估中,员工会对模型在一组有害提示上的表现进行评分,还会定期进行人工检查。评估显示,与Claude 1.3相比,Claude 2在无害回应方面的表现提高了2倍。
Anthropic采用了被他们称为Constitute AI的技术框架来实现对于语言模型的无害化处理。
竞泰观点|不同类型需求的用户也意味着有很大的发展空间
Anthropic已经投入了至少两个月的时间来开发Claude 2,一个由30到35人组成的团队全力开发人工智能模型,总共得到了150位技术人员的支持。生成式人工智能市场增长如此迅速,有足够的空间让多家公司取得成功。
从商业的角度来看,这是一个非常不寻常的时期,因为对大语言模型的需求非常大,而且行业目前却无法提供更多的需求。行业前景非常广阔。