文章主题:人工智能模型, 大语言模型, 文本生成, 聊天机器人
编译 | 铭滟
编辑 | 徐珊
近日,知名人工智能创新企业Anthropic公司推出了一款最新的AI模型——Claude 2,用户可通过API接口及全新的公开测试平台claude.ai进行调用与体验。此消息由智东西于7月13日发布,引起了业界的高度关注。
Claude 2是一款基于大型语言模型的强大工具,适用于各种书面任务,如总结、搜索、回答问题以及编码等。相较于其前身Claude 1.3,新版的Claude 2能够生成长度更长的响应文本,这无疑将为用户带来更为丰富的信息检索和处理体验。
▲图为Claude 2主界面
一、新版本逻辑推理能力更强、输入输出文本更长
此次新发布的Claude 2较其前身主要包括以下几点:
首先,我们需要明确的是,相较于Claude 1.3版本,Claude 2在各项测试中的表现约为3%至15%的提升。这主要体现在编程能力、数学能力和推理能力上,使得Claude 2在这些方面的表现都得到了显著的提高。具体来说,Claude 2在律师资格考试的多选题部分得分为76.5%,这一数据甚至超过了Claude 1.3版本的73.0%。而在GRE阅读和写作考试中,Claude 2的得分更是超过了90%的应届毕业生,其表现相当出色。此外,它还成功通过了美国医师执业考试的多项选择题部分。至于Codex人类级Python编码测试,Claude 2在编程能力上的表现更为突出,获得了71.2%的得分比,而Claude 1.3版本仅为56%。这些数据充分证明了Claude 2在各个领域的优秀表现,值得大家关注和使用。
第二,Claude 2在输入和输出方面具有更强大的能力。用户 now 可以输入高达100K的 tokens(相当于约75万英文单词或40万中文汉字),这使得Claude能够轻松应对数百页的技术文档,甚至是整本书籍的处理任务。此外,Claude 2现也具备了输出更长文档的能力,一次可生成数千个 tokens(大约为几千字英文单词或汉字)。
第三,Claude 2的公开测试网站已经上线。通过全新的公开测试平台——claude.ai,用户可以更便捷地获取Claude 2的体验资格,这将让更多用户有机会免费试用这一产品。
使用Claude后,用户将注意到其出色的响应速度。此外,在聊天过程中,用户允许上传多达五个、每个大小为10MB的文档,同时还可以直接在聊天窗口中输入网址进行相关分析。
二、35人团队专项研发,耗时超2个月
Anthropic是一家由少数前OpenAI员工于2021年创立的人工智能初创公司,该公司定位为构建更安全的聊天机器人。Anthropic总裁兼联合创始人Daniela Amodei表示,在Claude 2的开发中,Anthropic已经花费了至少两个月的时间。除此之外,有一个由30到35人的团队专门负责AI模型的工作,共计有150人为其提供支持。
▲图为Anthropic总裁兼联合创始人Daniela Amodei
比起其他聊天机器人,Anthropic希望Claude能更稳定且不易被用户的话语引导。他们希望Claude尽可能减少一些冒犯性话语或内容生成,这也是ChatGPT类聊天机器人的痛点。该公司也表示,相较于市面现有聊天机器人而言,其测试表明Claude 2对用户一些刻意引导的话语,都能给出较为合适的回应。
Amodei表示,Claude 2“主观上感觉比旧版本好一点”。但她也表示,当今世界上的所有语言模型都存在许多未知的因素,没有一种语言模型能够100%解决机器人用虚假信息进行回应的问题。“Claude 2也是如此。我们也知道它并不完美,仍有其局限性。”
结语:大模型竞赛已进入白热化阶段
总之,Anthropic推出的Claude 2以其在多个基准测试中的改进、支持中文以及新增的附件上传功能,为用户提供了一个强大且便利的免费聊天机器人。并且,依照Anthropic官方说法,未来Claude 2的输入文本长度将翻倍。
此次发布,Claude 2将与OpenAI旗下的ChatGPT展开一场激烈竞争,而Claude 2的公开免费、超强逻辑、超长文本等能力也直击ChatGPT的公众关注重点。两家“内卷”,或许将为人工智能领域带来了新的发展机遇。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!