一次可输入一本书,支持中文,但目前仅对美国和英国用户开放。

周愚

编辑邓咏仪

来源|智能涌现(ID:AIEmergence)

封面来源IC photo

OpenAI的最大竞争对手之一——Anthropic,又有大动作。

美国时间7月11日,这家由OpenAI前高管共同创立的人工智能企业,正式发布全新AI模型Claude 2及其网页测试版。网页测试版可以免费使用,且支持中文对话,但目前仅对美国和英国用户开放。

Anthropic还称,面向企业的Claude 2 API价格与Claude 1.3相同(每生成1000个单词约0.0465美元),并希望在未来几个月内将Claude 2推广至全球范围。

Claude 2此次更新,值得注意的是提高了单次可输入的长度——达10万token,这几乎是目前商业可用模型中最大的。10万Token,意味着Claude 2可以一次性处理大约75000个单词,这相当于数百页的技术文档,甚至是书籍。

此外,模型的编程、数学、推理技能也得到了改善。在Codex HumanEval(Python编程测试)中,Claude的得分从1.3的56.0%上升到了2的71.2%。在小学数学问题(GSM8K)、多学科问答(MMLU)、科学问题(ARC-Challenge)等方面,Claude 2较之前也均有所提升。

广告
可御可甜 有颜有料 惩罚整蛊任你选 >>进入直播间与主播亲密互动
×
来源:Anthropic

与Claude 1.3一样,Claude 2可以实现文档搜索、总结,代码分析和编码等功能。

根据官网给出的示例,用户只需上传需要分析的文档,然后给出相应的指令,Claude就会自动阅读文档,并作出回答。示例中的两个pdf大小总计近300k,包含超过83000个token,但Claude 2仍然成功地完成了任务。

36氪尝试输入了一个英文文档,并用中文下达指令。Claude 2虽然给出了较为清晰的答案,但可以明显感受到满满的翻译腔,并不能达到自然的中文对话水平。

阅读pdf,并回答问题。来源:Anthropic
广告
美女秀场 真人直播 >>进入直播间与主播亲密互动
×
来源:Claude 2使用截图另外,Anthropic在其发布的论文中表示,Claude 2具有支持20万token上下文的潜力,但目前暂未对外开放。为了进一步检测Claude 2的中文能力,36氪向Claude 2提出了高难度的“谐音梗”问题。Claude 2起初显然没有意识到问题的本质,还在尝试给出符合现实逻辑的答案。而当36氪给出正确答案——“巴黎世(是)家”时,Claude 2虽然意识到,问题可能是个“谐音梗”,但却开始一本正经地胡说八道了起来。
来源:Claude 2使用截图而在代码方面,官方展示了如何利用Claude 2,在一幅静态地图上加入交互的动效。使用者只需将静态地图的js文件输入聊天框,就可以要求Claude 2分析代码的功能,而后输入想要实现的新功能,Claude 2就会自动生成对应的代码。36氪也尝试用中文提问,要求Claude 2生成一个五子棋游戏的代码。Claude 2虽然快速生成了能够运行的代码,但还不能判断胜负逻辑。不过,Claude 2也给出了相应的解释,提示用户继续拓展其他代码。
分析代码功能。来源:Anthropic
生成新代码。来源:Anthropic
来源:Claude 2使用截图此次更新还使用了最新的数据集,包括网站、第三方授权数据集和2023年初用户自愿提供的数据。相较之下,OpenAI的ChatGPT未联网时,数据集还停留在2021年底。不过,Anthropic上市负责人Sandy Banerjee在接受TechCrunch时表示,Claude 2与1.3在模型上并没有什么不同,只是“不断迭代的模型开发方法的产物”。截至目前,Anthropic声称已有“数千客户”以及一批合作伙伴。公司的投资者之一谷歌,已承诺投资3亿美元,以换取该公司10%的股权。Anthropic还表示,要继续研发大模型,未来两年内公司还需要约50亿美元,其中大部分资金将用于计算。

36氪旗下AI公众号

???????? 真诚推荐你关注 ????????

来个“分享、点赞、在看”????

目前仅对美国和英国用户开放

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注