Anthropic成功升级Claude为GPT-4Turbo功能近两倍

文章主题：关键词：Anthropic, Claude, GPT-4 Turbo, 聊天机器人

Anthropic趁乱将Claude升级为GPT-4 Turbo功能近两倍

在11月23日，一则关于OpenAI的趣闻占据了大部分人们的关注度，然而，在这场闹剧的缝隙中，Anthropic这个由前OpenAI员工创立的公司，却趁机推出了他们强大聊天机器人的最新版本。

近日，Anthropic 推出了全新的 Claude 2.1 模型，这是一款具备强大自然语言处理能力的 Large Language Model (LLM)。该模型提供了高达 200,000 个令牌上下文窗口，这一数据远超出了 OpenAI 近期发布的 GPT-4 Turbo 的 120k 上下文规模。Claude 2.1 的性能提升 strategic version 带来了近两倍的上下文处理能力，这得益于与谷歌的长期合作，使得这家初创公司得以运用其顶尖的张量处理单元，从而在竞争中占据有利地位。

earlier this morning, Anthropic 在一条推文中宣布了他们的新模型 Claude 2.1 的推出。这款新模型拥有业界领先的特性和优势，其中 200K 代币上下文窗口是他们的重大突破。此外，幻觉率、系统提示、工具使用以及更新的定价都降低了 2 倍，这无疑是对加密货币市场的一大贡献。

Claude 2.1 的问世满足了人们对于能够精准处理和分析长篇文档的人工智能日益增长的需求。这一重大升级意味着 Claude 用户现在可以应对从法律分析到文学批评等各种应用场景下需要处理的海量文档，从而充分发挥了人工智能在各个领域的潜力。

仅仅通过扩大令牌窗口大小，从200K扩展到，并不仅仅实现了增量更新，Claude 2.1在处理GPT-4 Turbo的提示时，其检索率与GPT-4 Turbo之间呈现出正比例关系。因此，Claude 2.1能够比OpenAI的模型更精确地理解和回应用户的查询。

AI 研究员 Greg Kamradt 很快对 Claude 2.1 模型进行了测试。

在大约90K个代币时，文档的召回性能开始急剧下降，这是他调查中发现的一个现象。值得注意的是，GPT-4 Turbo的退化程度也相当严重，大约有65K个代币受到了影响。他在文中写道：“我对Anthropic团队表示由衷的支持——他们在努力突破法学硕士的表现，并为全球带来强大而实用的工具。”Anthropic对降低AI错误的承诺在Claude 2.1的准确性提升上表现得尤为明显，他们声称幻觉率已经降低了50%，这相当于真实性的翻倍。这些改进是在一系列旨在挑战现有模型限制的复杂、事实性问题上经过严格检验的。正如Decrypt之前的报道中所提到的，幻觉一直是克劳德的软肋之一。如今，LLM与GPT-4之间的竞争将变得更加激烈，得益于这种显著的准确率提升。

通过引入 API 工具使用功能，Claude 2.1 还可以更无缝地集成到高级用户的工作流程中，展示其协调各种功能、搜索网络以及从私有数据库中提取数据的能力。虽然仍处于测试阶段，但此功能有望将 Claude 的实用性扩展到一系列操作，从复杂的数字推理到提出产品推荐。

此外，Anthropic 的 Claude 2.1 还具有系统提示功能，旨在提升用户与人工智能之间的交互。这些提示允许用户通过指定角色、目标或风格来为克劳德的任务做好准备，从而增强克劳德在角色扮演场景中保持性格、遵守规则和个性化响应的能力。这与 OpenAI 的自定义指令相当，但在上下文方面更广泛。

例如，用户可以指示 Claude 在总结财务报告时采用技术分析师的语气，确保输出符合专业标准。这种通过系统提示进行的定制可以提高准确性，减少幻觉，并通过使交互更加精确和上下文相关来提高作品的整体质量。

然而，具有 200K 令牌上下文窗口的 Claude 2.1 的全部潜力是为 Claude Pro 用户保留的，因此免费用户将不得不坚持使用具有 100K 令牌且准确度排名在 GPT 3.5 和 GPT-4 之间的 Claude 2。

Claude 2.1 发布的连锁反应将影响人工智能行业的动态。随着企业和用户评估他们的人工智能选项，Claude 2.1 的增强功能为那些寻求利用人工智能的精确性和适应性的人带来了新的考虑。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复