文章主题:微调(Fine-tuning),GPT-3.5 Turbo,OpenAI,人工智能,模型训练,特定模型,通用语言模型,数据定制,ChatGPT,行业应用,影响力和增加营收,缓解亏损压力,商业竞争,GPT-4,微调功能,模型性能,优化效果,部署步骤,安全性,成本,训练,使用成本,初试结果,未来更新,行业动态

666AI工具大全,助力做AI时代先行者!

私人测试版中,微调客户已经能够有效地提高常见用例的模型性能。

在8月23日,知名的人工智能公司OpenAI发布了一项重大更新,他们宣布推出了一项全新的功能——基于GPT-3.5 Turbo的微调功能,并且还升级了API版本。这一举措使得企业以及开发人员具备了利用自身数据来定制ChatGPT的能力。这是OpenAI在人工智能领域的一次重要突破,对于未来的发展具有深远的意义。

微调(Fine-tuning)是一种创新性的技术,它允许我们利用已经训练好的通用语言模型(例如GPT-3.5)来创建针对特定领域或任务的定制模型。通用语言模型在语言理解和生成方面表现出色,但其广泛的应用性却意味着它们无法针对每一个独特的应用场景进行深度优化。因此,微调技术的出现,为我们提供了一种有效的方法,可以在保留通用语言模型的优秀性能的同时,显著提升模型的精确度和效率。具体来说,微调过程主要分为两个步骤。首先,我们在已有的通用语言模型的基础上,使用大量针对特定领域或任务的数据进行训练,从而使模型能够更好地理解并适应这些领域的语言特点和需求。这个过程被称为“微调”。其次,我们使用微调后的模型进行进一步的训练,以提高其性能和效率。这种方法使得模型能够在各种应用场景中展现出更高的准确性和适应性,大大提升了其实际应用价值。总的来说,微调技术为通用语言模型的应用打开了一扇新的大门。它不仅可以帮助我们更好地利用现有模型的优势,而且还能根据实际需求对其进行定制化优化,进一步提升模型的性能和效率。这对于人工智能领域的发展无疑是一个重要的突破,也预示着未来人工智能技术的无限可能。

装修已有的房子与新建房子相比,具有诸多优势。首先,这能节省大量的时间和资源,因为不需要从零开始建设,而是对已有结构进行改造。其次,这种方式可以避免一些技术难题,因为 existing house 的结构已经确定,只需根据个人需求和喜好进行调整。因此,装修现有房子不仅经济高效,而且能够更好地满足居住者的需求。

OpenAI最近推出的微调功能,为更多的开发者提供了参与GPT模型应用的机会,从而催生了众多具有个性和创新性的应用场景,进一步提升了用户体验和黏性。这一举措不仅对开发者生态的发展起到了积极的推动作用,而且极大地拓宽了通用模型的应用领域和潜力,为各行各业快速部署AI技术铺平了道路。

在这则公告中,我们将对GPT-3.5 Turbo微调的诸多方面展开深入探讨,包括其安全性、使用成果、价格策略、未来升级以及实际部署过程等关键环节。

安全性:从微调API发送的数据归客户所有,OpenAI或任何其他组织不会使用数据来训练模型。同时,为了保障模型部署的安全,OpenAI通过审核API和GPT-4驱动的审核系统,检测与安全标准冲突的有害数据。(微调有利于为用户提供更具个性化的服务,但也降低了技术门槛,可能导致不负责任的使用)

微调效果:在实际测试过程中,GPT-3.5 Turbo的微调版本在某些任务上,与基本型号的GPT-4能力相当甚至要更好。微调客户能够提高常见用例的模型性能,并缩短提示时间。通过对模型本身的指令进行微调,还可加快API调用并降低成本,提示词数量减少了90%。

价格和Token:GPT-3.5 Turbo的微调成本分为初始训练成本和使用成本两部分。一个包含100K tokens训练文件的微调工作,预计成本为2.4美元。具体来说,训练:$0.008 / 1K tokens;使用输入:$0.012 / 1K tokens;使用输出:$0.016 / 1K tokens。可处理的上下文为4K tokens,是之前微调模型的两倍。

微调步骤:只需经过准备数据、上传文件、创建微调作业、使用微调模型四步。一旦模型完成微调过程,就可以立即在生产中使用。

未来更新:GPT-4 的微调将于今年秋天推出,而在秋季晚些时候会推出对GPT-3.5函数调用和16k上下文的微调支持。不久的将来还会推出微调UI,可更容易访问正在进行的微调作业等有关信息。

GPT-3迭代:OpenAI现在正在提供babbage-002和davinci-002型号作为GPT-3基础模型或微调模型。最初的GPT-3基础型号(ada、babbage、curie、davinci)将于2024年1月4日关闭。

在总结中,我们可以看到,利用先进大模型的微调功能,OpenAI能够成功地吸引更多的企业与开发者加入其平台,进而提升其影响力,并且通过增加收入来缓解因亏损带来的压力。这一策略不仅使得AI产品得以得到更为广泛的运用,同时也推动了大型模型的更快落地,进一步促进了人工智能技术的发展。

在最近的这次功能更新中,我们可以看作是Meta开源模型的一种策略,它不仅允许商用,同时也为外部竞争提供了空间。其中,微调模型的这项功能,将有助于OpenAI进一步拓展和巩固其用户基础,从而确保其在所属行业中的领导地位。这一举动可能会引发其他企业的加速商业化进程,进一步推动行业的竞争态势。

以下为OpenAI公告全文:

GPT-3.5 Turbo的微调功能已经问世,而GPT-4的微调版预计将在今年秋天亮相。这一重要更新赋予了开发者根据自身需求定制更符合实际应用场景的模型的能力,同时也能大规模运行这些经过定制的模型。根据早期试运行的结果,GPT-3.5 Turbo的微调版在某些特定领域任务的表现甚至超过了基础版的GPT-4。与我们的所有API一样,微调API所提供的数据所有权归客户所有,且未经OpenAI或其他任何组织的训练,以保障客户的隐私和数据安全。

微调用例

自 GPT-3.5 Turbo 发布以来,开发人员和企业要求能够自定义模型,以便为其用户创造独特且差异化的体验。通过此次发布,开发人员现在可以运行监督微调,以使该模型在其用例中表现更好。

在我们的私人测试版中,微调客户已经能够有效地提高常见用例的模型性能,举例来说:

改进的可操纵性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以给定语言响应。例如,开发人员可以使用微调来确保模型始终按要求以德语响应。

可靠的输出格式:微调可提高模型一致格式化响应的能力,这对于需要特定响应格式(例如代码完成或撰写 API 调用)的应用程序来说至关重要。开发人员可以使用微调来更可靠地将用户提示转换为可与自己的系统一起使用的高质量 JSON 代码段。

自定义风格:微调是磨练模型输出定性感觉的好方法,具有可识别品牌风格的企业可以使用微调来使模型与其基调更加一致。

除了提高性能外,微调还使企业能够缩短提示时间,同时确保类似的性能。使用 GPT-3.5-Turbo 进行微调也可以处理 4K tokens——是我们之前微调模型的两倍。早期的测试人员通过将指令微调到模型本身,加快了每次 API 调用并降低成本,将提示大小减少了多达 90%。

当与其他技术如提示工程、信息检索和函数调用相结合时,微调的效果是最强大的。对这方面若想了解更多可查看我们的微调指南。另外,对函数调用和GPT-3.5-turbo-16k的微调支持将在今年秋季晚些时候进行。

微调步骤

我们还将在不久的将来推出微调 UI,这将使开发人员更容易访问正在进行的微调作业、已完成的模型快照等有关信息。

安全

对我们来说,安全地部署微调是非常重要的。为了在微调过程中保留默认模型的安全功能,微调训练数据将通过我们的审核API和GPT-4支持的审核系统,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两类:初始训练成本和使用成本。训练:$0.008 / 1K tokens;使用输入:$0.012 / 1K tokens;使用输出:$0.016 / 1K tokens。例如,用100,000个tokens进行微调工作,预计成本为2.40美元。

更新的 GPT-3 型号

今年7月,我们宣布原始 GPT-3 基本型号将于2024年1月4日关闭。今天,我们正在制造这些模型的替代品,无论是作为基本模型还是微调模型。这些模型可以使用我们新的 API 端点进行微调。基本和微调的 GPT-3 型号的定价如下:

新的端点提供了分页和更多的可扩展性,以支持微调 API 的未来发展,过渡到更新的端点也非常简单,更多详细信息可参见我们的微调指南。

微调(Fine-tuning),GPT-3.5 Turbo,OpenAI,人工智能,模型训练,特定模型,通用语言模型,数据定制,ChatGPT,行业应用,影响力和增加营收,缓解亏损压力,商业竞争,GPT-4,微调功能,模型性能,优化效果,部署步骤,安全性,成本,训练,使用成本,初试结果,未来更新,行业动态

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注