百川智能发布基于搜索增强的Baichuan2-Turbo系列API，助力企业打造高效智能解决方案

文章主题：关键词：百川智能，Baichuan2-Turbo系列API，搜索增强知识库。

雷递网乐天 12月19日

今天，我国知名的人工智能公司——百川智能，正式对外公布了一项重大创新举措。他们宣布开放了基于搜索增强的Baichuan2-Turbo系列API，其中包括Baichuan2-Turbo-192K和Baichuan2-Turbo两个版本。这一举措标志着我国人工智能技术在搜索增强领域迈出了重要的一步。值得一提的是，Baichuan2-Turbo系列API在支持192K超长上下文窗口的基础上，更具备了搜索增强知识库的功能。这不仅极大地提升了搜索效率，同时也使得API的应用场景更加广泛。总的来说，百川智能的这一创新举措，无疑为我国的人工智能技术发展注入了新的活力。我们可以预见，随着这样的技术的不断发展和应用，未来的人工智能将更加智能、高效。

为了更好地满足各类企业的个性化需求，我国知名的人工智能公司——百川智能，现已正式开放API接口，允许用户上传文本资料，构建属于自身的知识库。这一举措将有助于企业根据自身业务特点，制定更为精确、全面的智能解决方案，进一步提升工作效率，优化业务流程。

除此之外，我国领先的AI公司——百川智能，进一步优化了其官方网站的模型体验。如今，该公司的官网大型模型已经能够支持多种文本格式，如PDF和Word，并且允许用户直接输入URL网址。这意味着，用户可以通过百川智能的官方网站，享受到经过搜索增强和长窗口加持后的全面智能服务。

百川智能坚信，将搜索增强技术融入大模型的应用过程中，是推动其真正走进实际场景的关键所在。这一技术的引入，不仅能够针对幻觉、时效性差以及专业领域知识短缺等问题进行有效的处理，同时也具备强大的提升模型性能的能力。通过这种技术的运用，大模型便可以实现”外挂硬盘”，进而构建起一个能够覆盖互联网实时信息和企业完整知识库的”全知”系统。此外，搜索增强技术还能帮助大模型更加精准地理解用户的意图。在互联网和专业/企业知识库这两个海量文档的海洋中，它能够迅速找到与用户需求最为贴合的知识点。然后，将这些丰富的知识元素加载至上下文窗口，依托长窗口模型对其进行深入的总结和提炼，从而在充分发挥上下文窗口功能的基础上，更好地助力模型生成最理想的结果。这样一来，各个技术模块之间的协同作用得以强化，最终形成了强大且封闭的的能力网络，使得整个应用过程更为顺畅高效。

大模型+搜索构成完整技术栈

大模型的出现无疑是一次技术上的革命，但是，我们必须清醒地认识到，虽然它具有很大的潜力，但在当前阶段，它仍然存在一些问题和挑战。首先，大模型可能会面临幻觉的问题，这是由于它们基于大量的数据进行训练，而这些数据可能包含错误或者不完整的信息。其次，大模型的时效性较差，这对于需要实时响应的应用场景来说无疑是一个巨大的限制。最后，大模型在专业领域知识的掌握方面可能存在不足，这可能会影响到其在特定领域的应用效果。因此，大模型的落地面临着诸多挑战，需要在解决这些问题上做出努力，才能真正发挥其价值。

在面对这个问题时，业界已经尝试了多种解决方法，其中包括增加参数规模、拓宽上下文窗口长度、让大模型连接外部数据库，以及利用专用数据对大模型进行训练或微调，针对特定行业。虽然这些策略各具特点，但它们也都有其固有的限制。

在提升模型智能的过程中，扩大模型参数的持续方法是一个显著的选择。然而，这一过程不仅需要大量的数据和计算能力作为支持，更带来了高昂的成本负担，尤其对于我国的中小企业来说，这无疑是一个巨大的挑战。此外，过度依赖预训练技术来解决模型的虚幻性和时效性问题，其效果也并不理想。

在当前的业界环境中，我们需要寻找到一种方法，将大模型的智能真正转化为产业价值。在这个问题上，百川智能提供了全新的技术思路。他们认为，大模型搜索增强是未来计算机发展的新方向，它就像计算机的CPU，能够通过预训练将知识深度内化到模型之中，进而根据用户的提示生成相应的结果。而在这个过程中，上下文窗口则可以被视为计算机的内存，负责存储当前正在处理的文本信息。同时，互联网实时信息和企业的完整知识库一起构建了大模型时代的硬盘，为智能工作提供了强大的支持。

基于这一技术理念，百川智能称，以Baichuan2大模型为核心，将搜索增强技术与大模型深度融合，结合此前推出的超长上下文窗口，构建了一套大模型+搜索增强的完整技术栈，实现了大模型和领域知识、全网知识的全新链接。

大模型+搜索增强可解决99%企业知识库的定制化需求

企业自有数据/知识库，是企业的核心竞争力。大模型如果不能结合企业自有数据/知识库，对企业没有价值。对此，业界的传统做法是做行业大模型，通过预训练或者微调训练大模型。

但是基于特定数据预训练或微调垂直行业大模型需要高密度的技术人才团队、大量的算力支持，并且每更新一次数据都要重新训练或微调模型，不仅成本高昂、灵活性差，更关键的是不能保证训练的可靠性和应用的稳定性，多次训练后仍会出现问题。此外，大部分企业数据，都是结构化的数据，也不适合SFT，模型无法准确记忆结构化信息，会带来幻觉。

为解决传统方法的缺陷，业内探索了长上下文窗口和向量数据库两种较好的路径。

在此基础上，百川智能称，将向量数据库升级为搜索增强知识库，提升了大模型获取外部知识的能力，并且把搜索增强知识库和超长上下文窗口结合，让模型可以连接全部企业知识库以及全网信息，能够替代绝大部分的企业个性化微调，解决99%企业知识库的定制化需求，不仅为企业节省巨大成本，还能够更好地实现垂直领域知识的沉淀，让专有知识库能够真正成为企业不断增值的资产。

百川智能构建的大模型+搜索增强解决方案解决掉幻觉和时效性问题后，有效提升了大模型的可用性，拓展了大模型能够覆盖的领域，例如金融、政务、司法、教育等行业的智能客服、知识问答、合规风控、营销顾问等场景。而搜索增强相比微调，在提升可用性的同时还显著降低了应用成本，让更多中小企业也能够享受到大模型带来的变革，特别是在电商行业可帮助广大店家提升营销效率乃至转化率。

此外，这种应用方式还可以帮助提升企业各种场景应用创新的效率，加速大模型在千行百业创造实际价值。

稀疏检索与向量检索并行召回率提升至 95%

虽然搜索增强能够有效解决大模型落地应用的诸多问题，但在技术层面构建这样一套系统却并不容易，需要深厚的搜索和模型研发经验来发现并解决各个环节的技术难点与挑战。

在大语言模型时代，用户的需求表达不仅口语化、多元化，并且还与上下文强相关，因此用户需求（Prompt）与搜索的对齐成为了大模型获取外部知识过程中最为核心的问题。为了更精准地理解用户意图，百川智能使用自研大语言模型对用户意图理解进行微调，能够将用户连续多轮、口语化的Prompt信息转换为更符合传统搜索引擎理解的关键词或语义结构。

百川智能还参考Meta的CoVe（Chain-of-Verification Reduces Hallucination in Large Language Models）技术，将真实场景的用户复杂问题拆分成多个独立可并行检索的子结构问题，从而让大模型可以针对每个子问题进行定向的知识库搜索，提供更加准确和详尽的答案。

同时通过自研的TSF(Think Step-Further)技术，百川智能的知识库可以推断出用户输入背后深层的问题，更精准的理解用户的意图，进而引导模型回答出更有价值的答案，为用户提供全面和满意的输出结果。

在精确理解用户需求的基础上，想要进一步提升知识获取的效率和准确性，还需要借助向量模型解决用户需求和知识库的语义匹配问题。

为实现更好的向量检索效果，百川智能自研的向量模型使用了超过 1.5T token 的高质量中文数据进行预训练，通过自研的损失函数解决了对比学习对于 batchsize 的依赖，在C-MTEB评测集 6 个任务（分类、聚类、文本推理、排序、检索、文本相似度）中的 5 个任务上都取得了效果的大幅领先，综合分数登上榜首。

虽然当下构建大模型知识库的主流方法是向量检索，但是向量模型的效果过于依赖训练数据的覆盖，在训练数据未覆盖的领域泛化能力会有明显折扣，并且用户 prompt 和知识库中文档长度的差距也给向量检索带来了很大挑战。

对此，百川智能称，在向量检索的基础上融合了稀疏检索和 rerank模型。通过稀疏检索与向量检索并行的混合检索方式，将目标文档的召回率提升到了 95%。

对于大模型在回答过程中由于引用资料不准确以及与大模型不匹配，导致模型的“幻觉”加重的现象。百川智能还在通用RAG（检索增强生成）的技术基础上首创了Self-Critique大模型自省技术，该技术能够让大模型基于Prompt对检索回来的内容从相关性、可用性等角度进行自省，筛选出最优质、最匹配的候选内容，有效提升材料的知识密度和广度，并降低检索结果中的知识噪声。

长窗口+搜索实现“真·大海捞针”

长上下文窗口虽然可以接收更长的文本信息，但扩展上下文窗口长度会影响模型性能，在当前技术下存在上限。并且长窗口每次回答问题都要将文档全部重读一遍，推理效率低、成本高。

百川智能称，通过长窗口+搜索增强的方式，在192K长上下文窗口的基础上，将大模型能够获取的原本文本规模提升了两个数量级，达到5000万tokens。通过搜索增强，模型可以先根据用户的Prompt在海量的文档中检索出最相关的内容，再将这些文档与Prompt一起放到长窗口中，有效节省了推理费用和时间成本。

“大海捞针”测试（Needle in the Heystack）是由海外知名AI创业者兼开发者 Greg Kamradt 设计的，业内公认最权威的大模型长文本准确度测试方法。

对于192k token以内的请求，百川智能称，可以实现100%回答精度。

而对于192k token以上的文档数据，百川智能结合搜索系统，将测试集上下文长度扩展到 5000w tokens，分别评测了纯向量检索和稀疏检索+向量检索的检索的效果。测试结果显示，稀疏检索+向量检索的方式可以实现95%的回答精度，即使在 5000万tokens的数据集中也可以做到接近全域满分，而单纯的向量检索只能实现 80%的回答精度。

———————————————

雷递由媒体人雷建平创办，若转载请写明来源。

关键词：百川智能，Baichuan2-Turbo系列API，搜索增强知识库。

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复