原创天地 | 文心一言治好了我的精神内耗
点击蓝字 ╱ 关注我们 停靠心灵的港湾 作者:王兢 马斯克:慌了。 “呼吁AI研发工作暂停6个月”。 席卷全球、飞速迭代的ChatGPT让OpenAI创始人之一的马斯克都坐不住了,如此看来,迟到近4个月才开始内测的文心一言还有机会吗? 李彦宏:稳住。 “只有出来才有机会更快地迭代提升”。 相比马斯克的坐不住,百度的文心一言虽然饱受诟病,却已经大胆迈出了脚步。 其实,早在2019年百度就发布了文心1.0版本,经过近4年研发和迭代,文心大模型已经形成了产业级知识增强大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算、行业大模型,以及支撑大模型应用的工具平台,蕴含了大量百度自主创新、并且在大规模产业应用中得到验证的技术。 -图片源自网络- 然而,去年底ChatGPT发布后的惊艳表现,还是让百度团队倍感焦虑:他们与OpenAI的差距被进一步拉大。面对外界的质疑和内测的不确定,团队成员们都背负着巨大压力。 其实,在人工智能技术“芯片-框架-模型-应用”四层结构中,百度是全球为数不多在这四层进行全栈布局的公司。从昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,百度搜索等应用,各个层面都有自研技术,能实现层与层反馈、端到端优化,大幅提升效率。 与其临渊羡鱼,不如退而结网。更何况“网”已经结好多时,只是还不完美罢了。“开始行动就好”,所有创新都需要反馈的驱动,大型语言模型只有早日上线才能收到大量的用户反馈,进一步加速迭代和更新。 -图片源自网络- 3月16日,在ChatGPT-4发布的第二天,被外界誉为“中国版ChatGPT”的百度“文心一言”正式开放内测。 文心一言 文心一言(ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。它基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习,具备知识增强、检索增强和对话增强的技术特色。 -图片源自网络- 名称由来 “文”是语言文字,“心”是用心理解,“文心”指致力于理解和运用语言文字的自然语言理解模型;“一言”既有“一言为定、一言九鼎”的寓意,也有对人机之间“你一言我一语”流畅沟通的殷切期盼。 使用场景 ◉ 文学创作方面,文心一言可以撰写《流浪地球2》的影评文案,创作朋友圈配图; ◉ 商业文案创作方面,文心一言可以进行创业筹备工作,开展用户调研、设计店名、创作宣传语和藏头诗; ◉ 数理推算方面,文心一言可以准确计算复杂数学问题,先理解,再推理,最后生成答案; ◉ 中文理解方面,文心一言可以准确回答“日照香炉生紫烟,遥看瀑布挂前川”是哪里的自然景象及其背后的物理现象; ◉ 多模态生成方面,文心一言可以准确回答中国古诗相关的问题,并制表、作画,用方言朗读。 从开放内测到3月27日正式上线,文心一言正在逐步增强人类反馈、强化学习,未来大有可期。 -点击查看大图- 核心技术 文心一言是文心大模型家族的新成员,在文心知识增强大模型ERNIE及对话大模型PLATO的基础上研发,基于飞桨深度学习平台训练和部署,其关键技术包括,有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。 前三项是这类大语言模型都会采用的技术,在ERNIE和PLATO模型中已经有应用和积累,文心一言中又进行了进一步强化和打磨,做到了更懂中文、更懂中国文化、更懂中国的使用场景;后三项则是百度已有技术优势的再创新 ,也是文心一言越来越强大的技术底气。 ◉ 在知识增强方面,百度构建了5500亿事实的知识图谱,文心一言基于庞大的知识图谱来做知识增强,从海量数据和大规模知识中融合学习,还可以直接调用知识图谱做知识推理,自动构建提示,高效满足用户需求。 ◉ 在检索增强方面,百度搜索是世界上最大的中文搜索引擎,现已发展到基于语义理解和匹配的新一代搜索架构,能够得到更精准的搜索结果,进而为大模型提供准确率高、时效性强的参考信息。 ◉ 在对话增强方面,基于对话技术和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,以实现更好的对话连贯性、合理性和逻辑性。 实践出真知 心理咨询师: 行动,是消除焦虑的最佳良药。...