文章主题:ChatGPT, 自然语言模型, 科研范式变革, 产业变革

666AI工具大全,助力做AI时代先行者!

自ChatGPT诞生以来,我国的上海学术界和产业界已经成功研发出多个大型自然语言模型,其中包括MOSS、”曹植”以及”魔力写作”。在这些项目中,”MOSS”是由复旦大学科研团队负责开发的,目前正处于校园网内的试运行阶段,预计将在本月完成升级并实现开源;”曹植”则由达观数据公司打造,同样处于试运行阶段,计划在今年的上半年正式推出;至于”魔力写作Magic Writer”,则是竹间智能公司的作品,目前已有多家企业用户开始进行试用。同时,该公司面向个人用户的”灵感闪写”和”文胆”微信小程序已經正式上线一个月。

ChatGPT引发的科研范式变革和产业变革,已经成为全球范围内的话题。在这个背景下,三位大语言模型的开发负责人分享了自己的看法,为政府、高校院所和企业提供了有益的思路。对于科研范式变革,ChatGPT的出现打破了传统的人工智能的界限,将自然语言处理与机器学习相结合,使得人工智能的应用范围更加广泛。这种技术的出现,不仅改变了科研的方式,也促进了科学研究的创新和应用。政府应该积极推动人工智能技术的发展,鼓励企业和研究机构开展合作,促进科研成果的转化和应用。同时,政府也应该制定相关政策,规范人工智能的发展,保护数据安全和隐私。对于产业变革,ChatGPT的出现也对各行业产生了深远的影响。它可以帮助企业提高生产效率,优化客户服务,提升产品质量。同时,它也可以帮助人们更好地理解和利用海量的数据,推动产业升级和转型。企业应该积极拥抱人工智能,探索其在各自领域的应用,实现数字化转型。同时,企业也应该注重人才培养,加强员工对人工智能技术的培训和教育,提高其应用能力。对于高校院所,应该积极推动人工智能技术的研究和应用。高校应该加强对人工智能技术的研究,培养相关人才,推动科研成果的转化和应用。同时,高校也应该加强与企业的合作,促进产学研一体化。

科研范式变革涉及众多学科

科研范式的改变可划分为两大层次。首先,是在诸多学科领域中融入人工智能技术,推进AI for Science(人工智能驱动的科学研究)。其次,是在人工智能领域内,由传统的自然语言处理转向以大语言模型为基础的通用人工智能(AGI)研究。这一观点来自复旦大学计算机科学技术学院教授兼MOSS开发团队负责人邱锡鹏。

近年来,人工智能在科学领域的应用日益广泛。科研人员纷纷运用智能系统分析海量数据,从而揭示出一些人类智慧难以触及的科学结论。2020年,由“阿尔法折叠2”系统精准预测的蛋白质三维结构,荣膺《科学》杂志评选出的年度十大科学突破之一。此外,去 year前,ChatGPT的问世为人工智能在科学研究中的应用开辟了新的道路。该系统通过大型语言模型“阅读”大量科学文献,进而借助其生成的内容不确定性进行“头脑风暴”,以设计新的科研计划或技术策略。

在我国人工智能领域,ChatGPT的出现颠覆了传统的研究方向如句法分析等,使得这些领域的相关论文数量逐渐减少。这是因为ChatGPT展现出了卓越的自然语言理解和生成能力,这使得在大语言模型中,句法分析等中间步骤变得不再必要。因此,许多高校和科研机构,以及企业科研团队都开始转变研究方向,或是自主研发大语言模型,或是将自研的小型模型与开源的大模型进行融合,以打造出混合式的模型。这种转变无疑是对人工智能领域一次重大的技术突破。

“灵感闪写”微信小程序

“灵感闪写”和”魔力写作”是竹间智能公司推出的混合式模型产品。该公司的创始人兼首席执行官简仁贤表示,他们通过将自研的自然语言处理(NLP)小模型与大型语言模型进行深度融合,并进行精细的“调教”,从而实现了优秀的用户体验。记者亲自尝试了“灵感闪写”小程序,发现它可以根据用户输入的词语和句子,迅速生成包括商业计划书、公众号文章、带货笔记等各种文本和插图。而“魔力写作”则不仅可以生成文本,还具备对话功能。只需在学习企业的知识库之后,它就能回答企业员工以及客户的各类问题。

国内科技界要重视AGI研究

在科研精神和产业革新的大背景下,邱锡鹏强调,我国科技界应当关注通用人工智能的研究,而非仅仅聚焦于GPT模型及其应用的实践。通用人工智能的目标是使机器具备类似于人类的广泛能力,从而不再受限于特定的任务需求。近期,微软发布的评估报告指出,GPT-4在能力和广度上表现出了与人工通用智能相似的特征,这使得它有可能成为人工通用智能系统(AGIS)的发展原型。与此同时,包括OpenAI、谷歌和华盛顿大学在内的多家知名机构已经转向研究基于大型模型的AGIS。

在当前的科技革命浪潮中,我国必须加大力度,积极投身于通用人工智能的研究领域。具体而言,我们需要将多模态感知能力,如视觉和语音等,融入到大型语言模型中,从而提升大模型与现实世界的互动效能。此外,我们还需致力于构建一个以通用人工智能为核心的产学研合作生态系统,以此推动我国在该领域的持续发展,确保我们不会在此项技术革新中落后。

邱锡鹏教授(左一)带领团队研发MOSS。(来源:复旦大学)

遵循这一思路,复旦科研团队正在升级MOSS。作为国内第一个对话式大语言模型,MOSS今年2月启动内测后引发广泛关注。目前,邱锡鹏和博士生孙天祥等人一方面在提升它的中文水平,中文词语训练量已由内测启动时的300亿增至1000亿;另一方面,他们在为MOSS添加联网搜索、图片生成等功能,让它可以上网获取新的知识,向通用人工智能系统演进。

复旦团队计划本月完成升级并开源,公布MOSS模型参数和训练细节,与学术界和产业界分享大语言模型开发经验,还能让企业在开源模型基础上开发各种应用,促进产业生态繁荣。

建议发挥新型举国体制优势

谈及大语言模型产业前景,达观数据董事长兼首席执行官陈运文预测,产业上游是算力供应商,中游是百度等开发C端通用大模型的大企业和开发B端服务大模型的企业,下游是开发各种应用的中小企业。其中,B端服务大模型的参数量是C端通用大模型的1/5~1/3,适合较大规模的企业开发。

达观数据研发的“曹植”就是一个B端服务大模型,参数量超过500亿,公司希望它像曹植那样有“七步成诗”能力,成为满足金融、政务、制造等行业需求的智慧大脑。它拥有ChatGPT的所有功能,可以生成贷后管理报告、投行申报文档、法律文书等各类文本,也可以与用户对话。“我们想打造垂直、专用、自主可控的国产大模型。”陈运文说,“为了能生成长篇专业文本,比如上百页的报告,我们开发了一个能输入复杂指令的表单界面,有望为企业员工大幅减负。”

“曹植”大语言模型架构(来源:达观数据)

在研发过程中,达观数据也有些烦恼——公司只有100张GPU(图形处理器)卡,而要“跑”大模型,至少需要1000张GPU卡。为此,陈运文只能到处“化缘”借卡。在他看来,新型举国体制适用于大语言模型研发和产业化,国家和地方政府可建立人工智能公共算力池,租给企业和高校院所使用。“一张A800 GPU卡的价格是8万元,公共算力池可配备5000—10000张卡,所以建设成本在10亿元内。开发大模型产品的企业可分时租用池里部分GPU,大幅节省自购算力资源的成本。”

新型举国体制还可在大模型的中文预训练中发挥作用,推动图书馆、出版社、新闻机构等拥有高质量中文语料库的单位与人工智能企业合作,提高大模型的中文知识水平。

简仁贤也表达了人工智能企业的心声:在这轮产业变革中,希望政府和投资机构更多地关注、支持中小企业。大模型并非只有“BAT”等巨头才“玩得起”,事实上,OpenAI就属于创业期的中小企业。创业公司决策效率高、创新能力强的优势,在大模型技术创新中得到了充分体现。“就像OpenAI与微软的合作一样,创业公司与大企业、投资机构联手,有望开发出颠覆性产品。”

栏目主编:黄海华 题图来源:上观题图 图片编辑:徐佳敏

来源:作者:俞陶然

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注