文章主题:ChatGPT, MOSS
图说:MOSS
🎉🚀 随着OpenAI ChatGPT的全球火爆,AI革命再次被点燃!最近,复旦大学计算机科学技术学院邱锡鹏教授带领他的团队发布了一款名为MOSS的类ChatGPT模型,引起了国内外的高度关注!🌟在社交媒体上,MOSS的新闻迅速成为了热门话题。人们纷纷讨论这款模型的潜力和应用前景。🚀在最近的一次访谈中,邱锡鹏教授详细介绍了MOSS的开发过程、功能特点以及未来规划。他强调,MOSS的目标是为用户提供更加智能、便捷的服务,帮助他们更好地理解和解决问题。💡此外,邱锡鹏教授还表示,MOSS将不断学习和改进,以满足用户的需求和期望。他认为,AI技术的发展需要持续创新和突破,只有这样,我们才能真正实现人工智能的潜力。🚀总的来说,MOSS是一款非常有前景的AI模型,它不仅代表了复旦大学计算机科学技术学院的实力,也预示着未来AI发展的新趋势。让我们一起期待MOSS在未来的表现吧!🌟
🎉 春节前的腊月二十八,是大家最期待的一天!在这个特殊的日子里,项目主开发者、计算机科学技术学院博士研究生孙天祥在测试过程中输入了一个中文问题,MOSS却以英文正确地回答了他,“就像一个不会说但听得懂中文的人”。当时版本的MOSS还处于初级阶段,中文语料占所有训练数据的比例不到0.1%。
🌟 非常神奇!我们从未教授过它机器翻译技术。在MOSS的展示下,邱锡鹏当晚激动得难以入眠。他将MOSS比作一个“聪明的小孩”,尽管现在还不擅长写诗、解题或许多具体的事情,但已经展现出成为通用人工智能(AGI)大框架的潜力。“很多遥不可及的事情,它一点就通了。”实际上,邱锡鹏也让6岁的女儿和MOSS聊天,发现孩子可以愉快地与MOSS对话很长时间。
在科研人员的辛勤耕耘下,MOSS备受瞩目。作为人工智能研究领域的专家,邱锡鹏从博士期间起就专注于机器学习的研究,并在毕业后留校从事自然语言处理的研究工作。他与团队在自然语言处理的基础模型和基础算法上取得了许多创新性的研究成果。邱锡鹏的著作《神经网络与深度学习》因其通俗易懂的语言和深入浅出的内容,深受广大读者的喜爱,被誉为“蒲公英书”。该书在众多“人工智能必读书单”中名列前茅。去年,他还带领团队获得了中国中文信息学会颁发的钱伟长中文信息处理科学技术奖一等奖。
🚀 邱锡鹏和他的MOSS团队正在全力以赴地进行内测和迭代工作,他们已经成功地完成了新模型的初步优化,并计划在3月底完成最后的调整。在这个过程中,他们始终保持着高度的热情和专注,以确保每一个细节都达到最佳状态。
🎉 MOSS已经成功进入内测阶段!一些用户表示尽管它在参数规模上比ChatGPT小一个量级,但它确实有ChatGPT的味道,并且基本功能都实现了。邱锡鹏对此持乐观态度,认为MOSS这类大型语言模型将在不久的将来成为人们生活中的常规存在,为人们提供各种帮助。
邱锡鹏介绍,ChatGPT的参数量多达1750亿个,而MOSS的参数量比其小一个数量级,大约是前者的1/10。“比起事实类的知识储备,模型的逻辑思维能力更值得大家关注”,有一种说法,说我们和国外的技术水平差距非常大,想追上的话,要花很长时间。但我们的努力证明,其实不需要那么久。
新民晚报记者张炯强通讯员殷梦昊许文嫣
【相关报道】
MOSS究竟是什么?邱锡鹏答记者问,回应社会关注热点。
图说:团队照片,左六为邱锡鹏
记者:可否简单介绍一下MOSS?这种“大型对话式语言模型”和我们日常使用的Siri、小度、小爱等聊天机器人有什么区别?
邱锡鹏:我可以打个比方,这两者的关系就像智能手机和功能手机。之前的聊天系统还属于弱人工智能,设计它们就是用来聊天的,就像传统的功能手机只能用来打电话;而现在的大型语言模型,像ChatGPT、MOSS,它们能做很多事,聊天只是功能之一,就像智能手机可以用来打电话,但它的功能远远不止于此。
就ChatGPT、MOSS而言,它们具备的是一种通用能力,可以帮助人类完成各种各样的事情,只不过以对话形式呈现。它可以完成自然语言处理领域的绝大部分任务,包括机器翻译、信息抽取、纠错等。它们还可以在学习使用外部工具后,与外部世界进行交互,进行创作。这些都是现有的聊天机器人所不具备的。应该说,这种对话式大型语言模型向我们展示了一条通向“通用人工智能”的崭新路径。
记者:团队2月20日发布了MOSS模型,是刚刚建成吗?前后花了多长时间?
邱锡鹏:事实上,我们在春节前就开发出了第一代模型。它显示出了很大的潜能,与之前的聊天系统大不相同,有着不错的人类意图理解能力,也有很多涌现能力,比如未经训练就学会了机器翻译。之后,我们又花了一个多月的时间打磨它的工程部署情况,比如提高效率、优化界面等。
MOSS的开发同样不是一蹴而就,它离不开我们团队过去的铺垫工作和长期积累的研究经验。从2021年起,我们就开始做中文生成式预训练模型,也开源供别人下载,每月平均有上万次下载。后面我们又提出“语言模型即服务”的概念,认为基础语言模型会成为语言服务的基座。因为意识到大型语言模型会成为将来的基座,所以去年开始做大型语言模型方面的训练。后来又花费了半年时间,研究如何使大型语言模型理解人类指令以及具备对话能力。
记者:MOSS如何能够实现“端到端”走通大语言模型,克服了哪些难点?
邱锡鹏:“端到端”是一个学术概念,指的是从零开始,信息收集、数据处理、建立模型,到最终形成一个具有和人类对话能力的大模型,中间所有技术路径可以走通,这个就叫由起点到终点的“端到端”。因为OpenAI至今没有公布开发ChatGPT的技术路线和技术细节,所以我们需要靠有限的公开信息来自己摸索。
这个过程非常难,包含了非常多经验性、直觉性的设计,关键要打通两步:第一是基座,大型语言模型的基座不是简单的参数足够大就可以,还需要赋予大型语言模型各种各样的知识能力、学习能力,还有逻辑推理能力。第二就是要通过一些指令触发它的对话能力,让它理解人类意图,与人类能够交互对话。
到目前为止,我们还能把控技术路线,但未来可能会面临更大的困难,因为我们收集了非常多和人类交互的指令,要赋予它价值观和各种各样的能力,就要请一些专业人士来帮助我们设计,进一步增强MOSS各方面的能力。
记者:MOSS的名字是怎么来的?
邱锡鹏:在学术圈,大家非常喜欢用影视形象给自己开发的AI模型命名,也是一个比较常见的做法。比如,Transformer模型、Megatron模型名称取自《变形金刚》,BERT模型、ERNIE模型化用了《芝麻街》中的角色形象。那么,我们开发出这个具有对话能力的大型语言模型之后,也想找一个国产的、能够代表中国特色的影视形象来命名。
开发过程中,正逢《流浪地球2》电影热映,我们的团队成员都非常喜欢《流浪地球2》,也都是《流浪地球2》的粉丝。影片中的智能量子计算机MOSS给我们留下了深刻的印象,所以我们就把模型命名为MOSS,也是向《流浪地球2》这部电影致敬。这几天也有《流浪地球2》的粉丝们给我们发邮件,希望我们一定要加油,真的能够做出来。
新民晚报记者张炯强通讯员殷梦昊许文嫣
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!