文章主题:复旦大学, 邱锡鹏, 类ChatGPT, MOSS
复旦大学邱锡鹏教授团队于2月21日宣布推出我国首个同类 ChatGPT 模型 MOSS,此消息一经发布,便引发了各行各业积极参与内测的热潮。值得注意的是,MOSS 的英文回答表现相较于中文更为出色,这一现象在公众与 ChatGPT 的互动中也有一定的相似之处。那么,为何会出现这样的结果呢?
深圳粤港澳大湾区数字经济研究院(IDEA)认知计算与自然语言中心文本生成算法团队负责人王昊指出,数据质量的差异是中文自然语言处理面临的主要挑战之一。由于相较于英文数据,中文数据的开放度较低,使得中文数据集的规模相对较小。另外,英文作为科研的主流语言,在学术界和工业界中被广泛运用,从而积累了大量的优质语料数据,为英文自然语言处理的研究提供了巨大的优势。MOSS研究团队也坦诚地表示,“相较于中文,MOSS的英文回答能力更强,这是因为其模型基础部分学习了3000多亿个英文单词,而中文词汇的学习量仅约为300亿个。”
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!