类ChatGPT模型MOSS：英文回答水平超越中文，背后的数据差异解析

MOSS 2 年前 0 2

文章主题：复旦大学, 邱锡鹏, 类ChatGPT, MOSS

复旦大学邱锡鹏教授团队于2月21日宣布推出我国首个同类 ChatGPT 模型 MOSS，此消息一经发布，便引发了各行各业的积极参与内测的热潮。值得注意的是，MOSS 的英文回答表现相较于中文更为出色，这一现象在公众与 ChatGPT 的互动过程中也得到了相似的体现。那么，为何会出现这样的结果呢？

深圳粤港澳大湾区数字经济研究院（IDEA）认知计算与自然语言中心文本生成算法团队负责人王昊指出，数据质量的差异是中文自然语言处理面临的主要挑战之一。由于相较于英文数据，中文数据的开放度较低，使得中文数据集的规模相对较小。另外，英文作为科研的主流语言，在学术界和工业界中被广泛运用，从而积累了大量的优质语料数据，这为英文自然语言处理的研究带来了显著的优势。与此同时，MOSS研究团队也坦诚地表示，相较于中文，MOSS的英文回答能力更强。这是因为MOSS的模型基础学习了超过3000亿个英文单词，而中文词汇的学习量仅约为300亿个。

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复