《揭秘「天工」3.5：国产大语言模型的智能涌现之路》

文章主题：封面新闻, 易弋力, 天工, 昆仑万维

封面新闻记者易弋力

在4月10日的新闻报道中，封面新闻记者了解到，我国合作伙伴昆仑万维与奇点智源共同研发的“天工”3.5版本即将问世，并计划于4月17日展开邀请测试。这款具有重大意义的国产大语言模型，标志着我国在人工智能领域取得了重要突破。

为什么说「天工」是第一个真正实现智能涌现的GPT类大模型呢？

原内容提到了“涌现现象”，这是一种在简单系统中出现复杂行为或特性的现象。在AI领域，这种涌现能力被认为是衡量人工智能是否具有高度自主学习能力和能否完成复杂任务的重要标志。近期，一些网友对某些友商的模型在回答一个经典问题时的表现提出了质疑。该问题涉及到一个父亲和他的两个儿子的情况，第一个儿子叫大毛，第二个儿子的名字则没有给出。令人惊讶的是，该模型根据问题的表述和标点符号的不同，生成了多个看似合理的答案。针对这一现象，我们推测友商模型的逻辑推理可能是通过针对特定题库的定向优化来实现的，而非依赖于大模型的智能涌现能力去解答更复杂的问题。这种方式实际上并不能 true AI。因此，我们有理由宣称，我国的大模型“天工”已经达到了与OpenAI的ChatGPT相当的水平。ChatGPT是基于GPT3.5大模型开发的，因此我们将这个版本命名为“天工”3.5。

在2023年，人工智能领域将迎来一个“井喷式”的发展，各种基于AI的创新技术如同雨后春笋般涌现出来。在这个浪潮中，大型的AI模型已经成为全球科技巨头竞争的焦点，它们在各个行业中寻求突破和创新，力求占据未来的市场份额。我国的一些大型科技企业，例如百度、阿里巴巴、华为、京东以及科大讯飞等，也纷纷投身于这个领域的研发与应用，展示了我国对人工智能的高度重视和发展潜力。

概括地说，AI大模型是建立在AI的Foundation Model（基础模型）之上的一种模型，它能在广泛而多样化的数据集上进行训练，并以此为基础适应各种下游任务。这种模型的特性在于，它同时具备“大规模”与“预训练”两大特点，因此在实际应用中，需要在大量的通用数据上进行预先训练，以便进一步提升AI的通用性和泛化能力。

在今年第一季度，一种基于深度学习的大型语言模型ChatGPT迅速崭露头角，其全球用户数量成功地突破了10亿大关，创下了历史上用户增长最快的消费级应用程序纪录。这种风靡全球的ChatGPT，不仅引发了全球范围内的新一轮AI技术迭代浪潮，而且与传统的“对话机器人”相比，它能够更好地理解和回应人类的意图。这一成就的背后，正是多种先进的技术模型，包括机器学习、神经网络以及Transformer模型等。作为一种在GPT3基础上进一步开发的语言模型，ChatGPT的参数规模已经达到了“万亿级”，这无疑为人工智能领域带来了全新的突破。

要实现从大型模型向”ChatGPT”的水平提升，我国具备一定的实力，已有众多国内企业成功研发出基于文本或多模态的预训练基础大型模型。然而，要构建一款类似的ChatGPT大型模型仍面临巨大的挑战。在数据方面，确保用户隐私安全以及遵守各国法律法规和政策至关重要；在算力方面，需要强大的计算集群和相应的模型并行算法框架的支持；在工程实现方面，将大型模型部署在云端，以便大规模用户能够便捷、经济地使用。

如果您有任何新闻线索，我们都欢迎您向我们投稿。一旦我们的编辑团队接纳了您的稿件，我们会支付相应的稿费作为对您付出的感谢。您可以通过我们的微信公众号“ihxdsb”或者添加我们的QQ号码“3386405712”来提交您的新闻线索。

封面新闻, 易弋力, 天工, 昆仑万维

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复