《AI面试神手：揭秘昆仑万维旗下天工的神奇之处》

文章主题：AI, 程序员面试, 文本生成, 文案撰写

666AI工具大全，助力做AI时代先行者！

什么样的 AI，能通过自家公司的程序员面试？

刚刚出炉的国产大模型「天工」做到了，黑马，绝对是黑马。

其开发商昆仑万维的 CEO 方汉在与量子位合作的首发直播中透露：

对天工模拟过校招算法工程师的第一轮面试，可以很流畅地通过。

△天工回答算法题示例

如果你开始好奇天工是什么，不如请先它来一段自我介绍：

除了在编程语言上经受住面试级别的考验之外，在自然语言上天工还特别修炼过中文。

天工团队投入大量资源攻克了中文语料库的质量瓶颈 , 从数十万亿的数据中清洗、筛选出了3 万亿个单词数据用于训练大模型。

开发团队认为，优质的中文语料库让「天工」作为国产 AI, 在” 更懂中文 “这件事上具备天然的优势，更符合本土用戶的使用偏好。

天工自己倒是对此挺谦虚的，看来不仅学会了中文，还学会了谦虚的传统美德。

那么天工的中文水平到底如何，在首发直播中就进行了现场实时演示，不是放录像，是当场把问题敲进去那种。大模型作为新一代生产力工具，首先要考察的就是能不能在工作场景中帮到大家。

方汉表示天工在文本生成和文案撰写上的表现令他惊喜，并现场展示了三个场景。

首先是很多人都头疼的写周报，可以让天工直接搭一个框架出来，避免疏漏。

对于直接生成可用文本方面，选择的问题是写一个电商运营的招聘 JD。

天工给出结果后，方汉评价 ” 没有一到两年的 HR 工作经验是很难写这么完整的 “。

接下来要考验的是天工的创意能力，毕竟新晋独角兽 Jasper.ai 就是靠 AI 创意营销起家，AI 有了这方面能力商业化就有了保障。

直播中由于时间关系，只展示了编写二次元 mmorpg 游戏广告文案一个例子。

方汉进一步指出：“条件与上下文各有差异，所生成的结果自然也会大相径庭。对于广告文案工作来说，这样的差异性提供了极大的便利。”

直播过程中，除了官方准备的问题，网友也在弹幕中提出各种刁钻问题。

比如脑筋急转弯问题，天工也没有被难住，表现出一定逻辑能力。

还有一些灵魂拷问，天工给出的回答也都符合道德和人类价值观。更有意思的是，量子位 CEO 孟鸿在现场也向天工提出了一个尖锐的问题：

作为一名自媒体创作者，面对大公司邀请评测其产品的机会，如何在保持专业素养的同时，既不过分吹捧，也不过分批评，既不丧失独立思考，又兼顾各方利益，确实是一项挑战。首先，我们应该明确自己的职业操守，始终坚守诚实、公正、客观的立场，不受任何外在压力的干扰。其次，对于产品的优点和不足，我们需要进行深入细致的分析，既要看到产品的实际价值，也要对其存在的问题有清晰的认识。同时，我们还应该借助这个机会，对公司的品牌形象和产品质量进行全面的评估，以期推动其在未来的发展上能够做出更好的改进。在这个过程中，我们需要保持独立思考，不受任何利益驱动，以期达到评测的目的，同时也维护了自己的职业声誉。

从结果上来看，天工确实是做到了 ” 既要又要 “，是一个” 三观比较正 “的 AI 了。

天工，是如何炼成的？

在看过天工的能力之后，想必很多朋友们都会好奇，它到底是如何炼成的。

对此，昆仑万维也毫不掩饰地将背后的 ” 秘笈 ” 给亮了出来。

首先便是 ” 大力出奇迹 ” 的大模型，而且还是双千亿参数的那种：

千亿预训练基座模型

千亿 RLHF 模型

千亿预训练基座模型，是指至少有一个千亿参数的深度学习模型，可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。

千亿 RLHF 模型，是指基于 “Reinforcement Learning with Human Feedback（RLHF）” 强化学习方法的一种模型。

RLHF（Reinforcement Learning with Human Feedback）模型可被视为一种独特的交互式机器学习框架，它能够借助人类的反馈来不断提升自身的性能，进而更好地应对不确定性和稀疏性问题的挑战。

而在二者的 ” 强强联手 ” 之下，大模型的优势便凸显了出来。

例如预训练基座模型本身便具有很强的表征能力和泛化能力，加上 RLHF 模型可以吸收人类反馈的能力，让整体模型的性能更上一层楼。

这种方法在决策过程的可解释性、模型的鲁棒性和稳定性方面,以及在处理更多学习任务方面,都有一定的提升效果。

而除了模型层之外，在算法层方面，天工也有自己的独到之处。

众所周知，当前市场上大量的类 ChatGPT 产品基础部分采用的是Transformer架构的自然语言处理模型，这一现象非常普遍。

简单来说，它包括多层 Transformer 编码器和解码器，自注意力机制，预训练和微调等技术。

而天工团队首次在此基础之上，引入了蒙特卡洛搜索树算法，名震一时的 AlphaGo 背后便是结合了这一算法。

其一般分为选择、扩展、模拟和回溯四个过程，核心思想总结来说就是把资源放在更值得搜索的分枝上。

天工所引入的蒙特卡洛搜索树算法，主要应用于对话管理系统中的相关任务。这种方法可以帮助系统更好地理解在对话过程中何时需要转换话题，以及如何有效地提出相关问题以获取更多信息。通过运用这种算法，对话管理系统得以在实际对话场景中实现更为流畅、高效的信息交流与处理。

天工之所以具备卓越的记忆能力、能够应对超过一万字的文本对话以及20轮的交互，且整个过程极为流畅，皆因它经过了大量的训练与优化。

但除了模型和算法之外，天工的 ” 利刃 ” 还不仅于此。

中国最大 GPU 集群加持

数据和算力，亦是这轮 ChatGPT、大模型之战的关键所在。

在数据方面，天工所采用的策略是” 开源的力量 “——凝聚了百位开源社区 AI 科学家。

也正因如此，天工从数十万亿的数据中，最终清洗、筛选出了近 3 万亿单词的数据。

ChatGPT 在训练过程中所使用的单词数据量仅为 3 万亿，这一事实反映了它在语言生成方面的强大能力。因此，当我们在使用天工智能助手时，会感受到它的语言更加流畅，理解能力更加出色。这是由于 ChatGPT 在训练过程中吸收了大量的文本数据，从而使其具备了更丰富、更准确的语义理解和生成能力。

那么面对如此庞大的数据训练量，接踵而至的老大难问题，便是算力了。

对此，昆仑万维方汉在直播过程中非常自信地表示：

天工的算力是基于中国最大的 GPU 集群之一。

这也就是 ChatGPT 在支持十轮对话的时候，天工能够达到 20 多轮的原因所在了。

但若是纵览昆仑万维在技术上的布局，就不难发现，天工的诞生并非是一蹴而就的事情。

因为早在 2020 年昆仑万维便已然入局，累计投入了已达数亿元人民币、数百人参与研发。

并且在 2022 年发布 AIGC 全系列算法模型的同时，就开源了百亿级参数模型，积累了广泛的开发者好评与社区共创。

而至于为何选择在这个时间节点发布天工，方汉表示：

是综合考虑了技术水平和用户需求后做出的选择。

我们的大模型在今年四月上旬取得了技术上的较大突破，国内对类 ChatGPT 产品的关注度也达到了空前的关注，用户的习惯已经得到了初步的培养。

因此在这个时间节点推出，便可以很好地满足用户的现实需求。

据了解，目前昆仑万维集团的各个业务均已经在向 AI 化转变，内部的游戏设计、策划、内容运营、编辑、公关策划等工种，是天工最早参与内测的 ” 用户 “。

在未来，昆仑万维也有计划向 B 端用户开放 API 接口。

总而言之，有大数据、有大算力、有大模型，昆仑万维在国产 ChatGPT 之战上的前行道路，是值得期待一波了。

AI, 程序员面试, 文本生成, 文案撰写

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复