文章主题:AI, 程序员面试, 文本生成, 文案撰写

666AI工具大全,助力做AI时代先行者!

什么样的 AI,能通过自家公司的程序员面试?

刚刚出炉的国产大模型「天工」做到了,黑马,绝对是黑马。

其开发商昆仑万维的 CEO 方汉在与量子位合作的首发直播中透露:

对天工模拟过校招算法工程师的第一轮面试,可以很流畅地通过。

天工回答算法题示例

如果你开始好奇天工是什么,不如请先它来一段自我介绍:

除了在编程语言上经受住面试级别的考验之外,在自然语言上天工还特别修炼过中文。

天工团队投入大量资源攻克了中文语料库的质量瓶颈 , 从数十万亿的数据中清洗、筛选出了3 万亿个单词数据用于训练大模型。

开发团队认为,优质的中文语料库让「天工」作为国产 AI, 在” 更懂中文 “这件事上具备天然的优势,更符合本土用戶的使用偏好。

天工自己倒是对此挺谦虚的,看来不仅学会了中文,还学会了谦虚的传统美德。

那么天工的中文水平到底如何,在首发直播中就进行了现场实时演示,不是放录像,是当场把问题敲进去那种。大模型作为新一代生产力工具,首先要考察的就是能不能在工作场景中帮到大家。

方汉表示天工在文本生成和文案撰写上的表现令他惊喜,并现场展示了三个场景。

首先是很多人都头疼的写周报,可以让天工直接搭一个框架出来,避免疏漏。

对于直接生成可用文本方面,选择的问题是写一个电商运营的招聘 JD。

天工给出结果后,方汉评价 ” 没有一到两年的 HR 工作经验是很难写这么完整的 “。

接下来要考验的是天工的创意能力,毕竟新晋独角兽 Jasper.ai 就是靠 AI 创意营销起家,AI 有了这方面能力商业化就有了保障。

直播中由于时间关系,只展示了编写二次元 mmorpg 游戏广告文案一个例子。

方汉进一步指出:“条件与上下文各有差异,所生成的结果自然也会大相径庭。对于广告文案工作来说,这样的差异性提供了极大的便利。”

直播过程中,除了官方准备的问题,网友也在弹幕中提出各种刁钻问题。

比如脑筋急转弯问题,天工也没有被难住,表现出一定逻辑能力。

还有一些灵魂拷问,天工给出的回答也都符合道德和人类价值观。更有意思的是,量子位 CEO 孟鸿在现场也向天工提出了一个尖锐的问题

作为一名自媒体创作者,面对大公司邀请评测其产品的机会,如何在保持专业素养的同时,既不过分吹捧,也不过分批评,既不丧失独立思考,又兼顾各方利益,确实是一项挑战。首先,我们应该明确自己的职业操守,始终坚守诚实、公正、客观的立场,不受任何外在压力的干扰。其次,对于产品的优点和不足,我们需要进行深入细致的分析,既要看到产品的实际价值,也要对其存在的问题有清晰的认识。同时,我们还应该借助这个机会,对公司的品牌形象和产品质量进行全面的评估,以期推动其在未来的发展上能够做出更好的改进。在这个过程中,我们需要保持独立思考,不受任何利益驱动,以期达到评测的目的,同时也维护了自己的职业声誉。

从结果上来看,天工确实是做到了 ” 既要又要 “,是一个” 三观比较正 “的 AI 了。

天工,是如何炼成的?

在看过天工的能力之后,想必很多朋友们都会好奇,它到底是如何炼成的。

对此,昆仑万维也毫不掩饰地将背后的 ” 秘笈 ” 给亮了出来。

首先便是 ” 大力出奇迹 ” 的大模型,而且还是双千亿参数的那种:

千亿预训练基座模型

千亿 RLHF 模型

千亿预训练基座模型,是指至少有一个千亿参数的深度学习模型,可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。

千亿 RLHF 模型,是指基于 “Reinforcement Learning with Human Feedback(RLHF)” 强化学习方法的一种模型。

RLHF(Reinforcement Learning with Human Feedback)模型可被视为一种独特的交互式机器学习框架,它能够借助人类的反馈来不断提升自身的性能,进而更好地应对不确定性和稀疏性问题的挑战。

而在二者的 ” 强强联手 ” 之下,大模型的优势便凸显了出来。

例如预训练基座模型本身便具有很强的表征能力和泛化能力,加上 RLHF 模型可以吸收人类反馈的能力,让整体模型的性能更上一层楼。

这种方法在决策过程的可解释性、模型的鲁棒性和稳定性方面,以及在处理更多学习任务方面,都有一定的提升效果。

而除了模型层之外,在算法层方面,天工也有自己的独到之处。

众所周知,当前市场上大量的类 ChatGPT 产品基础部分采用的是Transformer架构的自然语言处理模型,这一现象非常普遍。

简单来说,它包括多层 Transformer 编码器和解码器,自注意力机制,预训练和微调等技术。

而天工团队首次在此基础之上,引入了蒙特卡洛搜索树算法,名震一时的 AlphaGo 背后便是结合了这一算法。

其一般分为选择、扩展、模拟和回溯四个过程,核心思想总结来说就是把资源放在更值得搜索的分枝上。

天工所引入的蒙特卡洛搜索树算法,主要应用于对话管理系统中的相关任务。这种方法可以帮助系统更好地理解在对话过程中何时需要转换话题,以及如何有效地提出相关问题以获取更多信息。通过运用这种算法,对话管理系统得以在实际对话场景中实现更为流畅、高效的信息交流与处理。

天工之所以具备卓越的记忆能力、能够应对超过一万字的文本对话以及20轮的交互,且整个过程极为流畅,皆因它经过了大量的训练与优化。

但除了模型和算法之外,天工的 ” 利刃 ” 还不仅于此。

中国最大 GPU 集群加持

数据和算力,亦是这轮 ChatGPT、大模型之战的关键所在。

在数据方面,天工所采用的策略是” 开源的力量 “——凝聚了百位开源社区 AI 科学家。

也正因如此,天工从数十万亿的数据中,最终清洗、筛选出了近 3 万亿单词的数据。

ChatGPT 在训练过程中所使用的单词数据量仅为 3 万亿,这一事实反映了它在语言生成方面的强大能力。因此,当我们在使用天工智能助手时,会感受到它的语言更加流畅,理解能力更加出色。这是由于 ChatGPT 在训练过程中吸收了大量的文本数据,从而使其具备了更丰富、更准确的语义理解和生成能力。

那么面对如此庞大的数据训练量,接踵而至的老大难问题,便是算力了。

对此,昆仑万维方汉在直播过程中非常自信地表示:

天工的算力是基于中国最大的 GPU 集群之一

这也就是 ChatGPT 在支持十轮对话的时候,天工能够达到 20 多轮的原因所在了。

但若是纵览昆仑万维在技术上的布局,就不难发现,天工的诞生并非是一蹴而就的事情。

因为早在 2020 年昆仑万维便已然入局,累计投入了已达数亿元人民币、数百人参与研发。

并且在 2022 年发布 AIGC 全系列算法模型的同时,就开源了百亿级参数模型,积累了广泛的开发者好评与社区共创。

而至于为何选择在这个时间节点发布天工,方汉表示:

是综合考虑了技术水平和用户需求后做出的选择。

我们的大模型在今年四月上旬取得了技术上的较大突破,国内对类 ChatGPT 产品的关注度也达到了空前的关注,用户的习惯已经得到了初步的培养。

因此在这个时间节点推出,便可以很好地满足用户的现实需求。

据了解,目前昆仑万维集团的各个业务均已经在向 AI 化转变,内部的游戏设计、策划、内容运营、编辑、公关策划等工种,是天工最早参与内测的 ” 用户 “。

在未来,昆仑万维也有计划向 B 端用户开放 API 接口

总而言之,有大数据、有大算力、有大模型,昆仑万维在国产 ChatGPT 之战上的前行道路,是值得期待一波了。

AI, 程序员面试, 文本生成, 文案撰写

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注