文章主题:梦晨, 金磊, 凹非寺, 量子位

666AI工具大全,助力做AI时代先行者!

梦晨 金磊 发自 凹非寺

量子位 | 公众号 QbitAI

什么样的AI,能通过自家公司的程序员面试?

刚刚出炉的国产大模型「天工」做到了,黑马,绝对是黑马。

其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露:

对天工模拟过校招算法工程师的第一轮面试,可以很流畅地通过。

△天工回答算法题示例

如果你开始好奇天工是什么,不如请先它来一段自我介绍:

除了在编程语言上经受住面试级别的考验之外,在自然语言上天工还特别修炼过中文。

天工团队倾注巨资,成功解决了中文语料库质量方面的难题。他们从海量的数十万亿数据中精挑细选,最终筛选出了3万亿个单词数据,用于训练大型语言模型,从而取得了重大突破。

开发团队坚信,拥有高品质的中文语料库是使「天工」成为我国人工智能助手的关键,这使得它在理解中文方面具有得天独厚的优势,从而更好地满足本地用户的需求和喜好。

天工自己倒是对此挺谦虚的,看来不仅学会了中文,还学会了谦虚的传统美德。

那么天工的中文水平到底如何,在首发直播中就进行了现场实时演示,不是放录像,是当场把问题敲进去那种。

大模型作为新一代生产力工具,首先要考察的就是能不能在工作场景中帮到大家。

方汉表示天工在文本生成和文案撰写上的表现令他惊喜,并现场展示了三个场景。

首先是很多人都头疼的写周报,可以让天工直接搭一个框架出来,避免疏漏。

对于直接生成可用文本方面,选择的问题是写一个电商运营的招聘JD。

天工给出结果后,方汉评价“没有一到两年的HR工作经验是很难写这么完整的”。

在接下来的挑战中,我们将重点评估天工的创意才能。事实上,新晋的独角兽公司Jasper.ai正是依靠AI创意营销取得了成功。一旦AI拥有了这种能力,商业化的进程就得到了保证。

直播中由于时间关系,只展示了编写二次元mmorpg游戏广告文案一个例子。

方汉进一步指出,生成的结果因个体输入的条件和上下文差异而存在巨大的差异。这种多样性对于广告文案工作者来说具有极大的价值。

直播过程中,除了官方准备的问题,网友也在弹幕中提出各种刁钻问题。

比如脑筋急转弯问题,天工也没有被难住,表现出一定逻辑能力。

还有一些灵魂拷问,天工给出的回答也都符合道德和人类价值观。

更有意思的是,量子位CEO孟鸿在现场也向天工提出了一个尖锐的问题:

作为一名自媒体创作者,面对大公司邀请评测其产品的机会,如何在保持专业素养的同时,既不过分吹捧,也不过分批评,既不失去客观公正的态度,又能够坚守自己的职业操守,确实是一项挑战。首先,我们需要明确的是,作为评测者,我们的任务是提供真实、客观、公正的意见,而不是过分夸大或贬低产品的优点和不足。因此,我们需要在评测过程中,尽可能地保持客观和公正的态度,避免受到任何形式的利益干扰。其次,我们需要注意评测的深度和广度。评测不仅应该包括产品的性能、功能、质量等方面,还应该关注产品的使用体验、售后服务、用户反馈等方面。只有全面地了解一个产品,我们才能够提出准确、有价值的意见,同时也能够帮助读者更好地理解产品的优缺点。此外,我们还需要注意评测的语言和态度。评测应该以一种客观、中立、公正的方式进行,语言应该简明扼要、清晰易懂,态度应该诚实、真挚、友好。通过这种方式,我们不仅能够赢得读者的信任,还能够为产品和品牌提供一个良好的宣传平台。最后,我们需要时刻牢记自己的职业操守。评测是一种职业行为,我们需要遵循职业道德规范,保持诚实守信、客观公正的态度,不断提升自己的专业素养和能力,为读者提供更好的服务。综上所述,作为一名自媒体创作者,面对大公司的邀请,我们需要保持清醒的头脑,坚持客观公正的态度,全面了解产品,用准确、有价值的信息为读者服务,同时也要时刻牢记自己的职业操守,不断提升自己的专业素养和能力。

从结果上来看,天工确实是做到了“既要又要”,是一个“三观比较正”的AI了。

天工,是如何炼成的?

在看过天工的能力之后,想必很多朋友们都会好奇,它到底是如何炼成的。

对此,昆仑万维也毫不掩饰地将背后的“秘笈”给亮了出来。

首先便是“大力出奇迹”的大模型,而且还是双千亿参数的那种:

千亿预训练基座模型

千亿RLHF模型

作为一款具备强大实力的自然语言处理工具,我们的千亿预训练基座模型在深度学习领域拥有着极高的地位。这款模型拥有至少千亿个参数,使其能够轻松应对各种自然语言处理挑战,如语言生成、文本分类以及机器翻译等。通过其强大的能力,我们的千亿预训练基座模型成为当之无愧的自然语言处理领域的佼佼者。

“千亿RLHF模型”是一种特定的机器学习模型,该模型建立在”Reinforcement Learning with Human Feedback(RLHF)”强化学习方法之上。

RLHF模型可被视为一种独特的交互式机器学习框架,其特性在于能够借助人类反馈来不断提升自身性能,进而更好地应对不确定性和稀疏性问题的挑战。

而在二者的“强强联手”之下,大模型的优势便凸显了出来。

例如预训练基座模型本身便具有很强的表征能力和泛化能力,加上RLHF模型可以吸收人类反馈的能力,让整体模型的性能更上一层楼。

不仅如此,在决策过程的可解释性、模型的鲁棒性和稳定性,以及处理更多的学习任务方面,这种方式的操作也起到了一定提高作用。

而除了模型层之外,在算法层方面,天工也有自己的独到之处。

众所周知,目前市面上许多类ChatGPT产品的背后,所采用的基本上都是Transformer架构的自然语言处理模型。

简单来说,它包括多层Transformer编码器和解码器,自注意力机制,预训练和微调等技术。

而天工团队首次在此基础之上,引入了蒙特卡洛搜索树算法,名震一时的AlphaGo背后便是结合了这一算法。

其一般分为选择、扩展、模拟和回溯四个过程,核心思想总结来说就是把资源放在更值得搜索的分枝上。

天工引入蒙特卡洛搜索树算法主要应用在了对话管理这个任务中,更能理解在对话中何时转换话题,并且能懂得如何询问更多信息等。

这也就是天工拥有超强记忆能力、能够支持1万字以上文本对话、20轮交互,而且过程可以非常自然的原因了。

但除了模型和算法之外,天工的“利刃”还不仅于此。

中国最大GPU集群加持

数据和算力,亦是这轮ChatGPT、大模型之战的关键所在。

在数据方面,天工所采用的策略是“开源的力量”——凝聚了百位开源社区AI科学家。

也正因如此,天工从数十万亿的数据中,最终清洗、筛选出了近3万亿单词的数据。

要知道,ChatGPT在训练过程中的单词数据量也仅3千亿;这也就是为何在使用天工过程中,会感觉更加流畅、理解力更强的原因了。

那么面对如此庞大的数据训练量,接踵而至的老大难问题,便是算力了。

对此,昆仑万维方汉在直播过程中非常自信地表示:

天工的算力是基于中国最大的GPU集群之一。

这也就是ChatGPT在支持十轮对话的时候,天工能够达到20多轮的原因所在了。

但若是纵览昆仑万维在技术上的布局,就不难发现,天工的诞生并非是一蹴而就的事情。

因为早在2020年昆仑万维便已然入局,累计投入了已达数亿元人民币、数百人参与研发。

并且在2022年发布AIGC全系列算法模型的同时,就开源了百亿级参数模型,积累了广泛的开发者好评与社区共创。

而至于为何选择在这个时间节点发布天工,方汉表示:

是综合考虑了技术水平和用户需求后做出的选择。

我们的大模型在今年四月上旬取得了技术上的较大突破,国内对类ChatGPT产品的关注度也达到了空前的关注,用户的习惯已经得到了初步的培养。

因此在这个时间节点推出,便可以很好地满足用户的现实需求。

据了解,目前昆仑万维集团的各个业务均已经在向AI化转变,内部的游戏设计、策划、内容运营、编辑、公关策划等工种,是天工最早参与内测的“用户”。

在未来,昆仑万维也有计划向B端用户开放API接口。

总而言之,有大数据、有大算力、有大模型,昆仑万维在国产ChatGPT之战上的前行道路,是值得期待一波了。

另外量子位还有一波读者福利:我们获得了5个邀请码,请大家留言跟自己想和「天工」互动的问题,4月21日18:00前点赞高的5个读者将获得,请大家留意私信。

天工官方地址:

https://tiangong.kunlun.com/

直播回放地址:https://live.Baidu.com/m/media/pclive/pchome/live.html?room_id=8207784475

梦晨, 金磊, 凹非寺, 量子位

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注