腾讯混元
若要用一个词来形容2023年2月的国内大厂,那就是“不甘落后”。和2月公布“文心一言”的百度相比,腾讯相对低调,但也备受万众瞩目的压力。 职场Bonus独家获悉,腾讯针对类ChatGPT对话式产品已成立「混元助手(HunyuanAide)」项目组,该项目组Owner为张正友,PM分别为俞栋、王迪、刘田,目前该项目有至少7位组长、7位Sponsor。上述几乎每一位在腾讯都是重量级人物(完整名单见文末)。 职场Bonus从多处信源得知:该项目组将联合腾讯内部多方团队构建大参数语言模型,目标是“通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,并能成为国内的业界标杆”。腾讯的底气之一,是手中“多样、高质的真实数据”;另一层是物理硬件问题的解决(后文会提到);还有一层,或许是多年来积累的人工智能技术人才。 17级大牛带队,3位PM顶梁,跨事业群精英集结 ╱ 01 低调布局争取来的“下注”时间╱ 02 大厂抢人,选对专业的应届生狂喜╱ 03 17级大牛带队,3位PM顶梁, 跨事业群精英集结 「混元助手(HunyuanAide)」项目组的一号位张正友,是腾讯史上最高专业职级拥有者。早年他曾就职于微软研究院,带领视觉团队从事大量学术研究,在Windows、Office、Xbox、Kinect、Skype for Business、Office Lens等诸多微软产品里都有其团队的贡献。张正友于2018年加入腾讯,带领创建了腾讯机器人实验室Robotics X,致力推进人机协作的下一代机器人研究。2021年1月8日,腾讯宣布张正友成为腾讯首位17级研究员/杰出科学家。 “正友是位随和的大牛,”与其短暂共事过的人告诉职场Bonus,“但他擅长的方向偏计算机视觉、立体视觉、3D重建,而类ChatGPT工具要突破的技术领域应该在NLP自然语言处理。虽然都是人机协作的必备课题,但两类领域略有区别。”据此预测,该“智能大助手”产品未来极有可能出现类“DALL·E [1] ”等结合图像、视觉能力的功能和应用场景。 学术背景方面,张正友于1985年本科毕业于浙江大学信息与电子工程系,1987年在南锡第一大学(现洛林大学)获计算机科学硕士学位,1990 年获巴黎第十一大学计算机科学博士学位。在国际顶尖会议和杂志上,张正友发表论文250余篇,论文引用次数51000多次,有超200项专利。其于1999年论文提出的摄像机标定法“张氏标定法”在全世界被普遍采用,获2013 IEEE Helmholtz时间考验奖。 [1] DALL·E:OpenAI推出的文本转图像模型 3位PM的能力画像,分别侧重于算法、工程和商业化。职场Bonus获悉,3人当中,余栋或会主要负责强化学习和多轮对话,王迪主要负责大模型、预训练。 俞栋是将深度学习成功应用在语音识别领域的开创者之一,他提出的理论与模型已经广泛用于业界的语音识别和处理系统中。其主要研究的领域包括自动语音识别、语音处理和自然语言处理等,发明了100多项专利,曾获得IEEE、NAACL的多个论文奖项,谷歌学术引用量5余万次。 王迪作为2008年7月校招即加入腾讯的15年老员工,经历过重组、换团队的动荡。我们在其2016年为数不多的一次采访中得知,当时他与团队正在给公司内部其他BG的业务产品提供“搜索引擎检索系统”相关模块的开发。目前,王迪已是腾讯TEG-AI平台部的助理总经理。 从组长的构成来看,「混元助手」项目的确做到了凝聚腾讯内部多个团队的能力。 其中Ying Shan(Dr. Shan)是腾讯PCG-ARC Lab(应用研究中心实验室)的杰出科学家和主任,在在线广告、计算机视觉、深度学习、文本挖掘和大数据分析领域拥有近22年的经验。和张正友一样,在加入腾讯之前他也在微软研究院(微软是AI华人黄埔军校实锤),并在Bing Ads担任首席科学家经理(Manager role),在ICCV、CVPR、ECCV、SIGGRAPH、KDD、PAMI、IJCV等顶级会议和期刊发表论文30余篇,拥有30项美国/国际专利。 项目的赞助支持人员更是堪称腾讯豪华阵容。值得注意的是,除了能看到TEG、PCG、CSIG力量的参与,微信和互娱的也出现在名单人员的业务覆盖面内。 低调布局争取来的“下注”时间 整份名单透露出的气息,可以用两个词来形容:押宝。 我们能在贯穿腾讯2022年的“降本增效”主题中找到鲜明的对比:上文提到的PCG(平台与内容事业群)、CSIG(云与智慧产业事业群)均在去年经历了公司范围内最大力度的裁员;AI Lab所挂靠的TEG(技术工程事业群)也曾被部分内部员工吐槽“穷”,被认为科研自由度不如百度。据晚点LatePost,去年腾讯除了砍掉十余款长期亏损的低战略价值产品、批评整治内部贪腐、调整多部门业务策略与考核重点,还通过转型深度自研来加速技术降本。 「混元助手」并不是混元AI大模型的第一次亮相。2022年6月,腾讯多模态AI大模型先被应用在了广告投放这一toB业务领域进行“降本增效”:先以腾讯混元AI大模型助力系统理解广告内容,其次以精排大模型提升广告和用户的匹配准确率,模型训练用的是腾讯机器学习平台太极。相比以前的小模型算法,腾讯广告精排大模型当时累计给广告主带来15%的GMV提升。 虽然对大模型早有布局,但如今,腾讯之所以能短时间内如此果断地往“大模型”上加注押宝,多是由于ChatGPT在用户增长和商业上摧枯拉朽的表现。用过的人或许知道,ChatGPT的交互界面极为简单,产品形态也相当原始。但上线5天后,ChatGPT注册用户便超过100万,2个多月后月活破亿,迅速超过了TikTok用9个月破亿的历史纪录。 在「混元助手」之前,腾讯最接近ChatGPT的项目或是智能创作助手文涌(Effidit)。「文涌」出自腾讯 AI Lab,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型,具有智能纠错、文本补全、文本润色等功能。 “混元大模型本就是国内自然语言类中的最强者。”内部知情人士对腾讯混元助手项目的未来信心满满。去年4月29日,腾讯混元AI大模型在CLUE(中文语言理解评测集合)分类榜中取得第一并刷新该榜单历史纪录,分数突破80.888分,有相关分析文章认为,该模型在自然语言处理上的实力接近人类语言理解能力。...