文章主题:谷歌, I/O 开发者大会, 生成式人工智能, PaLM 2

666AI工具大全,助力做AI时代先行者!

在5月11日的北京时间中,谷歌公司年度I/O开发者大会正式开启。正如人们预期的那样,承受巨大压力的谷歌公司在主题演讲中,将生成式人工智能作为最重要的环节,并采取谨慎的推进策略。

长久以来,微软和OpenAI的优秀表现使得谷歌备受压力,市场对其前景产生了质疑。然而,在昨日凌晨的两个小时演讲中,谷歌向公众展示了其在人工智能领域的巨大潜力和实力,令人重燃希望。尽管其发展速度相对较慢,但这并不意味着谷歌已经陷入了绝境,相反,它只是在探索过程中稍显迟缓,但其能量和潜力依然不容小觑。

GPT-4的PaLM 2成功亮相,携手Duet AI整入谷歌办公全家桶Workspace,同时Bard的进化力量面向所有人开放。此外,谷歌搜索也加入了AI快照的新篇章,而AI的功能也被整合进了Android 14系统中。值得一提的是,谷歌相册中也新增了AI魔术编辑器,让用户在编辑照片时能够享受到更多AI技术的便利。

这届I/O大会,可谓眼花缭乱,精彩纷呈。

01

语言模型PaLM2亮相,Bard能力爆炸跃升

谷歌超过25种产品和功能的背后,是源于新一代大模型PaLM2的支持。

作为当前参与度最高的5400亿参数大型语言模型PaLM的升级版,PaLM2在超过100种语言的数据上进行了训练,从而使其具备了更出色的逻辑推理能力。在一定程度上,它的某些功能已经超过了GPT-4。

谷歌最近推出了四种不同的PaLM2规格:Gecko(壁虎)、Otter(水潭)、Bison(野牛)和Unicorn(独角兽)。在这些规格中,Gecko是最轻量级的模型,即使在离线状态下,它仍然可以在移动设备上运行。

Bard模型最初是基于LaMDA开发的,但随着时间的推移,它已经全面转向了PaLM。这一转变使得Bard模型的参数数量增加到了惊人的1370亿个。这种巨大的参数规模使得Bard在生成答案时具有更强的能力和更高的准确性。此外,Bard现在不仅可以生成单一的文本答案,还能够处理更加复杂和多样化的数据组,从而提高了其应用范围和实用性。与此同时,谷歌公司也在不断推动Bard模型的应用和发展。为了更好地整合其内部和外部产品,谷歌将Bard与其他产品进行了集成,使其不再局限于聊天机器人的范畴,而真正成为了一款实用的工具。这种跨产品的集成不仅扩大了Bard的应用场景,还为用户提供了更加便捷和高效的使用体验。总结起来,Bard模型的发展和应用是AI技术不断进步和发展的产物。从最初的基于LaMDA开发的单一文本 answers,到现在的全面转向PaLM和跨产品集成,Bard模型不断突破自我,不断提高自身的能力和实用性,为人类社会带来了更多的便利和创新。

Bard能够为您提供丰富的信息形式,不仅限于文字,还包括图片、视频和外部链接等多元化资源。在未来,我们将继续扩大支持的应用程序范围,包括谷歌的Drive和地图等服务,为用户提供更加便捷的体验。

另一方面,PaLM 2 在代码编写和调试支持方面取得了显著的进步,其训练覆盖了20种编程语言,包括Python、JavaScript等热门语言,以及Prolog、Verilog和Fortran等更为专业的语言。作为Codey——谷歌专为编码和调试而设计的模型——的基础部分,PaLM 2为谷歌的代码补全和生成服务提供了有力支持。

皮查伊现场演示了 PaLM 2 的代码调试功能,输入指令「你能修复这段代码的一个 bug,并添加一行一行的韩文注释吗?」,结果如下动图所示。

谷歌还基于PaLM 2为医疗领域推出了Med-PaLM 2模型。该模型由谷歌健康研究团队训练,可以回答问题并总结各种医学文本的发现,比如它可以根据 X 光片分析病人伤势,Google 在这方面已经达到人类医生的水平。

尤其重要的是,现在人人都可以用上Bard了。谷歌此次取消了等候队列,Bard将面向180多个国家和地区的用户全面开放。此外在英语之外,还增添了日语和韩语两种语言,未来将逐步支持40种语言的交互。

02

谷歌工作套件迎来“Duet AI”

Copilot 的竞争者来了。

此前,微软Copilot把GPT-4整进了全系办公产品,掀起了震惊全世界的办公软件革命。

怎么破?谷歌这次祭出了Duet AI,给谷歌办公全家桶Workspace来了一个全新升级。

跟微软Copolit类似,Duet AI将被全面集成至谷歌旗下的Work Space,包括谷歌文档、表格、幻灯片、会议、GmailMeet的自动会议摘要等等。同时还推出了一项名为Sidekick的新功能,能够跨不同的谷歌应用程序进行阅读、总结和回答文档中的问题。

比如在文档之中,直接输入文章主题就能完整的生成一篇文章。

在谷歌表格中,仅需输入一句话“遛狗业务客户和宠物统计”就能自动生成完整的表格,包含狗、地址、电子邮件、日期、时间、持续时间和费用等,还可以通过自然语言命令来对表格进行编辑。

接入AI的谷歌地图在搜索呈现方式上也进行了全面的升级。在2022年I/O上,谷歌地图增加了沉浸式视图功能。

结合AI后,用户可输入目的地和期待的出行方式,如骑自行车,从而获得谷歌地图对路线的全面规划、当日空气质量、交通状,以及由AI生成的沉浸式骑行路线视图。

AI 一键 P 图工具 Magic Editor

谷歌今天还带来了一项名为 Magic Editor 的功能,同样基于 PaLM 2 , 让用户无需专业工具即可对照片进行编辑。

谷歌分享了几个 Magic Editor 的实际应用示例,比如在一张人在瀑布前的照片中,谷歌将人移到了照片的一侧,抹去背景中的人,并使天空更蓝:

在另一张照片中,Magic Editor 能够让一个坐在长凳上的孩子向右移动,并且自动生成了新的长凳和气球部分,天空也更加生机勃勃了。

当然这个新功能也不是很完美,例如瀑布照片中包带的折痕和第二张长凳下的阴影错误。

目前谷歌办公领域的Duet AI功能还没有对公众进行开放,如果想试用这些新工具,需要先注册“工作场景实验室(Workspace Labs)”并加入等候名单。

03

生成式AI上线谷歌搜索

面对Bing的步步紧逼,作为谷歌的立身之本,搜索业务此次也迎来了重大的AI更新。

跟Bing类似,在用户搜索问题之后,搜索栏的下方会首先出现由AI提供的更直接的答案,以及与这个问题相关的图片、链接、视频等。根据第一次提问返回的信息,你还可以进一步进行交互查询更多的信息,知道你得到最需要的答案。

而当你打算通过谷歌搜索并购买一款产品时,AI不仅能够为你返回你需要的产品链接还能够为你想购买的产品提供摘要,包括提醒你购买时需要注意的事项、产品的特点、最新的评论等等。

这种新的基于搜索的AI 购物体验是建立在谷歌的 Shopping Graph之上的,该Shopping Graph 拥有超过 350 亿个产品列表,是目前世界上最全面的、且动态更新的产品、卖家、品牌、评论和库存数据集。但谷歌同时也强调,广告与自然搜索结果将被区分开来,不会影响用户的使用体验。

虽然AI功能登陆谷歌搜索令人振奋,但在全球数十亿用户面前,谷歌的推进步伐仍然相对谨慎。

跟Duet AI的工作场景实验室(Workspace Labs)”类似,为了测试全新的搜索功能,谷歌也设立了一个新的“搜索实验室(Search Labs)”,用户如果想要访问这新的搜索功能,必须选择一个名为 Search Generative Experience(简称 SGE)的功能。

此外,谷歌也强调并非所有搜索都会引发 AI 答案,只有当 Google 的算法认为它比标准结果更有用时AI 才会出现,而有关健康、财务等敏感主题的信息则不会出现。

04

Google 的 AI 焦虑,只能用 AI 来解题

有人戏称本届 Google I/O 应该叫做 Google AI/O ,微软和 OpenAI 的珠玉在前,Google 少了一点令人高呼 Amazing 的时刻,但这无疑也是 Google 近年来最为坚决的一次自我革命。

自称 AI-first 的 Google,却一直因为过于谨慎保守的策略多次错失先机。如今 Google 也终于意识到自己必须快速行动。

总体来看,今天谷歌IO是一场诚意满满的大会,在整个开幕演讲中,谷歌多次提到“大胆而负责任(bold and responsible)”这个词,试图证明谷歌可以在对社会和业务负责任的同时仍然可以快速行动。

当然 AI 也并非万能药,大升级后的 Bard 也未必能改变 Google 搜索被颠覆的趋势。但毫无疑问,AI 会重塑搜索,彻底改变这种交互方式。在 I/O 大会进行的同时,谷歌的股价也大涨了 5%。但现在真的可以说 Bard 能和 ChatGPT 媲美了吗?

来源:智能涌现、硅星人、爱范儿、品玩

版权声明:本文综合整理与网络,版权归原作者所有,如有版权问题,请联系公众号后台。

↑火爆课程,限时优惠券!?速领↑

点击“阅读原文”即可查看课程

谷歌, I/O 开发者大会, 生成式人工智能, PaLM 2

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注