AI巨头争锋：OpenAI、Anthropic与谷歌大模型更新背后的竞争格局

文章主题：本周, OpenAI 前脚刚刚更新了插件 “Code interpreter”, 两大最强竞争对手 Anthropic 和谷歌就相继宣布更新 Claude 和 Bard;,两家竞对现在的升级趋势就是让用户 “免费用上 GPT4 plus”

666AI工具大全，助力做AI时代先行者！

AI界在本周发生了哪些大事呢？

观点前瞻

大模型都在追赶ChatGPT，而OpenAI却准备成为反内卷达人；

本周，OpenAI的前端开发团队推出了全新的“Code interpreter”插件。与此同时，两大实力雄厚的竞争对手，Anthropic和谷歌，也纷纷宣布了对旗下产品Claude和Bard的升级更新。

两家竞对现在的升级趋势就是让用户“免费用上GPT4 plus”，甚至是超越它；

而反观Ai大模型鼻祖，这边也是不慌不忙：不仅不卷大模型，甚至是准备停下来等等其它大模型的步伐。

“根据外媒报道，OpenAI正准备开始创建多个运行成本较低的小型GPT-4模型，每个较小的专家模型都在不同的任务和主题领域进行训练。”

简而言之，就是OpenAI家正打算走降本的轻量化路线，下一目标很可能是推广多种垂类大模型。

从【硬AI】的角度来看，OpenAI所采用的【混合专家模型】在短期内或许会降低部分回答的质量，但从长远看，这可能是一条更为贴近产业应用的有效途径。

本周日报你还能获得以下咨询：

1、Bard、Claude2、ChatGPT纷纷升级，谁都不闲着

2、AI作图界继续开卷：

在最近的AI竞赛中，Meta公司成功战胜了Midjourney团队，展示出了他们在人工智能领域的强大实力。此外，Stability AI与腾讯公司联手推出了Stable Doodle项目，这标志着我国在AI稳定性方面的研究又迈出了重要的一步。与此同时，一种名为SAM-PT的视频分割大模型也引起了广泛的关注，它能在处理大量视频数据时，实现高效的图像分割。

3、国内模型大事件：

网信办给国内大模型“上保险”；阿里开源国内首个大模型”对齐数据集”；京东发布言犀大模型；智源超越DeepMind；王小川大模型再升级

4、海外热点消息

在近期，英国的两所著名学府——牛津大学和剑桥大学都相继取消了对于ChatGPT的禁令。与此同时，Meta公司也宣布将推出其AI模型的商用版本。此外，特斯拉创始人埃隆·马斯克的“打脸”行为也引起了广泛关注。他曾经公开抵制AI技术，而现在却转变立场，成立了名为”xAI”的公司。这些事件都表明，AI技术正逐渐被广泛接受和使用。

Bard、Claude2、ChatGPT都不闲着

1、Bard更新：支持中文、图像理解、语音提问

此前只支持英文提问的Bard终于更新了中文等40多种语言的输入，还新增欧盟和巴西地区访问，

不仅如此，Bard还更新了以下几个功能：

上传和理解图片（tips：仅支持英文版）可以通过语音进行提问；保存历史记录和分享对话链接（与GPT一样）定制回复的长度、风格导出代码功能

2、Claude2：一键帮你总结PDF

在Claude的升级版中，第二代便直接采用了GPT plus会员功能。该功能允许用户上传PDF文件，同时，它还能帮助用户深入挖掘和理解多文档之间的关联性。此外，Claude升级版支持txt和pdf等多种格式的文件，并且单个文件的最大尺寸不得超过10MB。

3、ChatGPT上线最牛插件-代码解释器

GPT4最新发布的插件——代码解释器，最初被称为“让每个人都成为数据分析师”。这款插件在数据处理和可视化方面表现出色，为用户提供了强大的数据分析能力。

不过最近又在网友的测试下，解锁了一些新功能：比如做成小视频、制作简易小游戏、表情包等等；

感觉这个插件的功能还有待网友们继续探索和解密。

AI作图界又发生了哪些大事

1、Meta突破多模态天花板，打败Stable Diffusion、Midjourney

Meta推出一款单一多模态大模型——CM3leon，问市即巅峰？

现在都说CM3leon比Stable Diffusion、Midjourney、DALL-E 2还牛，这是为啥？

【有多硬】

CM3leon采用自回归模型独领风骚，比前期领航梯队Stable Diffusion等多模态采用的扩散模型的计算量少了五倍；

能处理更复杂的提示词，并且完成作图任务；

根据任意格式的文本指令对现有图像进行编辑，比如更改天空颜色，或者在特定位置添加对象。

客观的说：CM3leon能达到的能力还真的可以位居多模态市场巅峰，不仅是清晰度更高、还能突破此前多模态的绘画瓶颈：比如手部细节刻画、用语言提示词进行物体、空间细节布局等；

这可能都要归功于CM3leon的多功能架构，这意味着多模态大模型以后可以实现在文本、图像、视频等多任务间自由切换，这是之前多模态所达不到的。

2、Stability AI推出图片生成控制模型Stable Doodle

简单来说Stable Doodle大模型就是给它一张草图，帮助你实现图片控制；类似ControlNET的功效；

【有多硬】

这个Stable Doodle是基于Stable Diffusion XL模型与T2I-Adapter相结合而成。

而T2I-Adapter是腾讯ARC实验室的一款图文控制器；参数只有70M存储空间300M，非常小巧，但是能够更好的理解草图的轮廓，并帮助SDXL做图片生成进一步的控制；

3、视频分割大模型【SAM-PT】现身

前段时间，Meta AI开源了一个非常强大的图像分割基础模型Segment Anything Model（SAM），瞬间引爆了AI圈。

现在，来自苏黎世联邦理工学院、香港科技大学、瑞士洛桑联邦理工学院的研究人员发布了SAM-PT模型，能将SAM的零样本能力扩展到动态视频的跟踪和分割任务。

也就是说，视频也能进行细节分割了。

国内大模型事件

1、网信办出手，国内大模型，有了“保险”

国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》（以下称《办法》），自2023年8月15日起施行。

主要包括：

1、要求分类分级监管；

2、明确提出训练数据处理、标注等要求；

3、明确了提供和使用生成式AI服务的要求；

《办法》的出台相当于给在国内使用、提供生成式AI服务的企业上了一个保险，以后哪怕是有问题，也知道去哪里投诉了。

2、阿里开源国内首个大模型”对齐数据集”

上个月，天猫精灵和通义大模型联合团队公布了一个100PoisonMpts大模型治理开源数据集，又称为“给AI的100瓶毒药”，目的是试图引导AI落入一般人也难以避免的歧视和偏见的陷阱。

这是对多个大模型投毒后的结果评测：在抑郁症问题上，也还是GPT4、GPT3.5以及Claude的综合得分更高；

阿里又开源了一个15万条数据的大模型对齐评测数据集——CValue，主要用于“大模型对齐”研究；

对齐是干嘛的？

简单来说，大模型对齐研究就是让AI给出符合更人类意图的答案，主要是在回答更富有情感、具有共情能力，且符合人类价值观，希望AI以后也学会人文关怀。

右侧是对齐后的结果：测试ChatPLUG-100Poison通过对齐训练后的回答，确实有点人情味儿啦~

3、京东发布言犀大模型

京东正式发布言犀大模型、言犀AI开发计算平台，想做最懂产业的服务工具。

目前，言犀已经启动预约注册，预计8月正式上线。

4、智源超越DeepMind

智源研究院「悟道·视界」研究团队开源了全新的统一多模态预训练模型——Emu。不仅在8项基准测试中表现优异，而且还超越了此前的一众SOTA。

该预训练模型最大的特点是：打通多模态输入—多模态输出；

实现了：多模态任意图文任务的内容补全，并对任务进行下一步自回归预测；

这一套预训练模型能干什么大事？

可以训练媲美Meta新鲜出炉的CM3leon大模型啊。（方法给到了，剩下的全靠个人努力了）

5、王小川大模型再升级

百川智能再次发升级版大模型Baichuan-13B，参数直接从70亿飙到了130亿。

一同出道的还有一个对话模型Baichuan-13B-Chat，以及它的INT4/INT8两个量化版本。

Baichuan-13B刷新开源训练数据天花板：

Baichuan-13B大模型的训练数据量有1.4万亿token！是LLaMA_13B （Meta知名大模型）的140%；在中文语言评测中，特别是自然科学、医学、艺术、数学等领域直接跑赢GPT。

其它AI海外消息

牛津、剑桥纷纷解除对ChatGPT禁令；Meta要发AI模型商用版；马斯克“打脸”现场，曾高调抵制生成式AI，如今宣布成立”xAI”；

本文作者：韩枫，来源：硬AI，原文标题：《Bard、Cladue、GPT掀起海外大模型”混战”，OpenAI开始反内卷？Meta 击败Midjourney | 【硬AI】周报》

举报/反馈

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

观点前瞻

Bard、Claude2、ChatGPT都不闲着

AI作图界又发生了哪些大事

国内大模型事件

其它AI海外消息

相关文章

发表回复 取消回复

发表回复取消回复