最近很火的AI大语言模型DeepSeek(深度求索)已经霸占中美App Store下载榜第一名,专业评测的分数也是媲美ChatGPT的付费模型4o。那么问题来了,面对这么多大语言模型,我们该用哪个呢?

我会先简单介绍一下DeepSeek,然后再说我的选择。这篇文章肯定带有我的个人偏好,但作为一个生活在中国、工作中经常使用AI的人,我想我的选择能代表一大批同类人群。

简单介绍DeepSeek

DeepSeek是中国私募公司幻方量化旗下AI公司发布的大语言模型,开发团队都是年轻的中国研发人员。在性能上,DeepSeek最新的V3模型已经和ChatGPT的付费模型4o齐平甚至更好;而在价格上,因为从底层上优化了算法架构,DeepSeek模型的成本大幅降低,目前API收费是ChatGPT的几十分之一,而我们个人用户使用最多的Chatbot版本目前是免费的

DeepSeek-V3的综合能力与其他大语言模型的对比

现在去到DeepSeek网站,简单注册一下就可以免费使用啦,也有手机APP版。大家最近可能刷到过社交媒体上有人用DeepSeek写古诗,我来做个DeepSeek和ChatGPT 4o的对比:模仿李白写古诗和模仿五条人乐队写歌词。虽然和原作者还有差别,但以我浅薄的认知,我感觉在对中国文化的理解上,DeepSeek略胜ChatGPT一筹:DeepSeek写的古诗韵律更好,也没有像ChatGPT抄其他诗里的句子;DeepSeek的五条人歌词嘛,就是很有五条人的市井气和塑料感……

但让人有点隐忧的是,DeepSeek创作的歌词里含有抽烟这种概念。当然,这里创作的是文艺作品,其中也没有明显的不良引导,可能不算严重的伦理问题,但还是会让我紧一紧AI伦理这根弦。一个新的、有底层创新的大模型在刚推出时,可能会面临不少伦理上的漏洞,当年ChatGPT推出后也是经过了很多次应对伦理漏洞的调整、以及对公众不断的引导教育(这也是AI素养教育的一部分)。DeepSeek在AI伦理上,可能还有很长一段路要走。

还有几个使用DeepSeek的小贴士:

1. DeepSeek分为通用模型v3和推理模型r1,分别对应ChatGPT 4o和o1。在界面中,点击“深度思考r1”就是调用推理模型,不点击就是调用通用模型。使用通用模型时,对话的流畅度、陪伴感很好,能处理大部分日常任务。当你需要处理复杂逻辑推理任务时(数学题、编程、深度研究、数据分析等),就可以调用推理模型,但模型的反应时间也会更长。所以大家根据使用场景来选择,不是一定要用“r1深度思考”。当然,一开始使用r1时是很惊艳的,模型会把它的思考过程都展示给你。

2. 联网搜索:在界面中点击“联网搜索”,就可以让模型调用实时的网络信息。

3. 上传文档和图片:模型能识别用户上传的文档和图片中的文字,比如可以发送要读的文章给DeepSeek,然后一起讨论学习。

4. 暂时不支持其他模态:目前DeepSeek的互动模式更多还是基于文本,暂时没法像ChatGPT 4o那样生成图片、或用语音和实时视频进行互动。

我的AI选择策略

我自己对于大语言模型有三个要求,这三个要求的优先级依次递减

1

要用就用最好的:使用在能力测评上属于第一梯队的模型

(查看下面图片中第一梯队模型汇总)

2

要适合中国国情:使用在中国方便获得的、熟悉中国社会文化背景的模型

(这一点与我在中国做AI教育密切相关)

3

虽然愿意付费,但能便宜一点是一点

Ethan Mollick – 第一梯队AI大模型汇总分析

每个第一梯队模型的性能都不差

但交互功能上有差异,也都有自己的“个性”

在DeepSeek之前,我主要用的是ChatGPT 4o和o1,属于第一梯队大模型,每月20美金。钱倒还好说,但在国内使用实在麻烦,有钱花不出去的感觉…… 我做教师AI培训时,以前一直苦于没有特别适合中国国情的第一梯队大模型分享给国内老师。参加海外培训时,国外的老师们齐刷刷地打开ChatGPT、Claude来实操,而中国的老师们还在挣扎怎么用上好工具:今天网络不稳定了,明天token又没了,即使用上了ChatGPT,又会发现它可能没那么熟悉中国的教育状况和社会文化环境,这在用AI辅助教学时是很头疼的问题。我就一直在想,咱们国家什么时候才能有自己的第一梯队大模型啊……

这不就来了么!咱们终于有了和世界顶尖技术齐平的模型。我有种如愿以偿的感觉,这对我来说不只是停留在意识层面的民族自豪感,还实实在在关乎每一次教师培训、每一次课堂上能方便使用的AI工具和能达到的教学效果在上面我提的三条要求中,DeepSeek在第1条模型性能上和ChatGPT齐平,在第2条适合中国国情和第3条价格上又妥妥占上风。但我不会立刻停用ChatGPT,除了继续对比DeepSeek和ChatGPT的差异外,我还需要ChatGPT强大的多模态能力。多模态是指文字、语音、图片等多种信息模式,比如ChatGPT能用文字生成图片、用语音和实时视频做互动,这些是DeepSeek暂时还没做到的。

我目前的选择

文本互动多用DeepSeek,特别是基于中文和中国国情的任务,包括用通用模型v3做日常任务(例如对话式头脑风暴)和用推理模型r1做复杂推理任务(例如深度研究)保留ChatGPT 4o做多模态互动(语音互动、实时视频、生成图片等),同时当作对DeepSeek表现不满意时的备胎补充或第二伙伴

我的建议

如果你已经有常用的第一梯队大语言模型,那不妨和我一样先保留着,同时尝试用DeepSeek做更多的文本互动,特别是当你需要考虑中国国情的时候。如果你还没怎么用过AI,或者没有用得顺手的第一梯队模型那可以直接先上手DeepSeek不管使用DeepSeek还是其他模型,都对AI伦理问题保持警醒。

当然有些成年人不做选择,而是都要!他们会很喜欢POE或者Monica这样的平台,上面集成了很多个第一梯队大语言模型。我偶尔会在这些平台上试用新模型,但平时工作中倒不太爱用,一是对我来说,选择太多容易侵占注意力,二是在国内网络下使用这两个平台也很困难。这个选择因人而异,感兴趣的朋友可以试一试再做决定。

最后送个DeepSeek写的春联儿给大家吧!今天除夕,预祝蛇年大吉!

作者:刘天晗 来源公众号:飞星计划

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注