ChatGPT3.5和4.0真的使用差距很大吗？

chatgpt2023-09-10 22:16:42268

戳下方卡片→ 点击“...” → 点“设为星标 ★ ”不错过每篇好文章！

结论：差距很大，并且是全方位的差距。ChatGPT在GPT-4面前就是“小学生”对“大学生”一般的差距。

先看一些官方的测试结果，再给一些自己测的典型用例。

在本文介绍的所有测试中，ChatGPT都明显弱于GPT-4。

官方测试所涉及的能力：

视觉能力
代码能力
数学计算能力
工具使用能力
与人的交互能力
人类专业考试的能力

自己测的一些能力：

作为推荐算法的能力
实体抽取的能力

1. 微软的测试结果

这部分测试结果来自于微软针对GPT-4的研究论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4 》。这篇论文测的是GPT-4的一个早期版本，它在训练阶段仍只用了文本数据，没有图像。所以从训练数据的类型来看，它和ChatGPT是一致的。

1.1 视觉能力

GPT-4的一个强大能力是它从纯文本中产生了视觉概念，但ChatGPT没有这种能力。

第一个测试方法是让模型用SVG（一种简易的图像格式）生成“汽车”、“卡车”、“猫”和“狗”。GPT-4和ChatGPT生成的图像如图1和图2所示。

1.2 代码能力

论文中有很多复杂的例子，比如让GPT-4按照文字描述写一个PyTorch的优化器；让GPT-4对一段代码进行单步运行；让GPT-4对一段伪代码进行单步运行并分析等等。在所有这些测试中，GPT-4都明显优于ChatGPT。这里挑一个简单一点的示例，代码也比较短，如下图所示。

1.3 数学计算能力

题目大致如下。有一群兔子，在每年年初时，它们的数量为变为原来的a倍。在每年年底时，这群兔子中有b只兔子会被抓走。假设最开始有x只兔子，三年后兔子总数时27x - 26，求a和b。

GPT-4和ChatGPT的解答分别如下：

很容易看到，GPT-4答的非常好。而ChatGPT基本没理解到题目的意思。

2. OpenAI的测试结果

这一部分结果来自OpenAI的GPT-4论文。

第一个测试是人类参与的专业考试，测试结果如下图所示。

图中的柱状表示百分位数。比如，第六列的Uniform Bar Exam（律师资格考试），ChatGPT（GPT3.5）大概是垫底的10%（蓝色柱子），而GPT-4是最高的10%（绿色柱子）。图中浅绿色表示没有视觉能力的GPT-4（没有用图像数据训练），深绿色表示有视觉能力的GPT-4。

第二个测试结果是传统的“刷榜”：在一些标准的数据集上测试GPT-4的能力。结果如下。

最左侧是数据集和任务的描述。结果的第一列和第二列分别是GPT-4和ChatGPT（GPT3.5）的结果。非常明显，GPT-4的能力强太多。

3. 测试用例

这部分列举两个自己写的测试用例，这些用例涉及的场景GPT可能会比现有方法更优。

3.1 推荐

GPT对场景、上下文的理解非常深刻，因此想到的第一个场景就是让它代替推荐算法来做推荐。当然推荐本身的范畴非常大，这里以商品为例，测一下GPT对场景的理解能力。

用例设计：小明购买了新房，所以他在过去一段时间里购买了很多居家用品。测试GPT能否推测出小明当前的生活状态（即将入住新家或准备搬家）。

ChatGPT的结果如下：

GPT-4显然对场景的理解更加深刻。但它仍然过于强调了3月8日这一天的鲜花（更可能是妇女节送花）。

虽然还不完美，但GPT-4一定会使现有的推荐算法、模式（电商、短视频等等）发生巨大变化。

本文链接：https://yunguke.com/chatgpt/313.html

相关文章

国产GPT5.0即将登场，它能否打破技术天花板？
国产GPT5.0即将发布，引发业界对其技术突破的广泛期待，作为国产大模型的最新迭代版本，GPT5.0在语言理解、逻辑推理和多模态交互等方面或将实现显著提升，有望进一步缩小与国际顶尖AI模型的差距，此次...
chatgpt资讯2025-06-2012技术天花板国产gpt5.0
GPT-5.0原理揭秘，下一代AI如何突破思维边界？
GPT-5.0作为下一代AI代表，通过多模态架构融合与动态思维链技术实现认知跃迁，其核心突破在于：1）跨模态统一建模，将文本、图像、音频等数据转化为共享语义空间，实现复杂场景理解；2）引入神经符号系统...
chatgpt资讯2025-06-2013GPT5.0 思维边界 gpt5.0原理
GPT-5.0会收费吗？深度解析未来AI的定价趋势与用户选择
目前OpenAI尚未公布GPT-5.0的定价细节，但基于GPT-4及此前版本的商业化路径，未来AI收费趋势可能呈现以下特点：，1. **分层订阅模式延续**：大概率保留免费基础版+付费高级版的双轨...
chatgpt资讯2025-06-1913GPT5.0 定价趋势 gpt5.0收费吗
GPT-5.0不开源，技术垄断还是商业必然？深度解析背后的逻辑与影响
GPT-5.0未选择开源引发热议，这一决策究竟是技术垄断还是商业发展的必然选择？从商业视角看，闭源模式能保障OpenAI的研发投入回报，维持技术领先优势，同时规避开源可能带来的滥用风险，而技术垄断的质...
chatgpt资讯2025-06-1912技术垄断商业必然 gpt5.0不开源
GPT-5.0到底有多强？揭秘下一代AI的颠覆性突破
GPT-5.0作为下一代AI标杆，展现出颠覆性突破：其万亿级参数规模和多模态融合能力，实现了接近人类水平的复杂任务处理，包括逻辑推理、创意生成和跨领域知识整合，新架构采用"思维链"强化技术，错误率较前...
chatgpt资讯2025-06-1811GPT5.0 颠覆性突破 gpt5.0多么厉害

网友评论