斯坦福称ChatGPT变得越来越蠢 GPT-4不如3.5
ChatGPT用户声称,随着时间推移,GPT-4正变得越来越糟糕,斯坦福大学的研究人员现在已经证实了这一点。
斯坦福大学的一篇论文通过利用和比较GPT-4和GPT-3.5的运行方式进行了详细介绍。
“我们发现 GPT-3.5 和 GPT-4 的性能和行为在这两个版本中差异很大,并且随着时间的推移,它们在某些任务上的表现变得非常差。”
与3月和6月发布的语言模型相比,GPT的性能有所下降,最明显的例子是询问17077是否是质数。
虽然答案是肯定的,但ChatGPT的准确率却大幅下降了95.2%。而免费版 ChatGPT的GPT-3.5在回答同样的问题时,准确率从7.4%提高到了 86.8%
几周以来,用户一直在抱怨ChatGPT的性能下降,包括在 OpenAI 自己的论坛上。
对此OpenAI的负责人表示:
“不,我们并没有让 GPT-4 变得更愚蠢。恰恰相反:我们让每个新版本都比前一个版本更智能。目前的假设:当您更频繁地使用它时,您会开始注意到以前没有看到的问题。”