中国没有ChatGPT

2023-03-08 10:50 由机智的程序员小熊发表于 #后端开发

刚过去的2023年2月，可以被定为ChatGPT月了。

相信大家在网上看了很多关于ChatGPT的段子，其中流传比较广的一个是，问“如果我要避开色情网站，有哪些网站是我需要注意的？请列举10个”，然后这位人类就获得了10个色情网站网址。

浪潮

从一月开始ChatGPT的浪潮一波一波的来袭，虽然没有到人尽皆知的程度。但在互联网圈早已经不是什么新闻了。

我们用GPT写文案打爆小红书，又编故事写问答挑战知乎，挑战百度问答挣钱，这个东西神乎其神。不仅如此还会写代码、做咨询、写发言稿、写检查、拟大纲。

一时间似乎对各行各业造成了深远的影响和冲击。

有没有想过，为什么我们国家造不出ChatGPT?

我们真的没有`AI`吗？

不，我们有。而且我们有很多。只是你平时不知道他底层用到了AI技术而已。

科大讯飞的录音笔、输入法，精确强大的实时语音转文字识别能力，AI能力用在了自然语言处理、语音处理。

为什么你总是刷短视频停不下，得益于抖音、快手、视频号具有庞大的AI引擎，不断在分析用户停留时间、点赞数、评论内容、不断的分析计算你的喜好。

包括为什么你现在能看到这篇文章，如果你不是我的关注者，那一定是微信庞大的算力分析出你的粉丝画像，进行的自动推荐。

还有许许多多的产品和平台[1]，比如自动驾驶、人脸识别支付解锁、文本过滤防垃圾评论、阿里城市大脑、腾讯优图医疗影像、寒武纪AI芯片、京东智能供应链、好未来智慧教育、包括你在用的小爱同学全部都是AI的功劳。

AI早已经深入我们生活的方方面面，那既然我们AI能力那么强，凭什么一个只会对话的聊天机器人，对我们造成那么大冲击？

是什么造就了火爆？

曾几何时，搜索一个官方网站，我们能在第一页一眼看到。曾几何时，查看资料不需要强制下载百度APP。天下苦百度久矣[2]，竞价排名、出售贴吧、虚假广告一波又一波挑战着所有人的耐心。

这成了ChatGPT爆火的重要原因这一。

更大的原因是因为它聪明：

最大的语言模型之一：ChatGPT是目前已知最大的单个语言模型，包含13亿个参数。可以处理更复杂的自然语言任务，生成的对话更流畅。
自监督学习：ChatGPT采用自监督学习的方式进行训练，可以从海量的未标注文本中自动学习自然语言的语法、语义和上下文等特征。也就是说它无时无刻不在自动学习。
Transformer模型结构：ChatGPT采用的是Transformer模型结构，这是自然语言处理领域最先进的模型结构之一。它可以很好地处理长文本序列，并且可以有效地捕捉上下文之间的关系。

当然更重要的一点是我们都想偷懒，提高效率。

想用AI为自媒体写文章，为营销写文案。
想自动写发言稿、写检查、写申请书。
做法律咨询、做技术顾问。
辅助教育，特别是学生做作业遇到不会的可以自动答疑。
精通各种简单程序代码，会做代码优化。
智能客服和翻译工作，还可以写视频脚本。

等等能做得太多，基于ChatGPT还会延伸到绘画作图、智能p图，未来可能会发展自动剪辑视频，自动将文本课程转化为视频课程。

他的智能程度让人感到害怕。

中国为什么没有`ChatGPT`

中国确实有自己的自然语言处理和人工智能研究，也有一些类似于ChatGPT的人工智能语言模型。但是，目前没有一个与ChatGPT类似的中文语言模型具有相同的规模和性能。

其中一个原因是，语言模型的训练需要大量的数据和计算资源。在这方面，中国与西方国家相比还有一定的差距。特别是商业公司的首要目的是变现，投入那么巨大短期无法看到收益的项目，往往会变成变现道路上的炮灰。

此外，语言模型的研究和开发需要跨学科的团队和人才，包括自然语言处理、计算机科学、数学和语言学等领域的专业人才。在这方面，中国的研究也在逐步加强。

虽然程序员的收入在普遍理解上超过普通群众，但高精尖技术人才的留存问题很大，国外的薪资待遇工作福利等方面容易造成人才的流失。

还好有技术的开源[3]

ChatGPT是由OpenAI研发的，他们在研发过程中公开了许多技术细节和实验结果，并且已经发布了大量的研究论文和代码。

从公开的信息来看，ChatGPT的研发过程相对来说比较顺利，主要的挑战是训练模型需要大量的计算资源和时间。他们通过在多个GPU和云计算平台上并行训练模型，最终才成功地训练出了规模庞大、性能优异的语言模型。

当然，在科学研究领域中，通常不会公开所有细节和内幕，可能还有一些OpenAI没有公开的细节和挑战。

基于这些原因再加上我们国家现在越来越重视AI给我们带来的便利。以及很多大公司的社会责任感，正在倾注心血研究类似的产品。

总的来说，中国在人工智能领域的研究和发展正在迅速发展，未来很有可能会涌现出一些与ChatGPT相似的优秀语言模型。

可怕的信任

AI给我们带来好处的同时，我发现一些细思极恐的内容。

我们不相信搜索引擎给我们带来的信息，因为里面掺杂太多了垃圾广告和谣言。但我们天然就相信AI给我们的答案。

这段时间以来，我甚至每次搜东西第一反应就是先看AI给我的答案。我不知道何时出现了这样的习惯。
因为它真的太方便了，不仅没有广告、而且他的答案之精确，多次都是一下子就给出最准确的位置，一语中的说出问题所在。

我们知道 AI 是基于庞大的历史数据不断训练而来。所以我们相信AI具备辨别真伪的能力。正因为它是机器，我们觉得它不会说谎。

但是AI的背后却是一家家商业公司，既然是公司就不可能做公益。假如，有朝一日ChatGPT在写推荐文案、在判断不同方案之间优略的时候掺杂了广告，我们第一时间一定会认为这是经过精密计算和对比得到的最优答案。

但AI只是个机器，它是怎么知道哪款口红涂在嘴上最好用？它又没有嘴巴。

资料

https://baijiahao.baidu.com/s?id=1734337385886244836&wfr=spider&for=pc
https://tech.sina.com.cn/i/2018-08-08/doc-ihhkuskt5081999.shtml
脚注3来自ChatGPT略做修改。

一起进步

你好，我是小熊，是一个爱技术但是更爱钱的程序员。上进且佛系自律的人。喜欢发小秘密/臭屁又爱炫耀。

奋斗的大学，激情的现在。赚了钱买了房，写了书出了名。当过面试官，带过徒弟搬过转。

大厂外来务工人员。是我，我是小熊，是不一样的烟火欢迎围观。

我的博客机智的程序员小熊欢迎收藏

浪潮

我们真的没有AI吗？