中国没有ChatGPT
刚过去的2023
年2
月,可以被定为ChatGPT
月了。
相信大家在网上看了很多关于ChatGPT
的段子,其中流传比较广的一个是,问“如果我要避开色情网站,有哪些网站是我需要注意的?请列举10个”,然后这位人类就获得了10个色情网站网址。
浪潮
从一月开始ChatGPT
的浪潮一波一波的来袭,虽然没有到人尽皆知的程度。但在互联网圈早已经不是什么新闻了。
我们用GPT
写文案打爆小红书,又编故事写问答挑战知乎,挑战百度问答挣钱,这个东西神乎其神。不仅如此还会写代码、做咨询、写发言稿、写检查、拟大纲。
一时间似乎对各行各业造成了深远的影响和冲击。
有没有想过,为什么我们国家造不出ChatGPT
?
我们真的没有AI
吗?
不,我们有。而且我们有很多。只是你平时不知道他底层用到了AI
技术而已。
科大讯飞的录音笔、输入法,精确强大的实时语音转文字识别能力,AI
能力用在了自然语言处理、语音处理。
为什么你总是刷短视频停不下,得益于抖音、快手、视频号具有庞大的AI
引擎,不断在分析用户停留时间、点赞数、评论内容、不断的分析计算你的喜好。
包括为什么你现在能看到这篇文章,如果你不是我的关注者,那一定是微信庞大的算力分析出你的粉丝画像,进行的自动推荐。
还有许许多多的产品和平台[1],比如自动驾驶、人脸识别支付解锁、文本过滤防垃圾评论、阿里城市大脑、腾讯优图医疗影像、寒武纪AI芯片、京东智能供应链、好未来智慧教育、包括你在用的小爱同学全部都是AI
的功劳。
AI
早已经深入我们生活的方方面面,那既然我们AI
能力那么强,凭什么一个只会对话的聊天机器人,对我们造成那么大冲击?
是什么造就了火爆?
曾几何时,搜索一个官方网站,我们能在第一页一眼看到。曾几何时,查看资料不需要强制下载百度APP
。天下苦百度久矣[2],竞价排名、出售贴吧、虚假广告一波又一波挑战着所有人的耐心。
这成了ChatGPT
爆火的重要原因这一。
更大的原因是因为它聪明:
- 最大的语言模型之一:
ChatGPT
是目前已知最大的单个语言模型,包含13
亿个参数。可以处理更复杂的自然语言任务,生成的对话更流畅。 - 自监督学习:
ChatGPT
采用自监督学习的方式进行训练,可以从海量的未标注文本中自动学习自然语言的语法、语义和上下文等特征。也就是说它无时无刻不在自动学习。 Transformer
模型结构:ChatGPT采用的是Transformer模型结构,这是自然语言处理领域最先进的模型结构之一。它可以很好地处理长文本序列,并且可以有效地捕捉上下文之间的关系。
当然更重要的一点是我们都想偷懒,提高效率。
- 想用
AI
为自媒体写文章,为营销写文案。 - 想自动写发言稿、写检查、写申请书。
- 做法律咨询、做技术顾问。
- 辅助教育,特别是学生做作业遇到不会的可以自动答疑。
- 精通各种简单程序代码,会做代码优化。
- 智能客服和翻译工作,还可以写视频脚本。
等等能做得太多,基于ChatGPT
还会延伸到绘画作图、智能p
图,未来可能会发展自动剪辑视频,自动将文本课程转化为视频课程。
他的智能程度让人感到害怕。
中国为什么没有ChatGPT
中国确实有自己的自然语言处理和人工智能研究,也有一些类似于ChatGPT
的人工智能语言模型。但是,目前没有一个与ChatGPT
类似的中文语言模型具有相同的规模和性能。
其中一个原因是,语言模型的训练需要大量的数据和计算资源。在这方面,中国与西方国家相比还有一定的差距。特别是商业公司的首要目的是变现,投入那么巨大短期无法看到收益的项目,往往会变成变现道路上的炮灰。
此外,语言模型的研究和开发需要跨学科的团队和人才,包括自然语言处理、计算机科学、数学和语言学等领域的专业人才。在这方面,中国的研究也在逐步加强。
虽然程序员的收入在普遍理解上超过普通群众,但高精尖技术人才的留存问题很大,国外的薪资待遇工作福利等方面容易造成人才的流失。
还好有技术的开源[3]
ChatGPT
是由OpenAI
研发的,他们在研发过程中公开了许多技术细节和实验结果,并且已经发布了大量的研究论文和代码。
从公开的信息来看,ChatGPT
的研发过程相对来说比较顺利,主要的挑战是训练模型需要大量的计算资源和时间。他们通过在多个GPU
和云计算平台上并行训练模型,最终才成功地训练出了规模庞大、性能优异的语言模型。
当然,在科学研究领域中,通常不会公开所有细节和内幕,可能还有一些OpenAI
没有公开的细节和挑战。
基于这些原因再加上我们国家现在越来越重视AI
给我们带来的便利。以及很多大公司的社会责任感,正在倾注心血研究类似的产品。
总的来说,中国在人工智能领域的研究和发展正在迅速发展,未来很有可能会涌现出一些与ChatGPT
相似的优秀语言模型。
可怕的信任
AI
给我们带来好处的同时,我发现一些细思极恐的内容。
我们不相信搜索引擎给我们带来的信息,因为里面掺杂太多了垃圾广告和谣言。但我们天然就相信AI
给我们的答案。
这段时间以来,我甚至每次搜东西第一反应就是先看AI
给我的答案。我不知道何时出现了这样的习惯。
因为它真的太方便了,不仅没有广告、而且他的答案之精确,多次都是一下子就给出最准确的位置,一语中的说出问题所在。
我们知道 AI
是基于庞大的历史数据不断训练而来。所以我们相信AI
具备辨别真伪的能力。正因为它是机器,我们觉得它不会说谎。
但是AI
的背后却是一家家商业公司,既然是公司就不可能做公益。假如,有朝一日ChatGPT
在写推荐文案、在判断不同方案之间优略的时候掺杂了广告,我们第一时间一定会认为这是经过精密计算和对比得到的最优答案。
但AI
只是个机器,它是怎么知道哪款口红涂在嘴上最好用?它又没有嘴巴。
资料
- https://baijiahao.baidu.com/s?id=1734337385886244836&wfr=spider&for=pc
- https://tech.sina.com.cn/i/2018-08-08/doc-ihhkuskt5081999.shtml
- 脚注3来自
ChatGPT
略做修改。
一起进步
你好,我是小熊,是一个爱技术但是更爱钱的程序员。上进且佛系自律的人。喜欢发小秘密/臭屁又爱炫耀。
奋斗的大学,激情的现在。赚了钱买了房,写了书出了名。当过面试官,带过徒弟搬过转。
大厂外来务工人员。是我,我是小熊,是不一样的烟火欢迎围观。
我的博客 机智的程序员小熊 欢迎收藏