在全球掀起狂欢的ChatGPT是人类智能的升级,还是“颠覆”的开始?
最近,OpenAI 最新的 AI 对话机器人 ChatGPT 火出天际,成为现象级应用,在全网话题度狂飙。2月1日,根据投资咨询机构瑞银发布的一项研究报告显示,仅仅发布了两个月,ChatGPT的活跃用户已达1亿,成为历史上增长速度最快的应用。
ChatGPT是自然语言处理(NLP)中一项引人瞩目的进展,它阅览了互联网上几乎所有数据,并在超级复杂的模型之下进行深度学习。因为语言是人类智慧、思维方式的核心体现,因此,自然语言处理被称作“AI皇冠上的明珠”。而ChatGPT的出色表现,被认为可能是迈向通用型AI的一种可行路径—作为一种底层模型,它再次验证了深度学习中“规模”的意义。
那么,让全网沸腾的 ChatGPT 到底有哪些颠覆性的创新?其背后的NPL又对标准的制定与开发有怎样的启发?让我们跟随曾任The Open Group开放平台3.0™论坛总监的Chris Harding,一起探索ChatGPT以及其背后的自然语言处理技术吧!
NLP的力量
当下最热门的话题莫过于ChatGPT了,它引起了巨大的轰动,将NLP中最先进的技术打包到对话机器人中。值得一提的是,每个人都可以免费尝试。从当前社交媒体上的声音来看,几乎每个人可能都已经尝试过了。
这一轰动性的声音并不局限于技术媒体。美国CNN、伦敦时报和德国《图片报》等主流媒体也刊登了关于ChatGPT是如何影响其读者的文章。预计它将颠覆从医疗保健到房地产等行业,并对整个社会产生重大影响。
目前,一些行业中的颠覆也已经开始了。对话机器人在销售和技术支持方面发挥着越来越大的作用,任何最近访问过其网站的人都有这种感觉。ChatGPT正在引起人们的注意,它可以在更加普遍和广泛的层面上工作,像一个人一样响应任何主题的任何提示。它使用和支持对话机器人类似的技术,但除此之外还有一个大型模型,该模型在更大的数据集上进行了培训,这为其带来了至关重要的变化。
局限性
除了颠覆性的创新,这项技术确实也存在一定局限性。它可以根据之前记录的信息创建商品内容,但客观来说,并没有人类专家的准确性和洞察力。当最先进的对话机器人意识到自己已经达到极限时,它们就会移交给人类。
首先,这些对话机器人的优势在于展示从现有材料中提取的想法,而不是创造全新的东西。它可以对量子理论做出很好的总结,但几乎可以肯定的是,它无法发明量子理论。之前,我对它提问,是否能创造一个比量子理论更好的理论。它的部分回应是:“作为一个人工智能语言模型,我没有能力进行实验研究或为量子力学等物理理论的演变做出贡献。”
其次,它没有真正的逻辑推理能力。例如,它无法解答以下类似的问题—Mike的妈妈有四个孩子。其中三个是Tom、Dick和Harry。那么,她的第四个孩子叫什么名字?
此外,它的某些答案实际上来说并不准确。这并不奇怪,因为它训练的材料主体可能包括虚假陈述,当一个不太可能的答案实际上是正确的答案时,其概率模型可能会选择一个更可能的答案。
早在20世纪60年代,一个名为Eliza的人工智能程序也引起了类似的轰动。它可以通过挑选其中的模式和短语,并使用算法生成对话中可能接下来的短语,对提示做出相当现实的回应。例如,提示“我被人工智能吓坏了”,它可能会回答,“你被人工智能吓坏了多久?”
ChatGPT是升级版的Eliza。它的反应不仅基于提示中的内容,还基于它所训练的大量材料。它们不是由简单的算法生成的,而是由复杂的概率模型生成的。
协作智能
最好的人类总是在国际象棋中击败机器。直到20世纪90年代中期,大师Gary Kasparov输给了超级计算机Big Blue。这为关于人类与人工智能的辩论提供了巨大的动力。卡斯帕罗夫本人认真考虑了这个问题,并一直在探索人与人工智能之间的合作。他与David De Cremer一起在《哈佛商业评论》上发表了文章,描述了一个实验,用以表明人与机器之间组织良好的伙伴关系不仅可以优于最好的人,还可以优于最好的机器。最后,他们得出结论,人工智能应该增强人类智能,而不是取代它。
目前,使用人工智能增强人类智能似乎是前进的方向。一台机器可以吸收比任何人类更多的知识体系,并且可以以人类可以理解的方式从中得出结论。他们可以捕捉并表达共识。人类增加了道德和伦理层面,也许还有一些“常识”,并能够引导机器走向对其社会“正确”的东西。他们能够更好地形成新想法并发展新理论。
在标准制定中使用
尽管存在局限性,但作为ChatGPT背后的自然语言处理技术在许多领域具有巨大的颠覆性潜力。其中之一就是标准制定。去年,我在The Open Group架构论坛进行了一个关于使用NLP的可能性的演讲。ChatGPT随后的崛起表明,这些可能性甚至更令人兴奋,并且可能比我想象的更早实现。
标准通过为人们提供共同的沟通基础,使他们能够一起工作,进而扩大使用范围。UNIX®标准是The Open Group的标准,通过定义特定类型的操作系统来帮助软件开发人员进行协作;TOGAF®标准也是The Open Group的标准,通过描述企业架构师应该如何思考架构开发来帮助企业架构师进行协作。
在2020年,德克萨斯州圣安东尼奥举行的一场活动中,The Open Group的两位副总裁Andrew Josey和David Lounsbury提出了“标准即代码”的概念,认为标准可能由可执行代码组成,前提是代码受共识主导的更改控制。他们认识到计算机软件作为实用标准的潜力。该软件现在可以包括ChatGPT等程序,其标准由其语言模型组成。
除了提供一种表示标准的方式外,自然语言处理还可以支持它们的发展,并帮助人们更好地使用它们。The Open Group数据集成工作组正在探索这些可能性。
The Open Group数据集成工作组
数据集成工作组正在使用The Open Group标准编写数据集成指南。为了奠定这一基础,工作组正在研究数据集成的用例和当前趋势,并审查The Open Group标准的语料库,以确定相关条款。
为了帮助这项工作更加顺利的进行,工作组正在使用原型创意浏览器。该浏览器的工作逻辑是可以分析一组网页,以便用户无需阅读所有单词即可知晓其主题和想法。它的摘要正是由ChatGPT使用的语言模型生成的。在这里需要提出的是,这一工具不会取代人类,但会帮助人类可以更快地审查更多的材料,进而提高做决定的效率和时间,从而更好地进行工作。