阿里研发了一种新的大语言模型情境学习框架
7月6日消息,据报道,阿里巴巴研究团队研发出一款名为 Deep-Thinking 的大语言模型情境学习框架。
这个框架是一种迭代式的前向训练框架,旨在让大模型能够深度思考和快速定制专属模型。它摒弃了传统的模型训练方法,通过情境学习(In-context Learning)使该模型功能更为强大。
情境学习框架是在大模型时代的背景下提出的新兴框架。
大模型具有思维链、情景学习等涌现能力,能够执行人类的指令,并可以直接与人类进行对话。其核心作用是突破数据标注的困境,通过学习海量无标注的数据来进行预训练,从而提升大模型的知识水平,并在后续的下游任务中应用。
这个框架的提出将有助于大模型更好地理解和适应不同的情境,为人工智能的发展带来新的可能性,有望在语言处理和人工智能领域发挥重要作用。